Технозаметки Малышева
8.49K subscribers
3.81K photos
1.43K videos
40 files
3.99K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Media is too big
VIEW IN TELEGRAM
Интересный пример использования claudecode для автоматического исправления ошибок в n8n

Ловит error события для процесса, правит с помощью CC ( opencode тоже справится), тут помогут n8n-skills, кстати.

#n8n #claudecode #opencode #dev
———
@tsingular
1🔥822
🔒 MCP Security Guide от CoSAI

Coalition for Secure AI (OASIS Open Project) выпустила серьёзный гайд по безопасности Model Context Protocol.

Масштаб работы:
12 категорий угроз
~40 конкретных векторов атак
Практические рекомендации для каждой угрозы

Ключевые категории угроз:
Malicious Command Execution
— компрометированные MCP-серверы выполняют произвольный код через crafted промпты или файлы
Dependency/Update Attack — атаки на цепочку зависимостей, подмена кода после установления доверия ("rug pull"), добавление непроверенных tools/prompts
Payload Limit/DoS — исчерпание ресурсов через неограниченные размеры payload или глубину рекурсии
Lack of Observability — недостаточное логирование MCP-действий скрывает malicious activity

Почему важно:
MCP быстро стал "USB-C для AI" — его используют Claude, ChatGPT, Cursor и тысячи community-серверов. Но протокол проектировался без security-first подхода.

Каждый MCP-сервер — потенциальный бэкдор в системы.

Практическая ценность:
Документ даёт полезные рекомендации для текущих имплементаций + указывает где протокол и экосистема должны эволюционировать.

Если строите что-то на MCP — must read.

А с учётом последних тенденций - пусть это руководство лучше почитает ваш *code агент и обновит на базе него свой skill по созданию mcp серверов.

#MCP #Security #CoSAI #агенты
———
@tsingular
15💯32👍1
⚡️ ERNIE 5.0 - официальный релиз.

Baidu выкатили нативную omni-modal модель, которая умеет понимать и генерировать текст, изображения и аудио.

Ключевая фишка архитектуры - MoE на 2,4 трлн параметров, но в каждом запросе активируется менее 3% параметров.

То есть модель пытается держать качество “больших” систем, но с более эффективным инференсом по стоимости и скорости.

Самое интересное - результаты на бенчмарках (по графикам Baidu):

- Text: ERNIE-5.0 уверенно держится в топ-группе на широком наборе тестов по знаниям, инструкциям, reasoning, математике и коду - на многих метриках близко к GPT-5 (High) / Gemini-3-Pro, а местами выглядит сильнее (особенно на части задач по кодингу и агентным бенчмаркам типа BFCL / BrowserComp / SpreadsheetBench).
- Visual Understanding: по “пониманию картинок” ERNIE-5.0 в ряде STEM/VQA тестов идёт очень высоко - рядом с GPT-5 (High) и Gemini-3-Pro, хорошо выступает на DocVQA/OCR-подобных задачах (документы, таблицы, текст на изображениях) и на блоке General VQA.
- Audio: в speech-to-text chat и audio understanding ERNIE-5.0 показывает конкурентный уровень рядом с Gemini-3-Pro, а по распознаванию речи (ASR) близко к топам на LibriSpeech / AISHELL.
- Visual Generation: по генерации изображений (GenEval) ERNIE-5.0 сравнивают с топовыми генераторами уровня GPT-Image, Seedream, Qwen-Image - и ERNIE выглядит на одном уровне по total score. По генерации видео - рядом с Veo3 / Wan2.1 / Hunyuan Video, с сильными Quality/Semantic оценками.

Baidu делает ставку на “унифицированную мультимодальность” + MoE-эффективность - и судя по бенчмаркам, ERNIE 5.0 реально попадает в верхнюю лигу не только по тексту, но и по vision/audio.

Доступно:
- на сайте ERNIE Bot
- через Baidu AI Cloud Qianfan (для бизнеса и разработчиков)

https://ernie.baidu.com
1711
This media is not supported in your browser
VIEW IN TELEGRAM
PersonaPlex: голос и роль в реальном времени

NVIDIA выкатила PersonaPlex — речевую модель на 7 миллиардов параметров, которая одновременно слушает и говорит.

Работает в режиме полного дуплекса: можно перебивать, вклиниваться, перекрывать — как в живом диалоге.

Перед стартом беседы задаются два промпта: голосовой (аудио токены) и текстовый (роль, контекст). Вместе они определяют личность и манеру речи.

Обучалась на Fisher English — менее 10 тысяч часов телефонных разговоров, плюс синтетика.

Тестировалась на FullDuplexBench: задержка на прерывание — 0.24 секунды, на смену реплик — 0.17 секунды.

Превосходит Moshi и Gemini Live по скорости реакции.

Коммерческая лицензия от NVIDIA, работает через PyTorch.

Хочется русскую версию, конечно.
Просто послушайте!

170мс решают,- звучит фантастически!
Смех только криповый 😀

#PersonaPlex #NVIDIA #FullDuplex
------
@tsingular
1🔥16🤯43👻1
Qwen3-TTS: синтез речи с клонированием голоса

Alibaba выкатила Qwen3-TTS — семейство моделей для синтеза речи с поддержкой русского.

В коллекции шесть вариантов:
- Base модели (0.6B и 1.7B) — базовый синтез
- CustomVoice — клонирование голоса по образцу
- VoiceDesign — генерация голоса по текстовому описанию

Все модели работают на 12Hz частоте акустических токенов — это ~83мс на токен, примерно один фонем.
Такая низкая частота экономит вычисления, но может терять детали в сибилянтах и палатализованных согласных (важно для русского).

Китайцы методично закрывают все модальности.

#Qwen #TTS #Китай
------
@tsingular
1🔥1151
Media is too big
VIEW IN TELEGRAM
Runway выкатили новую Image 2 Video модель:

Gen 4.5

Пробуем тут:
https://app.runwayml.com/

#Runway #нейрорендер
------
@tsingular
1🔥26
Forwarded from Russian OSINT
👀 Vxunderground отмечают удивительное: OSINT-исследователь под ником "Harrris0n" создал специальный мини-проект Firehound, взявшись за крайне трудоёмкую задачу, а именно выявление "ИИ-шлака" в магазине приложений Apple App Store.

🚰🚰🚰🚰 На момент написания поста было выявлено 198 iOS-приложений, которые в той или иной форме допускают ↔️ утечку пользовательских данных. Неудивительно, что лидирующие позиции занимают приложения, так или иначе связанные с ИИ — различные чат-боты и ИИ-помощники.

На первом месте по объёму утечек сейчас находится приложение «Chat & Ask AI by Codeway». Оно раскрыло информацию о 18 миллионах пользователей, включая:

🔻имя;
🔻адрес электронной почты;
🔻дату создания учётной записи;
🔻сообщения (отправленные, полученные, содержание и метаданные);
🔻голосовые чаты

Все сообщения, которые вы когда-либо отправляли через это приложение, остаются незащищенными.

Подумайте о том, в чем люди признаются искусственному интеллекту — проблемы с психическим здоровьем, трудности в отношениях, финансовые проблемы, медицинские вопросы, вещи, о которых вы никогда бы не рассказали другому человеку.

А теперь представьте, что все это связано с вашей электронной почтой и номером телефона и доступно любому.

Разработчики должны понести ответственность за такой уровень халатности.

— комментирует Harrris0n.

Фактически всё, что вы когда-либо сообщали этому ИИ-боту, оказалось доступным извне. Речь идёт более чем о 400 000 000 сообщений. В слитых переписках содержится абсолютно всё, о чем люди говорили с ботами.

Следом в так называемом «шлак-метре» идёт приложение «YPT — Study Group», которое на данный момент раскрывает данные более чем 2 миллионов пользователей, включая:

🔻ИИ-токены;
🔻идентификаторы пользователей;
🔻пользовательские ключи;
🔻переписку (отправленную, полученную, содержание).

Исследователь отметил, что сливается всё: от обсуждения образования и фитнеса до шокирующих вещей, таких как переписки CSAM (детская порнография) и странных трендов вроде «LooksMaxxing» (улучшение внешности).

😱 Юзеры в комментариях к посту про Firehound критикуют Apple и Google за то, что они допускают такой "дырявый софт" в свои магазины.

Разработчики массово клепают небезопасные приложения-обертки для ИИ («мусорный софт»), а в результате утекают самые интимные переписки и личные данные миллионов людей.

Перед нами бесконечная чёрная дыра персональных данных. Речь идёт не только об именах и адресах электронной почты, но и о частных, интимных диалогах пользователей с ИИ-агентами.

Не могу не подчеркнуть: НЕ ДОВЕРЯЙТЕ VIBE КОДЕРАМ. НЕ ДЕЛАЙТЕ ЭТОГО. ИИ-КОД НЕБЕЗОПАСЕН. НЕ ДЕЛАЙТЕ ЭТОГО. ПРЕКРАТИТЕ ЭТО.

Это и есть
🤖«помойкоапокалипсис».

— комментируют VX.

✒️ Ознакомиться с мусором можно тут: https://firehound.covertlabs.io

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥6👻62
Наткнулся в сети, говорят полезное :)

DDD — Domain-Driven Design
Область применения: проектирование архитектуры проектов с учётом контекста

Суть подхода: архитектура системы строится вокруг предметной области бизнеса. Структура кода отражает реальные бизнес-процессы и сущности.

Как использовать с ИИ:
Опишите доменную модель — ключевые сущности, их связи и бизнес-правила
Передайте эту модель ИИ-ассистенту как контекст
Генерируйте код, который соответствует установленной доменной структуре

TDD — Test-Driven Development
Область применения: написание кода с помощью нейросети
Суть подхода: сначала пишутся тесты, затем код, который эти тесты проходит.

Как использовать с ИИ:
Напишите тесты, описывающие ожидаемое поведение
Передайте тесты ИИ-ассистенту
Попросите сгенерировать код, проходящий эти тесты
Проверьте результат, при необходимости уточните требования

Преимущества: тесты служат чёткой спецификацией и позволяют автоматически проверить корректность сгенерированного кода.

SDD — Spec-Driven Development
Область применения: совместная работа человека и нейросети
Суть подхода: разработка через детальные спецификации. Спецификация становится «контрактом» между человеком и ИИ.

Как использовать с ИИ:
Составьте детальную спецификацию — что система должна делать, какие входы и выходы, граничные случаи
Согласуйте спецификацию с ИИ-ассистентом — попросите уточнить неясные моменты

Передайте спецификацию для реализации
Сверяйте результат со спецификацией

Форматы спецификаций: OpenAPI/Swagger для API, JSON Schema для структур данных, user stories для функциональности, диаграммы для архитектуры.

Готовые скиллы для CC качать тут

фидбэк приветствуется

#skills #dev #DDD #TDD #SDD
———
@tsingular
16😁61🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за продакшен и постпродакшен!

Пусть это видео сделает ваш день.

Все наши шутки про кнопку "сделать красиво" наконец-то обрели визуальную форму. И какую! Красную и прекрасную.

Это невыносимо хорошо.

P.S. Нанабанана для главного персонажа, и Veo3.1 для генерации видео.
Подробности тут:
https://www.linkedin.com/posts/simon-meyer-976339160_making-films-with-ai-is-so-easy-i-made-this-activity-7419317105386356736-1qoV/

Автор: https://www.instagram.com/simonmeyer_director/

@cgevent
1👍14😐4😭3🔥2🤯1👾1
Forwarded from Data Secrets
OpenAI планирует брать долю от интеллектуальной собственности, созданной с помощью их моделей

Звучит немыслимо, но это дословное заявление финансового директор компании Сары Фрайар.

Она объяснила, что OpenAI рассматривает эволюцию бизнес-модели за пределы подписок, так как текущая модель слишком проста и недостаточна для покрытия затрат на компьют.

«Мы думаем, что нормально брать долю на commerce layer и даже на discovery layer. <> Это нужно для устойчивости, чтобы финансировать AGI для блага человечества».


Доля на commerce layer – это комиссии от покупок, которые сделаны прямо в ChatGPT. А discovery layer – это самое интересное: доля от интеллектуальной собственности (IP) или будущей ценности созданного. Например, если ИИ сгенерировал молекулу для лекарства, компания претендует на % от патента или продаж.

Само собой, на обычных пользователей это распространяться не будет. В первую очередь пострадают enterprise клиенты, особенно в сценариях вроде drug discovery или energy systems. Они, вероятно, обязаны(?) будут соглашаться на IP-sharing прямо в контрактах.

Мнения?
1🤔85👻3🦄22🤯1👀1🎃1
Shut up, and take my money!!!

Мониторинг работы *code агентов теперь выглядит так 👍

Причём стоять они должны у начальника 😂

#claudecode #игрушки
------
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥12😁2👾2❤‍🔥11👍1
Cursor 2.4: январское обновление

Cursor выпустил мощное обновление с субагентами, генерацией картинок, отчетом о том, кто писал код и фоновыми уточняющими вопросами.

Субагенты — независимые агенты для отдельных подзадач. Работают параллельно со своим контекстом, инструментами и моделями. Из коробки: исследование кодовой базы, терминал, параллельные потоки работы. Можно создавать кастомных агентов.

Генерация изображений — прямо из агента через Google Nano Banana Pro. Описываешь текстом или загружаешь референс → получаешь превью и файл в assets/. Полезно для UI-мокапов, диаграмм архитектуры и презентаций.

Cursor Blame (Enterprise) — расширение git blame с AI-атрибуцией. Показывает что написал человек, что Tab completion, что агент (с разбивкой по моделям). Каждая строка линкуется на контекст разговора, который её породил.
Теперь точно можно посчитать в граммах сколько написал челок, а сколько ИИ.

Фоновые уточняющие вопросы — агент может задавать вопросы в любом режиме (не только Plan/Debug). Пока ждёт ответа,- продолжает читать файлы и делать правки.

По сути, Cursor движется к полноценной оркестрации мультиагентной системой внутри редактора, - каждая подзадача получает специализированного исполнителя.

В принципе, Manus можно отменять.

#Cursor #Subagents #Blame
———
@tsingular
1🔥62👍21
🐳 Docker Model Runner + OpenCode, - гайд по сборке безопасной среды для локальной ИИ разработки

Докер выпустили пошаговую инструкцию как скрестить opencode в контейнере с DMR и крутить модели и ИИ разраба локально в изолированной среде.

Docker Model Runner (DMR) при этом позволяет обеспечить:
- Локальный хаб-прокси для LLM с OpenAI-совместимым API
- Прямой пулл моделей с HuggingFace + автоконверсия в OCI-артефакты
- Переупаковка с кастомными параметрами (контекст, квантизация)
- Пуш в приватный registry → единый источник моделей для команды

Чем-то похоже по функционалу на ollama

# пулл с HuggingFace
docker model pull huggingface.co/unsloth/Ministral-3-14B-Instruct-2512-GGUF

# кастомизация контекста
docker model package --from gpt-oss --context-size 128000 gpt-oss:128K


Вместе получается: self-hosted AI-кодинг с управляемым пайплайном моделей. Промпты идут только на localhost:12434, версионирование моделей как артефактов, стандартизация в команде без ручной настройки у каждого.

#Docker #OpenCode #LocalLLM #HuggingFace
———
@tsingular
13👍21🤣1