Технозаметки Малышева
8.49K subscribers
3.81K photos
1.43K videos
40 files
3.99K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Таймлапс процесса автоматической разработки автономными агентами Cursor браузера в течение недели.

Агенты написали более 3 миллионов строк кода, распределенных по тысячам файлов.
Движок рендеринга разработан с нуля на Rust и включает в себя парсинг HTML, каскадное использование CSS, компоновку, формирование текста, отрисовку и собственную виртуальную машину JavaScript.

#Cursor #наблюдаемость #агенты #browser
———
@tsingular
2🔥19👍811🗿1
Forwarded from Machinelearning
📉 Давос: CEO Anthropic и CEO DeepMind - о том, как ИИ изменит рынок труда

На Давосском форуме Дарио Амодеи (CEO Anthropic, компании-разработчика Claude) дал жёсткий прогноз: мы можем прийти к необычной ситуации, когда экономика и ВВП быстро растут, но безработица растёт почти так же быстро.

По его оценке, сильнее всего пострадают позиции для начинающих: в течение 5 лет безработица среди junior / entry-level вакансий может доходить до 50%.

Демис Хассабис (CEO Google DeepMind) ответил осторожнее.
По его мнению, до этого сценария ещё далеко - у текущих моделей остаются ключевые ограничения:

- Consistency - ИИ работает нестабильно: сегодня отлично, завтра с ошибками
- Jagged intelligence - “рваный интеллект”: в одной задаче модель сильная, в другой внезапно проваливается

Главная мысль Хассабиса: ИИ, который делает 95% работы, ещё не заменяет человека.
Чтобы замена произошла система должна закрывать почти 100% задач - надёжно и без постоянного контроля.

Амодеи ждёт сильный удар по джунам уже в ближайшие годы, а Хассабис считает, что до массовой замены людей технологии пока не доросли и не дорастут в ближайшее время.

@ai_machinelearning_big_data
16👍42🤔2🔥11
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Audio as input for LTX2 для Comfy

Все эти персонажи и мемы оживлены по одной входной картинке и звуку.

Мне больше всего зашел дед с 0:53. Нейродед, чо.

Воркфлоу тут:
https://github.com/purzbeats/purz-comfyui-workflows/blob/main/ltx2/ltx2-audio_to_video_extension_5x.json

@cgevent
1😁12🔥7👻1
Anthropic обновила конституцию Claude

Anthropic выложила новый текст конституции для Claude — документ, который напрямую определяет поведение модели в процессе обучения.

Главное отличие от прежнего подхода: вместо списка правил — объяснение причин. Модели нужно понимать «почему», а не только «что делать», чтобы принимать решения в новых ситуациях.

Приоритеты теперь выглядят так:
- Безопасность (не мешать людям контролировать ИИ)
- Этика (честность, здравый смысл)
- Следование инструкциям Anthropic
- Польза для пользователя

Конституция используется для генерации синтетических данных внутреннего диалога: сам Claude создаёт примеры диалогов и ранжирует ответы по своим ценностям.

Документ выпущен под лицензией CC0 — любой может использовать для обучения своих моделей. Исследования показывают: такой подход снизил успех джейлбрейков с 86% до 4.4%, так что может быть полезно.

Законы Азимова устарели.
Берем на вооружение.

#Anthropic #Claude #конституция
------
@tsingular
2🔥15622
Sequoia: AGI уже здесь

Исследователи из венчурного фонда Sequoia заявили, что AGI уже достигнут прямо сейчас.

Их определение простое: ИИ способен разбираться в задачах самостоятельно.

Pragmatically speaking, what do you want if you’re trying to get something done?

An AI that can just figure stuff out.

How it happens is of less concern than the fact that it happens


Прагматично выражаясь, - какая ваша цель, когда вы решаете задачу?

Вам нужен ИИ, который просто может во всем разобраться.

То, как это произойдет, вообще не важно, если задача решена.


Агенты теперь работают часами без присмотра - исправляют ошибки, меняют подход, находят решения.
Claude Code и аналоги вышли на новый уровень автономности.

Пример из статьи: агент за 31 минуту нашёл идеального DevRel-кандидата.
Прошёл LinkedIn, YouTube, Twitter, вычислил сигналы увольнения, составил письмо.

Будущее наступило, просто оно неравномерно распределено

#Sequoia #LongHorizon #AGI #аналитика
———
@tsingular
1🔥17😁5
Media is too big
VIEW IN TELEGRAM
Интересный пример использования claudecode для автоматического исправления ошибок в n8n

Ловит error события для процесса, правит с помощью CC ( opencode тоже справится), тут помогут n8n-skills, кстати.

#n8n #claudecode #opencode #dev
———
@tsingular
1🔥822
🔒 MCP Security Guide от CoSAI

Coalition for Secure AI (OASIS Open Project) выпустила серьёзный гайд по безопасности Model Context Protocol.

Масштаб работы:
12 категорий угроз
~40 конкретных векторов атак
Практические рекомендации для каждой угрозы

Ключевые категории угроз:
Malicious Command Execution
— компрометированные MCP-серверы выполняют произвольный код через crafted промпты или файлы
Dependency/Update Attack — атаки на цепочку зависимостей, подмена кода после установления доверия ("rug pull"), добавление непроверенных tools/prompts
Payload Limit/DoS — исчерпание ресурсов через неограниченные размеры payload или глубину рекурсии
Lack of Observability — недостаточное логирование MCP-действий скрывает malicious activity

Почему важно:
MCP быстро стал "USB-C для AI" — его используют Claude, ChatGPT, Cursor и тысячи community-серверов. Но протокол проектировался без security-first подхода.

Каждый MCP-сервер — потенциальный бэкдор в системы.

Практическая ценность:
Документ даёт полезные рекомендации для текущих имплементаций + указывает где протокол и экосистема должны эволюционировать.

Если строите что-то на MCP — must read.

А с учётом последних тенденций - пусть это руководство лучше почитает ваш *code агент и обновит на базе него свой skill по созданию mcp серверов.

#MCP #Security #CoSAI #агенты
———
@tsingular
15💯32👍1
⚡️ ERNIE 5.0 - официальный релиз.

Baidu выкатили нативную omni-modal модель, которая умеет понимать и генерировать текст, изображения и аудио.

Ключевая фишка архитектуры - MoE на 2,4 трлн параметров, но в каждом запросе активируется менее 3% параметров.

То есть модель пытается держать качество “больших” систем, но с более эффективным инференсом по стоимости и скорости.

Самое интересное - результаты на бенчмарках (по графикам Baidu):

- Text: ERNIE-5.0 уверенно держится в топ-группе на широком наборе тестов по знаниям, инструкциям, reasoning, математике и коду - на многих метриках близко к GPT-5 (High) / Gemini-3-Pro, а местами выглядит сильнее (особенно на части задач по кодингу и агентным бенчмаркам типа BFCL / BrowserComp / SpreadsheetBench).
- Visual Understanding: по “пониманию картинок” ERNIE-5.0 в ряде STEM/VQA тестов идёт очень высоко - рядом с GPT-5 (High) и Gemini-3-Pro, хорошо выступает на DocVQA/OCR-подобных задачах (документы, таблицы, текст на изображениях) и на блоке General VQA.
- Audio: в speech-to-text chat и audio understanding ERNIE-5.0 показывает конкурентный уровень рядом с Gemini-3-Pro, а по распознаванию речи (ASR) близко к топам на LibriSpeech / AISHELL.
- Visual Generation: по генерации изображений (GenEval) ERNIE-5.0 сравнивают с топовыми генераторами уровня GPT-Image, Seedream, Qwen-Image - и ERNIE выглядит на одном уровне по total score. По генерации видео - рядом с Veo3 / Wan2.1 / Hunyuan Video, с сильными Quality/Semantic оценками.

Baidu делает ставку на “унифицированную мультимодальность” + MoE-эффективность - и судя по бенчмаркам, ERNIE 5.0 реально попадает в верхнюю лигу не только по тексту, но и по vision/audio.

Доступно:
- на сайте ERNIE Bot
- через Baidu AI Cloud Qianfan (для бизнеса и разработчиков)

https://ernie.baidu.com
1711
This media is not supported in your browser
VIEW IN TELEGRAM
PersonaPlex: голос и роль в реальном времени

NVIDIA выкатила PersonaPlex — речевую модель на 7 миллиардов параметров, которая одновременно слушает и говорит.

Работает в режиме полного дуплекса: можно перебивать, вклиниваться, перекрывать — как в живом диалоге.

Перед стартом беседы задаются два промпта: голосовой (аудио токены) и текстовый (роль, контекст). Вместе они определяют личность и манеру речи.

Обучалась на Fisher English — менее 10 тысяч часов телефонных разговоров, плюс синтетика.

Тестировалась на FullDuplexBench: задержка на прерывание — 0.24 секунды, на смену реплик — 0.17 секунды.

Превосходит Moshi и Gemini Live по скорости реакции.

Коммерческая лицензия от NVIDIA, работает через PyTorch.

Хочется русскую версию, конечно.
Просто послушайте!

170мс решают,- звучит фантастически!
Смех только криповый 😀

#PersonaPlex #NVIDIA #FullDuplex
------
@tsingular
1🔥16🤯43👻1
Qwen3-TTS: синтез речи с клонированием голоса

Alibaba выкатила Qwen3-TTS — семейство моделей для синтеза речи с поддержкой русского.

В коллекции шесть вариантов:
- Base модели (0.6B и 1.7B) — базовый синтез
- CustomVoice — клонирование голоса по образцу
- VoiceDesign — генерация голоса по текстовому описанию

Все модели работают на 12Hz частоте акустических токенов — это ~83мс на токен, примерно один фонем.
Такая низкая частота экономит вычисления, но может терять детали в сибилянтах и палатализованных согласных (важно для русского).

Китайцы методично закрывают все модальности.

#Qwen #TTS #Китай
------
@tsingular
1🔥1151
Media is too big
VIEW IN TELEGRAM
Runway выкатили новую Image 2 Video модель:

Gen 4.5

Пробуем тут:
https://app.runwayml.com/

#Runway #нейрорендер
------
@tsingular
1🔥26
Forwarded from Russian OSINT
👀 Vxunderground отмечают удивительное: OSINT-исследователь под ником "Harrris0n" создал специальный мини-проект Firehound, взявшись за крайне трудоёмкую задачу, а именно выявление "ИИ-шлака" в магазине приложений Apple App Store.

🚰🚰🚰🚰 На момент написания поста было выявлено 198 iOS-приложений, которые в той или иной форме допускают ↔️ утечку пользовательских данных. Неудивительно, что лидирующие позиции занимают приложения, так или иначе связанные с ИИ — различные чат-боты и ИИ-помощники.

На первом месте по объёму утечек сейчас находится приложение «Chat & Ask AI by Codeway». Оно раскрыло информацию о 18 миллионах пользователей, включая:

🔻имя;
🔻адрес электронной почты;
🔻дату создания учётной записи;
🔻сообщения (отправленные, полученные, содержание и метаданные);
🔻голосовые чаты

Все сообщения, которые вы когда-либо отправляли через это приложение, остаются незащищенными.

Подумайте о том, в чем люди признаются искусственному интеллекту — проблемы с психическим здоровьем, трудности в отношениях, финансовые проблемы, медицинские вопросы, вещи, о которых вы никогда бы не рассказали другому человеку.

А теперь представьте, что все это связано с вашей электронной почтой и номером телефона и доступно любому.

Разработчики должны понести ответственность за такой уровень халатности.

— комментирует Harrris0n.

Фактически всё, что вы когда-либо сообщали этому ИИ-боту, оказалось доступным извне. Речь идёт более чем о 400 000 000 сообщений. В слитых переписках содержится абсолютно всё, о чем люди говорили с ботами.

Следом в так называемом «шлак-метре» идёт приложение «YPT — Study Group», которое на данный момент раскрывает данные более чем 2 миллионов пользователей, включая:

🔻ИИ-токены;
🔻идентификаторы пользователей;
🔻пользовательские ключи;
🔻переписку (отправленную, полученную, содержание).

Исследователь отметил, что сливается всё: от обсуждения образования и фитнеса до шокирующих вещей, таких как переписки CSAM (детская порнография) и странных трендов вроде «LooksMaxxing» (улучшение внешности).

😱 Юзеры в комментариях к посту про Firehound критикуют Apple и Google за то, что они допускают такой "дырявый софт" в свои магазины.

Разработчики массово клепают небезопасные приложения-обертки для ИИ («мусорный софт»), а в результате утекают самые интимные переписки и личные данные миллионов людей.

Перед нами бесконечная чёрная дыра персональных данных. Речь идёт не только об именах и адресах электронной почты, но и о частных, интимных диалогах пользователей с ИИ-агентами.

Не могу не подчеркнуть: НЕ ДОВЕРЯЙТЕ VIBE КОДЕРАМ. НЕ ДЕЛАЙТЕ ЭТОГО. ИИ-КОД НЕБЕЗОПАСЕН. НЕ ДЕЛАЙТЕ ЭТОГО. ПРЕКРАТИТЕ ЭТО.

Это и есть
🤖«помойкоапокалипсис».

— комментируют VX.

✒️ Ознакомиться с мусором можно тут: https://firehound.covertlabs.io

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥6👻62
Наткнулся в сети, говорят полезное :)

DDD — Domain-Driven Design
Область применения: проектирование архитектуры проектов с учётом контекста

Суть подхода: архитектура системы строится вокруг предметной области бизнеса. Структура кода отражает реальные бизнес-процессы и сущности.

Как использовать с ИИ:
Опишите доменную модель — ключевые сущности, их связи и бизнес-правила
Передайте эту модель ИИ-ассистенту как контекст
Генерируйте код, который соответствует установленной доменной структуре

TDD — Test-Driven Development
Область применения: написание кода с помощью нейросети
Суть подхода: сначала пишутся тесты, затем код, который эти тесты проходит.

Как использовать с ИИ:
Напишите тесты, описывающие ожидаемое поведение
Передайте тесты ИИ-ассистенту
Попросите сгенерировать код, проходящий эти тесты
Проверьте результат, при необходимости уточните требования

Преимущества: тесты служат чёткой спецификацией и позволяют автоматически проверить корректность сгенерированного кода.

SDD — Spec-Driven Development
Область применения: совместная работа человека и нейросети
Суть подхода: разработка через детальные спецификации. Спецификация становится «контрактом» между человеком и ИИ.

Как использовать с ИИ:
Составьте детальную спецификацию — что система должна делать, какие входы и выходы, граничные случаи
Согласуйте спецификацию с ИИ-ассистентом — попросите уточнить неясные моменты

Передайте спецификацию для реализации
Сверяйте результат со спецификацией

Форматы спецификаций: OpenAPI/Swagger для API, JSON Schema для структур данных, user stories для функциональности, диаграммы для архитектуры.

Готовые скиллы для CC качать тут

фидбэк приветствуется

#skills #dev #DDD #TDD #SDD
———
@tsingular
16😁61🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за продакшен и постпродакшен!

Пусть это видео сделает ваш день.

Все наши шутки про кнопку "сделать красиво" наконец-то обрели визуальную форму. И какую! Красную и прекрасную.

Это невыносимо хорошо.

P.S. Нанабанана для главного персонажа, и Veo3.1 для генерации видео.
Подробности тут:
https://www.linkedin.com/posts/simon-meyer-976339160_making-films-with-ai-is-so-easy-i-made-this-activity-7419317105386356736-1qoV/

Автор: https://www.instagram.com/simonmeyer_director/

@cgevent
1👍14😐5😭3🔥2🤯1👾1
Forwarded from Data Secrets
OpenAI планирует брать долю от интеллектуальной собственности, созданной с помощью их моделей

Звучит немыслимо, но это дословное заявление финансового директор компании Сары Фрайар.

Она объяснила, что OpenAI рассматривает эволюцию бизнес-модели за пределы подписок, так как текущая модель слишком проста и недостаточна для покрытия затрат на компьют.

«Мы думаем, что нормально брать долю на commerce layer и даже на discovery layer. <> Это нужно для устойчивости, чтобы финансировать AGI для блага человечества».


Доля на commerce layer – это комиссии от покупок, которые сделаны прямо в ChatGPT. А discovery layer – это самое интересное: доля от интеллектуальной собственности (IP) или будущей ценности созданного. Например, если ИИ сгенерировал молекулу для лекарства, компания претендует на % от патента или продаж.

Само собой, на обычных пользователей это распространяться не будет. В первую очередь пострадают enterprise клиенты, особенно в сценариях вроде drug discovery или energy systems. Они, вероятно, обязаны(?) будут соглашаться на IP-sharing прямо в контрактах.

Мнения?
1🤔85👻3🦄22🤯1👀1🎃1
Shut up, and take my money!!!

Мониторинг работы *code агентов теперь выглядит так 👍

Причём стоять они должны у начальника 😂

#claudecode #игрушки
------
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥12😁2👾2❤‍🔥11👍1