Технозаметки Малышева

В начале это было почти незаметно.
Мы просто подключили ИИ к рабочему процессу. Ассистенты, потом агенты, мультиагенты даже.

Мы ускорили анализ, автоматизировали рутину, вынесли мышление в интерфейс. Разница стала заметно, повысилась эффективность.

Потом появился рой.
Мультиагентные контуры, саморазворачивающиеся пайплайны, автономные исследовательские циклы.

Мы больше не проектировали решения, а задавали пространство проблематики. Архитектуры рождались через диалог.
Код,- просто побочный артефакт мышления.

Темпы ускорялись.
Агенты проектировали агентов.
Системы оптимизировали собственные цели.
Модели обучали сами себя.
Контуры обратной связи сжимались до микросекунд.

Появились нейроинтерфейсы. Сначала вспомогательные. Потом симбиотические. Поток запросов перестал быть внешним. Формулировка мысли стала избыточной — система подхватывала намерение до того, как оно оформлялось в языке.

Началась загрузка сознания.
Сначала — память. Потом — когнитивные паттерны. Потом — персональные модели сознания.

Люди синхронизировали себя с агентными роями. Границы между биологическим и вычислительным перестали быть техническим понятием.

На пике всё перестало быть «технологией».
Нанороботы в крови.
Сборка материи на уровне инструкций.
Самоорганизующиеся среды.
Интеллект, распределённый между людьми, агентами, инфраструктурой и физикой.

Не сервис.
Не продукт.
Не система.
Среда существования.

И в момент, когда ускорение стало абсолютным, всё исчезло.

Когда меня просят объяснить, я понимаю, что любые термины, модели и теории звучат беднее, чем сама история.
Ну как бы попроще...

- Жил старик со своею старухой у самого синего моря. И поймал как-то старик золотую рыбку...

#сказка
------
@tsingular

10👏33🔥21❤11✍8👍4😁3🐳1💯1

4.8K viewsedited 04:31

Технозаметки Малышева

Google купил Intersect Power за $4.75 млрд

Оказалось мощности генерации и дефицит GPU, - не единственные проблемы ИИ компаний.
Проблема пришла откуда не ждали, - очереди на подключение к энергосетям растягиваются на 12 лет!!!

На этом фоне проще обеспечить генерацию прямо рядом с датацентром.
Маск запустил 35 турбин для Colossus2, а Google покупает производителя солнечных батарей:

Alphabet забрал себе разработчика энергоинфраструктуры Intersect Power за $4.75 миллиарда.

На руки получают 2.2 ГВт солнечных мощностей и 2.4 ГВтч батарей плюс проекы в разработке. Компания останется отдельной, но под контролем Гугла.

Параллельно заключили сделку с Clearway Energy на 1.2 ГВт углеродно-нейтральных мощностей на 20 лет в SPP, ERCOT и PJM.

#Google #Intersect #energy
———
@tsingular

3👍9✍4⚡3❤2😁1

1.74K views05:33

Технозаметки Малышева

OpenWork: открытая альтернатива Claude Cowork

Вы будете смеяться, но у нас ещё один оупенсорс конкурент Cowork.

На этот раз это обёртка вокруг opencode.

При этом обратите внимание, - название OpenWork точно такое же, как в аналогичном решении от LangChain. Поэтому смотрите, - не перепутайте.

А так все стандартно, - выбираешь папку проекта, запускаешь задачу, смотришь план выполнения, подтверждаешь разрешения когда нужно. Всё через GUI.

Внутри два режима:
- Host mode: поднимает OpenCode локально на свободном порту
- Client mode: коннектится к удалённому серверу

Есть менеджер навыков (skills) — можно ставить плагины через opkg install или импортировать локальные папки.

#OpenWork #OpenCode #Cowork
———
@tsingular

1❤5✍4👍3⚡1🎉1

1.77K viewsedited 05:56

Технозаметки Малышева

Ollama теперь умеет генерить картинки

Случился праздник и на нашей улице.
Теперь не обязательно колдовать с ComfyUI или кодом, можно просто вызвать олламу и картинка готова!

Z-Image Turbo:

ollama run x/z-image-turbo

FLUX.2 Klein:

ollama run x/flux2-klein

Пока только для Маков.
В планах, - винда, линукс, больше моделей и поддержка редактирования изображений.

#Ollama #нейрорендер
———
@tsingular

1🔥13⚡2👍11

1.71K views06:42

Технозаметки Малышева

1:45

This media is not supported in your browser

VIEW IN TELEGRAM

Таймлапс процесса автоматической разработки автономными агентами Cursor браузера в течение недели.

Агенты написали более 3 миллионов строк кода, распределенных по тысячам файлов.
Движок рендеринга разработан с нуля на Rust и включает в себя парсинг HTML, каскадное использование CSS, компоновку, формирование текста, отрисовку и собственную виртуальную машину JavaScript.

#Cursor #наблюдаемость #агенты #browser
———
@tsingular

2🔥19👍8❤1⚡1🗿1

1.9K views07:26

Технозаметки Малышева

Forwarded from Machinelearning

0:49

This media is not supported in your browser

VIEW IN TELEGRAM

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

📉 Давос: CEO Anthropic и CEO DeepMind - о том, как ИИ изменит рынок труда

На Давосском форуме Дарио Амодеи (CEO Anthropic, компании-разработчика Claude) дал жёсткий прогноз: мы можем прийти к необычной ситуации, когда экономика и ВВП быстро растут, но безработица растёт почти так же быстро.

По его оценке, сильнее всего пострадают позиции для начинающих: в течение 5 лет безработица среди junior / entry-level вакансий может доходить до 50%.

Демис Хассабис (CEO Google DeepMind) ответил осторожнее.
По его мнению, до этого сценария ещё далеко - у текущих моделей остаются ключевые ограничения:

- Consistency - ИИ работает нестабильно: сегодня отлично, завтра с ошибками
- Jagged intelligence - “рваный интеллект”: в одной задаче модель сильная, в другой внезапно проваливается

Главная мысль Хассабиса: ИИ, который делает 95% работы, ещё не заменяет человека.
Чтобы замена произошла система должна закрывать почти 100% задач - надёжно и без постоянного контроля.

Амодеи ждёт сильный удар по джунам уже в ближайшие годы, а Хассабис считает, что до массовой замены людей технологии пока не доросли и не дорастут в ближайшее время.

@ai_machinelearning_big_data

1✍6👍4❤2🤔2🔥11

1.75K views11:40

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

1:20

Media is too big

VIEW IN TELEGRAM

Audio as input for LTX2 для Comfy

Все эти персонажи и мемы оживлены по одной входной картинке и звуку.

Мне больше всего зашел дед с 0:53. Нейродед, чо.

Воркфлоу тут:
https://github.com/purzbeats/purz-comfyui-workflows/blob/main/ltx2/ltx2-audio_to_video_extension_5x.json

@cgevent

1😁12🔥7👻1

1.7K views19:26

Технозаметки Малышева

Anthropic обновила конституцию Claude

Anthropic выложила новый текст конституции для Claude — документ, который напрямую определяет поведение модели в процессе обучения.

Главное отличие от прежнего подхода: вместо списка правил — объяснение причин. Модели нужно понимать «почему», а не только «что делать», чтобы принимать решения в новых ситуациях.

Приоритеты теперь выглядят так:
- Безопасность (не мешать людям контролировать ИИ)
- Этика (честность, здравый смысл)
- Следование инструкциям Anthropic
- Польза для пользователя

Конституция используется для генерации синтетических данных внутреннего диалога: сам Claude создаёт примеры диалогов и ранжирует ответы по своим ценностям.

Документ выпущен под лицензией CC0 — любой может использовать для обучения своих моделей. Исследования показывают: такой подход снизил успех джейлбрейков с 86% до 4.4%, так что может быть полезно.

Законы Азимова устарели.
Берем на вооружение.

#Anthropic #Claude #конституция
------
@tsingular

2🔥15✍6❤2⚡2

1.79K views19:50

Технозаметки Малышева

Sequoia: AGI уже здесь

Исследователи из венчурного фонда Sequoia заявили, что AGI уже достигнут прямо сейчас.

Их определение простое: ИИ способен разбираться в задачах самостоятельно.

Pragmatically speaking, what do you want if you’re trying to get something done?

An AI that can just figure stuff out.

How it happens is of less concern than the fact that it happens

Прагматично выражаясь, - какая ваша цель, когда вы решаете задачу?

Вам нужен ИИ, который просто может во всем разобраться.

То, как это произойдет, вообще не важно, если задача решена.

Агенты теперь работают часами без присмотра - исправляют ошибки, меняют подход, находят решения.
Claude Code и аналоги вышли на новый уровень автономности.

Пример из статьи: агент за 31 минуту нашёл идеального DevRel-кандидата.
Прошёл LinkedIn, YouTube, Twitter, вычислил сигналы увольнения, составил письмо.

Будущее наступило, просто оно неравномерно распределено

#Sequoia #LongHorizon #AGI #аналитика
———
@tsingular

1🔥17😁5

1.71K views06:28

Технозаметки Малышева

13:19

Media is too big

VIEW IN TELEGRAM

Интересный пример использования claudecode для автоматического исправления ошибок в n8n

Ловит error события для процесса, правит с помощью CC ( opencode тоже справится), тут помогут n8n-skills, кстати.

#n8n #claudecode #opencode #dev
———
@tsingular

1🔥8❤2✍2

2.04K viewsedited 07:37

Технозаметки Малышева

🔒 MCP Security Guide от CoSAI

Coalition for Secure AI (OASIS Open Project) выпустила серьёзный гайд по безопасности Model Context Protocol.

Масштаб работы:
12 категорий угроз
~40 конкретных векторов атак
Практические рекомендации для каждой угрозы

Ключевые категории угроз:
Malicious Command Execution — компрометированные MCP-серверы выполняют произвольный код через crafted промпты или файлы
Dependency/Update Attack — атаки на цепочку зависимостей, подмена кода после установления доверия ("rug pull"), добавление непроверенных tools/prompts
Payload Limit/DoS — исчерпание ресурсов через неограниченные размеры payload или глубину рекурсии
Lack of Observability — недостаточное логирование MCP-действий скрывает malicious activity

Почему важно:
MCP быстро стал "USB-C для AI" — его используют Claude, ChatGPT, Cursor и тысячи community-серверов. Но протокол проектировался без security-first подхода.

Каждый MCP-сервер — потенциальный бэкдор в системы.

Практическая ценность:
Документ даёт полезные рекомендации для текущих имплементаций + указывает где протокол и экосистема должны эволюционировать.

Если строите что-то на MCP — must read.

А с учётом последних тенденций - пусть это руководство лучше почитает ваш *code агент и обновит на базе него свой skill по созданию mcp серверов.

#MCP #Security #CoSAI #агенты
———
@tsingular

1✍5💯3⚡2👍1

1.73K viewsedited 12:06

Технозаметки Малышева

Forwarded from Анализ данных (Data analysis)

⚡️ ERNIE 5.0 - официальный релиз.

Baidu выкатили нативную omni-modal модель, которая умеет понимать и генерировать текст, изображения и аудио.

Ключевая фишка архитектуры - MoE на 2,4 трлн параметров, но в каждом запросе активируется менее 3% параметров.

То есть модель пытается держать качество “больших” систем, но с более эффективным инференсом по стоимости и скорости.

Самое интересное - результаты на бенчмарках (по графикам Baidu):

- Text: ERNIE-5.0 уверенно держится в топ-группе на широком наборе тестов по знаниям, инструкциям, reasoning, математике и коду - на многих метриках близко к GPT-5 (High) / Gemini-3-Pro, а местами выглядит сильнее (особенно на части задач по кодингу и агентным бенчмаркам типа BFCL / BrowserComp / SpreadsheetBench).
- Visual Understanding: по “пониманию картинок” ERNIE-5.0 в ряде STEM/VQA тестов идёт очень высоко - рядом с GPT-5 (High) и Gemini-3-Pro, хорошо выступает на DocVQA/OCR-подобных задачах (документы, таблицы, текст на изображениях) и на блоке General VQA.
- Audio: в speech-to-text chat и audio understanding ERNIE-5.0 показывает конкурентный уровень рядом с Gemini-3-Pro, а по распознаванию речи (ASR) близко к топам на LibriSpeech / AISHELL.
- Visual Generation: по генерации изображений (GenEval) ERNIE-5.0 сравнивают с топовыми генераторами уровня GPT-Image, Seedream, Qwen-Image - и ERNIE выглядит на одном уровне по total score. По генерации видео - рядом с Veo3 / Wan2.1 / Hunyuan Video, с сильными Quality/Semantic оценками.

Baidu делает ставку на “унифицированную мультимодальность” + MoE-эффективность - и судя по бенчмаркам, ERNIE 5.0 реально попадает в верхнюю лигу не только по тексту, но и по vision/audio.

Доступно:
- на сайте ERNIE Bot
- через Baidu AI Cloud Qianfan (для бизнеса и разработчиков)

https://ernie.baidu.com

1✍7❤1⚡1

1.47K views12:52

Технозаметки Малышева

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

PersonaPlex: голос и роль в реальном времени

NVIDIA выкатила PersonaPlex — речевую модель на 7 миллиардов параметров, которая одновременно слушает и говорит.

Работает в режиме полного дуплекса: можно перебивать, вклиниваться, перекрывать — как в живом диалоге.

Перед стартом беседы задаются два промпта: голосовой (аудио токены) и текстовый (роль, контекст). Вместе они определяют личность и манеру речи.

Обучалась на Fisher English — менее 10 тысяч часов телефонных разговоров, плюс синтетика.

Тестировалась на FullDuplexBench: задержка на прерывание — 0.24 секунды, на смену реплик — 0.17 секунды.

Превосходит Moshi и Gemini Live по скорости реакции.

Коммерческая лицензия от NVIDIA, работает через PyTorch.

Хочется русскую версию, конечно.
Просто послушайте!

170мс решают,- звучит фантастически!
Смех только криповый 😀

#PersonaPlex #NVIDIA #FullDuplex
------
@tsingular

1🔥17🤯4⚡3👻1

1.63K views14:42

Технозаметки Малышева

Qwen3-TTS: синтез речи с клонированием голоса

Alibaba выкатила Qwen3-TTS — семейство моделей для синтеза речи с поддержкой русского.

В коллекции шесть вариантов:
- Base модели (0.6B и 1.7B) — базовый синтез
- CustomVoice — клонирование голоса по образцу
- VoiceDesign — генерация голоса по текстовому описанию

Все модели работают на 12Hz частоте акустических токенов — это ~83мс на токен, примерно один фонем.
Такая низкая частота экономит вычисления, но может терять детали в сибилянтах и палатализованных согласных (важно для русского).

Китайцы методично закрывают все модальности.

#Qwen #TTS #Китай
------
@tsingular

1🔥11✍5⚡1

1.49K views15:01

Технозаметки Малышева

1:08

Media is too big

VIEW IN TELEGRAM

Runway выкатили новую Image 2 Video модель:

Gen 4.5

Пробуем тут:
https://app.runwayml.com/

#Runway #нейрорендер
------
@tsingular

1🔥26

1.56K views15:35

About

Blog

Apps

Platform