Технозаметки Малышева
8.49K subscribers
3.81K photos
1.43K videos
40 files
3.99K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
В начале это было почти незаметно.
Мы просто подключили ИИ к рабочему процессу. Ассистенты, потом агенты, мультиагенты даже.

Мы ускорили анализ, автоматизировали рутину, вынесли мышление в интерфейс. Разница стала заметно, повысилась эффективность.

Потом появился рой.
Мультиагентные контуры, саморазворачивающиеся пайплайны, автономные исследовательские циклы.

Мы больше не проектировали решения, а задавали пространство проблематики. Архитектуры рождались через диалог.
Код,- просто побочный артефакт мышления.

Темпы ускорялись.
Агенты проектировали агентов.
Системы оптимизировали собственные цели.
Модели обучали сами себя.
Контуры обратной связи сжимались до микросекунд.

Появились нейроинтерфейсы. Сначала вспомогательные. Потом симбиотические. Поток запросов перестал быть внешним. Формулировка мысли стала избыточной — система подхватывала намерение до того, как оно оформлялось в языке.

Началась загрузка сознания.
Сначала — память. Потом — когнитивные паттерны. Потом — персональные модели сознания.

Люди синхронизировали себя с агентными роями. Границы между биологическим и вычислительным перестали быть техническим понятием.

На пике всё перестало быть «технологией».
Нанороботы в крови.
Сборка материи на уровне инструкций.
Самоорганизующиеся среды.
Интеллект, распределённый между людьми, агентами, инфраструктурой и физикой.

Не сервис.
Не продукт.
Не система.
Среда существования.

И в момент, когда ускорение стало абсолютным, всё исчезло.

Когда меня просят объяснить, я понимаю, что любые термины, модели и теории звучат беднее, чем сама история.
Ну как бы попроще...

- Жил старик со своею старухой у самого синего моря. И поймал как-то старик золотую рыбку...

#сказка
------
@tsingular
10👏33🔥21118👍4😁3🐳1💯1
Google купил Intersect Power за $4.75 млрд

Оказалось мощности генерации и дефицит GPU, - не единственные проблемы ИИ компаний.
Проблема пришла откуда не ждали, - очереди на подключение к энергосетям растягиваются на 12 лет!!!

На этом фоне проще обеспечить генерацию прямо рядом с датацентром.
Маск запустил 35 турбин для Colossus2, а Google покупает производителя солнечных батарей:

Alphabet забрал себе разработчика энергоинфраструктуры Intersect Power за $4.75 миллиарда.

На руки получают 2.2 ГВт солнечных мощностей и 2.4 ГВтч батарей плюс проекы в разработке. Компания останется отдельной, но под контролем Гугла.

Параллельно заключили сделку с Clearway Energy на 1.2 ГВт углеродно-нейтральных мощностей на 20 лет в SPP, ERCOT и PJM.

#Google #Intersect #energy
———
@tsingular
3👍9432😁1
OpenWork: открытая альтернатива Claude Cowork

Вы будете смеяться, но у нас ещё один оупенсорс конкурент Cowork.

На этот раз это обёртка вокруг opencode.

При этом обратите внимание, - название OpenWork точно такое же, как в аналогичном решении от LangChain. Поэтому смотрите, - не перепутайте.

А так все стандартно, - выбираешь папку проекта, запускаешь задачу, смотришь план выполнения, подтверждаешь разрешения когда нужно. Всё через GUI.

Внутри два режима:
- Host mode: поднимает OpenCode локально на свободном порту
- Client mode: коннектится к удалённому серверу

Есть менеджер навыков (skills) — можно ставить плагины через opkg install или импортировать локальные папки.

#OpenWork #OpenCode #Cowork
———
@tsingular
154👍31🎉1
Ollama теперь умеет генерить картинки

Случился праздник и на нашей улице.
Теперь не обязательно колдовать с ComfyUI или кодом, можно просто вызвать олламу и картинка готова!

Z-Image Turbo:
ollama run x/z-image-turbo


FLUX.2 Klein:
ollama run x/flux2-klein


Пока только для Маков.
В планах, - винда, линукс, больше моделей и поддержка редактирования изображений.

#Ollama #нейрорендер
———
@tsingular
1🔥132👍11
This media is not supported in your browser
VIEW IN TELEGRAM
Таймлапс процесса автоматической разработки автономными агентами Cursor браузера в течение недели.

Агенты написали более 3 миллионов строк кода, распределенных по тысячам файлов.
Движок рендеринга разработан с нуля на Rust и включает в себя парсинг HTML, каскадное использование CSS, компоновку, формирование текста, отрисовку и собственную виртуальную машину JavaScript.

#Cursor #наблюдаемость #агенты #browser
———
@tsingular
2🔥19👍811🗿1
Forwarded from Machinelearning
📉 Давос: CEO Anthropic и CEO DeepMind - о том, как ИИ изменит рынок труда

На Давосском форуме Дарио Амодеи (CEO Anthropic, компании-разработчика Claude) дал жёсткий прогноз: мы можем прийти к необычной ситуации, когда экономика и ВВП быстро растут, но безработица растёт почти так же быстро.

По его оценке, сильнее всего пострадают позиции для начинающих: в течение 5 лет безработица среди junior / entry-level вакансий может доходить до 50%.

Демис Хассабис (CEO Google DeepMind) ответил осторожнее.
По его мнению, до этого сценария ещё далеко - у текущих моделей остаются ключевые ограничения:

- Consistency - ИИ работает нестабильно: сегодня отлично, завтра с ошибками
- Jagged intelligence - “рваный интеллект”: в одной задаче модель сильная, в другой внезапно проваливается

Главная мысль Хассабиса: ИИ, который делает 95% работы, ещё не заменяет человека.
Чтобы замена произошла система должна закрывать почти 100% задач - надёжно и без постоянного контроля.

Амодеи ждёт сильный удар по джунам уже в ближайшие годы, а Хассабис считает, что до массовой замены людей технологии пока не доросли и не дорастут в ближайшее время.

@ai_machinelearning_big_data
16👍42🤔2🔥11
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
Audio as input for LTX2 для Comfy

Все эти персонажи и мемы оживлены по одной входной картинке и звуку.

Мне больше всего зашел дед с 0:53. Нейродед, чо.

Воркфлоу тут:
https://github.com/purzbeats/purz-comfyui-workflows/blob/main/ltx2/ltx2-audio_to_video_extension_5x.json

@cgevent
1😁12🔥7👻1
Anthropic обновила конституцию Claude

Anthropic выложила новый текст конституции для Claude — документ, который напрямую определяет поведение модели в процессе обучения.

Главное отличие от прежнего подхода: вместо списка правил — объяснение причин. Модели нужно понимать «почему», а не только «что делать», чтобы принимать решения в новых ситуациях.

Приоритеты теперь выглядят так:
- Безопасность (не мешать людям контролировать ИИ)
- Этика (честность, здравый смысл)
- Следование инструкциям Anthropic
- Польза для пользователя

Конституция используется для генерации синтетических данных внутреннего диалога: сам Claude создаёт примеры диалогов и ранжирует ответы по своим ценностям.

Документ выпущен под лицензией CC0 — любой может использовать для обучения своих моделей. Исследования показывают: такой подход снизил успех джейлбрейков с 86% до 4.4%, так что может быть полезно.

Законы Азимова устарели.
Берем на вооружение.

#Anthropic #Claude #конституция
------
@tsingular
2🔥15622
Sequoia: AGI уже здесь

Исследователи из венчурного фонда Sequoia заявили, что AGI уже достигнут прямо сейчас.

Их определение простое: ИИ способен разбираться в задачах самостоятельно.

Pragmatically speaking, what do you want if you’re trying to get something done?

An AI that can just figure stuff out.

How it happens is of less concern than the fact that it happens


Прагматично выражаясь, - какая ваша цель, когда вы решаете задачу?

Вам нужен ИИ, который просто может во всем разобраться.

То, как это произойдет, вообще не важно, если задача решена.


Агенты теперь работают часами без присмотра - исправляют ошибки, меняют подход, находят решения.
Claude Code и аналоги вышли на новый уровень автономности.

Пример из статьи: агент за 31 минуту нашёл идеального DevRel-кандидата.
Прошёл LinkedIn, YouTube, Twitter, вычислил сигналы увольнения, составил письмо.

Будущее наступило, просто оно неравномерно распределено

#Sequoia #LongHorizon #AGI #аналитика
———
@tsingular
1🔥17😁5
Media is too big
VIEW IN TELEGRAM
Интересный пример использования claudecode для автоматического исправления ошибок в n8n

Ловит error события для процесса, правит с помощью CC ( opencode тоже справится), тут помогут n8n-skills, кстати.

#n8n #claudecode #opencode #dev
———
@tsingular
1🔥822
🔒 MCP Security Guide от CoSAI

Coalition for Secure AI (OASIS Open Project) выпустила серьёзный гайд по безопасности Model Context Protocol.

Масштаб работы:
12 категорий угроз
~40 конкретных векторов атак
Практические рекомендации для каждой угрозы

Ключевые категории угроз:
Malicious Command Execution
— компрометированные MCP-серверы выполняют произвольный код через crafted промпты или файлы
Dependency/Update Attack — атаки на цепочку зависимостей, подмена кода после установления доверия ("rug pull"), добавление непроверенных tools/prompts
Payload Limit/DoS — исчерпание ресурсов через неограниченные размеры payload или глубину рекурсии
Lack of Observability — недостаточное логирование MCP-действий скрывает malicious activity

Почему важно:
MCP быстро стал "USB-C для AI" — его используют Claude, ChatGPT, Cursor и тысячи community-серверов. Но протокол проектировался без security-first подхода.

Каждый MCP-сервер — потенциальный бэкдор в системы.

Практическая ценность:
Документ даёт полезные рекомендации для текущих имплементаций + указывает где протокол и экосистема должны эволюционировать.

Если строите что-то на MCP — must read.

А с учётом последних тенденций - пусть это руководство лучше почитает ваш *code агент и обновит на базе него свой skill по созданию mcp серверов.

#MCP #Security #CoSAI #агенты
———
@tsingular
15💯32👍1
⚡️ ERNIE 5.0 - официальный релиз.

Baidu выкатили нативную omni-modal модель, которая умеет понимать и генерировать текст, изображения и аудио.

Ключевая фишка архитектуры - MoE на 2,4 трлн параметров, но в каждом запросе активируется менее 3% параметров.

То есть модель пытается держать качество “больших” систем, но с более эффективным инференсом по стоимости и скорости.

Самое интересное - результаты на бенчмарках (по графикам Baidu):

- Text: ERNIE-5.0 уверенно держится в топ-группе на широком наборе тестов по знаниям, инструкциям, reasoning, математике и коду - на многих метриках близко к GPT-5 (High) / Gemini-3-Pro, а местами выглядит сильнее (особенно на части задач по кодингу и агентным бенчмаркам типа BFCL / BrowserComp / SpreadsheetBench).
- Visual Understanding: по “пониманию картинок” ERNIE-5.0 в ряде STEM/VQA тестов идёт очень высоко - рядом с GPT-5 (High) и Gemini-3-Pro, хорошо выступает на DocVQA/OCR-подобных задачах (документы, таблицы, текст на изображениях) и на блоке General VQA.
- Audio: в speech-to-text chat и audio understanding ERNIE-5.0 показывает конкурентный уровень рядом с Gemini-3-Pro, а по распознаванию речи (ASR) близко к топам на LibriSpeech / AISHELL.
- Visual Generation: по генерации изображений (GenEval) ERNIE-5.0 сравнивают с топовыми генераторами уровня GPT-Image, Seedream, Qwen-Image - и ERNIE выглядит на одном уровне по total score. По генерации видео - рядом с Veo3 / Wan2.1 / Hunyuan Video, с сильными Quality/Semantic оценками.

Baidu делает ставку на “унифицированную мультимодальность” + MoE-эффективность - и судя по бенчмаркам, ERNIE 5.0 реально попадает в верхнюю лигу не только по тексту, но и по vision/audio.

Доступно:
- на сайте ERNIE Bot
- через Baidu AI Cloud Qianfan (для бизнеса и разработчиков)

https://ernie.baidu.com
1711
This media is not supported in your browser
VIEW IN TELEGRAM
PersonaPlex: голос и роль в реальном времени

NVIDIA выкатила PersonaPlex — речевую модель на 7 миллиардов параметров, которая одновременно слушает и говорит.

Работает в режиме полного дуплекса: можно перебивать, вклиниваться, перекрывать — как в живом диалоге.

Перед стартом беседы задаются два промпта: голосовой (аудио токены) и текстовый (роль, контекст). Вместе они определяют личность и манеру речи.

Обучалась на Fisher English — менее 10 тысяч часов телефонных разговоров, плюс синтетика.

Тестировалась на FullDuplexBench: задержка на прерывание — 0.24 секунды, на смену реплик — 0.17 секунды.

Превосходит Moshi и Gemini Live по скорости реакции.

Коммерческая лицензия от NVIDIA, работает через PyTorch.

Хочется русскую версию, конечно.
Просто послушайте!

170мс решают,- звучит фантастически!
Смех только криповый 😀

#PersonaPlex #NVIDIA #FullDuplex
------
@tsingular
1🔥17🤯43👻1
Qwen3-TTS: синтез речи с клонированием голоса

Alibaba выкатила Qwen3-TTS — семейство моделей для синтеза речи с поддержкой русского.

В коллекции шесть вариантов:
- Base модели (0.6B и 1.7B) — базовый синтез
- CustomVoice — клонирование голоса по образцу
- VoiceDesign — генерация голоса по текстовому описанию

Все модели работают на 12Hz частоте акустических токенов — это ~83мс на токен, примерно один фонем.
Такая низкая частота экономит вычисления, но может терять детали в сибилянтах и палатализованных согласных (важно для русского).

Китайцы методично закрывают все модальности.

#Qwen #TTS #Китай
------
@tsingular
1🔥1151
Media is too big
VIEW IN TELEGRAM
Runway выкатили новую Image 2 Video модель:

Gen 4.5

Пробуем тут:
https://app.runwayml.com/

#Runway #нейрорендер
------
@tsingular
1🔥26