эйай ньюз

Яндекс решил зайти со стороны no-code и обновил свою AI Studio (не путать с aistudio.google.com). По сути, это платформа, которая позволяет собирать AI-агентов для автоматизации рутины почти без навыков разработки. Под капотом — поддержка мультиагентных сценариев, AI Search (RAG) для работы с документами и поиска в интернете, realtime API для генерации ответа в режиме реального времени и возможность интеграции с внешними сервисами через MCP Hub. Говорят, любая компания может создать в нем шаблон для подключения к своим сервисам по MCP, чтобы все остальные могли быстро подключить к ним своих агентов.

Главная идея здесь в том, чтобы дать инструмент напрямую сотрудникам. Тот же бухгалтер сможет использовать агента для рутинного составления отчётов, значительно повысив личную продуктивность. Но пока, чтобы запустить агента, все равно нужен разработчик, который сможет интегрировать его в условный Telegram-бот. На практике, конечно, главный барьер — не технология, а люди. Не все бухгалтеры готовы переходить на нейросети и скорее предпочтут сделать всё по старинке.

А те, кто шарит, могут и кодом всё написать. Хотя, в теории no-code визуализирует пайплайн и берет на себя ту часть работы, где ты вручную вводишь текст в IDE, плюс вайбкодерам его легче редактировать, что теоретически ускоряет разработку и понижает порог входа. Собрать такую тулу под себя с нуля всё равно сложно.

@ai_newz

3😁125❤47👍36🫡9🔥4

29.4K views11:26

эйай ньюз

K2 Vendor Verifier

Команда Kimi решила протестить разных вендоров своей модели на точность тулюза. Каждому провайдеру дают 2 тысячи одинаковых запросов и сравнивают результаты с официальным API. Результаты вышли не очень — у всех протестированных 3rd party провайдеров заметные проблемы. К сожалению, Groq, самого интересного провайдера K2 не затестили.

Подобные тесты уже делали Artificial Analysis с gpt-oss, и обнаружили пропасть между провайдерами по результатам бенчей. Пора делать такие тесты повсеместными для всех моделей и провайдеров, иначе баги инференса будут и дальше тихо портить всем жизнь.

https://github.com/MoonshotAI/K2-Vendor-Verfier

@ai_newz

❤72👍41🔥9😱5😁2

26K views13:49

Suno V5 + Suno Studio — RIP Mozart AI

Недавно я писал про Mozart AI, которые пытались сделать AI DAW (Digital Audio Workstation) для музыкантов. Но их продукт, как многие заметили в комментариях, всё ещё сырой. И вот пришёл гигант — Suno (по моему мнению, лучший, лучше чем Udio), выкатил свою новую SOTA-модель V5 и сразу же полноценную Studio-версию. И просто решил все проблемы.

По сути, это всё, что обещал Mozart AI, но уже реализованное и с новыми фичами. Главная из них — можно напеть мелодию, а затем превратить её в отдельную дорожку (stem), как на 10:25.

Что это даёт? Дикий контроль. Теперь продюсер, имея один только ноутбук, может получить реалистичную аудиозапись инструмента, а не MIDI-болванку. Причём со всеми нюансами, которые невозможно запрограммировать: реалистичной динамикой, звуком удара медиатора по струнам или шорохом пальцев гитариста по грифу, и всё это в «комнате» с её естественным эмбиенсом.

Профессионалы, конечно, не будут использовать Suno Studio как основную DAW, но как генератор стемов — это геймченджер.

Многие боятся, что генеративная музыка захламит чарты AI-слопом (треть новой музыки на стримингах уже сгенерирована). Но я думаю, что именно эта технология сделает музыку только лучше. Теперь вместо стерильных, запрограммированных в MIDI инструменталов можно будет генерить реалистичные аудиодорожки, что только поднимет общее качество продакшена.

V5 доступна пока только по подписке. Suno Studio — на тире Premier, но сейчас есть скидка: $15 в месяц на первые 3 месяца вместо $30.

@ai_newz

2🔥158👍50❤40🦄7😁3💔2

30.2K views18:57

эйай ньюз

Нейродайджест за неделю (#88)

LLM
- DeepSeek V3.1 Terminus — Вероятно, последний релиз в линейке V3. Выросла по агентским бенчам. Ждём V4 в ближайшие недели.
- ChatGPT Pulse — ChatGPT теперь может проактивно ресёрчить важные для вас темы и выдавать отчёт каждое утро.
- K2 Vendor Verifier — у всех сторонних провайдеров заметные проблемы с точностью.

Генеративные модели
- Kling 2.5 Turbo — Новая версия китайской видеомодели бросает вызов Veo 3. Физика и понимание промпта на уровне, близком к SOTA.
- Suno V5 + Suno Studio — Suno выкатили SOTA-модель и полноценную AI DAW. Главная фича — превращение напетой мелодии в инструментальную дорожку.

Робототехника
- Робот-кунгфуист — Новый гуманоид Unitree G1 от китайцев с улучшенной стабильностью. Быстро встаёт после ударов. Следующий шаг — научиться бить в ответ.

> Читать дайджест #87

#дайджест
@ai_newz

1❤28🔥16👍7⚡5🦄1

24.7K views07:07

эйай ньюз

Bitter Lesson снова в деле. Это главная мысль из доклада Дмитрия Иванова (Yandex B2B Tech) с big tech night. Эволюция AI от простых классификаторов к автономным агентам доказывает: вместо того, чтобы вручную тюнить правила, лучше дать системе больше данных, вычислительных мощностей и свободы.

Началось всё с классификаторов intent'ов и жёстких сценариев — система распознавала тип запроса и запускала соответствующий обработчик. Затем пришла эра файнтюнинга: под определенную задачу обучали специализированную модель, оптимизируя метрики месяцами. Сейчас те же задачи решаются промптами к более общим моделям — многостраничные текстовые инструкции определяют логику работы компонентов, от структуры поисковых ответов до выбора контента. Продуктовые гипотезы проверяются правкой текста за минуты вместо долгого переобучения.

Сейчас идёт переход к следующему этапу — когда мы задаем только минимальные ограничения вместо детальных инструкций. Системы получат только правила-запреты и самостоятельно будут выбирать тактику в заданных рамках. Агенты смогут определять последовательность вызова функций, адаптироваться к контексту и непрерывно обучаться на обратной связи. Каждый шаг эволюции увеличивает автономность за счёт снижения явного контроля разработчика (ну и, конечно, за счет того, что модели становятся более способными), причём большая часть этого пути прошла всего за три последних года. Где же мы будем ещё через три?

@ai_newz

👍80😁37❤23🫡7🔥2🤯2💯1

24.7K viewsedited 11:16

эйай ньюз

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

Wan 2.5 — китайский нейрокомбайн с генерацией видео по аудио

Вышла моделька Wan 2.5, продолжение всеми любимой в опенсорсе 2.2 версии.

Можно было бы написать просто про её релиз сразу, но после него выкатили ещё кучу фич. Оказалось, что платформа теперь моделька мультимодальная и чуть ли не единственная в своём роде.

Считайте сами, Wan 2.5 поддерживает вход и выход в следующих форматах: Text, Image, Video, Audio. Только запах осталось добавить. Причём видео и картинки можно редактировать промптом, и, судя по всему, всё это можно комбинировать. Например, только что появилась возможность генерации видео по аудиовходу.

Что это значит? Персонажи и окружение в видео теперь могут двигаться в такт музыке! Ну и нативный липсинк, конечно же.

Кроме того, обновили интерфейс и добавили удобный редактор. Полноценно монтировать там, конечно, не получится, но генерацию в целом это упрощает.

В опенсорс, как и ожидалось, пока не выложили.

Анонс

@ai_newz

👍70🔥44❤19❤‍🔥10😁2🤯1

33.3K views13:58

эйай ньюз

Claude Sonnet 4.5

GPT-5 Codex уже побыла лучшей моделью для кодинга уже целых две недели, так что пришло время для нового лидера. Клода ещё больше прокачали в кодинге и агентных тасках, где видно достаточно сильный прирост по бенчам. Цену сохранили прежнюю, Anthropic всё ещё упорно отказывается сбрасывать цены, в отличие от всех конкурентов.

По заявлениям Anthropic, новый Sonnet может автономно работать над задачей до 30 часов, предыдущий рекорд — 7 часов. Я не уверен как именно это измеряют, поэтому конкретно к этой части отношусь скептично.

Вместе с моделью обновили Claude Code до версии 2.0. Теперь Claude Code делает чекпоинты кодбазы перед каждым изменением, так что их можно легко откатить. Кроме этого обновили интерфейс и сделали расширение для VS Code. И наконец-то добавили возможность видеть оставшиеся лимиты использования моделей.

@ai_newz

👍131🔥64❤33❤‍🔥2🤯2🦄2

42.1K views19:18

эйай ньюз