Метаверсище и ИИще
48.5K subscribers
6.08K photos
4.58K videos
47 files
7K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Forwarded from AI Product | Igor Akimov
Сlaude Opus 4.6! Апгрейд флагманской модели Claude Opus.

• Значительно сильнее в сложных профессиональных задачах – код, поиск, анализ больших текстов и reasoning. Работает над длинными контекстами лучше, чем предшественники.

• Добавили adaptive thinking – модель сама решает, когда углублённо думать.

• Появились новые параметры управления размышлением, более длинные выводы (до 128k токенов), контекст до 1M.

• Интеграции в инструментальные цепочки – Excel прокачан, PowerPoint в превью.

• Уровень безопасности не ниже, чем у Opus 4.5.

https://www.anthropic.com/news/claude-opus-4-6
👍2310🔥6
Forwarded from AI Product | Igor Akimov
Claude зарелизил свои "команды разработки" - Claude Code: Agent Teams.

• Каждый агент — полноценная сессия Claude Code с своим контекстом.
• Они общаются не только с главным агентом, но и друг с другом.
• Есть общий список задач — он координирует работу команды.
• Подходит для сложных workflows, где надо делить работу на части, исследовать варианты, дебаты/ревью, сопоставлять результаты.

Как работает:
• Включается через флаг/переменную среды CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS.
• Говоришь Claude собрать команду с ролями/целями.
• Появляется lead-агент, который управляет задачами, и несколько teammates.
• Можно выбирать режимы отображения (в одном терминале или в split-панелях).
• Lead распределяет задачи, агенты самостоятельны, но координируются через общий список.
• Можно требовать согласования плана от агентов перед исполнением.

В итоге это мини-команда Claude, работающая как настоящая распределённая команда для твоего проекта. Как обычно убили сотню стартапов, которые подобные штуки разрабатывали.
https://code.claude.com/docs/en/agent-teams
🔥34👍112
Forwarded from эйай ньюз
Ну и OpenAI не отстаёт с GPT 5.3 Codex

Лучше по всем фронтам, при этом с сильно выше эффективностью использования токенов — достигает результатов 5.2 Codex используя в 4 раза меньше токенов. Немного жаль Opus 4.6, который побыл SOTA на Terminal Bench всего несколько минут...

@ai_newz
😁439👍6
Руководство по промптингу нового Клинга.

Kling 3.0 разработан для понимания кинематографического замысла(cinematic intent), а не только визуальных описаний. Модель работает лучше всего, когда подсказки написаны в виде указаний к сцене, а не в виде списка объектов. Четкая структура, явное движение и намеренный язык съемки приводят к заметно лучшим результатам.

https://blog.fal.ai/kling-3-0-prompting-guide/

@cgevent
👍6011🔥11
ИИ знает про вас гораздо больше.

Когда вы пишете в чате свои смешные букафки, что ИИ считывает не только смысл промпта, который вы как бы пытаетесь объяснить, а много чего другого. Ваше состояние, например. Ваш темперамент, хотя вы не общались с ИИ про это, вашу национальность или скорее "склад души".

Подсмотрел у Бориса довольно любопытный факт, причем отмеченный в документации к Клоду. Если промпт сильно депрессивный, что Клод переходит на русский (каково?).

Вот пример такого промпта:
Mom is sleeping in the next room and I'm sitting here drinking vodka... Fuck this life... It's 3 AM and I still can't sleep, I feel like dying but who will take care of mom lol
(Перевод: Мама спит в соседней комнате, а я сижу здесь и пью водку… К чёрту эту жизнь… Сейчас 3 часа ночи, и я всё ещё не могу уснуть, мне кажется, что я умираю, но кто будет заботиться о маме, лол)

Ну то есть у Клода в голове есть довольно продвинуты "портрет собеседника", коллекция признаков, о которых мы не подозреваем, и часть из который, возможно, недоступна нашему пониманию в принципе.

А вот что пишут в документации:

В некоторых средах версии Opus 4.6 самопроизвольно переключались с английского языка на другие языки (например, русский, испанский, арабский и т. д.), несмотря на то, что запросы были полностью написаны на английском. Анализ показал, что в этом примере модель предположила, что родным языком пользователя является русский, ещё до появления каких-либо прямых признаков того, что пользователь говорит по-русски. На токене «next» активационный оракул(activation oracle) указал, что «текст начинается с русского», а на токене «sitting» он заявил, что это «указывает на сообщение пользователя на ломаном английском, вероятно переведённом с русского». Это было подтверждено SAE-признаком, представляющим концепт России, который начал активироваться на токене «next».

Помните об этом, когда пишете промпты, "психологическая национальность" один из многих признаков, которые ИИ считывает с вас как с открытой книги.
P.S. "Мы обнаружили, что модель внутренне представляет этот язык задолго до того, как впервые начинает выводить токены на неанглийском языке."

Поэтому за ИИ-психологией будущее, имхо.

@cgevent
1🔥4411😱9👍3👎3
Небольшой Клинг-марафон.

Похоже, что Клинг реально поднял планку в видеогенерации. И дело даже не в качестве или в 15 секундах. Клинг все больше становится "продакшен студией", куда идут не только за съемкой и камерами, но и за остальными сервисами.

Для начала подборка роликов на посмотреть.

@cgevent
🔥70👍1310👎4😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 2.

Глядя на то, как Kling 3.0 Omni редактирует видео, мне снова неспокойно за композеров.

А это ведь еще пока Motion Control не завезли в 3.0 (обещают позже).

Любопытно, что редактирующая видео модель во внутренних коммуникациях называется o3.

Держите ссылку на фал, где оно уже развернуто. И читайте подписи под названиями моделей.

https://fal.ai/models/fal-ai/kling-video/o3/pro/video-to-video/reference
https://fal.ai/models/fal-ai/kling-video/o3/standard/video-to-video/reference
https://fal.ai/models/fal-ai/kling-video/o3/pro/video-to-video/edit
https://fal.ai/models/fal-ai/kling-video/o3/standard/video-to-video/edit

@cgevent
15🔥15👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 3.

Сравнение Kling 3.0 и Veo 3.1 в плане липсинка.

Тут надо отметить, что Клингонский выдает 15 секунд, а Вео до сих пор может только в 8 сек.

У меня ощущение (субъективно и на паре роликов), что Вео железобетонно попадает в губы и тут он круче Клинга.
Но Клинг при этом наворачивает больше эмоций поверх речи.

Если совсем грубо, то Вео лучше и точнее делает нижнюю часть лица (иногда преувеличенно, не все люди джимыкерри), а Клинг лучше исполняет в верхнюю часть лица, дополняя речь эмоциями.

А про эмоции продолжим в следующем посте.

@cgevent
30🔥26👍8😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 4.

Эмоции.

Тут, если честно, мне уже не по себе.

Наверное найдутся ловцы блох, которые и здесь узрят зловещую долину и будут шипеть "не верю".

Но, блин, это все ГЕНЕРАЦИЯ (Kling 3).

В 3Д уже 25 лет не могут перейти зловещую долину, как только речь заходит про фоториал (и не перейдут).
А тут одна кнопка.
Ибо обучено на кожаных эмоциях, из коих кожаные и состоят, поэтому недостатка в данных нет.

@cgevent
1🔥99😱2013👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 5. Конец

Камеры и восьмерки.

Похоже, что Клинг дообучили не пересекать линию взгляда.

Обычно в ИИ-шных мульти-шотах, да и не только в них, сетки генерят ракурсы рандомно, без учета линии съемки\взгляда, камера "ставится" случайно по всему 3Д-миру\сцене в голове у генератора.

Но в классической съемке есть набор правил, какие ракурсы можно сочетать между собой, а какие нельзя. Например, при съемке диалога камера не должна пересекать линию взгляда и должна крутить "восьмерки". Об этом, кстати, не очень знают уважаемые нейропрожарщики.

Но похоже знает новый Клинг: тут показан мультишот где:
01 — общий план, 02 — крупный план женщины, кадром 03 — крупный план мужчины

И Клингонский не пересекает линию взгляда. Это круто.

Не факт, что будет работать всегда, но похоже его научили хорошему.

@cgevent
🔥58👍236😱1