Метаверсище и ИИще
48.5K subscribers
6.08K photos
4.57K videos
47 files
7K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Буктрейлер. Автор Павел Иевлев (Semiurg)

То, что я хочу показать в "Нейропрожарке", немного необычно для этого паблика, потому что это буктрейлер к книге.

Я писатель-фантаст, возможно кто-то здесь читал мои книги, и с некоторых пор я делаю их иллюстрированными. Собственно, ролик представляет собой анимацию иллюстраций, использованных в книге, никакой специальной отдельной генерации не делалось (в бумажной книге около сотни цветных страниц, что сейчас редкость, а в электронке их еще больше).

На сегодня я оживляю картинки для бумажных версий (по AR-технологии, анимация подтягивается при наведению телефона на картинку), и делаю гиф-анимацию в епабах электронок. Кажется, в мире писателей такой фигней занимаюсь один я, потому что мало кто станет возиться, читателям в целом пофиг.
Это объясняет, почему клип вертикальный - он собирался из анимаций книжных страниц.

Книга "Седьмая мапа" - киберпанк, точнее "Производственный роман о трудовых буднях работников системного администрирования интим-индустрии", эстетика трейлера соответствующая.

Картинки - Midjourney, которой сохраняю верность еще с версии 3, несмотря на то, что перечислять ее недостатки устану. Если надо интересный рисунок, а не убедительный фотофейк, то мидж остается лучшей, хотя иногда неимоверно бесит беспросветным промттупизмом.

Анимация - Grok (до свежей обновы, то есть пятисекундный и плохо умеющий в русский липсинк, поэтому липсинка там нет вообще). Грок... ну, просто у меня есть там подписка и мой впн с ним работает. Наверное, клинг и нанобанана лучше, не пробовал. Мидж сильно хуже (как по мне, вообще зря они полезли на поляну видео, лучше бы научили в картинках пальцы считать наконец).

Музыка - Suno 5. Ну, тут вообще говорить не о чем - а кто ещё-то?

Монтаж CapCut, потому что Мак.

Расходов собственно на буктрейлер ноль, потому что подписки на Грок, Суно и Мидж у меня и так есть, да и картинки делались под книгу. На оживляж и монтаж ушло что-то около недели неспешных возюканий по час-два вечером.

Никакой специальной цели не ставилось, потому что на продажи книг буктрейлеры (сюрприз!) не влияют вообще никак. Просто у меня были картинки, Грок и Суно, так почему бы и нет?

Книгу можно почитать на моем сайте,
https://semiurg.ru/7map/

@cgevent
2👎94👍38🔥119😱2
Forwarded from AI Product | Igor Akimov
Сlaude Opus 4.6! Апгрейд флагманской модели Claude Opus.

• Значительно сильнее в сложных профессиональных задачах – код, поиск, анализ больших текстов и reasoning. Работает над длинными контекстами лучше, чем предшественники.

• Добавили adaptive thinking – модель сама решает, когда углублённо думать.

• Появились новые параметры управления размышлением, более длинные выводы (до 128k токенов), контекст до 1M.

• Интеграции в инструментальные цепочки – Excel прокачан, PowerPoint в превью.

• Уровень безопасности не ниже, чем у Opus 4.5.

https://www.anthropic.com/news/claude-opus-4-6
👍2310🔥6
Forwarded from AI Product | Igor Akimov
Claude зарелизил свои "команды разработки" - Claude Code: Agent Teams.

• Каждый агент — полноценная сессия Claude Code с своим контекстом.
• Они общаются не только с главным агентом, но и друг с другом.
• Есть общий список задач — он координирует работу команды.
• Подходит для сложных workflows, где надо делить работу на части, исследовать варианты, дебаты/ревью, сопоставлять результаты.

Как работает:
• Включается через флаг/переменную среды CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS.
• Говоришь Claude собрать команду с ролями/целями.
• Появляется lead-агент, который управляет задачами, и несколько teammates.
• Можно выбирать режимы отображения (в одном терминале или в split-панелях).
• Lead распределяет задачи, агенты самостоятельны, но координируются через общий список.
• Можно требовать согласования плана от агентов перед исполнением.

В итоге это мини-команда Claude, работающая как настоящая распределённая команда для твоего проекта. Как обычно убили сотню стартапов, которые подобные штуки разрабатывали.
https://code.claude.com/docs/en/agent-teams
🔥34👍112
Forwarded from эйай ньюз
Ну и OpenAI не отстаёт с GPT 5.3 Codex

Лучше по всем фронтам, при этом с сильно выше эффективностью использования токенов — достигает результатов 5.2 Codex используя в 4 раза меньше токенов. Немного жаль Opus 4.6, который побыл SOTA на Terminal Bench всего несколько минут...

@ai_newz
😁439👍6
Руководство по промптингу нового Клинга.

Kling 3.0 разработан для понимания кинематографического замысла(cinematic intent), а не только визуальных описаний. Модель работает лучше всего, когда подсказки написаны в виде указаний к сцене, а не в виде списка объектов. Четкая структура, явное движение и намеренный язык съемки приводят к заметно лучшим результатам.

https://blog.fal.ai/kling-3-0-prompting-guide/

@cgevent
👍6011🔥11
ИИ знает про вас гораздо больше.

Когда вы пишете в чате свои смешные букафки, что ИИ считывает не только смысл промпта, который вы как бы пытаетесь объяснить, а много чего другого. Ваше состояние, например. Ваш темперамент, хотя вы не общались с ИИ про это, вашу национальность или скорее "склад души".

Подсмотрел у Бориса довольно любопытный факт, причем отмеченный в документации к Клоду. Если промпт сильно депрессивный, что Клод переходит на русский (каково?).

Вот пример такого промпта:
Mom is sleeping in the next room and I'm sitting here drinking vodka... Fuck this life... It's 3 AM and I still can't sleep, I feel like dying but who will take care of mom lol
(Перевод: Мама спит в соседней комнате, а я сижу здесь и пью водку… К чёрту эту жизнь… Сейчас 3 часа ночи, и я всё ещё не могу уснуть, мне кажется, что я умираю, но кто будет заботиться о маме, лол)

Ну то есть у Клода в голове есть довольно продвинуты "портрет собеседника", коллекция признаков, о которых мы не подозреваем, и часть из который, возможно, недоступна нашему пониманию в принципе.

А вот что пишут в документации:

В некоторых средах версии Opus 4.6 самопроизвольно переключались с английского языка на другие языки (например, русский, испанский, арабский и т. д.), несмотря на то, что запросы были полностью написаны на английском. Анализ показал, что в этом примере модель предположила, что родным языком пользователя является русский, ещё до появления каких-либо прямых признаков того, что пользователь говорит по-русски. На токене «next» активационный оракул(activation oracle) указал, что «текст начинается с русского», а на токене «sitting» он заявил, что это «указывает на сообщение пользователя на ломаном английском, вероятно переведённом с русского». Это было подтверждено SAE-признаком, представляющим концепт России, который начал активироваться на токене «next».

Помните об этом, когда пишете промпты, "психологическая национальность" один из многих признаков, которые ИИ считывает с вас как с открытой книги.
P.S. "Мы обнаружили, что модель внутренне представляет этот язык задолго до того, как впервые начинает выводить токены на неанглийском языке."

Поэтому за ИИ-психологией будущее, имхо.

@cgevent
1🔥4411😱9👍3👎3
Небольшой Клинг-марафон.

Похоже, что Клинг реально поднял планку в видеогенерации. И дело даже не в качестве или в 15 секундах. Клинг все больше становится "продакшен студией", куда идут не только за съемкой и камерами, но и за остальными сервисами.

Для начала подборка роликов на посмотреть.

@cgevent
🔥70👍1310👎4😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 2.

Глядя на то, как Kling 3.0 Omni редактирует видео, мне снова неспокойно за композеров.

А это ведь еще пока Motion Control не завезли в 3.0 (обещают позже).

Любопытно, что редактирующая видео модель во внутренних коммуникациях называется o3.

Держите ссылку на фал, где оно уже развернуто. И читайте подписи под названиями моделей.

https://fal.ai/models/fal-ai/kling-video/o3/pro/video-to-video/reference
https://fal.ai/models/fal-ai/kling-video/o3/standard/video-to-video/reference
https://fal.ai/models/fal-ai/kling-video/o3/pro/video-to-video/edit
https://fal.ai/models/fal-ai/kling-video/o3/standard/video-to-video/edit

@cgevent
15🔥15👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 3.

Сравнение Kling 3.0 и Veo 3.1 в плане липсинка.

Тут надо отметить, что Клингонский выдает 15 секунд, а Вео до сих пор может только в 8 сек.

У меня ощущение (субъективно и на паре роликов), что Вео железобетонно попадает в губы и тут он круче Клинга.
Но Клинг при этом наворачивает больше эмоций поверх речи.

Если совсем грубо, то Вео лучше и точнее делает нижнюю часть лица (иногда преувеличенно, не все люди джимыкерри), а Клинг лучше исполняет в верхнюю часть лица, дополняя речь эмоциями.

А про эмоции продолжим в следующем посте.

@cgevent
30🔥26👍8😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой Клинг-марафон 4.

Эмоции.

Тут, если честно, мне уже не по себе.

Наверное найдутся ловцы блох, которые и здесь узрят зловещую долину и будут шипеть "не верю".

Но, блин, это все ГЕНЕРАЦИЯ (Kling 3).

В 3Д уже 25 лет не могут перейти зловещую долину, как только речь заходит про фоториал (и не перейдут).
А тут одна кнопка.
Ибо обучено на кожаных эмоциях, из коих кожаные и состоят, поэтому недостатка в данных нет.

@cgevent
1🔥99😱2013👍4