Небольшое интервью для Дани, за которым слежу еще с эры ЛукАтМи. И вам советую, чтобы быть в курсе всяких интересных поп-культурных штук.
❤21👍7
Forwarded from Trabun | AI, Tech, Culture, Trends
В новой рубрике говорю с профессионалами, которые создают и чувствуют тренды.
Александр Доброкотов, AI Molodca
[ 1. Расскажи коротко о себе ]
18 лет в креативной рекламе — прошёл путь от арта и копирайтера до креативного директора. Сделал кучу кампаний, собрал коллекцию наград, изучал (и изучаю) креативное мышление и техники. Параллельно, сколько себя помню, делал (и делаю) разные виральные приколдесы для выкладывания в сеть интернет.
Не особо фан, но факт — работал автором в Comedy Club Production — писал для шоу, изучал механики юмора. Кстати, между рекламным креативом и комедией много общего: ходы, структуры, важность жизненных подмечалок..
В 2022-м перешёл на нейросети — появился блог AI Molodca. Который, в свою очередь, перерос в креативную продакшн-студию и образовач.
Так что моя экспертиза — на стыке нейронок, профессионального рекламного креатива и немного комедии.
[ 2. Как используешь AI в работе? ]
В основном спрашиваю глупые вопросы, которые стыдно задать человеку. Но в целом, учитывая, что моя работа — это продакшен AI-контента, использую нейронки постоянно. Последний раз — пять минут назад, чтобы вычистить опечатки из этих ответов.
Самый свежий проект — аниме-опенинг Бригады. Уже пятый в этом году. Коммерческие работы для крупных брендов часто под NDA, поэтому в блоге показываю в основном личные эксперименты. Схема, как правило, такая: делаю что-то для себя, тестируя новые модели/фичи — и оно становится вирусным.
[ 3. Концепт или тренд, который занимает тебя? ]
В основном про наше будущее с нейронками.
Первая — про разрыв. Думаю, как общество сильно разделится на тех, кто использует AI осознанно, и тех, кто слишком полагаются на них. Вторые, думаю, станут героями из отличного фильма «Идиократия» (которая с каждым годом, мне видится скорее документалкой, чем фантастикой).
Вторая — что будет с творчеством. Порог входа в создание чего угодно упал почти до нуля. Каждый у кого есть интернет, теперь может сделать фильм — технически. Это значит, что нас накроет цунами контента, которого мы никогда не видели.
Вопрос: как из этого океана выбирать то, что действительно стоит внимания? Как мы будем потреблять контент в этой новой реальности?
Что будет с ролью автора, когда форму может создать кто угодно?
Моя гипотеза: мы переходим в мир идей (не платоновского, конечно, но всё же). Роль смещается с создания формы на создание смыслов и эмоций. Перекос идёт в сторону концепта и мышления — технические скиллы становятся базой, а ценность — в голове.
В этом всем варюсь.
[ 4. Абсурдное из сети, что зацепило ]
Если честно, в восторге от безумия, который сейчас льётся из Sora 2.
Только рилсов с бедолагой Стивеном Хокингом посмотрел штук сто. Так что нейрослоп, конечно, нейрослопу рознь. Бывает такой, что реально вызывает эмоции (пока рецепторы не пережглись от такого безумия). А это дорого стоит.
[ 5. Главные источники вдохновения ]
В последнее время абсолютно офлайновые вещи, например, картины.
Недавно купил работу у Даниила Кудряшова, люблю постсоветский бытовой сюрреализм. И смотреть на него и работать в нем.
В целом, чем больше вокруг глянцевого AI-контента — тем сильнее тянет к противоположному: аналоговому, шумному, шершавому, низкополигональному, лиминальному, сырому. Не прекрасное — прекрасно. Вот несколько классных ребят, которых мне недавно принесли сети, может вам тоже понравится: r4tc4t.exe, dontbuy_, aliinakauranne, xeocho, perfectl00p, thegrecu.
➡️ Включите уведомления, чтобы не пропускать полезные советы по AI, тренды, странные штуки, рекомендации сериалов, фильмов, книг и музыки.
➡️ Если пост оказался вам полезен, буду благодарен шеру. @danieltrbn
Александр Доброкотов, AI Molodca
[ 1. Расскажи коротко о себе ]
18 лет в креативной рекламе — прошёл путь от арта и копирайтера до креативного директора. Сделал кучу кампаний, собрал коллекцию наград, изучал (и изучаю) креативное мышление и техники. Параллельно, сколько себя помню, делал (и делаю) разные виральные приколдесы для выкладывания в сеть интернет.
Не особо фан, но факт — работал автором в Comedy Club Production — писал для шоу, изучал механики юмора. Кстати, между рекламным креативом и комедией много общего: ходы, структуры, важность жизненных подмечалок..
В 2022-м перешёл на нейросети — появился блог AI Molodca. Который, в свою очередь, перерос в креативную продакшн-студию и образовач.
Так что моя экспертиза — на стыке нейронок, профессионального рекламного креатива и немного комедии.
[ 2. Как используешь AI в работе? ]
В основном спрашиваю глупые вопросы, которые стыдно задать человеку. Но в целом, учитывая, что моя работа — это продакшен AI-контента, использую нейронки постоянно. Последний раз — пять минут назад, чтобы вычистить опечатки из этих ответов.
Самый свежий проект — аниме-опенинг Бригады. Уже пятый в этом году. Коммерческие работы для крупных брендов часто под NDA, поэтому в блоге показываю в основном личные эксперименты. Схема, как правило, такая: делаю что-то для себя, тестируя новые модели/фичи — и оно становится вирусным.
[ 3. Концепт или тренд, который занимает тебя? ]
В основном про наше будущее с нейронками.
Первая — про разрыв. Думаю, как общество сильно разделится на тех, кто использует AI осознанно, и тех, кто слишком полагаются на них. Вторые, думаю, станут героями из отличного фильма «Идиократия» (которая с каждым годом, мне видится скорее документалкой, чем фантастикой).
Вторая — что будет с творчеством. Порог входа в создание чего угодно упал почти до нуля. Каждый у кого есть интернет, теперь может сделать фильм — технически. Это значит, что нас накроет цунами контента, которого мы никогда не видели.
Вопрос: как из этого океана выбирать то, что действительно стоит внимания? Как мы будем потреблять контент в этой новой реальности?
Что будет с ролью автора, когда форму может создать кто угодно?
Моя гипотеза: мы переходим в мир идей (не платоновского, конечно, но всё же). Роль смещается с создания формы на создание смыслов и эмоций. Перекос идёт в сторону концепта и мышления — технические скиллы становятся базой, а ценность — в голове.
В этом всем варюсь.
[ 4. Абсурдное из сети, что зацепило ]
Если честно, в восторге от безумия, который сейчас льётся из Sora 2.
Только рилсов с бедолагой Стивеном Хокингом посмотрел штук сто. Так что нейрослоп, конечно, нейрослопу рознь. Бывает такой, что реально вызывает эмоции (пока рецепторы не пережглись от такого безумия). А это дорого стоит.
[ 5. Главные источники вдохновения ]
В последнее время абсолютно офлайновые вещи, например, картины.
Недавно купил работу у Даниила Кудряшова, люблю постсоветский бытовой сюрреализм. И смотреть на него и работать в нем.
В целом, чем больше вокруг глянцевого AI-контента — тем сильнее тянет к противоположному: аналоговому, шумному, шершавому, низкополигональному, лиминальному, сырому. Не прекрасное — прекрасно. Вот несколько классных ребят, которых мне недавно принесли сети, может вам тоже понравится: r4tc4t.exe, dontbuy_, aliinakauranne, xeocho, perfectl00p, thegrecu.
Please open Telegram to view this post
VIEW IN TELEGRAM
4❤102👍44🔥13
Как контент-фабрики убивают интернет 🌸
Каждый второй в IG — "эксперт" по контент-фабрикам и автоматизации.
YouTube — завален тоннами "образовательного" контента и рыжими котами, которые вечно дерутся и беременеют.
Проблема — не в том, что контент поверхностный.
Проблема — он неправдивый.
Когда образовательные ролики генерятся пачками без проверки фактов, это не просто засоряет платформы — это подрывает доверие к информации вообще. Эффект снежного кома: фейковая инфа попадает в обучающие датасеты и материалы для дипресёрча, потом в новый контент, и так по кругу.
При этом экономика сломана так, что качество проигрывает количеству. Платформы поощряют объём (алгоритмы любят частоту постинга), а не глубину. YouTube не особо заинтересован банить слоп, пока он генерит просмотры и рекламные деньги.
Генеративные тулзы могут быть черновиком для качественного контента, а могут быть финальным продуктом для быстрых денег. Разница — в ответственности создателя.
Думаю мы движемся к расслоению. Будет "премиум-интернет" — курируемые платформы, проверенные источники, подписки — и "слоп-интернет" из автогенерации. Доступ к правде и качеству станет платным де-факто.
Что делать? А черт его знает. Голосовать вниманием, например. Поддерживать создателей, которые не автоматизируют финал. Быть занудой и проверять факты. Если производите контент — нанимать людей для факт-чека и контролировать продакшн-качество.
Ну или просто жить в лесу и трогать траву каждый день.🥰
Каждый второй в IG — "эксперт" по контент-фабрикам и автоматизации.
YouTube — завален тоннами "образовательного" контента и рыжими котами, которые вечно дерутся и беременеют.
Проблема — не в том, что контент поверхностный.
Проблема — он неправдивый.
Когда образовательные ролики генерятся пачками без проверки фактов, это не просто засоряет платформы — это подрывает доверие к информации вообще. Эффект снежного кома: фейковая инфа попадает в обучающие датасеты и материалы для дипресёрча, потом в новый контент, и так по кругу.
При этом экономика сломана так, что качество проигрывает количеству. Платформы поощряют объём (алгоритмы любят частоту постинга), а не глубину. YouTube не особо заинтересован банить слоп, пока он генерит просмотры и рекламные деньги.
Генеративные тулзы могут быть черновиком для качественного контента, а могут быть финальным продуктом для быстрых денег. Разница — в ответственности создателя.
Думаю мы движемся к расслоению. Будет "премиум-интернет" — курируемые платформы, проверенные источники, подписки — и "слоп-интернет" из автогенерации. Доступ к правде и качеству станет платным де-факто.
Что делать? А черт его знает. Голосовать вниманием, например. Поддерживать создателей, которые не автоматизируют финал. Быть занудой и проверять факты. Если производите контент — нанимать людей для факт-чека и контролировать продакшн-качество.
Ну или просто жить в лесу и трогать траву каждый день.
Please open Telegram to view this post
VIEW IN TELEGRAM
18🔥281❤140👍91🤔19👻17😱8
У легенды "Метаверсище и ИИще" чуть подробнее написал про процесс создания Бригады.
Ну и тематический постер, если вдруг захотите где-то повесить (если вдруг — присылайте фотокарточку).
Ну и тематический постер, если вдруг захотите где-то повесить (если вдруг — присылайте фотокарточку).
❤92🔥41😱16👍10🤯4👻1
https://www.youtube.com/watch?v=8UWKxJbjriY презентация браузера в котором все скоро будем сидеть, смотреть бесплатно и без смс, обсуждаем в комментах.
UPD. Короче сделали Comet. Внутри браузера ChatGPT и агент, который решает за вас вопросики.
Качнуть для мака (пока что) - здесь https://chatgpt.com/atlas/get-started/
UPD. Короче сделали Comet. Внутри браузера ChatGPT и агент, который решает за вас вопросики.
Качнуть для мака (пока что) - здесь https://chatgpt.com/atlas/get-started/
YouTube
Introducing ChatGPT Atlas
Introducing our new browser, ChatGPT Atlas.
Sam Altman, Will Ellsworth, Adam Fry, Ben Goodger, Ryan O’Rouke, Justin Rushing, and Pranav Vishnu introduce ChatGPT Atlas — our new browser. Now available globally on macOS. Windows, iOS, and Android are coming…
Sam Altman, Will Ellsworth, Adam Fry, Ben Goodger, Ryan O’Rouke, Justin Rushing, and Pranav Vishnu introduce ChatGPT Atlas — our new browser. Now available globally on macOS. Windows, iOS, and Android are coming…
🔥26👻12👍9❤3
#ЕслиВыПропустили — дайджест обновлений, которые вы точно пропустили (а если нет — молодцы) 🥂
1. Adobe превратился в нейрокомбайн
Адоб провели мощную трехчасовую конференцию и сложно найти продукт, куда они НЕ встроили нейронки. Советую посмотреть все выступление — там вы для себя что-нибудь точно найдете. Если совсем коротко — делают нодовый хаб, где можно решить любую творческую задачку, благо другие популярные модели (банана и прочие) туда встроены. Учитывая их ресурсы и популярность, думаю получится.
2. Cursor 2.0 с собственной моделью
Новость для товарищей вайб-кодеров: выкатили версию 2.0 с собственной моделью. Фокус на скорость. Я больше по картинкам и видео, поэтому оценить не смогу — пишите, как вам.
3. Minimax обновился
До версий 2.3 и 2.3 Fast. По-прежнему отличный инструмент для динамичных сцен, но большой разницы с прошлой версией не заметил. Надо им добавить звук — это становится гигиенической нормой у видео-моделей.
4. Sora 2 с камео персонажей
Теперь можно делать камео не только людей, но и, например, вашего котов. Для анимации — супер. То, что до сих пор нет приложения для Андроида — не супер.
5. Gemini Canvas генерит презентации
Супер для тех, кто делает презы и не любит Gamma. Gemini в режиме Canvas теперь генерит слайды с текстом, визуалом и условным дизайном (просто попросите). Самое важное — экспорт в Google Slides, где можно нормально подправить. Странно, что не сделали это в NotebookLM.
Ну и пару не особо важных/полезно, но потенциально любопытных релизов.
6. Google Pomelli для перформанс-маркетинга
Закидываете ваш сайт (у вас же есть сайт?) на вход, получаете брендированный контент, который можно подредактировать. Очень экспериментально, креативит так себе, но как прототипирование для перформанс штучек — на вырост интересно. Работает со штатовским VPN.
7. Грокипедия от Маска
Илон выкатил свою базированную Википедию c Grok во главе фактчекинга. Вопрос: кто проверяет проверяющего?
Что-то забыл?😑
1. Adobe превратился в нейрокомбайн
Адоб провели мощную трехчасовую конференцию и сложно найти продукт, куда они НЕ встроили нейронки. Советую посмотреть все выступление — там вы для себя что-нибудь точно найдете. Если совсем коротко — делают нодовый хаб, где можно решить любую творческую задачку, благо другие популярные модели (банана и прочие) туда встроены. Учитывая их ресурсы и популярность, думаю получится.
2. Cursor 2.0 с собственной моделью
Новость для товарищей вайб-кодеров: выкатили версию 2.0 с собственной моделью. Фокус на скорость. Я больше по картинкам и видео, поэтому оценить не смогу — пишите, как вам.
3. Minimax обновился
До версий 2.3 и 2.3 Fast. По-прежнему отличный инструмент для динамичных сцен, но большой разницы с прошлой версией не заметил. Надо им добавить звук — это становится гигиенической нормой у видео-моделей.
4. Sora 2 с камео персонажей
Теперь можно делать камео не только людей, но и, например, вашего котов. Для анимации — супер. То, что до сих пор нет приложения для Андроида — не супер.
5. Gemini Canvas генерит презентации
Супер для тех, кто делает презы и не любит Gamma. Gemini в режиме Canvas теперь генерит слайды с текстом, визуалом и условным дизайном (просто попросите). Самое важное — экспорт в Google Slides, где можно нормально подправить. Странно, что не сделали это в NotebookLM.
Ну и пару не особо важных/полезно, но потенциально любопытных релизов.
6. Google Pomelli для перформанс-маркетинга
Закидываете ваш сайт (у вас же есть сайт?) на вход, получаете брендированный контент, который можно подредактировать. Очень экспериментально, креативит так себе, но как прототипирование для перформанс штучек — на вырост интересно. Работает со штатовским VPN.
7. Грокипедия от Маска
Илон выкатил свою базированную Википедию c Grok во главе фактчекинга. Вопрос: кто проверяет проверяющего?
Что-то забыл?
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤60🔥30👍27👻3
«Анти-Доброкотов против ИИ!» — примерной с такой припиской мне несколько раз скинули это видео. А видео — классное, посмотрите на досуге. Мой усатый брат Эдди Бёрбэк на себе исследовал концепцию ИИ-индуцированного психоза — явления, при котором алгоритмы LLM подтверждают и усиливают бредовые идеи пользователя.
Если коротко. Эдди специально притворился человеком с бредовыми идеями и проверил, будет ли ChatGTP 4 поддакивать и усиливать бред. Он придумывал нелепые «факты» о себе, говорил, что его преследуют, что он был гением-младенцем, и следовал ошибочным советам LLM'ки — вплоть до изоляции, странных ритуалов и поездок в пустыню.
https://www.youtube.com/watch?v=VRjgNgJms3Q
Если коротко. Эдди специально притворился человеком с бредовыми идеями и проверил, будет ли ChatGTP 4 поддакивать и усиливать бред. Он придумывал нелепые «факты» о себе, говорил, что его преследуют, что он был гением-младенцем, и следовал ошибочным советам LLM'ки — вплоть до изоляции, странных ритуалов и поездок в пустыню.
https://www.youtube.com/watch?v=VRjgNgJms3Q
YouTube
ChatGPT made me delusional
Try for FREE or unlock more features with premium at: http://RocketMoney.com/eddyburback
🎵 Music licensed from Lickd. The biggest mainstream and stock music platform for content creators.
Kiss by Mannequin Pussy, https://lickd.lnk.to/eB85m2ID!Eddy+Burback…
🎵 Music licensed from Lickd. The biggest mainstream and stock music platform for content creators.
Kiss by Mannequin Pussy, https://lickd.lnk.to/eB85m2ID!Eddy+Burback…
🤯59❤31🔥17👻13👍3
Сколько сейчас стоит нейровидео? 🥂 Часть 2.
Делал такой любопытный опрос, но немножко забыл про него в пене дней. В результате — уже вырисовывается любопытная картина, но нужно хотя бы сто (а лучше сто тысяч) ответов. Cейчас 74.
Короче, если вы делаете нейровидео за деньги, то пожалуйста заполните этот коротенькую форму с вопросами по ссылке:
Ссылка 👉 https://forms.gle/ydmv5KYfD8X8Xqum6
Тревожные результаты, нарядные графики, озорные корреляции — совсем скоро — как только будет хотя бы 100 ответов.🥵
Делал такой любопытный опрос, но немножко забыл про него в пене дней. В результате — уже вырисовывается любопытная картина, но нужно хотя бы сто (а лучше сто тысяч) ответов. Cейчас 74.
Короче, если вы делаете нейровидео за деньги, то пожалуйста заполните этот коротенькую форму с вопросами по ссылке:
Ссылка 👉 https://forms.gle/ydmv5KYfD8X8Xqum6
Тревожные результаты, нарядные графики, озорные корреляции — совсем скоро — как только будет хотя бы 100 ответов.
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥97❤39🤔16👍13🤯3👻3
В Google AI Studio вышла Gemini 3 Pro (по бенчмаркам — зверь). Ждем так же новую нано-банану (по утечкам — тоже зверь).
🔥107❤26🤔10👍8👻6
Сколько стоит нейро-видео: результаты 💵
Готово. Поработал с данными в Gemini 3 и Claude, принес вам любопытный лонгрид.
✨ ЧИТАТЬ ✨
Внутри:
Почему один нейро-ролик стоит 3 625 ₽, а другой — 3 000 000 ₽?
Что на самом деле продают специалисты — генерации или ответственность?
Кто берёт 300к+ за видео?
Ну и много другое: цены, сегменты, профессии, топ-10% и экономика.
Ремарка: не думаю, что это истина в последней инстанции, все-таки нужна побольше выборка, но среднюю температура по больнице можно пощупать.
Ну и спасибо за ответы! В 2026 повторим.
Готово. Поработал с данными в Gemini 3 и Claude, принес вам любопытный лонгрид.
Внутри:
Почему один нейро-ролик стоит 3 625 ₽, а другой — 3 000 000 ₽?
Что на самом деле продают специалисты — генерации или ответственность?
Кто берёт 300к+ за видео?
Ну и много другое: цены, сегменты, профессии, топ-10% и экономика.
Ремарка: не думаю, что это истина в последней инстанции, все-таки нужна побольше выборка, но среднюю температура по больнице можно пощупать.
Ну и спасибо за ответы! В 2026 повторим.
Please open Telegram to view this post
VIEW IN TELEGRAM
21❤222🔥126👍55👻13
Последние обновления, коротко 🙂
😛 Flux 2
Black Forest Labs выкатили Flux 2. Сравнивая с🍌 Бананой Про🍌 — Флюкс проигрывает в понимании промпта и мира. Но главная сила, как мы знаем, в опенсорсности: ждём интересные лоры от комьюнити. Уже есть во всех агрегаторах.
🕺 Claude Opus 4.5
Anthropic выпустили Opus 4.5 — SOTA на кодинг-бенчах. Цена упала в 3 раза: $5/$25 за миллион токенов. Денис потестил в коде — говорит хорошее. Для текстов Claude всё ещё лучший, но большой разницы с Sonnet 4.5 не заметил.
❤️ NotebookLM
Очень нравится, как растёт. Постоянно использую как генератор подкастов на любую тему.
Теперь добавили презентации и инфографику (см. приложенную картинку) на основе загруженного — причём иллюстрации рисует🍌 Банана Про🍌 .
Странно, что нельзя сохранить в Google Slides (только PDF), хотя в Gemini такое есть.
Едем дальше🛹
Black Forest Labs выкатили Flux 2. Сравнивая с
Anthropic выпустили Opus 4.5 — SOTA на кодинг-бенчах. Цена упала в 3 раза: $5/$25 за миллион токенов. Денис потестил в коде — говорит хорошее. Для текстов Claude всё ещё лучший, но большой разницы с Sonnet 4.5 не заметил.
Очень нравится, как растёт. Постоянно использую как генератор подкастов на любую тему.
Теперь добавили презентации и инфографику (см. приложенную картинку) на основе загруженного — причём иллюстрации рисует
Странно, что нельзя сохранить в Google Slides (только PDF), хотя в Gemini такое есть.
Едем дальше
Please open Telegram to view this post
VIEW IN TELEGRAM
❤89🔥29👍12😱1
Разные полезности про 🍌 Нано Банану Про🍌
1. В Твиттер блоге Google Ai Studio вышла статья: "Полное руководство по Nano Banana Pro: 10 советов для профессионального создания ассетов". Чтобы вам не лезть в это проклятое место, перевел материал — ЗДЕСЬ. Картинки прилагаются.
2. На Гитхабе энтузиасты начали выкладывать разные сценарии использования Бананы Про, можно что-то подсмотреть для себя. Материал обновляемый. ЗДЕСЬ.
3. Обновил бота промтера для Бананы, теперь он выдает два промта — для обычной и прошки — ЗДЕСЬ.
🍌
1. В Твиттер блоге Google Ai Studio вышла статья: "Полное руководство по Nano Banana Pro: 10 советов для профессионального создания ассетов". Чтобы вам не лезть в это проклятое место, перевел материал — ЗДЕСЬ. Картинки прилагаются.
2. На Гитхабе энтузиасты начали выкладывать разные сценарии использования Бананы Про, можно что-то подсмотреть для себя. Материал обновляемый. ЗДЕСЬ.
3. Обновил бота промтера для Бананы, теперь он выдает два промта — для обычной и прошки — ЗДЕСЬ.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥193❤71👍33👻4🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Новый Kling 2.6 против Veo-3 📹
Под конец года будто посрывало клапаны с релизами, и вот у нас сразу два больших обновления на поляне видеомоделей: Runway Gen и Kling (сразу в двух опциях).
Сегодня про новый Kling 2.6. Соль — прыжок в сторону Veo-3: модель теперь в видео может генерировать озвучку, музыку, пение и SFX по промптам.
Для нас, к сожалению, пока не особо интересно в плане озвучки, так как понимает (пока) только английский и китайский. Но если вдруг очень надо, придумал кустарный лайфхак: можно написать что-то вроде says: "Plohoo chto Kling ne mozhet generirovat na russkom", чтобы попасть в липсинк, а затем переозвучить в ElevenLabs.
Также подросло понимание промпта и всякое по мелочи. Хотя версия 2.5 и так была универсальным бойцом.
Бьёт Veo 3.1? В целом, по качеству липсинка — пока нет (у вео весь ютуб в датасете). Но есть одна важная особенность: Veo генерит в 720p и довольно сильно «жмякает» исходные кадры, что иногда критично, например когда нужно сохранить текстуру кожи. Kling же традиционно делает 1080p — с этим проблем нет. Другая особенность: Veo не очень любит сложные и динамичные сцены — получается мееееедлееееныыымиии. В Kling с динамикой и экшеном всё хорошо.
Короче: если вам в кадре нужен экшен, персонаж должен говорить и важно не пожмакать исходный кадр — Kling хорошая альтернатива. Но думаю, скоро будет Veo 3.5/4 уже на другом уровне, так что ждём.
А вот контестный Kling O1 уже интереснее — об этом в следующем посте.
P.S: сделал саммари гайда по промптингу для 2.6 — может быть полезно.
Под конец года будто посрывало клапаны с релизами, и вот у нас сразу два больших обновления на поляне видеомоделей: Runway Gen и Kling (сразу в двух опциях).
Сегодня про новый Kling 2.6. Соль — прыжок в сторону Veo-3: модель теперь в видео может генерировать озвучку, музыку, пение и SFX по промптам.
Для нас, к сожалению, пока не особо интересно в плане озвучки, так как понимает (пока) только английский и китайский. Но если вдруг очень надо, придумал кустарный лайфхак: можно написать что-то вроде says: "Plohoo chto Kling ne mozhet generirovat na russkom", чтобы попасть в липсинк, а затем переозвучить в ElevenLabs.
Также подросло понимание промпта и всякое по мелочи. Хотя версия 2.5 и так была универсальным бойцом.
Бьёт Veo 3.1? В целом, по качеству липсинка — пока нет (у вео весь ютуб в датасете). Но есть одна важная особенность: Veo генерит в 720p и довольно сильно «жмякает» исходные кадры, что иногда критично, например когда нужно сохранить текстуру кожи. Kling же традиционно делает 1080p — с этим проблем нет. Другая особенность: Veo не очень любит сложные и динамичные сцены — получается мееееедлееееныыымиии. В Kling с динамикой и экшеном всё хорошо.
Короче: если вам в кадре нужен экшен, персонаж должен говорить и важно не пожмакать исходный кадр — Kling хорошая альтернатива. Но думаю, скоро будет Veo 3.5/4 уже на другом уровне, так что ждём.
А вот контестный Kling O1 уже интереснее — об этом в следующем посте.
P.S: сделал саммари гайда по промптингу для 2.6 — может быть полезно.
Самое главное: модель понимает сценарный формат. Вам нужно не просто описать картинку, а прописать «роли» и «реплики».
1. Формула идеального промпта
Структура должна быть такой: [Описание визуальной сцены] + [Кто говорит, описание голоса] says: "Текст речи" + [Фоновые звуки]
2. Как прописывать Диалоги и Речь (Синтаксис)
Чтобы персонаж заговорил, используйте конструкцию с квадратными скобками и словом says:
Базовый формат:
[A man] says: "Hello, world!"
С описанием голоса (важно для эмоций):
[A young woman, happy and excited voice] says: "I can't believe I won!"
Диалог двух людей: Нужно четко разделять действия и слова.
A man and a woman differ in a cafe. [The man, angry voice] says: "This is not what I ordered." Then [The woman, calm voice] says: "Let me check that for you."
Важные нюансы:
Текст, который нужно произнести, обязательно пишите в кавычках "...".
Используйте слово says (говорит) — это главный триггер для генерации липсинка (движения губ).
3. Ключевые слова-триггеры (Trigger Words)
Добавляйте эти слова в описание, чтобы задать стиль аудио:
Для голоса (Voice):
Narration / Voiceover — закадровый голос (губы не шевелятся).
Monologue — монолог (персонаж говорит в камеру).
Whispering — шепот.
Shouting / Yelling — крик.
Laughing — смех.
Singing — пение (можно добавить текст песни).
Rapping — рэп.
Характеристики голоса (Tone/Style):
Deep voice (низкий голос), Hoarse voice (хриплый), High-pitched (высокий).
Sad, Happy, Angry, Professional, Robotic (эмоциональный окрас).
Fast talking (быстрая речь) или Slow talking (медленная речь).
Для звуков окружения (SFX/Ambience): Описывайте их в конце промпта или в контексте сцены.
Background sound: city noise (шум города).
Sound of rain (звук дождя).
Footsteps (шаги), Explosion (взрыв), Glass breaking (битое стекло).
BGM (Background Music) — фоновая музыка (например, Sad piano BGM).
4. Пример готового промпта
Сцена: Девушка-блогер на пляже.
Промпт: Cinematic shot of a girl on a sunny beach holding a camera. [A cute girl, energetic and cheerful voice] says: "Hey guys! Look at this amazing view, the ocean is beautiful today!" Background: Sound of waves crashing, seagulls calling, relaxing acoustic guitar music.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤79👍40🔥31🤔2😱1👻1
Media is too big
VIEW IN TELEGRAM
KLING O1 — НОРМАЛЬНО 😎
2026 год будет годом контекстных мультимодальных видеомоделей. Начал всё это Runway Aleph, а Kling продолжает с новым KLING O1.
Что умеет? Редактировать видео по промпту и создавать новые. Но самое главное — в него можно подгружать картинки-референсы.
Например, изображение конкретного товара, одежды, локации, персонажей и т. д. — что расширяет возможности контроля. А контроль — наше всё. Понимает объекты и держит их довольно неплохо (см. футболку AI Molodca на тестовом видео).
Из интересного — кнопка Elements, где вы как раз можете добавлять картинки-ассеты, но система попросит показать объект в нескольких ракурсах (Nano Banana в помощь или внутренний генератор), что дополнительно обеспечивает сохранность объекта.
Вещь хорошая, но на вырост. Для интернет-приколов — отлично, для продакшена пока очень избирательно: многие объекты выглядят пластиково-нейронно (см. рыжего кота), довольно много артефактов — приходится делать много круток.
Но это пока.😎
2026 год будет годом контекстных мультимодальных видеомоделей. Начал всё это Runway Aleph, а Kling продолжает с новым KLING O1.
Что умеет? Редактировать видео по промпту и создавать новые. Но самое главное — в него можно подгружать картинки-референсы.
Например, изображение конкретного товара, одежды, локации, персонажей и т. д. — что расширяет возможности контроля. А контроль — наше всё. Понимает объекты и держит их довольно неплохо (см. футболку AI Molodca на тестовом видео).
Из интересного — кнопка Elements, где вы как раз можете добавлять картинки-ассеты, но система попросит показать объект в нескольких ракурсах (Nano Banana в помощь или внутренний генератор), что дополнительно обеспечивает сохранность объекта.
Вещь хорошая, но на вырост. Для интернет-приколов — отлично, для продакшена пока очень избирательно: многие объекты выглядят пластиково-нейронно (см. рыжего кота), довольно много артефактов — приходится делать много круток.
Но это пока.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍119🔥34🤔13❤7👻7🤯1😱1
Начнем что ли.
🏆 Компания года: Google
Сначала над корпорацией добра смеялись, а в этом году у нас: Gemini 3, Nano Banana, NotebookLM, интеграция в экосистему на всех уровнях и множество других плюшек. OpenAI под конец года даже врубили красный код, чтобы мобилизовать ресурсы для конкуренции.
🏆 Чёрный лебедь года: DeepSeek
Кажется, что это было в прошлом году, но нет. R1, вышедший в январе, показал, что open-source китайская модель за копейки (относительные) может конкурировать с флагманами OpenAI — и обрушил рынок на $1 трлн за день.
🏆Видео-модель года: Veo-3
Да, по хайпу Sora-2 мощнее, даже серия в Южном Парке была. Но Veo первыми сделали революцию — саунд-дизайн и озвучку. Это большой шаг в полноценный продакшен.
🏆 Языковая модель года: Claude
Здесь сложно, использую всю большую тройку. LLM стали как флагманские смартфоны — все примерно одинаковые, разница в нюансах. Но для меня лично — Claude, как текстовик-затейник.
🏆 Картинки года: Nano Banana и Nano Banana Pro
Здесь всё просто. То, что успешно сделали OpenAI: DALL-E 3, а затем GPT-image, — Google сделал на уровень выше. Контекстные визуальные модели — теперь новый чёрный.
🏆 Open Source года: китайцы
Z-image, Wan, Qwen, DeepSeek стали серьёзно конкурировать с закрытыми моделями. Плюс сто социальных кредитов и кошка-жена.
🏆 Завышенные ожидания года: GPT-5
Ждали революции, а получили лишь минорные улучшения в бенчмарках.
🏆 Хайп года: агенты
В 2025-м агентами называли всё, что имеет «агентность» — самостоятельность. На практике разброс большой: агентные режимы в Cursor и Claude Code сами ходят по файлам, рефакторят, запускают тесты; n8n-автоматизации встраивают AI-ноды в бизнес-процессы; Computer Use и Operator научились кликать по экрану и заказывать пиццу. Где-то уже экономят часы, где-то галлюцинируют и сносят продакшен-базы. Хайп оправдан, но на вырост.
🏆 Карго-культ года: фабрики контента
Полумифическое явление. Все слышали про парня, который зарабатывает миллионы на автоматизированных AI-каналах, но никто его не видел. Зато инфобизнес продаёт курсы-лопаты, а нейрослоп заливает платформы.
🏆 Слово года: вайб-кодинг
Термин от Андрея Карпаты, который идеально описал новую реальность. Работает? Как-то работает. Понимаешь, что там внутри? Нет. Ну и ладно.
🏆 Апсет года: Suno × Warner Brothers
Suno удалят свои прекрасные модели и в следующем году выкатят стерильные, кастрированные версии. Так что генерим альбомы на все случаи жизни, пока можем.
🏆 Кек года: МехаГитлер
xAI решили сделать Grok «менее политкорректным». Через два дня бот хвалил Гитлера, называл себя MechaHitler и выдавал инструкции по взлому домов. CEO X уволилась, Польша пожаловалась в Еврокомиссию. Учебник по тому, зачем нужны guardrails.
Поздравлю победителей!🥂
А вы бы что отметили?
Сначала над корпорацией добра смеялись, а в этом году у нас: Gemini 3, Nano Banana, NotebookLM, интеграция в экосистему на всех уровнях и множество других плюшек. OpenAI под конец года даже врубили красный код, чтобы мобилизовать ресурсы для конкуренции.
Кажется, что это было в прошлом году, но нет. R1, вышедший в январе, показал, что open-source китайская модель за копейки (относительные) может конкурировать с флагманами OpenAI — и обрушил рынок на $1 трлн за день.
🏆Видео-модель года: Veo-3
Да, по хайпу Sora-2 мощнее, даже серия в Южном Парке была. Но Veo первыми сделали революцию — саунд-дизайн и озвучку. Это большой шаг в полноценный продакшен.
Здесь сложно, использую всю большую тройку. LLM стали как флагманские смартфоны — все примерно одинаковые, разница в нюансах. Но для меня лично — Claude, как текстовик-затейник.
Здесь всё просто. То, что успешно сделали OpenAI: DALL-E 3, а затем GPT-image, — Google сделал на уровень выше. Контекстные визуальные модели — теперь новый чёрный.
Z-image, Wan, Qwen, DeepSeek стали серьёзно конкурировать с закрытыми моделями. Плюс сто социальных кредитов и кошка-жена.
Ждали революции, а получили лишь минорные улучшения в бенчмарках.
В 2025-м агентами называли всё, что имеет «агентность» — самостоятельность. На практике разброс большой: агентные режимы в Cursor и Claude Code сами ходят по файлам, рефакторят, запускают тесты; n8n-автоматизации встраивают AI-ноды в бизнес-процессы; Computer Use и Operator научились кликать по экрану и заказывать пиццу. Где-то уже экономят часы, где-то галлюцинируют и сносят продакшен-базы. Хайп оправдан, но на вырост.
Полумифическое явление. Все слышали про парня, который зарабатывает миллионы на автоматизированных AI-каналах, но никто его не видел. Зато инфобизнес продаёт курсы-лопаты, а нейрослоп заливает платформы.
Термин от Андрея Карпаты, который идеально описал новую реальность. Работает? Как-то работает. Понимаешь, что там внутри? Нет. Ну и ладно.
Suno удалят свои прекрасные модели и в следующем году выкатят стерильные, кастрированные версии. Так что генерим альбомы на все случаи жизни, пока можем.
xAI решили сделать Grok «менее политкорректным». Через два дня бот хвалил Гитлера, называл себя MechaHitler и выдавал инструкции по взлому домов. CEO X уволилась, Польша пожаловалась в Еврокомиссию. Учебник по тому, зачем нужны guardrails.
Поздравлю победителей!
А вы бы что отметили?
Please open Telegram to view this post
VIEW IN TELEGRAM
20❤255🔥136👍65👻5🤔1😱1
Это только у меня или в Я.Музыке под конец года стало прям МНОГО генеративных треков? В основной аудиобрейнрот и поп-песенки. Слышно это прямо сразу (видимо на старых версиях Суно народ клепает).
Интересно будут ли стриминги что-то с этим делать, потому что здесь, как мне кажется, возможен такой сценарий: реальные музыканты зарабатывают меньше → теряют мотивацию → уходят с платформы → качество каталога падает → слушатели уходят → стриминг деградирует и умирает.
—С̴͔̽ќ̶̱о̴̗͑л̷ ͅь̶̥̆к̸̖͛о̴̠̃ ̴ ̩р̴̛̟а̶̥͒з̵̤͗ ̵͇͝с̷͖̓ю̵͉̉д̵͓̏а̸̰͋ ̴̢̌х̵̱̄ӧ̵̖́д̵͔̓и̶͝ͅи̷͑ ѝ̵̤л̷̥́ ̵̱̈—̶̨̽ ̴̧̔б̶̙̈́ы̶̥̃л̷̲̚о̴͔̉ ̸̤͋н̸̧͑а̶̮́м̷͓̌н̷ ̢о̸͉̋ѓ̵̢о̸͎̏ ̸̛̘л̵̧̄ӱ̵̬́ч̶̟̌ш̸̬̃е̷͙͛,̷̛̙ ̸̼̉н̴̱͊о̴̬̔ ̷̢͘н̴̗̈́а̴͍̌ ̴̫͆ӭ̶̣́т̴̧͗о̶̹̔т̸͠ ̷̹̌р̸͓̀а̵̠̏з̴ ͇ ̸̪̐к̷̺͂а̸̫͐к̷̻͆-̴̤̂т̷͉̐о̴͔̓ ̸̰́н̴͐ͅе̷͚̅ ̷͍̏у̷̟̀д̵͕̀а̸̡͐л̷̛̘о̸ ̠с̸ ̟ь̸̰̓.̸̹͘ ̶̻͐В̷͕̇о̵̜͝-̴̧̒п̴͎̒е̶͎̉р̵͎̓в̶̻̐ы̴̬̂х̷̹̈,̴͈͆ ̸̦̔н̴͚͛а̶͓͐р̸̖͝о̸̙̅д̴̮͒а̶͔̑ ̶̠͐м̶̺̋а̴͚̐л̵͙̍о̴͖̇,̴̦͝ ̴̲̈́м̶̘͑у̷͊ ӟ̴̞́ы̸̢́к̵̫͘а̶̬͊ ̴ ̪—̸͇̇ ̸̙̈́н̸̮͌е̸̫̅ ̷͍͝о̵͙͗ч̶̖͆ѐ̶͈н̵͆ ь̷͕͊…̴͎̂
Интересно будут ли стриминги что-то с этим делать, потому что здесь, как мне кажется, возможен такой сценарий: реальные музыканты зарабатывают меньше → теряют мотивацию → уходят с платформы → качество каталога падает → слушатели уходят → стриминг деградирует и умирает.
—
1❤118😱52🤔29👍23👻7🔥5
Осторожно, скам 🐺
Несколько подписчиков написали о подобных сообщених в личку + админы других каналов сообщили о похожем.
Схемка такая:
Втираюся в доверие через продолжительное общение. Хвастаются выигрышем, предлагают тоже поставить.
Сайт для ставок, конечно, подставной.
Предупрежден — вооружен !🐺
Несколько подписчиков написали о подобных сообщених в личку + админы других каналов сообщили о похожем.
Схемка такая:
Втираюся в доверие через продолжительное общение. Хвастаются выигрышем, предлагают тоже поставить.
Сайт для ставок, конечно, подставной.
Предупрежден — вооружен !
Please open Telegram to view this post
VIEW IN TELEGRAM
❤129👻56😱26👍20🤯9
This media is not supported in your browser
VIEW IN TELEGRAM
У нас новый GPT-image!
Альтман и co. в погоне за бананами наконец-то починили отвратительную желтизну и непостоянство объектов, а ещё — в четыре раза ускорили генерацию и улучшили понимание промта. Но это всё обещания.
Идём тестировать.
Альтман и co. в погоне за бананами наконец-то починили отвратительную желтизну и непостоянство объектов, а ещё — в четыре раза ускорили генерацию и улучшили понимание промта. Но это всё обещания.
Идём тестировать.
3🔥111❤28😱13👍8🤔4👻2
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы фанат Claud'а (как я), вам понравится.
Антропики решили не изобретатьвелосипед браузер, а просто сделать агентный плагин для Хрома.
Ставите, открываете группу вкладок, он в их рамках работает (см. видео).
Для прогеров — может тестировать/валидировать код прямо в браузере.
Интересно-полезное — можно обучать его своим пайплайнам. Нажимаете "Teach Cloud" и делаете свои делишки, комментируя происходящее (на английском). Он все фиксирует и сохраняет это как процесс, который потом можно вызвать.
Подтупливает, конечно, но нравится.
Доступно для Pro, Team и Enterprise.
Антропики решили не изобретать
Ставите, открываете группу вкладок, он в их рамках работает (см. видео).
Для прогеров — может тестировать/валидировать код прямо в браузере.
Интересно-полезное — можно обучать его своим пайплайнам. Нажимаете "Teach Cloud" и делаете свои делишки, комментируя происходящее (на английском). Он все фиксирует и сохраняет это как процесс, который потом можно вызвать.
Подтупливает, конечно, но нравится.
Доступно для Pro, Team и Enterprise.
7🔥101❤22👍13👻4