Метаверсище и ИИще
46.7K subscribers
5.93K photos
4.33K videos
45 files
6.81K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Тут в коментах спрашивали, что за чехарда теперь творится в выборе моделей от Гугла (в интерфейcе Gemini например, не в API)

Раньше было просто Fast и Thinking - но раньше была одна модель Gemini 3 Pro.

Теперь вышла Gemini 3 Flash, проэтому теперь:

Fast = Gemini 3 Flash (without thinking)
Thinking = Gemini 3 Flash (with thinking)
Pro = Gemini 3 Pro (with thinking)


@cgevent
😁35👍6😱61🔥1
Оппаньки, Нанабанана так бодро начала в опросе, а потом слила первенство GPT Image 1.5

Хотя если взять настроения из коментов и пошуршать в твитторе на этот счет, то там мнение "Банана рвет GPT Image" как тузикь старую клизьму.

Неожиданно.

Мое мнение такое: GPT Image как будто пытается изо всех сил понравится, поэтому перебарщивает с деталями и с контрастом. Как будто там был RLHF на цыганах. Банана поспокойнее и поуниверсальнее.

Я\МЫ БАНАНА!

Смешное: SD1.5 теперь можно трактовать как SeeDream 1.5.

@cgevent
41👍18😁7👎2😱2
Банана Красава.

Вот взяли я цветик-девятицветик, который GPT Image 1.5 мне впаривал за семицветик, и говорю: удали два лепестка!

Апажалста!

Чем не семицветик?!

@cgevent
😁14217👍8🔥6
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Музыкальный клип

Режиссёр: Клим Тукаев
Производство: AI-LAB

Полная версия:
https://www.youtube.com/watch?v=ZV5I6TQUpN4

⚡️Видео создавалось, как свободный творческий проект. Муз.клип с авторским замыслом и линейной историей на песню моей подруги.

Срок производства: 15 дней.

💻 Процесс работы проходил этапами: сначала сгенерил куклу главной героини через Midjorney с применением omni ref (живого фото певицы) и разных стилей. Затем разработал других персонажей в похожем стиле + сгенерировал реквизит (гитара, фургон, несколько вариантов постеров) через Nana Banana (тогда ещё не Pro).

Затем приступил к генерации сцен. Механика: создаю мастер-план (ключевой общий план сцены) через мидж, довожу его до совершенства и множу на ракурсы через Nana Banana.

Основной объём анимации через Kling 2.5 Turbo в Higgsfield. Но так как хигс часто цензурирует видео со словами “stop-motion animation” в промпте, в качестве альтернативы использовал Hailuo 2.3. Кстати, Hailuo чаще смазывает изображение, но лучше справляется с динамичными массовыми сценами (толпа на концерте, героиня на сцене, овечий апокалипсис и т.д.). В Kling все двигаются синхронно и ужасно замедленно, хоть и сохраняют пропорции.

👄 Kling Lip-sync не справился с кукольными губами, так что пришлось анимировать кадры с рандомным липсингом и подгонять фазы под музыку (вышло не очень, но приемлемо).

💀 Сложнее всего было сделать историю визуально-цельной и сюжетно-связной. Тем более, что во вторую неделю работы вышла Nana Banana Pro, которая стала рисовать кадры лучше, но иначе. Хотелось всё бросить, и начать генерить с нуля. Заставил себя сперва доделать клип до конца, и оценить общий результат.
Спасло наличие папки с фиксированными фото персонажей и реквизита, написанные в одном стиле промпты с одинаковыми ключевыми словами, общая системность в работе.

В общем было потно!
Но результат мне нравится.
Надеюсь, зайдёт и вам 🤟🏻


@cgevent
4👍77👎27🔥118
Поможем нашей психологической науке.
Она изучает сейчас очень интересное явление: почему мы с кем-то дружим всю жизнь, а с кем-то расстаемся!

Согласитесь, интересно.
Знаете, что одиночество стало новой нормой — ВОЗ уже говорит о нём как о мировой эпидемии.

Самым лучшим противоядием от одиночества считается дружба.

Давайте поможем ученым с кафедры психологии СПбГу! Ответьте, пожалуйста, на вопросы составленной психологами анкеты.
Опрос анонимный, занимает немного времени.

И тогда быть может, мы поймём:
Почему дружба заканчивается?
Умеем ли мы дружить на самом деле?

👉 Пройти опрос:
https://docs.google.com/forms/d/e/1FAIpQLScXQPmU3iV2Ejw2Sv4eQMVRaPl0RYUnrKjFwUQ4QJJoz5yHkQ/viewform?usp=publish-editor
👍2411👎5🔥2
Forwarded from Neural Shit
S L O P E R A T O R

Кажется, пора менять никнейм во всех соц. сетях и платформах
😁86🔥319
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen-Image-Layered с кодом и весами готов!

Делает из любой RGB картинки RGBA-слои.

Можно вручную задавать от 3 до 10 слоев.

Но! Можно делать слои из слоёв!

Держите сразу демо:
https://huggingface.co/spaces/Qwen/Qwen-Image-Layered

Все остальное, код, веса, папира тут:
https://github.com/QwenLM/Qwen-Image-Layered

P.S. уже есть на репликейт:
https://replicate.com/qwen/qwen-image-layered
И Фал:
https://fal.ai/models/fal-ai/qwen-image-layered

@cgevent
🔥8920👍7😱2😁1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Команда: "Нейростанок"
короткометражный ролик "Я все верну"

🛠 Задача: Создать короткометражный ролик с легким сюжетом в реалистичном стиле.
⏱️ Срок: 50-60 часов чистого времени.
👥 Команда: 2 человека. Разделили задачи по направлениям: — Видео, липсинк, звук. — Арт-дирекшн, статика, монтаж.
💡 Идея и Сеттинг:
Выбрали Микки — мы его фанаты), поэтому решили с ним поработать. Хотелось сделать что-то современное и с юмором, отправили его гулять в Москва-Сити. Вписали в сценарий российские бренды, чтобы продемонстрировать потенциал их интеграции в нейро-видео. Сюжет рождался в моменте, как творческий эксперимент.
Главная техническая цель — демонстрация работы бесшовной камерой с сохранением консистентности окружения и персонажа, а также общий тест наших возможностей.

🎬 Стек и Пайплайн:

Персонаж (Микки): Ideogram /Seedream.

Статика: Nano Banana (первая), Seedream 4

Анимация: Kling 2.1 (Start-End) и Kling 2.5 (Start-End).

Липсинк: Infinity.

Звук: ElevenLabs + Kling v2a (через
Fal.ai).

Пост: Photoshop, Topaz (апскейл до 4К 60fps).

Монтаж: Davinci, AE

🚧 Технические боли и Решения:
Главный вызов — бесшовная камера.

Проблема 1 (Движение): Для склеек нужны были последовательные движения камеры, а генераторы выдавали рандом. Регулировали промптом, точным подбором Start/End кадров и монтажом (выбор лучших шотов).

Проблема 2 (Генераторы): Тестировали Hailuo, Veo 3.1, Seedance — все они меняли конечное разрешение или масштаб объектов, что ломало склейку.
Решение: Полностью перешли на Kling, так как он единственный четко приводит анимацию в указанный End-фрейм.

Проблема 3 (Дорисовки): Если в кадре отсутствовали детали, Kling дорисовывал "что попало". Лечили доработкой стилов в Photoshop под End-фрейм и очень детальным описанием сцены.

Проблема 4 (Птеродактиль): Хотели, чтоб птеродактиль говорил, к сожалению корректно лип на него не лёг ни в одном V2V-инструменте.

🔊 Звук (Инсайт):
Поначалу использовали ElevenLabs, но для SFX (звуковых эффектов) Kling v2a оказался намного круче: он лучше понимает промпт и выдает стерео, в то время как ElevenLabs часто сваливался в моно.

💰 Бюджет:
Суммарно расходы составили $236 (около 23-24 тыс. руб).

Основная часть ($208) ушла на Kling через
Fal.ai (версии 2.1 по $0.45 и 2.5 по $0.35).

Подписка Higgsfield ($49) — для безлимита в Seedream и Banana.

📌 Итог:
Добились результата именно через связку Start-End анимации и ручной доработки промежуточных кадров в Photoshop, когда нейросети не знали нужных объектов или ломали масштаб.
P/S Знаем что присутствуют ляпы и нюансы, но на этом этапе решили остановиться. Надеемся, вайб и идея перевесят технические огрехи.✌🏼
Автор: Нейростанок
Телеграм:
@neurostanok
сайт:
https://нейростанок.рф

@cgevent
29👎420🔥15225👍16😱10😁4
Media is too big
VIEW IN TELEGRAM
Ни рендер, ни генерация...

Оказывается Олаф - это робот! Чистая мехатроника.

Я немного в шоке.

Поглядите видео, там показаны его внутренности.

А причем тут ИИ?

А притом что RL использовался для обучения и воспроизведения анимации. Причем не только основной, но и вторичной типа перекатывания с пятки на носок или уменьшения уровня "топания".

Посмотрите видео от Disney Research, оно реально интересное.

@cgevent
146🔥45👍10😱6😁3
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё немного Диснея/Пиксара.

Только вместо мехатроники чистая генерация.

Это Клинг 2.6 Motion Control.
И это уже хорошо!

Такой нейромокап нам нужен.

Конечно, именно, Эластика двигалась бы по другому, но меня удивляет качество картинки.

Новый нормальный композ однако.

@cgevent
🔥6620👎3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Generative Refocusing
Flexible Defocus Control from a Single Image

Очень занятная работа по рефокусу и боке.

Есть код и даже демо:
https://huggingface.co/spaces/nycu-cplab/Genfocus-Demo

Полный фарш тут:
https://generative-refocusing.github.io/

@cgevent
🔥40👍52
Media is too big
VIEW IN TELEGRAM
Ну за подтанцовку!

Хотя нет.

Ну за певческих артистов!

Добыл полное видео этого эпичного выступления с робатами. Там их соло где то на 2/3 тайминга.

Сначала подумал выпить в тишине за подтанцовку - вон как малыши из Unitree наяривают, а спать и бабки не просят.

Но потом понял, что такую музику в принципе и Суно напишет. А вместо этого кожаного Киркорова можно поставить того же Unitree робата, включить плюсовочку, на экране головы изобразить липсинк - и вот уже робаты поют и танцуют, а кожаные визжат и вонзают. Деньги за билеты и эмоции за просмотр.

Кожаным же все равно, лишь бы звезда была раскручена, вон китайские девочки визжат на концертах аниме-персонажей, а тут им ещё и 3д покажут и костюмы любые можно менять хоть каждый номер.

Звуковики и осветители пока держатся, а вот исполнителям пора податься в актеры мокапа.

Видео сделано прям хорошо. Робаты отлично вписываются в это безумие.

@cgevent
🙏18😁11👎64👍3🔥2
Media is too big
VIEW IN TELEGRAM
Нейропрожарка

Автор: Никита

Стояла задача - сделать как-бы музыкальный клип. Причем исключительно для проверки работоспособности брифа. Так получился клип - Not Today, Zombies
Инструменты очень простые:
Музыка - Suno
text2img - Nano Banana pro / Flux 2 pro
img2video - hailuo 2.3 (85%), Veo 3.1 fast (15%)
Забавно что почти везде справлялся hailuo 2.3, чему я очень рад, ибо он дешевый!

ссылка для просмотра через ютуб -
https://youtu.be/fbpqzZvm_jE?si=zL_0Jv28QAVS6MbA

@cgevent
2👍78👎30🔥1510
Маленький канал. Большие мысли.

Сергей Смелов — основатель финтех-компаний, где работает более 500 человек. Создал свой TG-канал в котором ⬇️

Делится опытом и инсайтами, которые получает, посещая компании Кремниевой долины и встречаясь с выдающимися людьми.

Канал можно читать как бизнес-сериал — с неожиданными сюжетами и бесконечным источником пользы для предпринимателей.

В ближайших постах вы сможете прочитать о том, как я посетил Университет Stanford и Berkeley, и узнал множество инсайтов о культуре и подходах .

Приглашаю вас в ближний круг https://xn--r1a.website/smelov_77

#промо
👎71😁11👍52🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за аниматоров!

Тут вот прям просится выражение "из говна и палок", но палки в данном случае довольно замысловатые:

Time-to-Move (TTM)

Wan 2.2 Video Model

SAM 3 (Meta)

Qwen Image Edit

ComfyUI

Wan Animate

AI Toolkit (LoRA Training)

Есть подробный туториал о том, как это было сделано.

A я вот подумал, что хорошо бы пропустить через это дело большинство страшных кукольных мультфильмов из моего детства.

А то бывало ждёшь целый день, когда по телевизору в 16.00 покажут мультики.
И думаешь: если рисованные - то отлично. Если кукольные - то отстой.

https://youtu.be/pUb58eAZ3pc?si=5eRjIqG_ocn_pfA5

@cgevent
2👍132🔥49😁1512👎1😱1
LLM_Evaluation_Guidebook_russian_version_22_12_2025_t_me_aivkube.pdf
4.8 MB
Новый перевод от Сергея Долгова - на этот раз LLM evaluation guidebook, совместной работы команд Hugging Face и LangChain, по оценке моделей, организации вайб-тестов и LLM-as-a-judge.

@cgevent
👍202🔥1
Forwarded from Denis Sexy IT 🤖
Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а эко-графика

Потому что текст из LLM и генеративные АИ-картинки оставляют намного меньший отпечаток карбона в мире, чем реальные художники и писатели ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁42👎22👍61
Flash portrait

Кому ещё один оживлятор портретов? С кодом.

Главная фишка - он типабыстрый. Ускорен в 6 раз, но не реалтайм.
Генерит говорящие головы неограниченной длительности.

Теперь плохая новость.

40 гиг vram.

И это нашлепка над wan 2.1 14b.

https://github.com/Francis-Rings/FlashPortrait

@cgevent
🔥213👎2👍1