Тут ребята представили новый метод для разбора анимированной графики на отдельные спрайты 🎨 ✨.
🚀 😌 🤖 🔍 🖼️
Как это работает?🤔
🎨 🔧 🎉
Вот здесь можно посмотреть пэйпер, а так же готовый код💻 🔥.
Сергей Булаев AI 🤖 - об AI и не только
1. Был собран набор данных
Crello Animation, содержащий сотни профессионально созданных анимированных графических видео (их делали в основном для ТикТока и Инсты)
. Это дало материал для тестирования и оценки метода 🧪.
2. Ключевая идея - представить каждый спрайт как комбинацию статичной текстуры и параметров анимации 💡. Это упрощает задачу по сравнению с попытками разложить каждый кадр отдельно
.
3. Использовали несколько ИИ-моделей
:
- Модель сегментации видео (TAM) для начального выделения объектов
- Нейронную сеть (U-Net) для улучшения качества текстур
- Алгоритмы оптимизации для точной настройки параметров ⚙️
Как это работает?
1. Пользователь выделяет объекты на одном кадре 👆
2. ИИ отслеживает эти объекты на протяжении всего видео 👀
3. Система создает начальные варианты текстур и параметров анимации
4. Запускается процесс оптимизации, который уточняет все параметры
5. В результате получаются отдельные спрайты с текстурами и анимацией
Вот здесь можно посмотреть пэйпер, а так же готовый код
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3 музыкальных AI видео от Ray, прошлогоднего финалиста конкурса Runway Gen:48 (кстати видео финалистов конкурса этого года тоже стоит посмотреть).
- музыкальное anime (мой сын делает их уже много лет, только вручную, и каждый раз тратит часы и даже дни)
- первая ежегодная конвенция для нереальных людей
- на и просто эксперементы с midjourney + runway
Сергей Булаев AI 🤖 - об AI и не только
- музыкальное anime (мой сын делает их уже много лет, только вручную, и каждый раз тратит часы и даже дни)
- первая ежегодная конвенция для нереальных людей
- на и просто эксперементы с midjourney + runway
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Эмоции... by Jer at EccentrismArt
Смотреть со звуком!🤔 🤔 🤔
🌄 Midjourney
🌃Upscale with @Magnific_AI
🎥 Runway Gen-3
🗣️Voice2Voice: @elevenlabsio
🫦Lipsync LivePortrait
😊Video face upscale in Remini.
💇Masked LivePortrait были артефакты по углам
Сергей Булаев AI 🤖 - об AI и не только
Смотреть со звуком!
🌄 Midjourney
🌃Upscale with @Magnific_AI
🎥 Runway Gen-3
🗣️Voice2Voice: @elevenlabsio
🫦Lipsync LivePortrait
😊Video face upscale in Remini.
💇Masked LivePortrait были артефакты по углам
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Так, ну что там, 8 по москве уже близко? Стоит ждать? У меня просто 11-й час, боюсь не досижу....
Что бы не уснуть, расскажу тему...
Давно думаю об омниканальности, ну в том смысле, что создаваемый тобой контент должен расходиться по разным платформам. Тоесть вот есть Telegram. Для меня - это основа - я пишу сюда. Есть понимание, что дальше из этих постов должны делаться твиты, youtube шортс, instagram stories, ТикТоки итд... Понятное дело что делать их в идеале должны AI агенты.
Думаю давно, а к действиям приступил на выходных - начал писать бота, который каждый мой пост в канале превращается в пост в твиттере. Начал, но не дописал, но ради эксперементальной практики решил пока делать это всё в ручную (вернее в текущем состоянии мне сейчас бот присылает в личку уже посты для твиттера). В результате впервые за долгое время выложил в твиттере пост на тему Omni Engineer. Получились прикольные результаты. Радуюсь.
Обещаю, когда научусь это всё автоматизировать - со всеми поделюсь :)
Сергей Булаев AI 🤖 - об AI и не только
Давно думаю об омниканальности, ну в том смысле, что создаваемый тобой контент должен расходиться по разным платформам. Тоесть вот есть Telegram. Для меня - это основа - я пишу сюда. Есть понимание, что дальше из этих постов должны делаться твиты, youtube шортс, instagram stories, ТикТоки итд... Понятное дело что делать их в идеале должны AI агенты.
Думаю давно, а к действиям приступил на выходных - начал писать бота, который каждый мой пост в канале превращается в пост в твиттере. Начал, но не дописал, но ради эксперементальной практики решил пока делать это всё в ручную (вернее в текущем состоянии мне сейчас бот присылает в личку уже посты для твиттера). В результате впервые за долгое время выложил в твиттере пост на тему Omni Engineer. Получились прикольные результаты. Радуюсь.
Обещаю, когда научусь это всё автоматизировать - со всеми поделюсь :)
Сергей Булаев AI 🤖 - об AI и не только
Google представил Gemini Live — расширенный режим голосового общения для Gemini. Он нацелен на создание более естественных и интерактивных разговоров с пользователями.
На данный момент Gemini Live уже доступен на английском языке для пользователей Android, подписанных на Gemini Advanced. Однако Google планирует другие языки и платформы, включая iOS.
Очевидна конкуренция с Advanced Voice Mode от OpenAI. Компания подчеркивает возможности своего бота для более "человечных" взаимодействий.
Вот здесь Джоанна Стерн из WSJ пробует им пользоваться, посмотрите с 1:40
Сергей Булаев AI 🤖 - об AI и не только
На данный момент Gemini Live уже доступен на английском языке для пользователей Android, подписанных на Gemini Advanced. Однако Google планирует другие языки и платформы, включая iOS.
Очевидна конкуренция с Advanced Voice Mode от OpenAI. Компания подчеркивает возможности своего бота для более "человечных" взаимодействий.
Вот здесь Джоанна Стерн из WSJ пробует им пользоваться, посмотрите с 1:40
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Сахил Лавинья (CEO Gumroad) записал клёвый стрим на два с половиной часа где он переделывает свою личную страничку на Tailwind с помощью Cursor. Очень хорошо показано как его использовать и то, что никакие Copilot там не нужны. Всем кто хочет научиться нормально пользоваться курсором - советую. Есть ещё первая сессия (это уже вторая), но я её я пока не посмотрел.
#CEOwhoCodes #Зерокодинг
Сергей Булаев AI 🤖 - об AI и зерокодинге
#CEOwhoCodes #Зерокодинг
Сергей Булаев AI 🤖 - об AI и зерокодинге
На новых Google Pixel 9-го поколения будет доступна функция суммаризации звонков (Call notes). Так же будет сохранятся полная расшифровка разговора. Всё будет работать прямо на телефоне (без облака), все участники разговора будут предупреждаться о записи.
Ещё в Pixel Studio будет доступна генерация изображений аж на двух моделях (локальной и облачной), а по скриншотам можно будет искать с ИИ анализом (по текстам, людям и объектам)
Сергей Булаев AI 🤖 - об AI и не только
Ещё в Pixel Studio будет доступна генерация изображений аж на двух моделях (локальной и облачной), а по скриншотам можно будет искать с ИИ анализом (по текстам, людям и объектам)
Сергей Булаев AI 🤖 - об AI и не только
А вы знали что через openrouter.ai можно использовать кучу разных моделей, платя за них в том числе криптой! И в чате и через API (это, кстати, как раз сервис универсального API к моделям).
ChatGPT-4o, GPT-4o (2024-08-06) - доступны по обычной цене, как при покупке напрямую... Правда?? А так можно было чтоли?
Сергей Булаев AI 🤖 - об AI и не только
ChatGPT-4o, GPT-4o (2024-08-06) - доступны по обычной цене, как при покупке напрямую... Правда?? А так можно было чтоли?
Сергей Булаев AI 🤖 - об AI и не только
a1.art — клёвая платформа, позволяет преобразовать ваши фотографии в иллюстрации 🎨 за секунды. Можно поиграться бесплатно! После регистрации по моей ссылке получите 15 генераций бесплатно.
Более 3000 приложений с различными стилями, а также поддержка мультимодальных форматов. Просто загружаешь картинку, иногда надо добавить что то текстом.
Пользователи могут создавать приложения для генерации изображений и видео. Модульная структура функций похожа на конструктор. Можно форкать😁 чужие приложухи и видоизменять их! Правда большинство функций доступны только с pro аккантуом. 😭
Видео где то должно быть, искал, но не нашёл, если найдёте пришлите ссылочку на приложение!
Даже и не спрашивайте кто на всех этих картинках.🥇
Сергей Булаев AI 🤖 - об AI и не только
Более 3000 приложений с различными стилями, а также поддержка мультимодальных форматов. Просто загружаешь картинку, иногда надо добавить что то текстом.
Пользователи могут создавать приложения для генерации изображений и видео. Модульная структура функций похожа на конструктор. Можно форкать
Видео где то должно быть, искал, но не нашёл, если найдёте пришлите ссылочку на приложение!
Даже и не спрашивайте кто на всех этих картинках.
Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM