PaperBanana: Automating Academic Illustration for AI Scientists
Генерилка иллюстрации для научных работ от Гугл, конкурент опенсорсного SciGenBench
Работает как команда из пяти агентов: один ищет примеры, другой планирует содержание, третий задаёт стиль, четвёртый превращает текст в картинки, а пятый проверяет и улучшает результат
Гитхаб - вот гитхаб пустой, он предмет простой
#text2image
Генерилка иллюстрации для научных работ от Гугл, конкурент опенсорсного SciGenBench
Работает как команда из пяти агентов: один ищет примеры, другой планирует содержание, третий задаёт стиль, четвёртый превращает текст в картинки, а пятый проверяет и улучшает результат
Гитхаб - вот гитхаб пустой, он предмет простой
#text2image
👍5😁3
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini и Nano Banana в Chrome
Гугл интегрировал ИИ в свой браузер
Часть функций видимо бесплатно. А автобраузинг (Gemini самостоятельно выполняет задачи разной степени сложности вместо пользователя) оставили для пользователей с платной подпиской AI Pro и Ultra в США
#news #browser #assistant #agent
Гугл интегрировал ИИ в свой браузер
Часть функций видимо бесплатно. А автобраузинг (Gemini самостоятельно выполняет задачи разной степени сложности вместо пользователя) оставили для пользователей с платной подпиской AI Pro и Ultra в США
#news #browser #assistant #agent
❤8🔥1😁1
InteractAvatar: Text-Driven Human-Object Interaction
Видео-аватар на базе wan22-5b
— работает с несколькими объектами одновременно
— выполняет сложные многоступенчатые команды
— создаёт реалистичные движения и жесты в такт песне
— реагирует на аудио и движения, а не только на текст
Гитхаб
HF
Спасибо @m_franz
#humanavatar #characteranimation #portrainanimation #lipsync
Видео-аватар на базе wan22-5b
— работает с несколькими объектами одновременно
— выполняет сложные многоступенчатые команды
— создаёт реалистичные движения и жесты в такт песне
— реагирует на аудио и движения, а не только на текст
Гитхаб
HF
Спасибо @m_franz
#humanavatar #characteranimation #portrainanimation #lipsync
👍7❤4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
FSVideo: Fast Speed Video Diffusion Model in a Highly-Compressed Latent Space
Быстрый видеогенератор без кода от ByteDance на базе Wan2.1-14B-I2V
Прикрутили видеоавтоэнкодер, который сильно сжимает данные (соотношение даунсэмплинга 64 × 64 × 4), но при этом сохраняет качество реконструкции
Генерирует видео в несколько шагов с повышением разрешения, что делает их более чёткими и реалистичными.
Спасибо @m_franz
#image2video
Быстрый видеогенератор без кода от ByteDance на базе Wan2.1-14B-I2V
Прикрутили видеоавтоэнкодер, который сильно сжимает данные (соотношение даунсэмплинга 64 × 64 × 4), но при этом сохраняет качество реконструкции
Генерирует видео в несколько шагов с повышением разрешения, что делает их более чёткими и реалистичными.
Спасибо @m_franz
#image2video
👍6❤3🔥2
Нейронавт | Нейросети в творчестве
У нас снова ролик от Антона Зимина. Вернее, пока трейлер. И теперь он работал не один, с командой Слово автору: А вот и трейлер для моего короткометражного фильма «Not A Toy» — «Не игрушка», полностью созданного в нейронке. Совместное производство моего…
Media is too big
VIEW IN TELEGRAM
https://vimeo.com/antonzimin/notatoy
Новый короткометражный фильм «Not A Toy» («Не игрушка») уже в доступе. Он, как вы уже догадались, полностью сделан в нейронке.
Совместное производство AI-бутика AiZ и продакшн-компании Lion Films. Автор сценария и режиссёр — Антон Зимин.
Сделан за шесть недель. Все видеоматериалы фильма сгенерированы в Veo 3.1 по требованиям фестиваля Ai Awards для 1billionsummit.
Ключевые кадры созданы с помощью Nano Banana. Ближе к концу проекта появилась Banana Pro, и мы её тоже кое-где использовали.
В процессе производства использованы сервисные AI-решения Google — Flow, Whisk, Gemini, а также работа через API. Дополнительно применялись сторонние инструменты, включая Freepik и Adobe Photoshop по API.
Отдельным этапом стала разработка собственного приложения, работающего через API Nano Banana. Оно позволило существенно упростить и ускорить создание консистентных ключевых кадров — одной из основных проблем при работе с генеративным видео, за что отдельное спасибо Жене и Сереже.
Я делал подробный бриф на каждую сцену — с расположением камер и мудбордом, потом мы вместе делали ключевые кадры, и уже на их основе генерил видео.
Существенную часть времени заняла работа с качеством изображения. Общие планы, полученные в Veo, часто имели недостаточную детализацию, поэтому был выстроен сложный многоэтапный процесс апскейла. Вообще Veo сильно «мажет» на общих планах. Использовали несколько сервисов и моделей, включая Topaz и SeedVR. Что-то апскейлилось с первого раза, а где-то приходилось переходить из модели в модель, выстраивая сложную последовательность, работая с изображением послойно. Монтаж, цветокоррекцию и финальный плёночный эффект делал в DaVinci Resolve.
Фильм создавался для конкурсного направления «Мир скрытых вещей». Я подумал, что будет интересно показать, что думает игрушечный пистолет. Вдруг он вовсе не хочет быть пистолетом, а мечтает быть обычной игрушкой. Так появился главный герой — игрушечный пистолет-невротик, который боится, что может внезапно выстрелить. В мире, где все готовы бесконечно бомбить друг друга ракетами, такой персонаж становится белой вороной, и именно на этом строится центральный конфликт истории.
В итоге это фильм о том, как сложно быть чем-то иным в мире, где насилие становится нормой. О персонаже, который не вписывается в реальность, построенную на разрушении, и именно поэтому оказывается в конфликте с окружающим миром.
Музыкальная тема фильма создана с помощью Suno — на основе напетого мной припева, который спонтанно возник у меня в голове, пока я мылся в душе. Да, иногда я пою, когда никто не слышит.
Как вы знаете, я уже делал рекламу в AI, и мне было интересно поработать с нейронкой в более крупной форме.
Команда:
Совместное производство LION FILMS(lionfilms.ru) и AiZ (@aizproduction)
Режиссер и автор сценария - Антон Зимин
Исполнительный продюсер - Виктория Санкина
Креативный продюсер - Кирилл Абакумов
ИИ художники:
Антон Зимин
Кирилл Абакумов
Сергей Сапрыкин
Евгений Крыжнев
Монтаж:
Антон Зимин
Максим Брагин
#работыподписчиков
Новый короткометражный фильм «Not A Toy» («Не игрушка») уже в доступе. Он, как вы уже догадались, полностью сделан в нейронке.
Совместное производство AI-бутика AiZ и продакшн-компании Lion Films. Автор сценария и режиссёр — Антон Зимин.
Сделан за шесть недель. Все видеоматериалы фильма сгенерированы в Veo 3.1 по требованиям фестиваля Ai Awards для 1billionsummit.
Ключевые кадры созданы с помощью Nano Banana. Ближе к концу проекта появилась Banana Pro, и мы её тоже кое-где использовали.
В процессе производства использованы сервисные AI-решения Google — Flow, Whisk, Gemini, а также работа через API. Дополнительно применялись сторонние инструменты, включая Freepik и Adobe Photoshop по API.
Отдельным этапом стала разработка собственного приложения, работающего через API Nano Banana. Оно позволило существенно упростить и ускорить создание консистентных ключевых кадров — одной из основных проблем при работе с генеративным видео, за что отдельное спасибо Жене и Сереже.
Я делал подробный бриф на каждую сцену — с расположением камер и мудбордом, потом мы вместе делали ключевые кадры, и уже на их основе генерил видео.
Существенную часть времени заняла работа с качеством изображения. Общие планы, полученные в Veo, часто имели недостаточную детализацию, поэтому был выстроен сложный многоэтапный процесс апскейла. Вообще Veo сильно «мажет» на общих планах. Использовали несколько сервисов и моделей, включая Topaz и SeedVR. Что-то апскейлилось с первого раза, а где-то приходилось переходить из модели в модель, выстраивая сложную последовательность, работая с изображением послойно. Монтаж, цветокоррекцию и финальный плёночный эффект делал в DaVinci Resolve.
Фильм создавался для конкурсного направления «Мир скрытых вещей». Я подумал, что будет интересно показать, что думает игрушечный пистолет. Вдруг он вовсе не хочет быть пистолетом, а мечтает быть обычной игрушкой. Так появился главный герой — игрушечный пистолет-невротик, который боится, что может внезапно выстрелить. В мире, где все готовы бесконечно бомбить друг друга ракетами, такой персонаж становится белой вороной, и именно на этом строится центральный конфликт истории.
В итоге это фильм о том, как сложно быть чем-то иным в мире, где насилие становится нормой. О персонаже, который не вписывается в реальность, построенную на разрушении, и именно поэтому оказывается в конфликте с окружающим миром.
Музыкальная тема фильма создана с помощью Suno — на основе напетого мной припева, который спонтанно возник у меня в голове, пока я мылся в душе. Да, иногда я пою, когда никто не слышит.
Как вы знаете, я уже делал рекламу в AI, и мне было интересно поработать с нейронкой в более крупной форме.
Команда:
Совместное производство LION FILMS(lionfilms.ru) и AiZ (@aizproduction)
Режиссер и автор сценария - Антон Зимин
Исполнительный продюсер - Виктория Санкина
Креативный продюсер - Кирилл Абакумов
ИИ художники:
Антон Зимин
Кирилл Абакумов
Сергей Сапрыкин
Евгений Крыжнев
Монтаж:
Антон Зимин
Максим Брагин
#работыподписчиков
🔥15👍6👎4❤3
ACE-Step 1.5: Pushing the Boundaries of Open-Source Music Generation
Новая версия генератора музыки в опенсорсе!
Целая песня на 10 сек на RTX 3090
Достаточно 4ГБ VRAM
50+ языков
Разрешено коммерческое использование
— дообучается на стиль на нескольких песнях
— сама придумывает план для песни по простому запросу — от коротких лупов до композиций на 10 минут
И уже поддерживается в Комфи
Гитхаб
HF
Веса на ComfyOrg
MS
Демо
воркфлоу
Спасибо @MaxKhtv
#music #text2music #musicediting
Новая версия генератора музыки в опенсорсе!
Целая песня на 10 сек на RTX 3090
Достаточно 4ГБ VRAM
50+ языков
Разрешено коммерческое использование
— дообучается на стиль на нескольких песнях
— сама придумывает план для песни по простому запросу — от коротких лупов до композиций на 10 минут
И уже поддерживается в Комфи
Гитхаб
HF
Веса на ComfyOrg
MS
Демо
воркфлоу
Спасибо @MaxKhtv
#music #text2music #musicediting
🔥17👍4❤1
Нейронавт | Нейросети в творчестве
ACE-Step 1.5
This media is not supported in your browser
VIEW IN TELEGRAM
Заработал демоспейс ACE-Step 1.5
Если нет возможности / желания заводить генерилку музыки локально, то теперь можно попробовать. А вчера он выдавал ошибку.
Клянусь, про курву и шалаве он сам сочинил, у меня промпт был из одного слова, и язык я не выбирал
#musicediting #text2music
Если нет возможности / желания заводить генерилку музыки локально, то теперь можно попробовать. А вчера он выдавал ошибку.
Клянусь, про курву и шалаве он сам сочинил, у меня промпт был из одного слова, и язык я не выбирал
#musicediting #text2music
😁18👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen3-Coder-Next: Pushing Small Hybrid Models on Agentic Coding
Модель для кода на базе Qwen3-Next-80B-A3B-Base
— умеет хорошо рассуждать на длинные дистанции, пользоваться инструментами и справляться с ошибками при выполнении задач
— показывает результаты выше 70 % в SWE-Bench Verified и держится на уровне в других тестах
— при размере в 3B активных параметров работает не хуже моделей с 10–20 раз большим количеством параметров
Гитхаб
HF - есть GGUF, от всего 49ГБ
Qwen чат
#coding #assistant #agent
Модель для кода на базе Qwen3-Next-80B-A3B-Base
— умеет хорошо рассуждать на длинные дистанции, пользоваться инструментами и справляться с ошибками при выполнении задач
— показывает результаты выше 70 % в SWE-Bench Verified и держится на уровне в других тестах
— при размере в 3B активных параметров работает не хуже моделей с 10–20 раз большим количеством параметров
Гитхаб
HF - есть GGUF, от всего 49ГБ
Qwen чат
#coding #assistant #agent
👍6🤷♂1🔥1😁1
https://acemusic.ai/playground/create
И еще тут можно попробовать ACE-Step 1.5, только кажется сервис в коме. А нет, не в коме, прочухался через полчаса. Треками можно делиться но не скачивать
Кто узнает мелодию?
Еще можно скачать десктопное #windows приложение и не париться с макаронным монстром (Комфи)
А вместо этого попариться с ошибками питона. Потому что аппка запускает сервер с вебмордой, а под ней те же diffusers
Если захотите поколупаться, среду для аппки можете качнуть с моего сбердиска потому что у них без впн не скачивается
[UPDATE] можно и без инсталлятора установить, инструкция на гитхабе
#desktop #musicediting #text2music #music2music
И еще тут можно попробовать ACE-Step 1.5, только кажется сервис в коме. А нет, не в коме, прочухался через полчаса. Треками можно делиться но не скачивать
Кто узнает мелодию?
Еще можно скачать десктопное #windows приложение и не париться с макаронным монстром (Комфи)
А вместо этого попариться с ошибками питона. Потому что аппка запускает сервер с вебмордой, а под ней те же diffusers
Если захотите поколупаться, среду для аппки можете качнуть с моего сбердиска потому что у них без впн не скачивается
[UPDATE] можно и без инсталлятора установить, инструкция на гитхабе
#desktop #musicediting #text2music #music2music
👍3