Media is too big
VIEW IN TELEGRAM
Лора для генератора картинок Qwen IE 2509 с фокусом на ретекстуризации объектов.
С первой картинки берется объект/окружение, а со второй референс.
Триггер в промте:
Коммерческая лицензия Apache 2.
Хаггинг
С первой картинки берется объект/окружение, а со второй референс.
Триггер в промте:
change materials of image1 to match the reference in image2Коммерческая лицензия Apache 2.
Хаггинг
Comfy обновился и произошел переход на новую версию нод — Nodes 2.0, в основе которой JavaScript фреймворк Vue.
Это должно помочь разработчикам комфи быстрее пилить апдейты, а авторам нод упростить и ускорить их создание.
Также это шаг в сторону единого упрощающегося фронтенда с Comfy Cloud, который вышел в публичную бету и обзавёлся пачкой RTX 6000 Pro с 96 ГБ VRAM для запуска воркфлоу пользователей.
Визуально разница в следующем:
* Очередь/история генераций теперь справа вверху
* Если её раскрыть, в сжатом виде показываются текущие задачи и можно через меню контента посмотреть его/добавить в воркфлоу/открыть ворк на его основе, итд.
* Прогрессбар показан не зеленой полосой на весь экран, а небольшой голубой под очередью
* Параметры меняются прямо в поле, а не попапе
* Выбор контента на вход отображается визуально плитками, а не списком
Вместе с этим видны и некоторые баги: параметры в ноде могут разъехаться далеко друг от друга; выпадающий список с моделями может быть перекрываться заблокированной (bypass) нодой; некоторые ноды не двигаются; ты промт поменял, а оно продолжает генерить по тому же промту или не генерит вообще.
Так что, возможно, если хотите стабильности, стоит или выключить Nodes 2 в меню комфи, или не обновляться пока.
Про Nodes 2
Гитхаб
Сайт
Это должно помочь разработчикам комфи быстрее пилить апдейты, а авторам нод упростить и ускорить их создание.
Также это шаг в сторону единого упрощающегося фронтенда с Comfy Cloud, который вышел в публичную бету и обзавёлся пачкой RTX 6000 Pro с 96 ГБ VRAM для запуска воркфлоу пользователей.
Визуально разница в следующем:
* Очередь/история генераций теперь справа вверху
* Если её раскрыть, в сжатом виде показываются текущие задачи и можно через меню контента посмотреть его/добавить в воркфлоу/открыть ворк на его основе, итд.
* Прогрессбар показан не зеленой полосой на весь экран, а небольшой голубой под очередью
* Параметры меняются прямо в поле, а не попапе
* Выбор контента на вход отображается визуально плитками, а не списком
Вместе с этим видны и некоторые баги: параметры в ноде могут разъехаться далеко друг от друга; выпадающий список с моделями может быть перекрываться заблокированной (bypass) нодой; некоторые ноды не двигаются; ты промт поменял, а оно продолжает генерить по тому же промту или не генерит вообще.
Так что, возможно, если хотите стабильности, стоит или выключить Nodes 2 в меню комфи, или не обновляться пока.
Про Nodes 2
Гитхаб
Сайт
TwelveLabs: выпустили Marengo 3, индексатор видео контента для поиска в нём персонажей/объектов/сказанных фраз, итд. Подойдёт для: нахождения слов и действий персонажа; моментов как спортсмен N забивает мяч в ворота; блогер появляется в кадре с продуктом бренда; итд. Я писал о них ранее.
Что нового:
* Индексация видео файлов длиной до 4 часов
* Мультимодальный поиск одновременно и по тексту и рефу с картинки
* Возможность создать сущность по 1-5 фото, которую можно тегать в поле поиска
* Работает на 36 языках, включая русский
* Понимает специфичные термины для спорта и кино (zooms, pan, tracking shot, итд)
Есть SDK для интеграции в сторонний пайплайн и API для оплаты за каждый запрос.
На бесплатном тарифе у вас 600 минут. Я закинул 40+ мин файл для теста и сделал сущность по 5 фото. Индексация идёт очень быстро за считанные минуты, а нужный момент с персонажем ищется моментально.
Сайт
Анонс
Что нового:
* Индексация видео файлов длиной до 4 часов
* Мультимодальный поиск одновременно и по тексту и рефу с картинки
* Возможность создать сущность по 1-5 фото, которую можно тегать в поле поиска
* Работает на 36 языках, включая русский
* Понимает специфичные термины для спорта и кино (zooms, pan, tracking shot, итд)
Есть SDK для интеграции в сторонний пайплайн и API для оплаты за каждый запрос.
На бесплатном тарифе у вас 600 минут. Я закинул 40+ мин файл для теста и сделал сущность по 5 фото. Индексация идёт очень быстро за считанные минуты, а нужный момент с персонажем ищется моментально.
Сайт
Анонс
1
Kling: выпустили видео модель Kling V 2.6.
Из нового: генерация 1080p сразу с аудио и липсинком на разных языках. Работает и с животными. Можно в промте написать какую фразу требуется сказать и она сгенерится. Поддерживает режимы text-2-video и image-2-video, но пока не с 2 кейфреймами.
Уже доступен у агрегаторов Freepik, Fal, Higgsfield, итд.
А вчера они презентовали свою альтернативу банане — генератор картинок O1 Image, хотя он был доступен с момента запуска O1 Video.
Давайте рисовые котаны! Теперь музыкальный генератор вместо Suno и Udio!
Сайт
Анонс
Из нового: генерация 1080p сразу с аудио и липсинком на разных языках. Работает и с животными. Можно в промте написать какую фразу требуется сказать и она сгенерится. Поддерживает режимы text-2-video и image-2-video, но пока не с 2 кейфреймами.
Уже доступен у агрегаторов Freepik, Fal, Higgsfield, итд.
А вчера они презентовали свою альтернативу банане — генератор картинок O1 Image, хотя он был доступен с момента запуска O1 Video.
Давайте рисовые котаны! Теперь музыкальный генератор вместо Suno и Udio!
Сайт
Анонс
Там YouTube запустил фичу Recap, которая суммаризует что ты смотрел за год, в каких количествах, и в какой прокрастинаторский котёл тебя сажать. Похоже на Wrapped у Spotify.
В начале рекапа пишется, что AI может ошибаться, а дальше идёт перечисление тематик просмотренных видосов, и уже сама аналитика. Довольно занятно увидеть стату по просмотренным каналам, и тут особо вопросов нет, кроме того факта, что в AI секции он подсветил какие-то малознакомые из них. Где Себастьян, Оливио, Nerdy Rodent, и другие?
И тоже самое сходу незнакомое про музыкальные каналы на самом YouTube. Хотя по YouTube Music всё 100% правильно, я его отдельной десктоп апой слушаю.
Больше вопросов по срезу тематик и выданной ачивке. Но тут YouTube ориентируется на описание видео или может даже его содержание, и чтобы выдать более правильный значок нужно знать почему/какими глазами я смотрю этот контент, что мной движет. Потому что, если мне дать описание ачивок и возможность выбора самому, я весьма вероятно выбрал бы другую. Кстати сия функция пригодилась бы ютубу в качестве RLHF.
Чтобы увидеть рекап нужен ip на США. В других локациях запустят на следующей неделе.
Посмотреть свой рекап
Анонс
В начале рекапа пишется, что AI может ошибаться, а дальше идёт перечисление тематик просмотренных видосов, и уже сама аналитика. Довольно занятно увидеть стату по просмотренным каналам, и тут особо вопросов нет, кроме того факта, что в AI секции он подсветил какие-то малознакомые из них. Где Себастьян, Оливио, Nerdy Rodent, и другие?
И тоже самое сходу незнакомое про музыкальные каналы на самом YouTube. Хотя по YouTube Music всё 100% правильно, я его отдельной десктоп апой слушаю.
Больше вопросов по срезу тематик и выданной ачивке. Но тут YouTube ориентируется на описание видео или может даже его содержание, и чтобы выдать более правильный значок нужно знать почему/какими глазами я смотрю этот контент, что мной движет. Потому что, если мне дать описание ачивок и возможность выбора самому, я весьма вероятно выбрал бы другую. Кстати сия функция пригодилась бы ютубу в качестве RLHF.
Чтобы увидеть рекап нужен ip на США. В других локациях запустят на следующей неделе.
Посмотреть свой рекап
Анонс