Psy Eyes

Kling: в рамках анонсированной омни-недели, запустили видеогенератор Kling O1.

Это мультимодальная модель, которой можно подавать на вход рефы разных форматов: текст, картинки, и видео.

Одно видео стоит 40 кредитов.

Сайт
Твит

1.94K views15:38

Psy Eyes

Лора для генератора картинок Qwen IE 2509 с фокусом на ретекстуризации объектов.

С первой картинки берется объект/окружение, а со второй референс.

Триггер в промте: change materials of image1 to match the reference in image2

Коммерческая лицензия Apache 2.

Хаггинг

2.1K views17:00

Psy Eyes

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

тест на дантиста

зачем фильмы ужасов, когда есть сплаты

1.69K views18:09

Psy Eyes

Comfy обновился и произошел переход на новую версию нод — Nodes 2.0, в основе которой JavaScript фреймворк Vue.

Это должно помочь разработчикам комфи быстрее пилить апдейты, а авторам нод упростить и ускорить их создание.

Также это шаг в сторону единого упрощающегося фронтенда с Comfy Cloud, который вышел в публичную бету и обзавёлся пачкой RTX 6000 Pro с 96 ГБ VRAM для запуска воркфлоу пользователей.

Визуально разница в следующем:
* Очередь/история генераций теперь справа вверху
* Если её раскрыть, в сжатом виде показываются текущие задачи и можно через меню контента посмотреть его/добавить в воркфлоу/открыть ворк на его основе, итд.
* Прогрессбар показан не зеленой полосой на весь экран, а небольшой голубой под очередью
* Параметры меняются прямо в поле, а не попапе
* Выбор контента на вход отображается визуально плитками, а не списком

Вместе с этим видны и некоторые баги: параметры в ноде могут разъехаться далеко друг от друга; выпадающий список с моделями может быть перекрываться заблокированной (bypass) нодой; некоторые ноды не двигаются; ты промт поменял, а оно продолжает генерить по тому же промту или не генерит вообще.

Так что, возможно, если хотите стабильности, стоит или выключить Nodes 2 в меню комфи, или не обновляться пока.

Про Nodes 2
Гитхаб
Сайт

3.55K views13:00

Psy Eyes

1:15

This media is not supported in your browser

VIEW IN TELEGRAM

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

TwelveLabs: выпустили Marengo 3, индексатор видео контента для поиска в нём персонажей/объектов/сказанных фраз, итд. Подойдёт для: нахождения слов и действий персонажа; моментов как спортсмен N забивает мяч в ворота; блогер появляется в кадре с продуктом бренда; итд. Я писал о них ранее.

Что нового:
* Индексация видео файлов длиной до 4 часов
* Мультимодальный поиск одновременно и по тексту и рефу с картинки
* Возможность создать сущность по 1-5 фото, которую можно тегать в поле поиска
* Работает на 36 языках, включая русский
* Понимает специфичные термины для спорта и кино (zooms, pan, tracking shot, итд)

Есть SDK для интеграции в сторонний пайплайн и API для оплаты за каждый запрос.

На бесплатном тарифе у вас 600 минут. Я закинул 40+ мин файл для теста и сделал сущность по 5 фото. Индексация идёт очень быстро за считанные минуты, а нужный момент с персонажем ищется моментально.

Сайт
Анонс

2.29K views14:32

Psy Eyes

0:43

This media is not supported in your browser

VIEW IN TELEGRAM

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Kling: выпустили видео модель Kling V 2.6.

Из нового: генерация 1080p сразу с аудио и липсинком на разных языках. Работает и с животными. Можно в промте написать какую фразу требуется сказать и она сгенерится. Поддерживает режимы text-2-video и image-2-video, но пока не с 2 кейфреймами.

Уже доступен у агрегаторов Freepik, Fal, Higgsfield, итд.

А вчера они презентовали свою альтернативу банане — генератор картинок O1 Image, хотя он был доступен с момента запуска O1 Video.

Давайте рисовые котаны! Теперь музыкальный генератор вместо Suno и Udio!

Сайт
Анонс

2.59K views16:13

Psy Eyes

Там YouTube запустил фичу Recap, которая суммаризует что ты смотрел за год, в каких количествах, и в какой прокрастинаторский котёл тебя сажать. Похоже на Wrapped у Spotify.

В начале рекапа пишется, что AI может ошибаться, а дальше идёт перечисление тематик просмотренных видосов, и уже сама аналитика. Довольно занятно увидеть стату по просмотренным каналам, и тут особо вопросов нет, кроме того факта, что в AI секции он подсветил какие-то малознакомые из них. Где Себастьян, Оливио, Nerdy Rodent, и другие?

И тоже самое сходу незнакомое про музыкальные каналы на самом YouTube. Хотя по YouTube Music всё 100% правильно, я его отдельной десктоп апой слушаю.

Больше вопросов по срезу тематик и выданной ачивке. Но тут YouTube ориентируется на описание видео или может даже его содержание, и чтобы выдать более правильный значок нужно знать почему/какими глазами я смотрю этот контент, что мной движет. Потому что, если мне дать описание ачивок и возможность выбора самому, я весьма вероятно выбрал бы другую. Кстати сия функция пригодилась бы ютубу в качестве RLHF.

Чтобы увидеть рекап нужен ip на США. В других локациях запустят на следующей неделе.

Посмотреть свой рекап
Анонс

2.01K views18:09

About

Blog

Apps

Platform