Psy Eyes
4.86K subscribers
1.02K photos
926 videos
5 files
1.14K links
Креатив + AI + Web3... и мемы

Личная страница @andrey_bezryadin
Download Telegram
Tencent: выпустили опенсорсный видеогенератор HunyuanVideo.

По качеству (черрипиков) выглядит неплохо: лучше, чем Allegro, но тесты покажут насколько годнее Mochi-1 или LTX. Опять же, для чего-то абстрактного, не лезущего в сторону зловещей долины, может подойти. Из интересного — монтаж кадров промтом: описываешь две сцены, детали для камеры, и получаешь естественный переход. Плюс генерация со звуком как в Movie Gen.

Для генерации 544px960px129fps понадобится 45 ГБ VRAM, а для 720px1280px129fps 60 ГБ. При этом авторы рекомендуют не мелочиться и гонять на 80 ГБ VRAM. Есть веб демо, но нужна китайская симка. Альтернативно имеется колаб.

Для Mochy тоже по началу нужно было 4 H100, а в итоге оптимизировали под запуск на 4090. Kijai уже ваяет адаптер под Comfy.

В целом тренд релиза таких прожорливых моделей навевает мысли, что толи в 5090 будет памяти больше слухов и китайская братия об этом знает, толи разрабы двигают развитие multigpu в рамках одного компа или распределёнку, толи считают что народ сам или с помощью нейронок (возможно будущих) адаптирует это под актуальное железо.

Пока HunyuanVideo работает только в text-2-video. Позже подъедут image-2-video с чекпоинтами, Gradio демо, официальное Comfy, и diffusers.

Будем следить за развитием событий.

Сайт
Гитхаб
Comfy (Kijai)
Хаггинг
Демо (сайт)
Демо (колаб)
This media is not supported in your browser
VIEW IN TELEGRAM
Если Магомет не идёт к горе, то гора идёт к Магомету.

За всё это время ни разу не доводилось потестить голосовой режим ChatGPT в мобильной и десктоп апе, а недавно его завезли и в браузерную версию. Ну штош, теперь погнали.

Как я раньше говорил, мне применение наиболее интересно в работе с акцентом, конкретно британским. Заметил, что не все голоса хорошо в него умеют: то есть ожидать, что Maple с американского начнёт говорить также как Vale из коробки вероятно не стоит.

Отвечает быстро и диалог кажется живым. Но способных на это моделей уже не мало: Play Dialog, Moshi, итд. После разговора виден его текстовый вариант, что удобно. Также хорошо, что запоминается то, где остановились, хотя было бы неплохо иметь кнопочку reset, чтобы обнулить знания о тебе.

Как учитель AI пока ведёт себя слишком радушно. Я пробовал намеренно говорить с очень плохим акцентом, а она отвечала, что ты молодец продолжай в том же духе. Это создаёт фейковое ощущение прогресса, и потакает тем, кто хочет жить в пузыре позитива и не может воспринимать критику. Но возможно надо просто сказать don't be nice и тогда всё будет.

10 минут в месяц бесплатно. Далеко на этом не уедешь, но хотя бы можно пощупать.

Сайт
Windows
Mac
Android
iOS
This media is not supported in your browser
VIEW IN TELEGRAM
Krea продолжают ваять вменяемый UI/UX для генератива и теперь тизерят Krea Editor, в котором можно делать аутпейнт и впиливать объекты промтом в выделенную область.

Ещё бы картинки можно было таким образом вкидывать, как, например, у Blendbox.

Пока фича в приватной бете, доступ к которой вероятно можно получить оставив коммент под твиттом.

Сайт
This media is not supported in your browser
VIEW IN TELEGRAM
Оказывается помимо V2 версии IC-Light есть ещё Vary с упором на разнообразие вариаций освещения, при сохранении деталей. Тут обсуждение на гитхабе.

lllyasviel, давай уже жахни в опенсорс всё.

Демо (IC-Light-V2)
Демо (IC-Light-V2-Vary)
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня хочу подсветить работы сообщества. Будем идти по порядку появления на горизонте событий.

Начнём со Stan Travis, который поковырял код видеогенератора Allegro и смог оптимизировать всё под запуск на 20 ГБ VRAM вместо 27-30 ГБ как в оригинальной репе.

Вместо 100 шагов и более часа на одно видео на 4090, теперь норм результат можно получить в 25 шагов за 20 минут. Заодно вот тест цензуры и генерации nsfw контента.

Файл, который надо заменить в папке с Allegro и действия которые надо сделать описаны здесь.

Все звёзды с этого поста пойдут Стену. Так как в телеге нет способа напрямую их послать (кроме как подарком, но там комиссия за сжигание), то я спустя неделю с этой публикации пошлю эму эквивалент в TON. Если потом поставятся ещё звёзды - докину. Или вы можете отправить ему TON напрямую по юзернейму.

Альтернативно: Стен заведи канал и на него в посты можно будет донатить звёзды, или сделай бота/миниапп в телеге чиста для приёма звёзд.
Следующим у нас идёт FREY_Глеб.

Он сделал воркфлоу для Mochi-1, где выходное видео апскейлится и сразу идёт в mp4 без необходимости ручной конвертации из webp. Можете опробовать воркфлоу закинув в Comfy картинку из этого поста или вот json файлик (лишние элементы внизу можете удалить).

Глеб появился с нами недавно, но очень активно в чате делится разными тестами, воркфлоу, и генерациями (например, раз и два).

А ещё он ведёт свой канал ArtStory, на котором думаю интересного будет всё больше.

Все звёзды с этого поста пойдут Глебу.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
И закончим на сегодня обзор работ сообщества роликом Dominick The Donkey.

Фоны к нему делал Всеволод Таран, с которым некоторые из вас знакомы по каналу тоже моушн.

Со своей задачей — нести Новогоднее настроение видео справляется. В следующем году уже будем такие видео делать с персонализацией под себя и в ещё лучшем качестве. Единственно его бы подсократить и тогда сумбур под нарратив текста песни не так бросался бы в глаза.

Заставка студии в конце ништ!

Все звёзды с этого поста пойдут Всеволоду.
Пока мы на этой волне ещё хотел кое-чем поделиться.

Открываю я значит входящие на почте и вижу это письмо. У меня сразу перед глазами вьетнамские флешбеки, когда я сам писал похожие письма много лет назад, рассылая их во все стороны. Вот только теперь я это вижу глазами пусть и случайного, но получателя, и всё смотрится иначе.

Я решил ответить и дать фидбэк, что можно улучшить в подходе (не только тексте), чтобы повысить эффективность. Так как я ответил наскоро, я потом ещё добавил отдельным письмом, что вес личных связей может перевалить вес нейронных связей и это надо качать, а также что "тебя заменит не нейронка, а тот кто умеет пользоваться нейронкой", и доп пару вещей.

Просто ещё из её письма я ощутил некую беззащитность перед завтрашним днём. Как буд-то никаких нейросетей не существует и хэдкаунт вакансий на хэдхантере на копирайтеров завтра будет таким же как вчера. И почувствовал, что надо предупредить человека.

Если б мне кто-нибудь годы назад ответил хоть на одно моё письмо и дал подобный фидбэк я был бы благодарен.
⚡️⚡️⚡️ Вниманию пользователей СomfyUI

Пакет Ultralytics, необходимый для FaceDetailer версий v8.3.41 и v8.3.42 был скомпрометирован и содержит майнер. Пока что пострадали только пользователи macOS и Linux. Но чтобы обезопасить себя на Windows, рекомендую удалить любой Ultralytics и поставить версию 8.3.40.
Официальный источник

Как это сделать:
1. Зайдите в корень ComfyUI (там, где лежит папка python_embeded и файл run_nvidia_gpu.bat)
2. В адресной строке проводника (там, где видите путь) нажмите в пустом месте. Выделится путь, сотрите его и наберите cmd и нажимаете ⏎ Enter, чnобы открылась консоль.
3. В открывшейся консоли выполните этот код:
set appdata=tmp
set userprofile=tmp
set temp=tmp
set path=python_embeded
python -m pip uninstall -y ultralytics
python -m pip install ultralytics==8.3.40

Он удалит все пакеты Ultralytics и установит чистые не заражённые, версии 8.3.40
Please open Telegram to view this post
VIEW IN TELEGRAM
То, что партнёрки так легко из своего мини-апа делать, как и вписываться в них это прям найс.

Кстати как у вас новый плеер для видео работает и вложение картинок к уже существующим постам? У меня плеер не оптимизирует видео какие варики ни грузи, и нет выбора качества на какие видосы бы не натыкался. Аттач картинок работает как-то местечково. Может нагрузка увеличилась и решили откатить? Будем наблюдать.

https://telegram.org/blog/affiliate-programs-ai-sticker-search/ru
Вот что прям нужно в телеге как по мне, так это возможность прицеплять форумы к каналам.

Что это даёт:
* Народ сможет в соответствующих ветках обсуждать модели, подходы к трене, делиться артом, оставлять визитки, находить заказы, вместе мутить проекты, итд.
* Есть те, кому чат кажется мало активным/дублирующим новости, и они уходят из чата, оставаясь подписанными на канал. В форуме будет больше движа и больше вариантов найти что-то для себя.
* Те, кому наоборот чат кажется очень активным, могут замьютить лишние ветки и оставить только те, что им нужны.
* Если будет возможность разные каналы делать отдельными ветками форума, это будет плюс. Например, у вас много разных каналов на схожую тематику, и так их можно было бы соединить воедино.

Канал + форум = match made in heaven

Но на данный момент я не могу взять чат, который используется для коментов и сконвертировать его в форум, пока он используется как дискуссионная группа. А если чат отцепить, то все коменты под постами пропадут. В итоге форумы как не пришей манде рукав болтаются у людей в описании каналов, в которые ещё должна быть причина чтобы заглянуть.

А нужно-то всего, чтобы при сцепливании ты выбирал ветку в которую идут новости и в которую идут коменты (или оставить general для этого). Я не нахожу причин почему это до сих пор не сделано за 2 года. Возможно есть какие-то технические ограничения.

У телеги есть страница, где собираются фичи и баги. Я не ожидаю, что Паша и ко её смотрят, но попытка не пытка. Нашёл три тикета на тему близкую к тому, что я описал. На всех проголосовал.

https://bugs.telegram.org/c/22766

https://bugs.telegram.org/c/33822

https://bugs.telegram.org/c/22905
В следующий раз, когда к тебе подойдёт тимлид с предложением что-то добавить/убавить, можешь апеллировать "казна опустела милорд".