Метаверсище и ИИще
47.8K subscribers
6.05K photos
4.51K videos
46 files
6.95K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Помните Ленсу? Приложение, куда загружаешь свое фото, потом ждешь минут 20, получаешь пачку своих аватаров.
Сейчас это можно делать на своем компе или на в сети - например тут.

Зовется все это InstantID и базируется на ControlNet и том самом IP-Adapter

Для тех, кто не готов лезть в Автоматик или разводить код у себя на компе, есть демо на ХаггингФейс, где это теперь генерится со скоростью Stable Diffusion 1.5.

Я выждал, когда спадет ажиотаж и теперь демо работает довольно быстро. Забросил туда пару старых фоток. Не стал упираться в промпт, а просто спросил chatGPT:
give me prompt for generating cyberpunk portrait of old man weaponed with AI-gun

и после этого покричал на него:
now make it for Stable Diffusion and avoid "he" and verbs

Получил:
"Cyberpunk portrait: old, wise man with cybernetic enhancements. White, slicked-back hair, glowing cybernetic eyes. Dark, rugged trench coat, neon trim. Neon-lit, urban futuristic setting. Sophisticated AI-gun with glowing elements, digital interface in hand. Background of towering skyscrapers, holographic ads, dystopian city atmosphere. Mood: moody, gritty futurism; seasoned figure in high-tech world. #cyberpunk #futuristic #dystopia"

Результаты в шапке. Он меня отлично состарил, прям попал в текущий лук. А то на фотках я на Сигграфе в 2019 году.

Го генерить себя красивых.

И тут речь не идет о переносе лица, для этого есть FaceFusion, о котором я писал.

Это скорее замена всех этих Лор и Чекпойнтов, натренированных на ваших или чужих фотках. Причем по ОДНОЙ фотографии.

И кстати, вторая картинка, которая призвана контролировать позу, контролирует поворот головы и плеч. Это скорее ракурс, чем поза. Про руки забудьте.

Ну и какие руки - этожаватары!

P.S. Кто знает, какой чекпойнт Stable Diffusion там под капотом - делитесь в коментах.
👍35🔥8👎1
Ну вот чем итальянцам не нравится chatGPT?
Итальянский регулятор заявил, что ChatGPT от OpenAI все же нарушает законы о конфиденциальности.
Это вымогательство денег (штрафы) или что-то личное, итальянское?
👍4🔥3
Forwarded from Denis Sexy IT 🤖
Кажется, у знаменитого в среде больших языковых моделей стартапа Mistral AI украли модель «Mistral Medium 70b» и выложили ее для всех в формате gguf с именем «miqu-70b».

Автор модели не признается что это утечка и утверждает что все натренил сам, при этом детали тренировки не раскрывает и отказывается опубликовать «несжатую» (fp16) версию модели – якобы, выложить не может так как у него плохой интернет, при этом уже залил больше 100гб разных «пожатых» версий этой модели (модели «ужимают» или «квантируют» жертвуя немного их качеством, чтобы проще было запустить на слабом железе).

Я тоже поигрался и согласен, что модель подозрительно хорошая – не gpt4, но блин, от ноунейма в индустрии таких уровней не ждешь обычно.

Вы можете потестировать ее бесплатно тут, какой-то реддитор выложил (без регистрации):
https://www.neuroengine.ai/Mixtral-7b-8expert

Еще, на тестах с реддита видно, что «неизвестная модель miqu» подозрительно близко подобралась по количеству очков к известной закрытой модели «Mistral Medium».

Ждем деталей, выглядит все очень подозрительно.

Но если правда, нас скоро ждет gpt3.5 уровень в каждом тостере хотим мы этого или нет ☕️ правда, даже если это не утечка, нас всё равно это ждало бы, так что ничего не поменялось
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30🔥2
Полезность: Калькулятор видеопамяти, необходимой для инференса и обучения LLM-ок.

Начинаете вводить слева название модели и не забываете нажать Enter. Справа появится диаграмма, сколько вам надо выбранных видеокарт, чтобы запускать или тренировать модель для разных вариантов точности (int4-fl32).
Список видеокарт пополняется.
https://huggingface.co/spaces/Vokturz/can-it-run-llm
Я также давал ссылку на альтернативный LLM-калькулятор:
https://vram.asmirnov.xyz/
🔥12👍5
Пятнадцать тысяч девятьсот шестьдесят три LLM-ки.

Тут вот португальские ребята, которые раньше занимались базами данных и датой, взяли и запилили полный каталог больших языковых моделей.
Видно, что опыт работы с данными у них имеется - получился довольно нарядный дашборд, где также есть неплохой поиск.

Сразу шуруйте в общий список:
https://llm.extractum.io/list/

Там много вариантов сортировки и огромное количество столбцов. Рейтинги и скачивания, как я понял, берутся с HuggingFace. Все это синкается постоянно - для поиска, анализа и ресерча - очень удобно. Есть ссылки на статьи с архива.

Но 15963 ллм-ки!
https://llm.extractum.io/
🔥20👍5
Смотрите, что получается, когда Stable Diffusion и Runway попадают в руки человека, который является монстром в Гудини. Ну и вообще монстром графики.
Даня Криворучко бахнул в инсте несколько постов о том, как он приручает Stable Diffusion и что из этого получается.

Я выкусил у него несколько примеров и текстов, а полный пост от Дани со всеми ссылками на инсту ниже. Там же вы узнаете, что будет если посчитать моушен-вектора от лоурезной анимации из Runway и применить обратно на хайрезные исходные картинки? И про автоматический in-paint недостающих кусков на геометрии дисплейснутой сгенереной картой глубины...

"В ноябре прошлого года я просто установил ComfyUI и начал свое путешествие - возиться с этой технологией было очень похоже на мои первые дни изучения Houdini - как будто смотришь на черную дыру, и гравитация медленно, но неотвратимо затягивает тебя.

Интересно размышлять о том, как ваш мозг проходит путь от полного отключения в попытках постичь совершенно чуждые знания до момента, когда вы думаете в терминах ControlNets / IPAdapters / LoRAs / Samplers, и внезапно все это обретает смысл.

Забавно, насколько искусство с помощью ИИ далеко от того, чем я занимался в CG. Мне не хватит двух рук, чтобы сосчитать все счастливые случайности, которые произошли за всю мою карьеру при работе с Houdini - вы должны очень хорошо понимать, что вы хотите сделать, иначе этого просто не произойдет. Работа в ComfyUI была гораздо ближе к моей борьбе с акварелью во времена учебы в художественной школе. Большую часть времени приходится тратить на то, чтобы склонить среду к своей воле; в 95 % попыток получается что-то слишком очевидное, скучное или похожее на то, что сделал бы любой другой. Но в 1% из оставшихся 5 (если вам повезет) вы увидите что-то, что вас зацепит, и эта часть вызывает привыкание - я могу часами настраивать параметры, постоянно думая: "Следующая работа будет той самой"


https://xn--r1a.website/myshli_channel/686
👍35🔥18👎6
This media is not supported in your browser
VIEW IN TELEGRAM
Такое нейро3Д нам нужно!
https://twitter.com/myshli_com
👍34👎8🔥4
Я знаю Серегу Осипова еще по временам, когда я прилетал в Минск выступать в Wargaming, а вся команда WG Video Team (Кирилл, Саша, Саша) круто выступала у меня на Ивентах и брала призы в категорях Motion Design.

Так вот, Сергей запускает нехилый такой стартап Placy.ai - AI real estate assistant. MVP стартует на Кипре уже весной. Есть возможность понаблюдать за стартапом прямо в процессе создания продукта. Сергей, один из фаундеров, который на минуточку когда-то придумал и сделал единорога Cian.ru, ведет свой блог Placy Journal, где пишет обо всем в формате “открытая кухня”. Техно-инсайты, маркетинговые находки. Там даже можно поучаствовать в выборе аватара для AI-ассистента и т.п. Обещает пригласить подписчиков канала первыми на тестирование MVP в апреле.

И это не взаимный пиар или что там еще употребляют в телеграмме. Мы только что три часа взахлеб общались с Серегой, расширяя сознание разговорами про ИИ. Так что контент там будет интересный).
https://xn--r1a.website/placy_ai
👍10🔥5👎2
Чем мне нравится DALL·E 3, так это своим чувством юмора и неприхотливостью к промптам.
Пишу анонс к очередному Хабу. И просто кидаю в chatGPT - дай мне криптозиму, бро.
- Апажалста.

И все на месте. И смыслы, и персонажи.
🔥84👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Тут недавно инернетик взрывался новым трейлером GTA6.
Выглядит нарядно, а на реддите мощно обсуждают, ИИ уже проник в застенки TakeTwo и нас может ожидать что-то совсем новое и интересное.

Динамическая генерация Интерьеров и Анимаций (для NPC), которая подстраивается, скажем так, под контекст (прокачка игрока, наигрыш, время года или дня, что угодно).

TakeTwo запатентовали несколько "идей" из которых выделяются две.

ИИ-интерьеры.

Интерьеры будут генерироваться случайным образом, то есть: комнаты/здания будут соответствовать стилистическим категориям/тегам.

Например: квартира дорогого класса по сравнению со старой квартирой, где есть стили и объекты: новые/изношенные, чистые/грязные. Общая структура, но будут взаимозаменяемые черты/объекты/элементы, которые будут генерироваться и развиваться с течением времени. Комната не изменится просто от того, что вы выйдете из нее и сразу же войдете снова.

AI NPC
У NPC будут генерируемые ИИ "ответы", настроения и анимации, основанные на событиях, атмосфере, настроениях и ситуациях других игроков или NPC.

Пример: Если NPC попал под дождь, его действия могут быть рандомизированы в зависимости от дождя/погоды. Если NPC пьян, он будет реагировать по-разному, основываясь на том, что ИИ случайно подскажет NPC, что делать - это не встроенное в игру "дерево анимаций". Если вы делаете что-то "безумное", ИИ может приказать NPC начать записывать вас на свой телефон.

По сути, они будут вести себя и чувствовать себя гораздо более индивидуально, с большим разнообразием спонтанных действий. Как будто все они живут своей собственной жизнью.

Я честно посмотрел патенты от TakeTwo, но не нашел там ничего про ИИ, максимум про data-driven animation. Что, впрочем, позволяет домыслить это как ИИ и бахнуть вот этот пост.

Ну и мы стремительно движемся к content on demand - каждому своя картинка. Дергающая за индивидуальный рычажок удовольствия.
👍40👎2🔥2
И да, Илон Маск удачно вонзил свою иголочку в мозг первого кожаного пациента. Пациент жив. На этом пока все.
Поэтому я бы подождал месяцок, чтобы поглядеть, что будет дальше.
И какого рода "коммуникация" будет идти через иголочку.
Пока это односторонний канал. Изнутри наружу.
🔥29👍14👎6