Метаверсище и ИИще
47.9K subscribers
6.05K photos
4.52K videos
47 files
6.95K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Для начала, это были никакие не дипфейки, а довольно топорные генерации, целиком сделанные в одном из генераторов.

Я быстро нашел исходники, это очень-очень плохого качества картинки, сделанные похоже либо в старом Stable Diffusion, либо вообше в Microsoft Designer. Никакого реализма, скорее карикатура низкого качества. Не порно, а скорее визуальные оскорбления.

Появились они с подачи одного фаната футбольной команды Buffalo Bulls. Тот разозлился, что его любимцы проиграли команде Chiefs, где играет нынешний бойфренд певицы Трэвис Келси, и таким вот способом решил пофанатеть.

В Твитторе глупые картинки набрали 50 миллионов просмотров и 25 тыщ репостов - это к вопросу о вере в человечество.

В этой ситуации меня радует, что вектор дискуссии наконец-то смещается с "запретить ИИ" на "что делать с распространенем картинок в интернете".

А ИИ просто обнажает проблему, переводя количество в некое новое качество, с которым непонятно, что делать.

Поясню. Все эти генерации с Тейлор Свифт появились сначала на сайте Celebrity Jihаd. Он существует уже около 15 лет и все это время постит реальные и не очень реальные картинки знаменитостей. Там полно фейков, созданных кожаными, а не ИИ.
Та же Тейлор Свифт уже судилась с сайтом, как и многие другие. И ничего, сайт жив и здоров, ибо экономическая модель работает и покрывает издержки.

Но тут пришел ИИ, и выяснилось, что генерить фейки (которые уже были и до того), можно в промышленных масштабах. И что они могут быть кривыми, косыми, некачественными - пипл схавает.

И тут кожаные, наконец, задумались. А на чем строится экономическая модель сайтов типа Celebrity Jihаd? На чем строится 50 миллионов просмотров в Твитторе за сутки? Что не так с экономикой внимания и на чем строится это внимание? Что будет на следующих выборах? Может быть что-то не так с метриками? Или с самими кожаными?

А ИИ стоит в сторонке и предлагает посмотреть в зеркало всем кожаным, которые мечтали о завоевании космоса, а теперь репостят глупости в твитторе, чем пугают Белый дом.
Вы находитесь тут, говорит он, без всяких эмоций (которых у него, по убеждению многих, нет).
🔥39👍18👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Я далек от того, чтобы перепащивать тыщщи ИИ-картиночек и видосов с просторов интернетов и твитторов.
Мне гораздо интереснее, как реальные люди используют это в реальной повседневной работе. Такой как графика и реклама.

Вот держите рекламу, полностью сделанную с помощью ИИ (кроме музыки).
Ну и за пределами картиночек, всегда интересно, КАК это все добро делалось.
Коменты от подписчика (Магомед, спасибо, дорогой):
В процессе создания видео, особенно сложным оказался этап подбора промптов для MidJourney, но в этом мне помогал Chat Gpt. Но что бы добиться максимальной консистентности пришлось создать более тысячи тестовых изображений. Для анимации я использовал PikaLabs, там было применено 50 - 100 тестов каждой сцены, что бы получить реалистичное движение и необходимую динамику.
Всего процесс занял около месяца.

https://www.instagram.com/reel/C2pGS26vI7Q/?igsh=NXJsbW5pNnFxNnhu
🔥59👍14👎3
Помните Ленсу? Приложение, куда загружаешь свое фото, потом ждешь минут 20, получаешь пачку своих аватаров.
Сейчас это можно делать на своем компе или на в сети - например тут.

Зовется все это InstantID и базируется на ControlNet и том самом IP-Adapter

Для тех, кто не готов лезть в Автоматик или разводить код у себя на компе, есть демо на ХаггингФейс, где это теперь генерится со скоростью Stable Diffusion 1.5.

Я выждал, когда спадет ажиотаж и теперь демо работает довольно быстро. Забросил туда пару старых фоток. Не стал упираться в промпт, а просто спросил chatGPT:
give me prompt for generating cyberpunk portrait of old man weaponed with AI-gun

и после этого покричал на него:
now make it for Stable Diffusion and avoid "he" and verbs

Получил:
"Cyberpunk portrait: old, wise man with cybernetic enhancements. White, slicked-back hair, glowing cybernetic eyes. Dark, rugged trench coat, neon trim. Neon-lit, urban futuristic setting. Sophisticated AI-gun with glowing elements, digital interface in hand. Background of towering skyscrapers, holographic ads, dystopian city atmosphere. Mood: moody, gritty futurism; seasoned figure in high-tech world. #cyberpunk #futuristic #dystopia"

Результаты в шапке. Он меня отлично состарил, прям попал в текущий лук. А то на фотках я на Сигграфе в 2019 году.

Го генерить себя красивых.

И тут речь не идет о переносе лица, для этого есть FaceFusion, о котором я писал.

Это скорее замена всех этих Лор и Чекпойнтов, натренированных на ваших или чужих фотках. Причем по ОДНОЙ фотографии.

И кстати, вторая картинка, которая призвана контролировать позу, контролирует поворот головы и плеч. Это скорее ракурс, чем поза. Про руки забудьте.

Ну и какие руки - этожаватары!

P.S. Кто знает, какой чекпойнт Stable Diffusion там под капотом - делитесь в коментах.
👍35🔥8👎1
Ну вот чем итальянцам не нравится chatGPT?
Итальянский регулятор заявил, что ChatGPT от OpenAI все же нарушает законы о конфиденциальности.
Это вымогательство денег (штрафы) или что-то личное, итальянское?
👍4🔥3
Forwarded from Denis Sexy IT 🤖
Кажется, у знаменитого в среде больших языковых моделей стартапа Mistral AI украли модель «Mistral Medium 70b» и выложили ее для всех в формате gguf с именем «miqu-70b».

Автор модели не признается что это утечка и утверждает что все натренил сам, при этом детали тренировки не раскрывает и отказывается опубликовать «несжатую» (fp16) версию модели – якобы, выложить не может так как у него плохой интернет, при этом уже залил больше 100гб разных «пожатых» версий этой модели (модели «ужимают» или «квантируют» жертвуя немного их качеством, чтобы проще было запустить на слабом железе).

Я тоже поигрался и согласен, что модель подозрительно хорошая – не gpt4, но блин, от ноунейма в индустрии таких уровней не ждешь обычно.

Вы можете потестировать ее бесплатно тут, какой-то реддитор выложил (без регистрации):
https://www.neuroengine.ai/Mixtral-7b-8expert

Еще, на тестах с реддита видно, что «неизвестная модель miqu» подозрительно близко подобралась по количеству очков к известной закрытой модели «Mistral Medium».

Ждем деталей, выглядит все очень подозрительно.

Но если правда, нас скоро ждет gpt3.5 уровень в каждом тостере хотим мы этого или нет ☕️ правда, даже если это не утечка, нас всё равно это ждало бы, так что ничего не поменялось
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30🔥2
Полезность: Калькулятор видеопамяти, необходимой для инференса и обучения LLM-ок.

Начинаете вводить слева название модели и не забываете нажать Enter. Справа появится диаграмма, сколько вам надо выбранных видеокарт, чтобы запускать или тренировать модель для разных вариантов точности (int4-fl32).
Список видеокарт пополняется.
https://huggingface.co/spaces/Vokturz/can-it-run-llm
Я также давал ссылку на альтернативный LLM-калькулятор:
https://vram.asmirnov.xyz/
🔥12👍5
Пятнадцать тысяч девятьсот шестьдесят три LLM-ки.

Тут вот португальские ребята, которые раньше занимались базами данных и датой, взяли и запилили полный каталог больших языковых моделей.
Видно, что опыт работы с данными у них имеется - получился довольно нарядный дашборд, где также есть неплохой поиск.

Сразу шуруйте в общий список:
https://llm.extractum.io/list/

Там много вариантов сортировки и огромное количество столбцов. Рейтинги и скачивания, как я понял, берутся с HuggingFace. Все это синкается постоянно - для поиска, анализа и ресерча - очень удобно. Есть ссылки на статьи с архива.

Но 15963 ллм-ки!
https://llm.extractum.io/
🔥20👍5
Смотрите, что получается, когда Stable Diffusion и Runway попадают в руки человека, который является монстром в Гудини. Ну и вообще монстром графики.
Даня Криворучко бахнул в инсте несколько постов о том, как он приручает Stable Diffusion и что из этого получается.

Я выкусил у него несколько примеров и текстов, а полный пост от Дани со всеми ссылками на инсту ниже. Там же вы узнаете, что будет если посчитать моушен-вектора от лоурезной анимации из Runway и применить обратно на хайрезные исходные картинки? И про автоматический in-paint недостающих кусков на геометрии дисплейснутой сгенереной картой глубины...

"В ноябре прошлого года я просто установил ComfyUI и начал свое путешествие - возиться с этой технологией было очень похоже на мои первые дни изучения Houdini - как будто смотришь на черную дыру, и гравитация медленно, но неотвратимо затягивает тебя.

Интересно размышлять о том, как ваш мозг проходит путь от полного отключения в попытках постичь совершенно чуждые знания до момента, когда вы думаете в терминах ControlNets / IPAdapters / LoRAs / Samplers, и внезапно все это обретает смысл.

Забавно, насколько искусство с помощью ИИ далеко от того, чем я занимался в CG. Мне не хватит двух рук, чтобы сосчитать все счастливые случайности, которые произошли за всю мою карьеру при работе с Houdini - вы должны очень хорошо понимать, что вы хотите сделать, иначе этого просто не произойдет. Работа в ComfyUI была гораздо ближе к моей борьбе с акварелью во времена учебы в художественной школе. Большую часть времени приходится тратить на то, чтобы склонить среду к своей воле; в 95 % попыток получается что-то слишком очевидное, скучное или похожее на то, что сделал бы любой другой. Но в 1% из оставшихся 5 (если вам повезет) вы увидите что-то, что вас зацепит, и эта часть вызывает привыкание - я могу часами настраивать параметры, постоянно думая: "Следующая работа будет той самой"


https://xn--r1a.website/myshli_channel/686
👍35🔥18👎6
This media is not supported in your browser
VIEW IN TELEGRAM
Такое нейро3Д нам нужно!
https://twitter.com/myshli_com
👍34👎8🔥4
Я знаю Серегу Осипова еще по временам, когда я прилетал в Минск выступать в Wargaming, а вся команда WG Video Team (Кирилл, Саша, Саша) круто выступала у меня на Ивентах и брала призы в категорях Motion Design.

Так вот, Сергей запускает нехилый такой стартап Placy.ai - AI real estate assistant. MVP стартует на Кипре уже весной. Есть возможность понаблюдать за стартапом прямо в процессе создания продукта. Сергей, один из фаундеров, который на минуточку когда-то придумал и сделал единорога Cian.ru, ведет свой блог Placy Journal, где пишет обо всем в формате “открытая кухня”. Техно-инсайты, маркетинговые находки. Там даже можно поучаствовать в выборе аватара для AI-ассистента и т.п. Обещает пригласить подписчиков канала первыми на тестирование MVP в апреле.

И это не взаимный пиар или что там еще употребляют в телеграмме. Мы только что три часа взахлеб общались с Серегой, расширяя сознание разговорами про ИИ. Так что контент там будет интересный).
https://xn--r1a.website/placy_ai
👍10🔥5👎2
Чем мне нравится DALL·E 3, так это своим чувством юмора и неприхотливостью к промптам.
Пишу анонс к очередному Хабу. И просто кидаю в chatGPT - дай мне криптозиму, бро.
- Апажалста.

И все на месте. И смыслы, и персонажи.
🔥84👍21