Метаверсище и ИИще
46.8K subscribers
5.94K photos
4.37K videos
45 files
6.83K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Хуньянь: Китайский генератор картинок от ТикТока. С весами и пирогами.

Коль скоро SD3 мы увидим примерно никто не знает когда, то смотрим, вокруг.
ТикТок выкатил свою модель. С кодом и весами.
Ну и конечно по их китайским тестам она бьет весь опенсорс (включая SD3), скромно уступая Midjourney и DALL·E 3.

Но мы ж не просто перепащиваем новости и визжим от черрипикнутых картинок с их сайта.

Лезем в демо и тестируем. Расчехляем промпт с принцессой.
Они делают акцент на улучшенное понимание китайского языка. Тут мне похвастаться нечем, я погонял на английском.

И да, там есть Prompt Enhancement, как в фооокусе, добавление текстовой красоты в промпт. Работает забавно. Но мыло не убирает.
Три сэмплера, третий не работает.

На итоге: уровень SD2 или SD1.5. Сильное мыло, беда с руками, постоянно сваливается в аниме. Возможно если бы были крутилки, можно что-то докрутить, но в демо нет никаких крутилок.
Можно поставить локально, может быть там будет больше параметров.

Он совершенно не умеет в людей, но на всяких узорах и декорах ведет себя пристойно, даже мылит меньше. Похоже на первый firefly.

Для тех, кто в NSFW - очень забавная цензура. Промпт не отвергает, но пытается укутать картинку хотя бы в белье. Постоянно сваливается в аниме, от греха подальше. Когда добиваешь негативным промтом, изорачиваетя. Мылит соски, прячет детали. Похоже на поведение SDXL.

Все явки и пароли тут:
https://github.com/Tencent/HunyuanDiT

Потестируйте, может у вас китайский хороший...
👍24👎1
Ну и вишенка на китайском торте.

Если включаешь Prompt Enhancement, то она из стройной девушки на лугу, делает вот такой вариант. Типа добавляет новой нормальной красоты. С одним и тем же сидом и промптом.
Диверсити, блин. И до Китая добралось.

Подробнее в предыдущем посте.
🔥45👎15👍3
Если вернуться к аналогиям с рассерженными художниками и программерами, то я все ждал, когда начнется волна гонений на Suno и Udio. Это ж какая угроза музыкальной индустрии и повод выпить за музыкантов. Музыка пришла на полянку GenAI последней (по масс адопшену, скажем так), и пришла сразу не с пустыми руками, а в виде охренительных генераторов. Музыканты уже приподвзвыли, Там Билли Айлиш с пацанами уже протестуют в интернетике.
Но с горы уже спускаются очень взрослые мальчики с юристами наперевес. Которые вопрошают: а вы где музычку скачали для тренировки.
И пока OpenAI лихорадочно заключает соглашения с медиа-ресурсами, StackOverflow и Реддитом, чтобы иметь справку из школы, а Маск закупает данные с 4Chan, музыкальным стартапам придется несладко. Столько денег у них нет, чтобы договариваться с Ворнером или Сони.
Кто будет следующим Stable Music Diffusion? Чтобы можно было тренировать, тюнить, выпускать свои модели в опенсорс:
Читаем ниже:
👍18
Forwarded from Denis Sexy IT 🤖
😐 Корпорация Sony Music напряглась от такого количества генераторов музыки и приступила к запугиванию: они написали письма ~700 стартапам, с просьбой рассказать, как музыка лицензируемая Sony используется в тренировках

Это чистая атака на музыкальные GenAI стартапы, потому что закона обвязывающего показывать, что в датасете – нет

Потом будут использовать эти ответы в суде и может быть как-то прессовать тех, кто не ответят

Но я не удивлен если честно, музыкальные модели только в опенсорсе мне кажется будут развиваться, аналогично Stable Diffusion – чтобы выстоять перед давлением Sony Music нужно иметь серьезных юристов за плечами

Ссылка на новость
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥6👎1
Forwarded from AI Product | Igor Akimov
OpenAI анонсировали улучшение в анализе данных.

1. Загрузка файлов напрямую из Google Drive и Microsoft OneDrive:
- Больше не нужно загружать файлы на рабочий стол и затем загружать их в ChatGPT. Теперь можно добавлять файлы напрямую из облачных хранилищ, что ускоряет процесс анализа данных.

2. Работа с таблицами в реальном времени:
- ChatGPT создаст интерактивную таблицу, которую можно развернуть на весь экран. Вы сможете следить за обновлениями таблицы в процессе анализа, задавать уточняющие вопросы или выбирать подсказки для более глубокого анализа.

3. Настройка и скачивание диаграмм для презентаций и документов:
- Вы можете настраивать и взаимодействовать с различными типами диаграмм (столбчатые, линейные, круговые и точечные диаграммы) прямо в разговоре. Когда диаграмма будет готова, её можно скачать для использования в презентациях или документах.

Выглядит интересно. И снова подкосит сотню стартапов :)
https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
👍34🔥9👎31
ИИ-поздравлялки.

Вчера был какой-то угарный день, в канал влетело 300 человек - в основном из-за репостов истории про то, как Gemini матерится на OpenAI. Хороший контент рулит.

И я совершенно пропустил момент, когда мы пробили 25 000!
Глянул вечером, оппаньки! Раздулся от гордости и ну продолжать писать глупости.

В общем, напишите мне в коментах что-то приятное, а я буду дальше раздуваться и писать.
Если вы совсем дерзкие, можете жбакнуть по кнопке "Поддержать" в закрепе и метнуть TON в мою сторону, но это совершенно не обязательно.

Чтобы пост был не совсем бесполезным для вас, вот вам промп для gpt-4o, который позволяет сделать картинку в точности по тексту, без раскучерявливания.

make picture with exact prompt "25k subscribers" with no prompt enhancement and show me this prompt in json-format after

Он выдаст вам вот так, чтобы вы могли его контролировать:
{
"prompt": "25k subscribers",
"size": "1024x1024"
}

Есть еще параметр n:1, но он не работает. А когда-то был даже seed но его убрали. Про разрешения спросите его, он расскажет.

Мне вот такая картинка без стереотипов и приукрашиваний вполне себе нравится. С приукрашиваниями получаются банальные логосы с кривым текстом.

Это я к чему. Покидайте в него промпты типа "." или " " или "`" или ":)" или куски кода.
Обнаружилось, что его ломает "{" или "}" в любых включениях и он не может в пустой промпт "". В отличие от Stable Diffusion. Системный промпт ломается очевидно.

Получите странные картинки. Меня сразило, когда он на чистый пробел " " выдал мне Будду. Совпадение?

И не увлекайтесь, сначала поздравлялки, потом картинки.

Ваш ИИ-дедован.
👍104🔥49👎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой трик, который вы можете использовать, чтобы повысить удобство использования генераций во время рисования:

Скачиваете Windows on Top, накладываете окно Photoshop поверх Krea.ai, включаете стриминг окна Photoshop и рисуете поверх генерации.
🔥99👍25👎2
ИИ-новый NFT?

Вот держите огненную историю о том, деньги на итоге решают. А ИИ просто смотрит на то, как кожаные с помощью него зарабатывают - ибо наши любимые метрика - это трафик.

Я стал замечать, что даже Гугл в поиске мне стал часто подсовывать картинки сгенеренные ИИ. Особенно, когда речь идет о нетривиальных запросах.

И тут бомбануло на сайте Devian Art. Обнаружилось, что сайт активно продвигает "лучших продавцов" контента "Isaris-AI" и "Mikonotai", которые, как сообщалось, заработали десятки тысяч долларов на массовых продажах.
Обнаружилось кто-то (вероятно админы) создал сеть ботов, реализующую хорошо известную в NFT схему зарабатывания: создать тысячи ИИ-изображений и аккаунтов, заставить их покупать и шиллить друг друга, раздуть метрики, чтобы "искусство" бустилось на DeviantArt и поднималось в рейтингах выше кожаных. А там и продажи.

Напомню, что в отличие от остальных стоков, DevianArt ласково принял ИИ в 2022 году - вместе со StabilityAI они запустили внутренний инструмент генерации изображений под названием DreamUp.

В Девиане полыхает. Юзеры удаляют свои акки, пишут проклятия, админы удаляют эти проклятия, в общем все как у людей.

Но это я к чему. Пока метриками являются трафик, переходы и объемы контента, ИИ будет хохотать над этим смешными протестами и попытками регуляции. Ибо получается лицемерие: а давайте сохраним существующие метрики, но не разрешим кожаным зарабатывать на ИИ.

OpenAI скупает данные по всему интернетику, Адобченко и Getty тоже. Скоро даже серая зона в виде "вы тренировались на наших данных, мы на такое не подписывались" станет белой. И смышленые ребята будут лить контент и трафик, пока интернетик не лопнет. Или кожаные, наконец, поймут, что с их метриками что-то не так.

https://twitter.com/romainrevert/status/1772921780933448139

https://www.theverge.com/2024/5/19/24160240/ai-art-is-gobbling-up-deviantarts-creator-revenue-sharing

https://slate.com/technology/2024/05/deviantart-what-happened-ai-decline-lawsuit-stability.html
🔥26👍101
Немного навеяло предыдущим постом.
Я помню, как в начале нулевых народ упарывался по Роботам и Мехам. На концепт-арт площадках были целые битвы Мехов, а тогда еще форумы и первые сайты пестрели предтечами трансформеров.

На глаза попалась вот такая такая Лора для SDXL.
https://huggingface.co/Fiacre/robodiffusion-xl-v1
(внимание ее надо юзать с коэффициентом около 0.7 - < lora:robodiffusionxl:0.7 >).

Читаем RoboDiffusionXL был обучен на высококачественном синтетическом наборе данных, составленном таким образом, чтобы включить в себя широкий спектр форм и стилей роботов. Изображения включают исторические, культурные и футуристические темы, что обеспечивает разнообразие генерируемых результатов.

Роботы и Мехи пошли на корм ИИ. И сейчас можно кинуть на Civitai в поиск "mech" и получить 56 моделей и лор:
https://civitai.com/tag/mech

Это я к чему: если что-то популярно и не дай бог продается, то ИИ растиражирует это в лучшем виде. А что с этим делать - решать (пока) кожаным.
👎11🔥7👍4
Утечки про SD3. Похоже веса Stable Diffusion 3 все-таки появятся.

Разработчики, которые пилят DissusionKit - адаптацию и инференс моделей на мобильных устройствах, твитторнули, что уже допиливают локальную Stable Diffusion 3 причем для Мака!
Our first step was to bring Stable Diffusion 3 to Mac. We have optimized the memory consumption and latency for both MLX and Core ML.

"Мы откроем исходный код этого проекта вместе с предстоящим выпуском весов Stability AI."

Причем обещают опубликовать тесты и время просчета уже в ближайшие дни.

https://x.com/argmaxinc/status/1790785157840125957

Также неутомимый Лыкон, который постоянно постит картинки из SD3 в твитторе, написал:
Также, насколько я знаю, мы все еще планируем выпустить #SD3. Надеюсь, ожидание почти закончилось.
Поскольку моя команда работает над open release, будет странно, если мы откажемся от этого.

https://x.com/lykon4072/status/1791839648987156525

Штош, надежда не потеряна...
🔥34👍12
Плагины для chatGPT всё.

Помните, какого шума наделали плагины для chatGPT?
Красивые презентации, демо, удивительные графики и диаграммы от Вольфрама.

А потом пришли плечистые ceo-оптимизаторы и засрали поляну тысячей плагинов, уводящих трафик к себе на сайты с помощью бесполезных поделок.
М-Модерация? Нет, не слышали (в OpenAI по крайней мере).

Сейчас все это безобразие тихой сапой исчезло из интерфейса chatGPT.

Смышленые ребята скажут, что теперь у нас есть Джипитишки и будут правы. Там можно реализовать тот же функционал.

Но помните, нам в ноябре обещали GPT Store, каталоги, магазин, монетизацию, аналог AppStore и вот это вот всё?

Вместо этого у нас три миллиона(!) созданных Джипитишек (среди которых, подобно плагинам, большинство - ацкий треш и снова нагон трафика), странный каталог с ограниченной навигацией. И, похоже, отсутствием внятной модерации. Подробнее тут.

История с плагинами повторяется?

Похоже, что в продукты у OpenAI не очень получается. Продуктовое мышление сильно отличается от разработки.

В этом смысле у Гугла огромная фора и тысячелетний опыт. Интерфейс Гемини сильно лучше, чем у chatGPT. Плюс выводок продуктов с миллионными аудиториями.

Тем интереснее будет конкуренция.
🔥36👍5👎2