Хуньянь: Китайский генератор картинок от ТикТока. С весами и пирогами.
Коль скоро SD3 мы увидим примерно никто не знает когда, то смотрим, вокруг.
ТикТок выкатил свою модель. С кодом и весами.
Ну и конечно по их китайским тестам она бьет весь опенсорс (включая SD3), скромно уступая Midjourney и DALL·E 3.
Но мы ж не просто перепащиваем новости и визжим от черрипикнутых картинок с их сайта.
Лезем в демо и тестируем. Расчехляем промпт с принцессой.
Они делают акцент на улучшенное понимание китайского языка. Тут мне похвастаться нечем, я погонял на английском.
И да, там есть Prompt Enhancement, как в фооокусе, добавление текстовой красоты в промпт. Работает забавно. Но мыло не убирает.
Три сэмплера, третий не работает.
На итоге: уровень SD2 или SD1.5. Сильное мыло, беда с руками, постоянно сваливается в аниме. Возможно если бы были крутилки, можно что-то докрутить, но в демо нет никаких крутилок.
Можно поставить локально, может быть там будет больше параметров.
Он совершенно не умеет в людей, но на всяких узорах и декорах ведет себя пристойно, даже мылит меньше. Похоже на первый firefly.
Для тех, кто в NSFW - очень забавная цензура. Промпт не отвергает, но пытается укутать картинку хотя бы в белье. Постоянно сваливается в аниме, от греха подальше. Когда добиваешь негативным промтом, изорачиваетя. Мылит соски, прячет детали. Похоже на поведение SDXL.
Все явки и пароли тут:
https://github.com/Tencent/HunyuanDiT
Потестируйте, может у вас китайский хороший...
Коль скоро SD3 мы увидим примерно никто не знает когда, то смотрим, вокруг.
ТикТок выкатил свою модель. С кодом и весами.
Ну и конечно по их китайским тестам она бьет весь опенсорс (включая SD3), скромно уступая Midjourney и DALL·E 3.
Но мы ж не просто перепащиваем новости и визжим от черрипикнутых картинок с их сайта.
Лезем в демо и тестируем. Расчехляем промпт с принцессой.
Они делают акцент на улучшенное понимание китайского языка. Тут мне похвастаться нечем, я погонял на английском.
И да, там есть Prompt Enhancement, как в фооокусе, добавление текстовой красоты в промпт. Работает забавно. Но мыло не убирает.
Три сэмплера, третий не работает.
На итоге: уровень SD2 или SD1.5. Сильное мыло, беда с руками, постоянно сваливается в аниме. Возможно если бы были крутилки, можно что-то докрутить, но в демо нет никаких крутилок.
Можно поставить локально, может быть там будет больше параметров.
Он совершенно не умеет в людей, но на всяких узорах и декорах ведет себя пристойно, даже мылит меньше. Похоже на первый firefly.
Для тех, кто в NSFW - очень забавная цензура. Промпт не отвергает, но пытается укутать картинку хотя бы в белье. Постоянно сваливается в аниме, от греха подальше. Когда добиваешь негативным промтом, изорачиваетя. Мылит соски, прячет детали. Похоже на поведение SDXL.
Все явки и пароли тут:
https://github.com/Tencent/HunyuanDiT
Потестируйте, может у вас китайский хороший...
👍24👎1
Ну и вишенка на китайском торте.
Если включаешь Prompt Enhancement, то она из стройной девушки на лугу, делает вот такой вариант. Типа добавляет новой нормальной красоты. С одним и тем же сидом и промптом.
Диверсити, блин. И до Китая добралось.
Подробнее в предыдущем посте.
Если включаешь Prompt Enhancement, то она из стройной девушки на лугу, делает вот такой вариант. Типа добавляет новой нормальной красоты. С одним и тем же сидом и промптом.
Диверсити, блин. И до Китая добралось.
Подробнее в предыдущем посте.
🔥45👎15👍3
Если вернуться к аналогиям с рассерженными художниками и программерами, то я все ждал, когда начнется волна гонений на Suno и Udio. Это ж какая угроза музыкальной индустрии и повод выпить за музыкантов. Музыка пришла на полянку GenAI последней (по масс адопшену, скажем так), и пришла сразу не с пустыми руками, а в виде охренительных генераторов. Музыканты уже приподвзвыли, Там Билли Айлиш с пацанами уже протестуют в интернетике.
Но с горы уже спускаются очень взрослые мальчики с юристами наперевес. Которые вопрошают: а вы где музычку скачали для тренировки.
И пока OpenAI лихорадочно заключает соглашения с медиа-ресурсами, StackOverflow и Реддитом, чтобы иметь справку из школы, а Маск закупает данные с 4Chan, музыкальным стартапам придется несладко. Столько денег у них нет, чтобы договариваться с Ворнером или Сони.
Кто будет следующим Stable Music Diffusion? Чтобы можно было тренировать, тюнить, выпускать свои модели в опенсорс:
Читаем ниже:
Но с горы уже спускаются очень взрослые мальчики с юристами наперевес. Которые вопрошают: а вы где музычку скачали для тренировки.
И пока OpenAI лихорадочно заключает соглашения с медиа-ресурсами, StackOverflow и Реддитом, чтобы иметь справку из школы, а Маск закупает данные с 4Chan, музыкальным стартапам придется несладко. Столько денег у них нет, чтобы договариваться с Ворнером или Сони.
Кто будет следующим Stable Music Diffusion? Чтобы можно было тренировать, тюнить, выпускать свои модели в опенсорс:
Читаем ниже:
👍18
Forwarded from Denis Sexy IT 🤖
Это чистая атака на музыкальные GenAI стартапы, потому что закона обвязывающего показывать, что в датасете – нет
Потом будут использовать эти ответы в суде и может быть как-то прессовать тех, кто не ответят
Но я не удивлен если честно, музыкальные модели только в опенсорсе мне кажется будут развиваться, аналогично Stable Diffusion – чтобы выстоять перед давлением Sony Music нужно иметь серьезных юристов за плечами
Ссылка на новость
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥6👎1
Forwarded from AI Product | Igor Akimov
OpenAI анонсировали улучшение в анализе данных.
1. Загрузка файлов напрямую из Google Drive и Microsoft OneDrive:
- Больше не нужно загружать файлы на рабочий стол и затем загружать их в ChatGPT. Теперь можно добавлять файлы напрямую из облачных хранилищ, что ускоряет процесс анализа данных.
2. Работа с таблицами в реальном времени:
- ChatGPT создаст интерактивную таблицу, которую можно развернуть на весь экран. Вы сможете следить за обновлениями таблицы в процессе анализа, задавать уточняющие вопросы или выбирать подсказки для более глубокого анализа.
3. Настройка и скачивание диаграмм для презентаций и документов:
- Вы можете настраивать и взаимодействовать с различными типами диаграмм (столбчатые, линейные, круговые и точечные диаграммы) прямо в разговоре. Когда диаграмма будет готова, её можно скачать для использования в презентациях или документах.
Выглядит интересно. И снова подкосит сотню стартапов :)
https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
1. Загрузка файлов напрямую из Google Drive и Microsoft OneDrive:
- Больше не нужно загружать файлы на рабочий стол и затем загружать их в ChatGPT. Теперь можно добавлять файлы напрямую из облачных хранилищ, что ускоряет процесс анализа данных.
2. Работа с таблицами в реальном времени:
- ChatGPT создаст интерактивную таблицу, которую можно развернуть на весь экран. Вы сможете следить за обновлениями таблицы в процессе анализа, задавать уточняющие вопросы или выбирать подсказки для более глубокого анализа.
3. Настройка и скачивание диаграмм для презентаций и документов:
- Вы можете настраивать и взаимодействовать с различными типами диаграмм (столбчатые, линейные, круговые и точечные диаграммы) прямо в разговоре. Когда диаграмма будет готова, её можно скачать для использования в презентациях или документах.
Выглядит интересно. И снова подкосит сотню стартапов :)
https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
Openai
Improvements to data analysis in ChatGPT
Improvements to data analysis in ChatGPT
Interact with tables and charts and add files directly from Google Drive and Microsoft OneDrive.
Interact with tables and charts and add files directly from Google Drive and Microsoft OneDrive.
👍34🔥9👎3❤1
ИИ-поздравлялки.
Вчера был какой-то угарный день, в канал влетело 300 человек - в основном из-за репостов истории про то, как Gemini матерится на OpenAI. Хороший контент рулит.
И я совершенно пропустил момент, когда мы пробили 25 000!
Глянул вечером, оппаньки! Раздулся от гордости и ну продолжать писать глупости.
В общем, напишите мне в коментах что-то приятное, а я буду дальше раздуваться и писать.
Если вы совсем дерзкие, можете жбакнуть по кнопке "Поддержать" в закрепе и метнуть TON в мою сторону, но это совершенно не обязательно.
Чтобы пост был не совсем бесполезным для вас, вот вам промп для gpt-4o, который позволяет сделать картинку в точности по тексту, без раскучерявливания.
make picture with exact prompt "25k subscribers" with no prompt enhancement and show me this prompt in json-format after
Он выдаст вам вот так, чтобы вы могли его контролировать:
{
"prompt": "25k subscribers",
"size": "1024x1024"
}
Есть еще параметр n:1, но он не работает. А когда-то был даже seed но его убрали. Про разрешения спросите его, он расскажет.
Мне вот такая картинка без стереотипов и приукрашиваний вполне себе нравится. С приукрашиваниями получаются банальные логосы с кривым текстом.
Это я к чему. Покидайте в него промпты типа "." или " " или "`" или ":)" или куски кода.
Обнаружилось, что его ломает "{" или "}" в любых включениях и он не может в пустой промпт "". В отличие от Stable Diffusion. Системный промпт ломается очевидно.
Получите странные картинки. Меня сразило, когда он на чистый пробел " " выдал мне Будду. Совпадение?
И не увлекайтесь, сначала поздравлялки, потом картинки.
Ваш ИИ-дедован.
Вчера был какой-то угарный день, в канал влетело 300 человек - в основном из-за репостов истории про то, как Gemini матерится на OpenAI. Хороший контент рулит.
И я совершенно пропустил момент, когда мы пробили 25 000!
Глянул вечером, оппаньки! Раздулся от гордости и ну продолжать писать глупости.
В общем, напишите мне в коментах что-то приятное, а я буду дальше раздуваться и писать.
Если вы совсем дерзкие, можете жбакнуть по кнопке "Поддержать" в закрепе и метнуть TON в мою сторону, но это совершенно не обязательно.
Чтобы пост был не совсем бесполезным для вас, вот вам промп для gpt-4o, который позволяет сделать картинку в точности по тексту, без раскучерявливания.
make picture with exact prompt "25k subscribers" with no prompt enhancement and show me this prompt in json-format after
Он выдаст вам вот так, чтобы вы могли его контролировать:
{
"prompt": "25k subscribers",
"size": "1024x1024"
}
Есть еще параметр n:1, но он не работает. А когда-то был даже seed но его убрали. Про разрешения спросите его, он расскажет.
Мне вот такая картинка без стереотипов и приукрашиваний вполне себе нравится. С приукрашиваниями получаются банальные логосы с кривым текстом.
Это я к чему. Покидайте в него промпты типа "." или " " или "`" или ":)" или куски кода.
Обнаружилось, что его ломает "{" или "}" в любых включениях и он не может в пустой промпт "". В отличие от Stable Diffusion. Системный промпт ломается очевидно.
Получите странные картинки. Меня сразило, когда он на чистый пробел " " выдал мне Будду. Совпадение?
И не увлекайтесь, сначала поздравлялки, потом картинки.
Ваш ИИ-дедован.
👍104🔥49👎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой трик, который вы можете использовать, чтобы повысить удобство использования генераций во время рисования:
Скачиваете Windows on Top, накладываете окно Photoshop поверх Krea.ai, включаете стриминг окна Photoshop и рисуете поверх генерации.
Скачиваете Windows on Top, накладываете окно Photoshop поверх Krea.ai, включаете стриминг окна Photoshop и рисуете поверх генерации.
🔥99👍25👎2
ИИ-новый NFT?
Вот держите огненную историю о том, деньги на итоге решают. А ИИ просто смотрит на то, как кожаные с помощью него зарабатывают - ибо наши любимые метрика - это трафик.
Я стал замечать, что даже Гугл в поиске мне стал часто подсовывать картинки сгенеренные ИИ. Особенно, когда речь идет о нетривиальных запросах.
И тут бомбануло на сайте Devian Art. Обнаружилось, что сайт активно продвигает "лучших продавцов" контента "Isaris-AI" и "Mikonotai", которые, как сообщалось, заработали десятки тысяч долларов на массовых продажах.
Обнаружилось кто-то (вероятно админы) создал сеть ботов, реализующуюхорошо известную в NFT схему зарабатывания: создать тысячи ИИ-изображений и аккаунтов, заставить их покупать и шиллить друг друга, раздуть метрики, чтобы "искусство" бустилось на DeviantArt и поднималось в рейтингах выше кожаных. А там и продажи.
Напомню, что в отличие от остальных стоков, DevianArt ласково принял ИИ в 2022 году - вместе со StabilityAI они запустили внутренний инструмент генерации изображений под названием DreamUp.
В Девиане полыхает. Юзеры удаляют свои акки, пишут проклятия, админы удаляют эти проклятия, в общем все как у людей.
Но это я к чему. Пока метриками являются трафик, переходы и объемы контента, ИИ будет хохотать над этим смешными протестами и попытками регуляции. Ибо получается лицемерие: а давайте сохраним существующие метрики, но не разрешим кожаным зарабатывать на ИИ.
OpenAI скупает данные по всему интернетику, Адобченко и Getty тоже. Скоро даже серая зона в виде "вы тренировались на наших данных, мы на такое не подписывались" станет белой. И смышленые ребята будут лить контент и трафик, пока интернетик не лопнет. Или кожаные, наконец, поймут, что с их метриками что-то не так.
https://twitter.com/romainrevert/status/1772921780933448139
https://www.theverge.com/2024/5/19/24160240/ai-art-is-gobbling-up-deviantarts-creator-revenue-sharing
https://slate.com/technology/2024/05/deviantart-what-happened-ai-decline-lawsuit-stability.html
Вот держите огненную историю о том, деньги на итоге решают. А ИИ просто смотрит на то, как кожаные с помощью него зарабатывают - ибо наши любимые метрика - это трафик.
Я стал замечать, что даже Гугл в поиске мне стал часто подсовывать картинки сгенеренные ИИ. Особенно, когда речь идет о нетривиальных запросах.
И тут бомбануло на сайте Devian Art. Обнаружилось, что сайт активно продвигает "лучших продавцов" контента "Isaris-AI" и "Mikonotai", которые, как сообщалось, заработали десятки тысяч долларов на массовых продажах.
Обнаружилось кто-то (вероятно админы) создал сеть ботов, реализующую
Напомню, что в отличие от остальных стоков, DevianArt ласково принял ИИ в 2022 году - вместе со StabilityAI они запустили внутренний инструмент генерации изображений под названием DreamUp.
В Девиане полыхает. Юзеры удаляют свои акки, пишут проклятия, админы удаляют эти проклятия, в общем все как у людей.
Но это я к чему. Пока метриками являются трафик, переходы и объемы контента, ИИ будет хохотать над этим смешными протестами и попытками регуляции. Ибо получается лицемерие: а давайте сохраним существующие метрики, но не разрешим кожаным зарабатывать на ИИ.
OpenAI скупает данные по всему интернетику, Адобченко и Getty тоже. Скоро даже серая зона в виде "вы тренировались на наших данных, мы на такое не подписывались" станет белой. И смышленые ребята будут лить контент и трафик, пока интернетик не лопнет. Или кожаные, наконец, поймут, что с их метриками что-то не так.
https://twitter.com/romainrevert/status/1772921780933448139
https://www.theverge.com/2024/5/19/24160240/ai-art-is-gobbling-up-deviantarts-creator-revenue-sharing
https://slate.com/technology/2024/05/deviantart-what-happened-ai-decline-lawsuit-stability.html
🔥26👍10❤1
Немного навеяло предыдущим постом.
Я помню, как в начале нулевых народ упарывался по Роботам и Мехам. На концепт-арт площадках были целые битвы Мехов, а тогда еще форумы и первые сайты пестрели предтечами трансформеров.
На глаза попалась вот такая такая Лора для SDXL.
https://huggingface.co/Fiacre/robodiffusion-xl-v1
(внимание ее надо юзать с коэффициентом около 0.7 - < lora:robodiffusionxl:0.7 >).
Читаем RoboDiffusionXL был обучен на высококачественном синтетическом наборе данных, составленном таким образом, чтобы включить в себя широкий спектр форм и стилей роботов. Изображения включают исторические, культурные и футуристические темы, что обеспечивает разнообразие генерируемых результатов.
Роботы и Мехи пошли на корм ИИ. И сейчас можно кинуть на Civitai в поиск "mech" и получить 56 моделей и лор:
https://civitai.com/tag/mech
Это я к чему: если что-то популярно и не дай бог продается, то ИИ растиражирует это в лучшем виде. А что с этим делать - решать (пока) кожаным.
Я помню, как в начале нулевых народ упарывался по Роботам и Мехам. На концепт-арт площадках были целые битвы Мехов, а тогда еще форумы и первые сайты пестрели предтечами трансформеров.
На глаза попалась вот такая такая Лора для SDXL.
https://huggingface.co/Fiacre/robodiffusion-xl-v1
(внимание ее надо юзать с коэффициентом около 0.7 - < lora:robodiffusionxl:0.7 >).
Читаем RoboDiffusionXL был обучен на высококачественном синтетическом наборе данных, составленном таким образом, чтобы включить в себя широкий спектр форм и стилей роботов. Изображения включают исторические, культурные и футуристические темы, что обеспечивает разнообразие генерируемых результатов.
Роботы и Мехи пошли на корм ИИ. И сейчас можно кинуть на Civitai в поиск "mech" и получить 56 моделей и лор:
https://civitai.com/tag/mech
Это я к чему: если что-то популярно и не дай бог продается, то ИИ растиражирует это в лучшем виде. А что с этим делать - решать (пока) кожаным.
👎11🔥7👍4
Утечки про SD3. Похоже веса Stable Diffusion 3 все-таки появятся.
Разработчики, которые пилят DissusionKit - адаптацию и инференс моделей на мобильных устройствах, твитторнули, что уже допиливают локальную Stable Diffusion 3 причем для Мака!
Our first step was to bring Stable Diffusion 3 to Mac. We have optimized the memory consumption and latency for both MLX and Core ML.
"Мы откроем исходный код этого проекта вместе с предстоящим выпуском весов Stability AI."
Причем обещают опубликовать тесты и время просчета уже в ближайшие дни.
https://x.com/argmaxinc/status/1790785157840125957
Также неутомимый Лыкон, который постоянно постит картинки из SD3 в твитторе, написал:
Также, насколько я знаю, мы все еще планируем выпустить #SD3. Надеюсь, ожидание почти закончилось.
Поскольку моя команда работает над open release, будет странно, если мы откажемся от этого.
https://x.com/lykon4072/status/1791839648987156525
Штош, надежда не потеряна...
Разработчики, которые пилят DissusionKit - адаптацию и инференс моделей на мобильных устройствах, твитторнули, что уже допиливают локальную Stable Diffusion 3 причем для Мака!
Our first step was to bring Stable Diffusion 3 to Mac. We have optimized the memory consumption and latency for both MLX and Core ML.
"Мы откроем исходный код этого проекта вместе с предстоящим выпуском весов Stability AI."
Причем обещают опубликовать тесты и время просчета уже в ближайшие дни.
https://x.com/argmaxinc/status/1790785157840125957
Также неутомимый Лыкон, который постоянно постит картинки из SD3 в твитторе, написал:
Также, насколько я знаю, мы все еще планируем выпустить #SD3. Надеюсь, ожидание почти закончилось.
Поскольку моя команда работает над open release, будет странно, если мы откажемся от этого.
https://x.com/lykon4072/status/1791839648987156525
Штош, надежда не потеряна...
🔥34👍12
Плагины для chatGPT всё.
Помните, какого шума наделали плагины для chatGPT?
Красивые презентации, демо, удивительные графики и диаграммы от Вольфрама.
А потом пришли плечистые ceo-оптимизаторы и засрали поляну тысячей плагинов, уводящих трафик к себе на сайты с помощью бесполезных поделок.
М-Модерация? Нет, не слышали (в OpenAI по крайней мере).
Сейчас все это безобразие тихой сапой исчезло из интерфейса chatGPT.
Смышленые ребята скажут, что теперь у нас есть Джипитишки и будут правы. Там можно реализовать тот же функционал.
Но помните, нам в ноябре обещали GPT Store, каталоги, магазин, монетизацию, аналог AppStore и вот это вот всё?
Вместо этого у нас три миллиона(!) созданных Джипитишек (среди которых, подобно плагинам, большинство - ацкий треш и снова нагон трафика), странный каталог с ограниченной навигацией. И, похоже, отсутствием внятной модерации. Подробнее тут.
История с плагинами повторяется?
Похоже, что в продукты у OpenAI не очень получается. Продуктовое мышление сильно отличается от разработки.
В этом смысле у Гугла огромная фора и тысячелетний опыт. Интерфейс Гемини сильно лучше, чем у chatGPT. Плюс выводок продуктов с миллионными аудиториями.
Тем интереснее будет конкуренция.
Помните, какого шума наделали плагины для chatGPT?
Красивые презентации, демо, удивительные графики и диаграммы от Вольфрама.
А потом пришли плечистые ceo-оптимизаторы и засрали поляну тысячей плагинов, уводящих трафик к себе на сайты с помощью бесполезных поделок.
М-Модерация? Нет, не слышали (в OpenAI по крайней мере).
Сейчас все это безобразие тихой сапой исчезло из интерфейса chatGPT.
Смышленые ребята скажут, что теперь у нас есть Джипитишки и будут правы. Там можно реализовать тот же функционал.
Но помните, нам в ноябре обещали GPT Store, каталоги, магазин, монетизацию, аналог AppStore и вот это вот всё?
Вместо этого у нас три миллиона(!) созданных Джипитишек (среди которых, подобно плагинам, большинство - ацкий треш и снова нагон трафика), странный каталог с ограниченной навигацией. И, похоже, отсутствием внятной модерации. Подробнее тут.
История с плагинами повторяется?
Похоже, что в продукты у OpenAI не очень получается. Продуктовое мышление сильно отличается от разработки.
В этом смысле у Гугла огромная фора и тысячелетний опыт. Интерфейс Гемини сильно лучше, чем у chatGPT. Плюс выводок продуктов с миллионными аудиториями.
Тем интереснее будет конкуренция.
Telegram
Метаверсище и ИИще
За Джипитишки.
Я долго терпел, но приподнакипело.
Смотрите, интернетик захлебывается от восторга - пользователи уже насоздавали 3 000 000 джипитижек. Ох и ах.
OpenAI обещал в ноябре, что в декабре запустит GPT Store. Запустил в начале года. Обещал монетизацию…
Я долго терпел, но приподнакипело.
Смотрите, интернетик захлебывается от восторга - пользователи уже насоздавали 3 000 000 джипитижек. Ох и ах.
OpenAI обещал в ноябре, что в декабре запустит GPT Store. Запустил в начале года. Обещал монетизацию…
🔥36👍5👎2