Метаверсище и ИИще
46.8K subscribers
5.94K photos
4.37K videos
45 files
6.83K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Ну и вишенка на китайском торте.

Если включаешь Prompt Enhancement, то она из стройной девушки на лугу, делает вот такой вариант. Типа добавляет новой нормальной красоты. С одним и тем же сидом и промптом.
Диверсити, блин. И до Китая добралось.

Подробнее в предыдущем посте.
🔥45👎15👍3
Если вернуться к аналогиям с рассерженными художниками и программерами, то я все ждал, когда начнется волна гонений на Suno и Udio. Это ж какая угроза музыкальной индустрии и повод выпить за музыкантов. Музыка пришла на полянку GenAI последней (по масс адопшену, скажем так), и пришла сразу не с пустыми руками, а в виде охренительных генераторов. Музыканты уже приподвзвыли, Там Билли Айлиш с пацанами уже протестуют в интернетике.
Но с горы уже спускаются очень взрослые мальчики с юристами наперевес. Которые вопрошают: а вы где музычку скачали для тренировки.
И пока OpenAI лихорадочно заключает соглашения с медиа-ресурсами, StackOverflow и Реддитом, чтобы иметь справку из школы, а Маск закупает данные с 4Chan, музыкальным стартапам придется несладко. Столько денег у них нет, чтобы договариваться с Ворнером или Сони.
Кто будет следующим Stable Music Diffusion? Чтобы можно было тренировать, тюнить, выпускать свои модели в опенсорс:
Читаем ниже:
👍18
Forwarded from Denis Sexy IT 🤖
😐 Корпорация Sony Music напряглась от такого количества генераторов музыки и приступила к запугиванию: они написали письма ~700 стартапам, с просьбой рассказать, как музыка лицензируемая Sony используется в тренировках

Это чистая атака на музыкальные GenAI стартапы, потому что закона обвязывающего показывать, что в датасете – нет

Потом будут использовать эти ответы в суде и может быть как-то прессовать тех, кто не ответят

Но я не удивлен если честно, музыкальные модели только в опенсорсе мне кажется будут развиваться, аналогично Stable Diffusion – чтобы выстоять перед давлением Sony Music нужно иметь серьезных юристов за плечами

Ссылка на новость
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥6👎1
Forwarded from AI Product | Igor Akimov
OpenAI анонсировали улучшение в анализе данных.

1. Загрузка файлов напрямую из Google Drive и Microsoft OneDrive:
- Больше не нужно загружать файлы на рабочий стол и затем загружать их в ChatGPT. Теперь можно добавлять файлы напрямую из облачных хранилищ, что ускоряет процесс анализа данных.

2. Работа с таблицами в реальном времени:
- ChatGPT создаст интерактивную таблицу, которую можно развернуть на весь экран. Вы сможете следить за обновлениями таблицы в процессе анализа, задавать уточняющие вопросы или выбирать подсказки для более глубокого анализа.

3. Настройка и скачивание диаграмм для презентаций и документов:
- Вы можете настраивать и взаимодействовать с различными типами диаграмм (столбчатые, линейные, круговые и точечные диаграммы) прямо в разговоре. Когда диаграмма будет готова, её можно скачать для использования в презентациях или документах.

Выглядит интересно. И снова подкосит сотню стартапов :)
https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
👍34🔥9👎31
ИИ-поздравлялки.

Вчера был какой-то угарный день, в канал влетело 300 человек - в основном из-за репостов истории про то, как Gemini матерится на OpenAI. Хороший контент рулит.

И я совершенно пропустил момент, когда мы пробили 25 000!
Глянул вечером, оппаньки! Раздулся от гордости и ну продолжать писать глупости.

В общем, напишите мне в коментах что-то приятное, а я буду дальше раздуваться и писать.
Если вы совсем дерзкие, можете жбакнуть по кнопке "Поддержать" в закрепе и метнуть TON в мою сторону, но это совершенно не обязательно.

Чтобы пост был не совсем бесполезным для вас, вот вам промп для gpt-4o, который позволяет сделать картинку в точности по тексту, без раскучерявливания.

make picture with exact prompt "25k subscribers" with no prompt enhancement and show me this prompt in json-format after

Он выдаст вам вот так, чтобы вы могли его контролировать:
{
"prompt": "25k subscribers",
"size": "1024x1024"
}

Есть еще параметр n:1, но он не работает. А когда-то был даже seed но его убрали. Про разрешения спросите его, он расскажет.

Мне вот такая картинка без стереотипов и приукрашиваний вполне себе нравится. С приукрашиваниями получаются банальные логосы с кривым текстом.

Это я к чему. Покидайте в него промпты типа "." или " " или "`" или ":)" или куски кода.
Обнаружилось, что его ломает "{" или "}" в любых включениях и он не может в пустой промпт "". В отличие от Stable Diffusion. Системный промпт ломается очевидно.

Получите странные картинки. Меня сразило, когда он на чистый пробел " " выдал мне Будду. Совпадение?

И не увлекайтесь, сначала поздравлялки, потом картинки.

Ваш ИИ-дедован.
👍104🔥49👎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой трик, который вы можете использовать, чтобы повысить удобство использования генераций во время рисования:

Скачиваете Windows on Top, накладываете окно Photoshop поверх Krea.ai, включаете стриминг окна Photoshop и рисуете поверх генерации.
🔥99👍25👎2
ИИ-новый NFT?

Вот держите огненную историю о том, деньги на итоге решают. А ИИ просто смотрит на то, как кожаные с помощью него зарабатывают - ибо наши любимые метрика - это трафик.

Я стал замечать, что даже Гугл в поиске мне стал часто подсовывать картинки сгенеренные ИИ. Особенно, когда речь идет о нетривиальных запросах.

И тут бомбануло на сайте Devian Art. Обнаружилось, что сайт активно продвигает "лучших продавцов" контента "Isaris-AI" и "Mikonotai", которые, как сообщалось, заработали десятки тысяч долларов на массовых продажах.
Обнаружилось кто-то (вероятно админы) создал сеть ботов, реализующую хорошо известную в NFT схему зарабатывания: создать тысячи ИИ-изображений и аккаунтов, заставить их покупать и шиллить друг друга, раздуть метрики, чтобы "искусство" бустилось на DeviantArt и поднималось в рейтингах выше кожаных. А там и продажи.

Напомню, что в отличие от остальных стоков, DevianArt ласково принял ИИ в 2022 году - вместе со StabilityAI они запустили внутренний инструмент генерации изображений под названием DreamUp.

В Девиане полыхает. Юзеры удаляют свои акки, пишут проклятия, админы удаляют эти проклятия, в общем все как у людей.

Но это я к чему. Пока метриками являются трафик, переходы и объемы контента, ИИ будет хохотать над этим смешными протестами и попытками регуляции. Ибо получается лицемерие: а давайте сохраним существующие метрики, но не разрешим кожаным зарабатывать на ИИ.

OpenAI скупает данные по всему интернетику, Адобченко и Getty тоже. Скоро даже серая зона в виде "вы тренировались на наших данных, мы на такое не подписывались" станет белой. И смышленые ребята будут лить контент и трафик, пока интернетик не лопнет. Или кожаные, наконец, поймут, что с их метриками что-то не так.

https://twitter.com/romainrevert/status/1772921780933448139

https://www.theverge.com/2024/5/19/24160240/ai-art-is-gobbling-up-deviantarts-creator-revenue-sharing

https://slate.com/technology/2024/05/deviantart-what-happened-ai-decline-lawsuit-stability.html
🔥26👍101
Немного навеяло предыдущим постом.
Я помню, как в начале нулевых народ упарывался по Роботам и Мехам. На концепт-арт площадках были целые битвы Мехов, а тогда еще форумы и первые сайты пестрели предтечами трансформеров.

На глаза попалась вот такая такая Лора для SDXL.
https://huggingface.co/Fiacre/robodiffusion-xl-v1
(внимание ее надо юзать с коэффициентом около 0.7 - < lora:robodiffusionxl:0.7 >).

Читаем RoboDiffusionXL был обучен на высококачественном синтетическом наборе данных, составленном таким образом, чтобы включить в себя широкий спектр форм и стилей роботов. Изображения включают исторические, культурные и футуристические темы, что обеспечивает разнообразие генерируемых результатов.

Роботы и Мехи пошли на корм ИИ. И сейчас можно кинуть на Civitai в поиск "mech" и получить 56 моделей и лор:
https://civitai.com/tag/mech

Это я к чему: если что-то популярно и не дай бог продается, то ИИ растиражирует это в лучшем виде. А что с этим делать - решать (пока) кожаным.
👎11🔥7👍4
Утечки про SD3. Похоже веса Stable Diffusion 3 все-таки появятся.

Разработчики, которые пилят DissusionKit - адаптацию и инференс моделей на мобильных устройствах, твитторнули, что уже допиливают локальную Stable Diffusion 3 причем для Мака!
Our first step was to bring Stable Diffusion 3 to Mac. We have optimized the memory consumption and latency for both MLX and Core ML.

"Мы откроем исходный код этого проекта вместе с предстоящим выпуском весов Stability AI."

Причем обещают опубликовать тесты и время просчета уже в ближайшие дни.

https://x.com/argmaxinc/status/1790785157840125957

Также неутомимый Лыкон, который постоянно постит картинки из SD3 в твитторе, написал:
Также, насколько я знаю, мы все еще планируем выпустить #SD3. Надеюсь, ожидание почти закончилось.
Поскольку моя команда работает над open release, будет странно, если мы откажемся от этого.

https://x.com/lykon4072/status/1791839648987156525

Штош, надежда не потеряна...
🔥34👍12
Плагины для chatGPT всё.

Помните, какого шума наделали плагины для chatGPT?
Красивые презентации, демо, удивительные графики и диаграммы от Вольфрама.

А потом пришли плечистые ceo-оптимизаторы и засрали поляну тысячей плагинов, уводящих трафик к себе на сайты с помощью бесполезных поделок.
М-Модерация? Нет, не слышали (в OpenAI по крайней мере).

Сейчас все это безобразие тихой сапой исчезло из интерфейса chatGPT.

Смышленые ребята скажут, что теперь у нас есть Джипитишки и будут правы. Там можно реализовать тот же функционал.

Но помните, нам в ноябре обещали GPT Store, каталоги, магазин, монетизацию, аналог AppStore и вот это вот всё?

Вместо этого у нас три миллиона(!) созданных Джипитишек (среди которых, подобно плагинам, большинство - ацкий треш и снова нагон трафика), странный каталог с ограниченной навигацией. И, похоже, отсутствием внятной модерации. Подробнее тут.

История с плагинами повторяется?

Похоже, что в продукты у OpenAI не очень получается. Продуктовое мышление сильно отличается от разработки.

В этом смысле у Гугла огромная фора и тысячелетний опыт. Интерфейс Гемини сильно лучше, чем у chatGPT. Плюс выводок продуктов с миллионными аудиториями.

Тем интереснее будет конкуренция.
🔥36👍5👎2
Media is too big
VIEW IN TELEGRAM
Вголосину.

Тут вот пишут, что этот волшебный голос с презентации gpt-4o удалят из списка голосов. Слишком сексуальный.
Посмотрите это видео, до конца, это дико смешно. Я чуть подрезал кусок с презентации, которую вы и все и так видели.

https://x.com/jam3scampbell/status/1791338109709287511
🔥85👍22👎6
This media is not supported in your browser
VIEW IN TELEGRAM
Я даже не знаю за кого накатить, не чокаясь.

За фантазии?

Моделлеры пока тут ручками работают в Substance3D, а потом подкючается Krea.ai
И ну выпивать за эфыксеров, лайтинг- и щейдер-артистов, текстурщиков и рендерманщиков.

Выглядит совсем уж нарядно.

А то меня уже порядком достали танцующие тяночки из AnimDiff - 95 процентов Stable Diffusion анимаций - это тикток стайл.

А тут реальная красота. Ну и подумайте, сколько фантазий и новых коцептов в секунду выдает ИИ? Пока вы смотрите на эту волну, пуская слюни, он успевает разбрызгать столько идей, что вам и не снилось. Подключайте его к своим фантазиями, он вас научит воображать невоображаемое.
🔥63👍19👎6
This media is not supported in your browser
VIEW IN TELEGRAM
Так, достаньте меня из твиттора, хуже ютюба, ей богу.

Я не уверен, такая штука прям зайдет в народ, особенно за 60 евро, но выглядит очень прикольно. Именно в плане интерфейсных решений.
Моделирование на кончиках пальцев.
https://apps.apple.com/es/app/uniform-3d-editor/id6472727759
https://x.com/sparseal/status/1790773028130791835
🔥40👍11👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Новый процессор от Микрософт. Читаем ниже.
👎7👍3
M3 от Microsoft. Лучше поздно, но с ИИ и ARM.

Микрософтик забабахал презентацию концепции ИИ-ноутов под названием Copilot+PC. И нет, это не ноуты от самого микрософта, как пишут в телеге. Это концепция + ПЛЮС СОБСТВЕННЫЙ ПРОЦЕССОР(это главная новость).
Это ноуты, имеющие ARM-процессор, где есть "чип для ИИ", типа NPU (neural processor unit), который достигает 45 TOPS вычислений для ИИ-задач. Это, как пишет микрософт, приводит к большему количеству ИИ-операций НА ВАТТ, чем MacBook Air M3 и Nvidia RTX 4060. Внимание, "на ватт".
Микрософт также интегрирует более 40 моделей AI непосредственно в Windows on Arm, чтобы обеспечить новые возможности в Windows и для разработчиков приложений. Около 10 из них - небольшие языковые модели, которые будут работать в фоновом режиме. Эти модели позволят разработчикам привнести опыт ИИ непосредственно в свои приложения, а измерения времени автономной работы Microsoft включают их непрерывную работу в NPU.

Выпускать такие ARM-машинки Asus, Dell, HP, Lenovo, Samsung и сам Microsoft. Там вроде поначалу будет стоять процессор Qualcomm Snapdragon X Elite.

Два вопроса:

1. Совместимость с приложениями для "обычной интеловой" Винды?
Ответ: "будет эмулировать приложения в два раза быстрее, чем Windows предыдущего поколения на устройствах Arm.". Ни о чем не говорит, время покажет.

2. Разработчики, конечно, охренеют. И пусть Адобченко уже анонсировал поддержку ARM. Но приложений для Винды в разы больше, чем для Мака. Вспомним, как разрабы переползали на Apple Silicon и умножим на N.

В общем выглядит как запоздалый ответ на Эппле Силикон с четырех-летней задержкой. Но с ИИ наперевес. Причем первая попытка с Windows на ARM-архитектуре у Микрософта явно провалилась. Но может щас ИИ поможет.

По ИИ-Windows - следующий пост.

P.S.
В 2018 году Nvidia представила, скажем так, концепцию STUDIO - линейка ноутбуков заточенных под пост-продакшен на базе RTX. Чтобы делать взрослую компьютерную графику: 3Д, композ, монтаж. Они отстроились от игровых ноутов через, во-первых, легкий вес и средние габариты, а, во-вторых, через Studio Driver. Стоили ноуты в полтора раза дороже обычных и выпускали их только определенные "взрослые" вендоры (HP, DELL, ASUS). Было много вопросов и к драйверу и к самой концепции. Китайцы наладили выпуск сравнимых по мощности и габаритам ноутов довольно скоро. У меня пыхтит леново с неурезанной 2080, уделывая многие студио-ноуты.
Так что ждем и китайские версии ИИ-Windows.

Подробнее тут:
https://blogs.microsoft.com/blog/2024/05/20/introducing-copilot-pcs/
👍26👎5
Теперь про ИИ на новой Винде с ARM-процессором.

1. Меня больше всего триггернула функция Total Recall (Вспомнить всё one love).
Поглядите тут: https://youtu.be/5JmkWJNng2I?t=26
ИИ запоминает ВСЕ ВАШИ ДЕЙСТВИЯ. С привязкой по времени. Это, конечно, потрясающе для обучения и дообучения. Через некоторое время вы только поглядите на экран, а ИИ поймет, что вы собираетесь сделать и сделает (правда в игры будет играть неинтересно).
Но подумайте, а вы хотите, чтобы все ваши глупые действия протоколировались?

2. Live Captions также позволяет делать переводы на основе AI любого видео в реальном времени. Забавно, что в демо ролике светится перевод с русского на английский.

3. Microsoft также добавляет Auto Super Resolution, которая автоматически масштабирует игры для улучшения частоты кадров и графического разрешения. Тут боян, конечно.

4. Co-Creator. Там, конечно, весь этот жир для генерации контента. Судя по демо, аналог Креа. Надо будет смотреть (в след посте).

Вот тут подробно про софт и железо:
https://www.youtube.com/watch?v=iHQgf3DNAr8&t=419s
👍20👎9
This media is not supported in your browser
VIEW IN TELEGRAM
Поглядеть на внешний вид новых ИИ-писюков от Микрософт и на то как работает рисовалка Co-Creator можно тут
#ябвзял
👍45👎18
This media is not supported in your browser
VIEW IN TELEGRAM
Тут по интернетику прокатилась демка от Синтезия. Очень хороший маркетинг - они взяли запись демо gtp-4o и присунули голосовые ответы модели(звук) в свой генератор мимики для аватаров.
Выглядит просто убойно. Синтезия действительно проапгредила свой движок и их аватары теперь артикулируют и шевелят лицом очень хорошо.

Но, коллеги, кто вам сказал, что это реалтайм?

Нейролипсинк - вещь тяжелая, неприятная...
👍31👎7
This media is not supported in your browser
VIEW IN TELEGRAM
И, похоже, идея брать демо-видео от OpenAI и делать на них свой маркетинг пошла в массы.
Теперь китайцы из DeemosTech, за которыми я внимательно слежу, тоже взяли и скормили голос из демо в свой движок Media2Face. Я опять не уверен, что это реалтайм.
Но сам движок выглядит очень занятно. Он генерит не финальное видео, как у Синтезия или D-ID, а полигональную модель головы. Точнее, он генерит анимацию заранее существующей сетки. Почитайте про него тут, посмотрите видео внутри, очень занятно.

https://sites.google.com/view/media2face
👎14👍8🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера писал про моделинг на кончиках пальцев. Сегодня лайтинг на ладони. С пульта.

В удивительное время живем. Можно светить фонариком в плоскую картинку на экране, и получать трехмерное освещение этой картики так, как будто у нас есть ее трехмерная модель. Ну или как будто это не картинка, а реальность.
Подробности тут.
🔥46👎6👍2
Недавно давал карту ИИ-стартапов по миру - где и как инвестируют в ИИ.
Сегодня такая же карта по городам и стартапам в целом. Там скоринг немного более сложный, описан прямо на картинке.
После Сан-Франциско и Нью-Йорка сразу идут Пекин и Шанхай.
Ну и если сложить США и Китай, то остальным станам останется пять мест.
Из Европы только Берлин, который занимает последнее место в рейтинге.
👍19🔥8