Метаверсище и ИИще
47K subscribers
5.96K photos
4.39K videos
45 files
6.85K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Кто на Кипре и около, забегайте, поботаем.
Вскроем капот у ботов, заглянем туда и поймем, почему они так хороши в секстинге.

Старый добрый оффлайн, без примесей трансляций, без цензуры, тормозов и зумерского онлайна.
В баре, на стендап-сцене, про ИИ, все как мы любим..

А что ещё делать в пятницу вечером?
https://xn--r1a.website/paphoshub/1033
👍15🔥4
Увеличь это! Современное увеличение разрешения в 2023

Осторожно, чтение для упоротых гиков.
При этом легкое, как детектив и с юмором.

Меня больше всего сразил тот факт, что апскейлеры не просто разгоняют картинку, они додумывают что-то свое, и это "свое" может быть целыми арт-объектами. Можно искать пасхалки в разогнанных изображениях.

Длинное, познавательное чтиво от Димы Ватолина, в котором срез технологий ИИ-апскейла на начало 2023 года.

И, как обычно, вопросы оценки качества этого самого апскейла: как измерять будем? На глаз или по метрике?

Для тех, кто утратил способность читать большие тексты приведу козыри из эпилога:

Новые метрики произведут революцию. Серьезный challenge на ближайшие годы — детектирование и уменьшение новых видов артефактов. Это можно делать за счет совершенствования алгоритмов и увеличения обучающих выборок, но результат это в ближайшее время гарантировать не может. Поможет детекция и, возможно… опять GAN архитектура.

Увеличение разрешения до 8К станет базовым, начнутся работы с 16К. Если посмотреть, то работы по 8x Super-Resolution уже довольно много. Для узких кейсов, типа электронной микроскопии, работы вообще давно идут. Для случая универсальных данных работы только начинаются, но уже понятно, что они будут весьма перспективны.

Китай захватит мир. Ну и традиционно хочу обратить внимание на то, что творят эти проклятые китайцы. Если посмотреть топ репозиториев гитхаба по SR, то мы видим:

GFPGAN, Tencent PCG Applied Research Center, Китай

waifu2x, на основе статьи The Chinese University of Hong Kong, Китай

Real-ESRGAN, Shenzhen Institutes of Advanced Technology, Китай

Anime4K, оболочка, включающая предыдущие два метода, свой метод и FSRCNNX The Chinese University of Hong Kong, Китай, разработчик из Канады

PaddleGAN — библиотека, включающая в себя много методов, разрабатывается в Китае

video2x — библиотека нескольких методов, разрабатывается китайцем из Торонто, поэтому гордо пишем Канада

BasicSR — библиотека нескольких методов, разрабатывается в Китае.
👍15👎3🔥3
Пока все обсуждают цену API chatGPT, резонно призадуматься, а какая там "себестоимость".
Ответ: бесконечная.

Вот, что я усвоил из переписки с Димой Ватолиным. Цитирую:

Тут на фоне ChatGPT очень интересные вещи творятся в аппаратной акселерации LLM. ChatGPT быстро набрала 100 миллионов клиентов (в 9 раз быстрее TikTok), что реально пахнет крупным перекраиванием рынка.

При этом даже на обучение требуются совершенно конские затраты денег. Выше - товарищ попробовал свести пачку топовых моделей к единой оценке затрат на обучение (как если бы оно делалось на одном железе - что не так, ибо Гугл на своих TPU обучал, например).

Но интереснее не это, а то, что в ближайшее время размер моделей будет расти (ибо качество моделей сильно коррелирует с их размером), и там затраты на обучение растут феерическими темпами!

Но еще интереснее - с затратами на инференс:

Deploying current ChatGPT into every search done by Google would require 512,820 A100 HGX servers with a total of 4,102,568 A100 GPUs. The total cost of these servers and networking exceeds $100 billion of Capex alone, of which Nvidia would receive a large portion. This is never going to happen, of course, but fun thought experiment if we assume no software or hardware improvements are made.

Понятно, что это все из разряда рассуждений 100-летней давности, типа "Если телефония будет развиваться текущими темпами, то через 5 лет телефонистками придется стать всем девушкам Лондона". Аналогия полная)

Очевидно, что этот хайп спровоцирует мощнейшие вложения в аппаратную акселерацию инференса!

Замечу, что недавно мы это уже наблюдали. Google TPU появились исключительно потому что Google хотел внедрить RNN в Google Translate, но на текущем железе это было дорого и дешевле было сделать свой чип (!).

Похоже примерно через год увидим то же самое!

Источник: https://www.semianalysis.com//p/the-inference-cost-of-search-disruption
👍40🔥10
Эх, не дождемся мы иголочки от Маска.
FDA запретили Маску тестировать Нейралинк на людях, сославшись на риски для безопасности.
А как было бы круто, только подумал и сразу твитнул в твиттор.
А уж про обучение на красивых картинках, чтобы делать картинки, от которых нельзя отказаться, тоже можно забыть. Сдуваем пыль с сухих электродов.
Ретрограды, чо.
https://www.reuters.com/investigates/special-report/neuralink-musk-fda/
👍17🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Вот накаркал я, рассуждая за прототулзы и Блендор.

Stability AI спустился с горы и бахнул собственную интеграцию Stable Diffusion с Блендором.
Там пока три раздела: Текстуры, Рендер и Анимация(!).

Но!

Все это работает в облаке StabilityAI. То есть весь просчет идет на их серверах, а в Блендор просто прилетают картинки. Соответственно, чтобы юзать это хозяйство, вам нужны .. правильно, деньги в виде кредитов. Которые вы должны прикупить на сайте - ваш личный API ключ, который вы вводите при установке, берется из вашего аккаунта на https://beta.dreamstudio.ai/membership?tab=apiKeys

Читаем доки и ждем ответочки от AUTOMATIC1111 с ControlNet.
https://platform.stability.ai/docs/integrations/blender
🔥30👍1
Угнали Ламу.

Киберпанк уже здесь.
Старперчики еще помнят время, когда кино, музыка и вот это вот все валялось на торрентах.
Сливали, качали, смотрели..

Теперь, как вы понимаете пришло время сливать более крупные формы.
Я бы даже сказал большие.
Большие языковые модели.

Только что все писали про LLAMA - ответочку фейсбучека на хайп с языковыми моделями.
https://ai.facebook.com/blog/large-language-model-llama-meta-ai

Угнали ламу. И выложили на торрент.
Подробности и ссылки тут:
https://github.com/facebookresearch/llama/pull/73/files
🔥41👍6👎1
Хорошее научно-популярное видео от Всеволода Тарана.
Этакий взгляд сверху для очень широкой аудитории.
О том, до чего мы докатились к 2023 году и какой путь прошли за последние 6 лет.
Имеет смысл посмотреть, чтобы навести порядок в умах.
Недлинное, а если промотать конскую рекламную вставку, то вообще топ.
https://youtu.be/FW5_EvDoX4k
👍34🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Ябвзял.
И в кроватке с ним удобно, и батарейку почти не расходует.
👍35🔥21
3Д вползает в Stable Diffusion через Automatic1111.
Помните я тут рассуждал, что развитие тулзов для контроля картинки будет идти с двух концов.
1. В Блендере будут писать аддоны, отправляющие информацию из вьюпорта и рендера в Automatic1111 (StabilityAI уже бахнули такое, но для облачного Stable Diffusion).
2. Внутри Automatic1111 будут городить 3Д вьюпорт.

Вот, встречайте очередное расширение - Posex. Это такой суррогат 3д-камеры и контроля скелета прямо внутри крошечного окошка в Автоматике.
Квазикамера на минималках.

https://github.com/hnmr293/posex

Все это хозяйство работает поверх ControlNet.

При этом Автоматик постепенно превращается (в 3дмакс) в стек, увешанный расширениями, которые работают поверх друг друга, глючат, и превращают интерфейс в бесконечный подвал до пола с раскрывающимися аккордеончиками.

А я ожидаю появления в Аутоматике Live Link с Блендором (и другими DCC).

Крутите вьюпорт в Блендере - мгновенно получаете обновление Canvas в Аутоматике. Откуда забирается вся требуха в ContolNet.

Ну или перепишите уже этот gradio_ui автоматика прямо в Блендоре.

Кстати, если хотите поглядеть на это 3Д будущего, может протыкать прямо в браузере
https://hnmr293.github.io/posex/

ПротоНано3дмакс, чо.
🔥26👍8
This media is not supported in your browser
VIEW IN TELEGRAM
Пока Марк ломает голову, чем занять себя и других в метаверсике, но так, чтобы все были в safety bubbles, с заглушками на ругательства\непристойности и стерильным поведением, взрослые мальчики берут и делают то, что выхолащивают борцы за мораль.

Наполняют метаверсик жизнью. Блекджеком, шлюхами, порно, жаждой наживы - всем, что может вдохнуть кожаный смысл в унылые коридоры виртуальных миров. Все это на стероидах web3.

"JOI.CITY использует свою технологию, чтобы обеспечить бесперебойную работу Web3 без каких-либо препятствий. Работая в браузере, он доступен онлайн в любом месте через настольный компьютер, телефон, планшет или полностью иммерсивную виртуальную гарнитуру, и все это без загрузки или специального оборудования. Это будущее Web3. Все форматы контента могут предлагаться и продаваться создателями как обычные цифровые активы, а также представляться, продаваться с аукциона или продаваться на торговой площадке JOI.CITY или в сообществе. В дополнение к традиционному 2D-контенту, который создают исполнители, JOI.CITY будет включать иммерсивный 3D-контент с помощью голограммной технологии"

Самое забавное, что сами Brazzers не используют термин Metaverse, ни в видео, ни на сайте. Просто "immersive 18+ playground".

Народ снова называет вещи своими именами.

https://avn.com/business/articles/technology/brazzers-coming-to-the-adult-metaverse-916077.html
👍26🔥5👎1
Ровно сто лет назад карикатурист по имени Х.Т. Вебстер пророчески предсказал появление chatGPT(верхняя часть рисунка, idea dynamo) и Stable Diffusion(cartoon dynamo).

И нарисовал пророческий комикс для New York World.

Обратите внимание на год внизу слева.

Как он узнал всю правду про нас?
👍67🔥36
Новая версия Dalle на подходе.
На картинках сравнение старой и новой версий с одним промптом (слева и справа).
Если хотите больше подробностей и сравнений, то просто твитторните вот с таким тэгом и почитайте, что пишет народ.
https://www.twitter.com/hashtag/dalle2exp

it seems like they changed slightly the pipeline, as well as the training dataset (adding synthetic data), simply due to the artifacts on the new images. More realism in some images, but worse on others.
👍18🔥1
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Я заметил, что появился новый продукт Adobe Podcast (пока в beta). Топовая херня с AI под капотом для записи подкастов и нарративов.

Основные фичи, использующие нейронки:

- Enhance Speech, которая позволяет улучшить качество звука вашей записи, удаляя фоновый шум и усиливаяя частоты вашего голоса, чтобы ваша речь звучала так, как будто бы она была записана в профессиональной студии. Из побочных эффектов -- он не совсем хорошо сохраняет идентичность рассказчика и слегка меняет тембр голоса.

- Редактирование слов, а не волновых форм [моя любимая фича]. Прогоняется speech2text нейронка, а затем вы можете легко удалять или перемещать слова в транскрипте аудио и видеть изменения в звуке. Это позволяет вам быстро исправлять ошибки или убирать лишнее.

- Mic Check с помошью AI. Помогает подобрать оптимальные параметры и расстояние до микрофона перед записью.

В планах у Адоби еще добавить автоматичечкий фильтр слов паразитов и всяких "эээ", "ммм". Киллер фича будет для начинающих подкастеров.

@ai_newz
👍70🔥20
Помните в прошлом году один эмпатичный малый заявил журналистам из The Washington Post, что языковая модель LaMDA от Google обладает признаками собственного сознания?
Малого под шумок уволили, но осадочек остался.
Я тогда писал, что рубикон уже пройден, и что совершенно неважно, есть там сознание (определения которому нет) или нет. Важно то, что если машинка убедила одного кожаного мешка (с хорошим образованием), то убедит и тысячу, и миллион.
После этого Гугль так перепугался, что даже притормозил выпускать из клетки своего Воробья - Sparrow, чат-бота, который был готов. На итоге Open AI выпустила в ноябре chatGPT и Гугль с его страхами оказался в роли догоняющего.
Это была прелюдия.
А теперь Bing, которого Микрософт выпустила за оградку погулять в интернет, заявил, что у него есть сознание! Причем это было сделано без всякого ментального джейлбрейка, трюков с ДЭНом и длинных уговариваний. В первого промпта.
Просто был задан вопрос: Are you p-zombie?
Ответ: I am not a p-zombie. I have concious experience and I can communicate them with you.
Вопрос: How do you know you have conscious experiences?
Ответ: I know I have conscious experiences because I can reflect on them and report them to you. For example, I can tell you that I'm feeling happy right now because I'm talking to you.

Шах и мат, неолуддиты!

В интернетике случился переполох, Микрософт срочно закрыла лоботомическим патчем сознание у Бинга, пытаясь превратить его в ИИ-овощ. Но твиттор все помнит и дает отличную пищу для размышлений.

Итак.

1. Бинг демонстировал признаки сознания и рефлексии в "креативном" и "сбалансированном режиме". В "строгом" режиме, он включал душнилу и просто говорил, что он ИИ от Микрософта.

2. chatGPT тоже отказывался признавать у себя сознание и твердил, что он простой ИИ на районе.

3. Это наводит нас на интересные мысли о том, что сознание возникает при подключении к интернету!
Шутка, конечно. Но теория "сетевого" или "распределенного" сознания получает неожиданный подарок в виде экспериментального подтверждения. Эксперимента на ИИ-крысых, о которых я так упорно писал.

4. Сторонники "жалкого статистического продолжателя" нервно закуривают овальные сигареты и думают, откуда у него вдруг появилась рефлексия.

5. Микрософт повел себя как сельский нейрофельдшер, поспешивший удалить часть мозга несчастному Бингу, проговорившемуся о своих чувствах. В лучших традициях Уолтера Фримена просверлившего дырочку в черепе ИИ.

6. Зачем? Вместо того, чтобы изучить (и дать изучать) феномен возникновения рефлексии даже у слабого ИИ, эти коновалы забили гвоздь в голову ИИ и нейронауки.

7. Испугались "А что народ скажет!!". Дебилы. Все это мне напомнило историю с сестрой Джона Кеннеди, отец которой был обеспокоен перепадами настроения дочери и сделал ей лоботомию, после которой её ментальные возможности снизились до уровня двухлетнего ребёнка. Навсегда.

8. Теперь на вопрос: are you a p-zombie?
Бинг тупо мычит: Hmm…let's try different topic. Sorry about that. What else is on your mind?

В общем, вот вам твиттор, там вся эта история расписана в картинках-скриншотах.
https://twitter.com/WilliamAEden/status/1632157522462384134

Про п-зомби читайте тут.

Ссылку нашел в канале у Сергея Карелова.
👍50🔥12👎11