Метаверсище и ИИще
50.5K subscribers
6.31K photos
4.97K videos
48 files
7.3K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Сделал вам Чорную Маску!

Forge\Flux\50 Steps\NB4.ver1

@cgevent
🔥76👍11😁1
Вышла обновленная модель flux1-dev-bnb-nf4-v2.safetensors для Forge.

Жанг пишет, Always use V2 by default.

V2 is quantized in a better way to turn off the second stage of double quant.

Я не заметил разницы совсем.
Но чествно скачал и поставил.

https://huggingface.co/lllyasviel/flux1-dev-bnb-nf4/tree/main

@cgevent
👍21
LivePortrait как расширение для AUTOMATIC1111.

Оно позволяет добавить вкладку LivePortrait в оригинальный Stable Diffusion WebUI, чтобы рулить LivePortrait там

https://github.com/dimitribarbot/sd-webui-live-portrait
🔥30👍1
ИИ - это не только ценный смех, это еще и способ вернуть возможность говорить немым пациентам.

Говорить - это доводить до озвучки свои попытки в голове что-то сказать.

Если эксперимент удастся воспроизвести на более разнообразных текстовых данных, а не только для тех, что использовались в статье, то это (мне кажется) невыносимо круто, учитывая заявленную точность в 90% и выход на 97% после дотренировки.

Если на TLDR-пальцах:
Человеку имплантировали 4 электрода, которые регистрировали его нейроактивность. За 30-минут обучили ИИ превращать эти сигналы в текст. Текст озвучили с помощью text-2-speech. Это на словарном запасе 50 слов.
Но.
Потренировали еще полтора часа и вот уже словарный запас 125 000 слов (больше чем у любого школьника) и точность 90.2 процента.

Как тут не вспомнить про пластичность мозга, который может использовать новые сигналы взамен потерянных (кохлеарные имплантанты, писал тут 1 2 3), чтобы расшифровывать их в нужный канал восприятия (слух речь).
ИИ и есть эта пластичность в данном примере.

Для гиков.
Пациенту была проведена хирургическая имплантация четырех микроэлектродных массивов в левую прецентральную извилину, которые регистрировали нейронную активность с 256 внутрикорковых электродов. Такой нейропротез, декодировал его нейронную активность, когда он пытался говорить в условиях как заданной, так и неструктурированной беседы. Декодированные слова отображались на экране, а затем озвучивались с помощью text2speech. В первый день использования системы, после 30 минут попыток обучения речи, нейропротез достиг точности 99.6% при словарном запасе в 50 слов. На второй день объем возможного словарного запаса увеличился до 125 000 слов, и после 1.4 дополнительных часов обучения нейропротез достиг точности 90.2%. При дальнейшем обучении нейропротез сохранял точность 97.5% в течение восьми месяцев после хирургической имплантации. Участник использовал нейропротез для самостоятельного общения в течение более 248 часов. У человека с ALS и тяжелой дизартрией внутрикорковый речевой нейропротез достиг уровня производительности, пригодного для восстановления естественного общения, после короткого периода обучения.

Когда Маск сделает свою иголочку доступной на уровне амбулаторного укола в голову для всех, можно будет набирать текстовые сообщения молча. Нет, общаться с chatGPT молча. А еще круче - тихие Zoom-коллы. Все сидят в наушниках и молчат.

Если вы думаете, что все это шуточки, поглядите видео:
https://www.youtube.com/watch?v=thPhBDVSxz0

Немного не по себе после просмотра.
https://pubmed.ncbi.nlm.nih.gov/38645254/

А, самое значимое, код есть на Гитхабе.

@cgevent
🔥73👍18
Вернемся к новому Гроку, который реально грокает твиттор.

Маск, конечно, красавчик, он выпустил за оградку опен-сорсный генератор картинок, который чихать хотел на все правила корпоративного приличия (это по-масковски).
Если вы читали код флукса, там стоит смешной вызов Falcon для проверки картинок на неприличность и это в основном отсекает эротический контент. Селебрити, чорный юмор, оружие, кокаин и кровищщу Флюкс прекрасно хавает и отрыгивает.

И тут все это добро начинает сыпаться, нет, не на Цивитай или Реддит, а в Твиттор!
А там народ непривычный к нашим генеративным выходкам.
И вот уже Verge, Ars Technica и другие орут благим матом.

И правда, если вы кинете в твиттор поиск Grok NSFW Images, то вам там навалят добра от курящего роблокса до голого аниме.

И правда, Маск сотворил величайший троллинг в духе "жопа есть, а слова нет".
И пока OpenAI кастировали DALL·E 3
А Гугл генерил чорных индейцев
А Микрософт лоботомировал Бинга
А Метачка бегала от европейцев

Маск вышел, снял штаны с Грока и сказал, дети, не верьте им, жопа есть.

Вот поглядите как Verge завывает:
https://www.theverge.com/2024/8/14/24220173/xai-grok-image-generator-misinformation-offensive-imges

@cgevent
🔥132👍27👎2
Опрос: каким видео-апскейлером вы пользуетесь? Опрос анонимный, про Топаз отвечайте как есть. Я точно, что-то не учел, напишите в комментарии, чем пользуетесь.
Anonymous Poll
30%
Topaz
1%
Face Fusion
1%
Krea Video (тариф макс)
0%
Fotor
0%
HitPaw
0%
DiffIR2VR-Zero
4%
CapCut
66%
Хочу посмотреть результат
🔥10👍4👎1
В коментах случился спонтанный челлендж. Сгенерить чорного Трампа.

В отличие от Маска, это сделать реально сложнее. Ну то есть перекрасить ему кожу несложно, а вот сделать прическу по понятиям - непросто, либо получаем группу BoneyM, либо Трампа, но без прически. Видать они приросли к друг другу в латентном пространстве.

Но я чуть напрягся и поколдовал.
Промпт в коментах

Flux - топ.

@cgevent
🔥72👍18👎3