Метаверсище и ИИще
47K subscribers
5.96K photos
4.39K videos
45 files
6.85K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
ComfyUI OmniGen2 Native Workflow Examples

Не Flux Kontextoм единым.

Для тех гиков, кто сидит в Комфи и кто слышал про OmniGen2 - теперь есть нативная поддержка и примеры воркфлоу прямо на сайте Комфи.

Редиторы приподвзварчивают на качество, остается только самим тестировать.

https://docs.comfy.org/tutorials/image/omnigen/omnigen2

@cgevent
16👍9
Пока у нас небольшая передышка перед 4 июля (Маск обещает Grok 4, который уничтожит всех и вся, OpenAI объявил каникулы для сотрудников: у них сманили 4-8 ключевых сотрудников в Мету на фоне 80 часовой рабочей недели) позволю пару диванных постов.

Тут вот телеграмчик пестрит мемом про апендицит слева. А в коментах ниспровергатели ИИ частенько используют аргумент: "а вы будете доверять хирургу\летчику, которые использует chatGPT\ИИ?"

Ответ: да.

В медицине есть диагностика, а есть лечение.
Нейродед за свою жизнь получил немалое количество смертельных диагнозов, которые потом магическим образом превращались в несмертельные просто методом second opinion. Но вот эта вот способность раздавать ацкие диагнозы сильно повлияла на мое отношение к кожаным дохтурам. И если с лечением особых вопросов не было, то с диагностикой постоянно была игра в кальмара.
Это я к чему: в плане диагностики я бы сильно больше доверял доктору, который использует "гибридную модель". Ставит свои кожаные диагнозы, сравнивает их с диагнозами ИИ, не чурается вводить данные и спрашивать обобщенный или специализированный chatGPT. Короче, использует ИИ, как second opinion.
Ибо ум хорошо, а 1+N - лучше.

Так что можно и дальше пилить мемы, но я за гибридную модель.

Это же относится и к учителям.

@cgevent
164👍57😁22🔥13👎2
Forwarded from Education Scaling Club (Alexander Laryanovskiy)
Если тебе предлагают пройти тренинг, а ты хочешь сбежать — тебе, блин, точно на него надо.

Возможно, ты просто ещё не дошёл до зеркала. А может стоишь к нему спиной. И думаешь, что никого там нет. А он там.

То есть я там.

Всё завертелось, когда я решил накормить нейросеть собственными текстами — и попросил диагноз — составить глубокий психологический портрет автора и рекомендуемые зоны ближайшего развития. 

Шаг 1. Скачал архив заметок с Медиума, это было быстрее всего.

Шаг 2.  Попросил раскопать, какая методология исследования личностных характеристик подходит для составления портрета на основании анализа текста.

На выходе получил рекомендации, что методики можно ограниченно использовать для понимания общих личностных тенденций и выявления зон развития. 

Шаг 3. Попросил на основании выбранных методик составить  глубокий психологический портрет автора статей, его сильные и слабые стороны.

Определить, что он скрывает от себя, предположить его мотивацию выявить, какие внутренние преграды мешают его развитию.

И вот эта болтливая Матрица выдала мне на 30 страниц (!) анализ с эволюцией мышления, паттернами поведения и личностными проявлениями. 

Богатый урожай собрал, чо уж тут. Рассчитывал поржать, а получил очень глубокую рефлексию. 

Я прочитал. Вздохнул. Признал: ну да, всё по делу. Глубоко, метко, местами даже обидно.

И в этот момент у меня возникло ложное ощущение завершённости.

Как будто часть мозга такая:
— Окей, я увидел. Этого достаточно. Пошли другими делами заниматься. 

Взял себя в руки и заставил дойти путь до конца. 

И тут всё сломалось. 

Шаг 4.  По рекомендациям зон роста попросил подготовить методики и литературу для самообучения, курсы и тд. В общем, кто виноват, я уже увидел, осталось понять что делать. 

И вот тут… меня не зацепило вообще ничего. Как будто вместо списка рекомендаций нейросеть прислала мне каталог IKEA. 

Никакого отклика.

Ну, думаю, бывает, промт кривой, отправил запрос в две другие нейросетки.

Результат тот же. Ни один пункт не вызвал у меня внутреннего отклика.
Вообще.

Мозг включил защиту. Типа: ну просто не моё. Я же вообще не про это. Пропущу.

Но три нейросети не могут одновременно ошибаться. И тут до меня дошло.

Когда ничего не резонирует — это не потому, что ты просветлён. Это и есть тот самый момент, когда тебе говорят, куда надо смотреть, а ты отвечаешь:
— Не, я туда не хочу.

Это самый тревожный маркер.

Потому что, брат, именно на этот тренинг тебе и надо — со скидкой по промокоду «Я-в-отрицании».

Ну, думаю, сейчас проверю.

Взял первую книжку из рекомендуемых. Про самосострадание. 

Если бы я составлял себе список самых бесполезных книжек, эта была бы в топе только по одному названию. «Самосострадание шаг за шагом». 

Шаг 5. Начал читать… И вот сидит сегодня Саша, который кричал:
— Это галлюцинации нейросетей, а не рекомендации, — и тихонько шуршит страничками под звуки ломающейся брони. 

— Ну наконец-то, дружище. Мы тебя потеряли между контролем и сарказмом. Заходи, чувствуй себя как дома. Только туфли сними, здесь — эмоции.
.
.
.
.
И напоследок — несколько здравых оговорок, чтобы не делать из этого мистику.

Я хорошо знаю границы своей некомпетентности и поэтому лишь частично понимаю реальные ограничения данного метода и применимость результатов. 

Понимаю, что публичные тексты и уклон в профессиональную тематику могут не отражать полную личность автора. 

Тем не менее я думаю, что результат можно использовать для понимания общих личностных тенденций, выявления зон развития софт-скиллов и отправной точки для дальнейшего развития. 

Чем я хуже Зощенко с его «Перед восходом солнца». 

Постскриптум
Если у вас со школы есть незакрытый гештальт на тему «что хотел сказать автор своим произведением на самом деле» — этот метод вполне может вам помочь ответить.
:-)
👍5622👎11🔥7😁4
Media is too big
VIEW IN TELEGRAM
Нейропрожарка


📽 Нейровидеоклип от Артема

Марина Цветаева - Прохожий

Все таки как могут стихи заиграть новыми красками с помощью ИИ.

Инструменты: suno, imagen 4, runway, kling, higgsfield, hailuo 02.

Основные изображения imagen 4, немного ранвей референс.
Видео 90% клинг 2.1 про и 2.1 мастер. Немного higgsfield и hailuo.
Липсинг ранвей act-one.

По времени около 25 часов.

По деньгам примерно 10-15т₽.

@cgevent
2👍106🔥54👎3211
Тут, мне кажется, можно выпить за Affter Effects, титры, и вот эти вот все текстовые эффекты.

Veo3 просто удивительно неплохо справляется со шрифтами, эффектами и вообще "понимает", о чем идет речь.

Вспомните, ведь еще где-то полгода-год назад текст на картинках был набором иероглифов.

А сейчас мы смотрим на то, как видеогенераторы бахают титры и логосы.

What a time to be alive!

Автор

@cgevent
🔥74👍12😱96😁6👎4
OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation

Аватары постепенно обрастают плечами, руками, жестами, половиной тулова, скоро грань между Аватарогенераторами и видеогенераторами будет истончаться.

Но самоего главное, несмотря на то, что это Алибабищенко, - это опен сорс!

https://github.com/omni-avatar/OmniAvatar

В OmniAvatar задействованы WAN 2.1 и Wav2Vec.
Требования будут как у Вана.

Оно умеет в жесты, управляемые эмоции, натуральные движения, работу с фоном и даже предметами и, по мнению авторов, ultra-accurate lip-sync

Но вот липсинк-то мне не очень нравится. И вообще опенсорсные липсинки, конечно, здорово отстают от коммерческих решений.

Но это я придираюсь. Певцы поют, как умеют. Это опен-сорс.

Репозитарий выглядит адово, не уверен, что полезу ставить.

Тьма видосов и подробностей тут:
https://omni-avatar.github.io/

@cgevent
👍17🔥10👎5
Вынесу из коментов толковый текст от Виталия про Flux Kontext и его капризность:

Последние пару дней тестировал локальный Flux Kontext Dev. Вот некоторые наблюдения.

1. Может быть очень полезным на мощном железе и не очень полезным на слабом. За то время, что ждёшь генерацию, лично я могу уже довольно много всего провернуть в Фотошопе. Учитывая, что генерация может промахнуться, на простейшую двухминутную ручную работу может уйти минут 10 на нейронке. Если человек нулевой в Фотошопе, то тогда 100% мастхэв.

2. Очень чувствителен к промпту. Наверное, самая капризная модель. Буквально одним словом промахнёшься - вернёт тебе либо ерунду, либо вообще ничего не сделает.

3. Чувствителен к сиду. При одной простой, но точной задаче на разных сидах может выдать очень далёкое от запрошенного. Пытался ускорить пайплайн, выставляя 10 шагов, чтобы для начала можно было быстро оценить композицию на новом сиде - и потом перегенерить с тем же числом на 20-30 шагах для лучшего качества. Но картинка может кардинально поменяться. Не прокатило.

4. Любит короткие задачи. Прям точечные. С ними справляется хорошо: убери серёжку, удлини волосы и т.д. Но все равно может шакалить, скейлить и двигать исходник. Немного помогает уменьшение Flux Guidance - не более двух.

5. Вообще не понимает понятия масштабов и размеров. Может сделать лилипутское тело или квартиру в масштабе кукольного домика.

6. Бесполезен в плане цветокоррекции. Максимум - двигает контраст. Не понимает даже простейших просьб по исправлению цвета. А вот поменять цвет объекта - на изи.

7. Все недостатки приумножаются, когда на входе несколько картинок. Не соблюдает масштабы, иногда игнорирует один из исходников. Может потерять консистентность персонажей. Долго мучил довольно простой задачей: добавить человека с одного фото на фон с другого фото. Перебрал несколько воркфлоу. В зависимости от сида, он может их склеивать, а может не склеивать. По цвету или резкости их не сводит - компоуза ноль. По размерам, если исходники не отмасштпбированв - вставляет как есть.

По итогу я уже понял, где он для меня полезен, а где быстрее руками. Но, в целом, это всё равно занятно.


P.S. Интересно поразмышлять про "хрупкость Конекста по Талебу" и о том, что "создание" и "редактирование" - совершенно разные задачи. И что именно редактирование обнажает родовую проблему генераторов - управляемость.
Про редактирование видосов я вообще молчу.
👍4112🔥4