Метаверсище и ИИще
47K subscribers
5.96K photos
4.39K videos
45 files
6.85K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Midjourney V7 вышла в "альфа-тест".

Затрудняюсь, что-то сказать по качеству, оцените сами, как я понял из-официального блога вот тут, основной упор на скорость и новый режим Draft Moode.
Черновой режим стоит в два раза дешевле, а скорость рендеринга изображений в 10 раз выше. Он настолько быстрый, что к нему прикрутили голосовое управление, теперь можно промпты наговаривать через микрофон.

Нового апскейла, редактирования и ретекстуринга не будет, новых sref тоже. Все это остается от версии V6.

Про остальное написал вчера тут.

P.S. Подписчики уже гоняют V7, вот отзывы:

Прямо сейчас гоняю альфу. Чт-то лучше, что-то также, драфт-режим у меня пока подвисает, как всегда при смене модели надо изобретать новые промты, со старыми все совсем не так. Надо обучать заново профили.

Настолько обосрались, погнавшись за видеогенераторами, что прогресса в картинках, практически нет за долгий период. Им нужно было сильно доработать вари регион и персонажей, чего они не сделали, по итогу V7 не приносит абсолютно ничего нового, так еще и у конкурентов фишки прикольней появились.

@cgevent
👎22👍20🔥84
Media is too big
VIEW IN TELEGRAM
Вот так выглядит голосовой режим и Draft Mode в Midjourney V7.

Я возможно придираюсь, но вот это вот "добавь единорога на задний план" полностью меняет картинку и композицию. Это как бы не редактирование картинки, а редактирование промпта.

Просто мы тут уже насмотрелись на реальное редактирование картинок в chatGPT и Gemini. Ну и зажрались.

@cgevent
😁33👍15🔥91
This media is not supported in your browser
VIEW IN TELEGRAM
SkyReels-A2: Compose Anything in Video Diffusion Transformers

Опенсорсная ответочка Kling Elements и Pika Ingredients


Этакий метакомпоз. На входе референсы и промпты, на выходе вот такой вот видеоряд.

Теперь это нашлепка над весам Wan - пару месяцев назад выходил SkyReels-V1 - там был использован Хуньянь.

Код, демо и все дела есть. Обещают поддержку Комфи.

Для тех, кто генерит ручками у себя - самое время потестировать подождать.

Просто железо пока не потянет, у них в планах вот такое:
User-Level GPU Inference on RTX4090

А сколько жрет сейчас неведомо.

Вообще-то это релиз от https://www.skyreels.ai/home

Мне не очень нравятся такие проекты - никогда нельзя сказать в чем отличия кода и весов у них на сайте и кода и весов в репозитариях.

@cgevent
👍159🔥4
Предприниматели и энтузиасты технологий — этот пост для вас. Хотя, на самом деле, для всех!

Меня зовут Max Votek. Я сооснователь компании Customertimes — бизнеса, который уже 17 лет внедряет технологии для мировых брендов с офисами в 9 странах и командой более 1000 человек.

Я много лет создаю компании, инвестирую в прорывные идеи и кайфую от результатов. Живу во Флориде и считаю её идеальным местом для работы и жизни.

На моём канале «Мысли вслух» вы найдёте опыт, мои мысли и идеи:

🔘 Как перестать бояться и запустить проект, даже если кажется, что вы «ещё не готовы». [пост]
🔘 Почему иногда игнорировать клиентов важнее, чем слушать. [пост]
🔘 Про AI пузырь на рынке. [пост]
🔘Топ-3 моих больших ошибок, в бизнесе. [пост]
🔘Об оригинальном контенте и нейросетях. [пост]

Никаких абстрактных советов и теорий — только живые истории, мой личный опыт и практические выводы.

Подписывайтесь на мой канал «Мысли вслух», чтобы не пропустить полезные идеи и инструменты для вашего бизнеса и жизни.

#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
👎41👍63🔥3😱1
Media is too big
VIEW IN TELEGRAM
А у меня сегодня день рождения! Поэтому, пожалуй, ничего писать не буду ни в субботу, ни даже в воскресенье. Пойду потрогаю траву и смешную лору для Wan (на видео).
Только что провел AI-Party на 250 человек, было весело, генерили картинки и видео, издевались над нейродедом, скармливая его в chatGPT и Sora.
Хотите поздравить нейродеда и оценить усилия по ведению канала (каналу, кстати, 7 лет и 7 месяцев) - добро пожаловать в кнопку Донат или сюда.
Всем отличных выходных!

Ваш нейродед.
362🔥246👍6053😁8👎4🙏3
🌟 Поддержать канал
И поздравить нейродеда
361👍56🔥2116👎6😱2🙏2
Forwarded from Data Secrets
⚡️ Вышла Llama-4 с огромным контекстом

Релизнули в трех весах: Llama 4 Scout на 109B, Llama 4 Maverick на 400B и Llama 4 Behemoth на 2T (да-да, в триллионах).

– Llama 4 Scout. Контекст 10M токенов (вау!), MoE на 16 экспертов, 17B активных параметров. Запускается на одной GPU. Уровень Gemini 2.0 Flash Lite.

Llama 4 Maverick. Контекст поменьше, 1M. 128 экспертов по 17B активных параметров. Примерно на уровне GPT-4o.

Обе модели выше мультимодальные (на вход принимают до 5 изображений) и поддерживают много языков. Знания – по август 2024. Веса

Llama 4 Behemoth. Модель невероятных размеров. 16 экспертов по 288B активных параметров. Уровень GPT-4.5 и Claude Sonnet 3.7. Весов пока нет, модель в превью и все еще обучается.

Блог | Попробовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍65😱18🔥134👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Понять за 60 секунд.

Вот нашел в фейсбучеке ролик, практически сгенерированный с помощью ИИ, по крайней мере спотыкающаяся озвучка, намекает. Но речь не про качество ролика. А, как ни странно, про содержание.

Вот я тут ною, что пока все эти ИИ-трейлеры режут глаз ацкими нестыковками по монтажу и принципом "слепила из того, что было".

Но похоже люди с такой насмотренностью будут потихоньку вымирать, ибо кто сейчас еще ходит в кино и может посмотреть два часа контента, не умерев от усилий по удержанию фокуса.

Новым нормальным тиктокерам уже 20-минутные эпизоды сериалов даются с трудом.

Поэтому появляются 60-секундные сериалы.

И вот тут-то ИИ развернется во всю мощь. Какие монтажные переходы, какой внутрикадровый монтаж? Новый нормальный контент компрессирует всё в щель внимания потребителя интернетика, которая сжимается все сильнее.

И вот тут-то появятся, наконец, кнопки "Сделай быстро".

Кроме того, если если подучить сетки сразу на этих самих 60-секундных сериалах и скриптах к ним, то все сведется к серверам, генерящим такой контент непрерывно.

@cgevent
1😱68👍32😁12🔥117
Рунвейцы, налетаем.

Выкатили Runway GEN-4 Turbo.

Как бы в пять раз быстрее, при этом в два раза дороже.

Позиционируется как "быстрые итерации" отличного качества.

Раскатывают на все тарифы.

@cgevent
1🔥525😁5👍4
This media is not supported in your browser
VIEW IN TELEGRAM
One-Minute Video Generation with Test-Time Training

Ого, вот это уже интересно.

По крайней мере тема с 60-секундными сериалами закрыта.

Когда вы смотрите все эти "нейросетьсделалахарипотера", вам наливают нарезку по 5 секунд из несовместимых движений камеры. Пока только видео-2-видео и говорящие головы могут генерить контент больше минуты.

А тут вот авторе взялись порешать задачу длинных видосов. По сравнению Mamba 2, Gated DeltaNet и слоями со скользящим окном внимания, слои Test-Time Training генерируют гораздо более целостные видео, рассказывающие сложные истории.

Срочно шуруйте вот сюда и смотрите, что они сотворили с Том и Джерри:
https://test-time-training.github.io/video-dit/

Там внутри CogVideoX 5B model. Авторы говорят, что можно генерить и более длинные видео, а артефакты в будущем можно пофиксить взяв более тяжелые модели.

Ну и обратите внимание на промпты, они величиной с Юпитер. Но вы же понимаете, кто будет их писать...
В оригинале 21 параграф:
An underwater scene stretches across the entire screen. Amidst the colorful reef, a small, rolled-up parchment map lays on the sea floor. Jerry, the brown mouse, swims calmly into the scene from the left, his large eyes wide with curiosity, carefully looking around while his tiny paws propel him forward gently. A small, rolled-up parchment map is laying on the sea floor. The map has a single small red x on it.

An underwater scene stretches across the entire screen. Jerry, the brown mouse, pauses, his attention drawn to a small, rolled-up parchment map laying on the sea floor. With gentle care, Jerry grasps the delicate parchment with both paws and slowly unrolls it, examining its smooth surface intently. The map has a single small red x on it.<end_scene>

<start_scene>A coral-covered underwater area stretches across the screen, rich with delicate coral formations in pastel hues gently moving with the rhythm of the ocean. Jerry, the brown mouse, swims thoughtfully toward a gently glowing sea anemone, its soft tentacles subtly pulsing with luminescence. Jerry's expression is curious and determined, his tiny paws methodically propelling him through the water. As he swims, he turns his head left and right, eyes carefully scanning for something important. The camera smoothly pans along with Jerry's steady forward swimming, highlighting his thoughtful and attentive demeanor as he continues his careful exploration of the vibrant underwater environment.<end_scene>

<start_scene>Underwater, a close-up reveals Tom, the blue-gray cat, with a hungry and predatory expression, his sharp eyes narrowed as he keenly scans the surroundings. Tom turns his head methodically from left to right, squinting his eyes carefully as he searches for something, a cunning gleam evident in his gaze. Small bubbles of air gently rise behind him, highlighting his location beneath the ocean surface. In the softly swaying background, a green coral plant moves rhythmically with the water's flow. Tom is depicted naturally, free of any clothing, his sleek fur softly illuminated by the refracted sunlight filtering down from above.<end_scene>

<start_scene>Underwater, a large purple coral sways gently and rhythmically from side to side in the mild ocean current. From behind the broad coral branches, Tom, the blue-gray cat, peers mischievously with a sly and calculating smile, his eyes following Jerry intently. Jerry, the brown mouse, swims slowly and obliviously past Tom, calmly navigating the serene underwater landscape without sensing any threat. The camera smoothly pans horizontally, tracking Jerry's leisurely movement across the scene, emphasizing Tom's stealthy observation, his sly grin deepening as he patiently waits for the ideal moment to act upon his mischievous intentions toward Jerry.




Кстати, код есть
https://github.com/test-time-training/ttt-video-dit

Ну и прежде чем писать о том, какая же отстойная анимация, представьте, что все это смотрят двухлетки, которым все равно на принципы диснея, а траффик, как известно не пахнет.

@cgevent
3👍57🔥20😱125
Огненный Китайский Липсинк и не только.

Я уже писал про Дримину, как китайскую ответочку Креа и Фрипик. И единственное место, где можно попробовать тот самый Omni Human.

Оказывается, если зайти туда штатовским ВПНом, то кнопка с липсинком становится доступна! Бесплатно!

В общем, это больше похоже на китайскую Хедру - загружаешь портрет, аудио или текст, и жмешь Сгенерить.

И надо сказать, генеративная Марго Робби получилаcь отлично. С первого раза.

Дальше я, конечно, попытался это сломать. Присунув ей двух анимэ персонажей с широко открытыми ртами в одном кадре (T-поза для липсинка - слегка открытый рот).

Ну что сказать, получилось. Но все равно она выкрутилась. Смешно наблюдать как вход один, а рта - два. Синк на лицо\лице.

Там, кстати, цензура на звук. Отрывок из Laid Back: If you wonna be rich, you gotta be a bitch не пропустила из-за последнего слова.

Пробуем тут, я логигился капкатовским аккаунтом, а в капкате логинился гуглом. Без смс и оргий.

https://dreamina.capcut.com/ai-tool/video/lip-sync/generate

Штатовский впн.

@cgevent
7👍4212👎5🔥2