У нас еще одно обновление в семействе генераторов картинок.
Некоторое время назад на LMArena появилась модель Mandarin (странно, что не пикоМандарин).
Вчера выяснилось, что это новый Grok Imagine.
Картинки действительно хорошие.
Но с версиями пока непонятки: раньше Imagine имел версию 0.9, по идее новая версия это 1.0 (Mandarin).
Но кроме истерики в твитторе этому нет подтверждения.
Также непонятки с обновлениями.
У меня в приложении Grok на андроиде действительно появился банер на старте про Imagine Update. Но на десктопе все как обычно, и понять, где какая версия довольно сложно.
Но можно провести тестирование на картинках с текстами - новый Grok Imagine очень хорош в этом.
@cgevent
Некоторое время назад на LMArena появилась модель Mandarin (странно, что не пикоМандарин).
Вчера выяснилось, что это новый Grok Imagine.
Картинки действительно хорошие.
Но с версиями пока непонятки: раньше Imagine имел версию 0.9, по идее новая версия это 1.0 (Mandarin).
Но кроме истерики в твитторе этому нет подтверждения.
Также непонятки с обновлениями.
У меня в приложении Grok на андроиде действительно появился банер на старте про Imagine Update. Но на десктопе все как обычно, и понять, где какая версия довольно сложно.
Но можно провести тестирование на картинках с текстами - новый Grok Imagine очень хорош в этом.
@cgevent
👍19🔥12❤7😁4🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
ElevenLabs бахнули риалтайм титровалку (Speech-to-Text) Scribe v2
Задержка 150мс, это исчезающе мало.
Распознает и помечает разных спикеров
Русский - да, 92 языка.
Можно использовать на мероприятиях, есть стриминг и АПИ.
Побивает Gemini 2.5 Flash, GPT 4o MiniTranscribe, Deepgram Nova 3 и кто там еще есть.
https://elevenlabs.io/docs/models#scribe-v2-realtime
@cgevent
Задержка 150мс, это исчезающе мало.
Распознает и помечает разных спикеров
Русский - да, 92 языка.
Можно использовать на мероприятиях, есть стриминг и АПИ.
Побивает Gemini 2.5 Flash, GPT 4o MiniTranscribe, Deepgram Nova 3 и кто там еще есть.
https://elevenlabs.io/docs/models#scribe-v2-realtime
@cgevent
❤44👍21🔥10
This media is not supported in your browser
VIEW IN TELEGRAM
GAMMA.APP
Это, пожалуй, самый успешный стартап по созданию презентаций, который может устоять перед Микрософтом и Гуглом которые встраивают ИИ в свои Паверпойнты и Гуглслайды.
У них новая версия 3.0 и они теперь генерят не только презентации, но и целые сайты и макеты для социальных сетей. Тут Канва явно нервничает.
Из интересного.
У них 100 миллионов ARR, 70 миллионов пользователей и оценка в 2.1 миллиарда(!). При этом 50 сотрудников.
Также пишут, что 1 миллион гамм создается каждый день. Даже если все это поделить на маркетинг, то все равно впечатляет.
Еще они открыли API и вот вам Промпт Гайд от них:
https://gamma.app/prompts
Из совсем любопытного - пять лет назад, когда не было никакого ИИ, они создавали Гамму как Anti-Power-Point, для создания презентаций из блоков. А по дороге переобулись в ИИ.
@cgevent
Это, пожалуй, самый успешный стартап по созданию презентаций, который может устоять перед Микрософтом и Гуглом которые встраивают ИИ в свои Паверпойнты и Гуглслайды.
У них новая версия 3.0 и они теперь генерят не только презентации, но и целые сайты и макеты для социальных сетей. Тут Канва явно нервничает.
Из интересного.
У них 100 миллионов ARR, 70 миллионов пользователей и оценка в 2.1 миллиарда(!). При этом 50 сотрудников.
Также пишут, что 1 миллион гамм создается каждый день. Даже если все это поделить на маркетинг, то все равно впечатляет.
Еще они открыли API и вот вам Промпт Гайд от них:
https://gamma.app/prompts
Из совсем любопытного - пять лет назад, когда не было никакого ИИ, они создавали Гамму как Anti-Power-Point, для создания презентаций из блоков. А по дороге переобулись в ИИ.
@cgevent
🔥33❤8👍6👎5
This media is not supported in your browser
VIEW IN TELEGRAM
ProcGen3D: Learning Neural Procedural Graphs for Image-to-3D Reconstruction
Процедурная 3Д-генерация.
Очень красивая работа. И хотя нет ни кода, ни демо, хочется отметить ее за смелый подход.
Олды помнят процедурное моделирование в Худини или Maya Paint Effects или L-системы. Когда 3Д-объект описывается формулами.
Китайские гении из Мюнхена научили нейросеточку генерить не кашеобразный набор вертексов (как у всех), а набор графов, которые процедурно описывают объект. Что-то типа L-систем.
Понятно, что это не будет работать на лицах, органике и произвольных объектах. Но они так и пишут: мы умеем генерить объекты, которые хорошо описываются процедурно: например кактусы(!), деревья или мосты. Изначально они ориентировались на процедурные модели из CAD\CAM софтов. Но потренировались на кактусах).
Сама идея отличная - генерить графы, которые потом можно править и обтягивать заранее хорошей топологией.
Кому интересно или ностальгично, есть видео на три минуты:
https://youtu.be/HFsMF8DwY_A
@cgevent
Процедурная 3Д-генерация.
Очень красивая работа. И хотя нет ни кода, ни демо, хочется отметить ее за смелый подход.
Олды помнят процедурное моделирование в Худини или Maya Paint Effects или L-системы. Когда 3Д-объект описывается формулами.
Китайские гении из Мюнхена научили нейросеточку генерить не кашеобразный набор вертексов (как у всех), а набор графов, которые процедурно описывают объект. Что-то типа L-систем.
Понятно, что это не будет работать на лицах, органике и произвольных объектах. Но они так и пишут: мы умеем генерить объекты, которые хорошо описываются процедурно: например кактусы(!), деревья или мосты. Изначально они ориентировались на процедурные модели из CAD\CAM софтов. Но потренировались на кактусах).
Сама идея отличная - генерить графы, которые потом можно править и обтягивать заранее хорошей топологией.
Кому интересно или ностальгично, есть видео на три минуты:
https://youtu.be/HFsMF8DwY_A
@cgevent
🔥21👍12❤8
Media is too big
VIEW IN TELEGRAM
Нейропрожарка (MyFilm48)
«THE KILL SWITCH or 96 Hours on Bali to Duck the World»
3-место в международном AI-конкурсе Myfilm48 и AI Films Awards.
Авторы: Дмитрий и Алексей.
ДМИТРИЙ РАЗЕПИН @dm_creator369 (Production, режиссура, монтаж)
Работа была выполнена за 96 часов.
Сроки сжатые, есть много недочетов, но это максимум возможностей, что мы успели сделать. И считаю, что работа достойна внимания, если прочитать небольшую предысторию ниже. Основной пайплайн:
Отрисовка кадров в нужной атмосфере за счет чего сокращается время на пост-обработку в цветокоррекции.
Основной инструмент NanoBanana - 90% кадров.
Доп.инструменты: SeedReam / Reve.
Обработка кадров: Magnific и Enchancor AI
Анимация: Клинг - 80%, Вео - 20%
Озвучка 11лабс + отдельно сервисы по липсинк. (здесь не хватило времени, чтобы подобрать нормально голоса и смэтчить их).
Монтаж в Давинчи: Эффекты, цветокор, SFX.
Дополнительно принимал участие звукорежиссер, который помог выстроить весь аудио-ряд.
ALEX TIKHONOV CHAPSKY @AlexTenerifer (концепт, сценарий, супервайз)
Бриф был очень странный - фактически вместо того, чтобы придумывать завязку, организаторы ее предоставили сами (человек прибывает в аэропорт, ему вручают билет на конкретное мероприятие и т.д. + дали даже рекомендации по развитию действия, как будто сами придумали ролик, но не дописали скрипт). Продвижение брендов в брифе - отдельная боль, так как продвигать бич клаб под названием Beach Club ну такое. Вишенкой на торте - предложение использовать образ отца-организатора мероприятия в качестве героя (оправданного). Это, кстати, меня порадовало почему-то, легкий эксгибиционизм организаторов зашел. В общем, вводные были “вот тебе свекла, лук, картоха и мясо, свари любой суп на конкурс мишлен”.
Главная проблема скрипта была в поиске темы, которая бы вызывала резонанс. Похоже, мы единственные из финалистов потрогали реально больную тему - грядущую регуляцию ИИ государством. Развили ее в сюжет, создали AI-полицию, которая бдит и преследует. За транзит ИИ-кода или весов на Бали дают пожизненное, кстати. Вы не знали? Погуглите.
Сюжет собрался по всем аркам, false victory случилась, но надежда на спасение есть. Как говорится, мало кто знает, что в слове “постапокалипсис” прячется слово “тапок”.
Работалось круто, плотно, арки прорабатывались многовариантно, и удивительным образом хватило 96 часов на законченный арочный сюжет и выход.
Сначала придумали цельный полный метр от начала до конца. Затем - обрезали до трейлера. С точки зрения реализации - сразу приняли решение делать в реализме, ибо мультипликация для нашей темы - явное снижение градуса и вообще не очень серьезно как носитель замысла в данном случае.
Всем спасибо! 96 часов огня)
@cgevent
«THE KILL SWITCH or 96 Hours on Bali to Duck the World»
3-место в международном AI-конкурсе Myfilm48 и AI Films Awards.
Авторы: Дмитрий и Алексей.
ДМИТРИЙ РАЗЕПИН @dm_creator369 (Production, режиссура, монтаж)
Работа была выполнена за 96 часов.
Сроки сжатые, есть много недочетов, но это максимум возможностей, что мы успели сделать. И считаю, что работа достойна внимания, если прочитать небольшую предысторию ниже. Основной пайплайн:
Отрисовка кадров в нужной атмосфере за счет чего сокращается время на пост-обработку в цветокоррекции.
Основной инструмент NanoBanana - 90% кадров.
Доп.инструменты: SeedReam / Reve.
Обработка кадров: Magnific и Enchancor AI
Анимация: Клинг - 80%, Вео - 20%
Озвучка 11лабс + отдельно сервисы по липсинк. (здесь не хватило времени, чтобы подобрать нормально голоса и смэтчить их).
Монтаж в Давинчи: Эффекты, цветокор, SFX.
Дополнительно принимал участие звукорежиссер, который помог выстроить весь аудио-ряд.
ALEX TIKHONOV CHAPSKY @AlexTenerifer (концепт, сценарий, супервайз)
Бриф был очень странный - фактически вместо того, чтобы придумывать завязку, организаторы ее предоставили сами (человек прибывает в аэропорт, ему вручают билет на конкретное мероприятие и т.д. + дали даже рекомендации по развитию действия, как будто сами придумали ролик, но не дописали скрипт). Продвижение брендов в брифе - отдельная боль, так как продвигать бич клаб под названием Beach Club ну такое. Вишенкой на торте - предложение использовать образ отца-организатора мероприятия в качестве героя (оправданного). Это, кстати, меня порадовало почему-то, легкий эксгибиционизм организаторов зашел. В общем, вводные были “вот тебе свекла, лук, картоха и мясо, свари любой суп на конкурс мишлен”.
Главная проблема скрипта была в поиске темы, которая бы вызывала резонанс. Похоже, мы единственные из финалистов потрогали реально больную тему - грядущую регуляцию ИИ государством. Развили ее в сюжет, создали AI-полицию, которая бдит и преследует. За транзит ИИ-кода или весов на Бали дают пожизненное, кстати. Вы не знали? Погуглите.
Сюжет собрался по всем аркам, false victory случилась, но надежда на спасение есть. Как говорится, мало кто знает, что в слове “постапокалипсис” прячется слово “тапок”.
Работалось круто, плотно, арки прорабатывались многовариантно, и удивительным образом хватило 96 часов на законченный арочный сюжет и выход.
Сначала придумали цельный полный метр от начала до конца. Затем - обрезали до трейлера. С точки зрения реализации - сразу приняли решение делать в реализме, ибо мультипликация для нашей темы - явное снижение градуса и вообще не очень серьезно как носитель замысла в данном случае.
Всем спасибо! 96 часов огня)
@cgevent
👍47🔥24👎14❤8😁8
chatGPT 5.1 раскатали: у меня вот так выглядит.
"GPT‑5.1 Instant, наиболее используемая модель ChatGPT, теперь по умолчанию стала более теплой и разговорной. Судя по результатам ранних тестов, она часто удивляет людей своей игривостью, оставаясь при этом понятной и полезной."
"Мы также модернизируем GPT‑5 Thinking, чтобы сделать его более эффективным и понятным в повседневном использовании. Теперь он более точно адаптирует время на обдумывание к вопросу — уделяя больше времени сложным проблемам и быстрее отвечая на более простые. На практике это означает более тщательные ответы на сложные запросы и меньшее время ожидания на более простые."
https://openai.com/index/gpt-5-1/
@cgevent
"GPT‑5.1 Instant, наиболее используемая модель ChatGPT, теперь по умолчанию стала более теплой и разговорной. Судя по результатам ранних тестов, она часто удивляет людей своей игривостью, оставаясь при этом понятной и полезной."
"Мы также модернизируем GPT‑5 Thinking, чтобы сделать его более эффективным и понятным в повседневном использовании. Теперь он более точно адаптирует время на обдумывание к вопросу — уделяя больше времени сложным проблемам и быстрее отвечая на более простые. На практике это означает более тщательные ответы на сложные запросы и меньшее время ожидания на более простые."
https://openai.com/index/gpt-5-1/
@cgevent
👍39❤12
В среднем у 7 из 10 компаний с распределёнными командами есть одна и та же проблема - выплаты.
Банки замораживают транзакции, ручной документооборот превращает каждый расчёт в ад, сотрудники жалуются на задержки, а бухгалтерия еле сводит отчеты.
Теперь эти проблемы решаются через платформу 4dev.com.
Как это работает: за 15 секунд можно выплатить зарплату 15 сотрудникам из разных стран - и сразу получить закрывающие документы для бухгалтерии и аудита.
⭐️ 4dev.com для бизнеса это:
— один договор вместо десятков индивидуальных контрактов;
— выплаты в 150+ стран и 30 валютах;
— персональный менеджер для компании и ежедневная поддержка для исполнителей;
— легальные криптоплатежи с автоматическими инвойсами;
Никаких подписок и скрытых платежей. Платформа берёт только комиссию 3% и ниже от каждой выплаты. Чем больше вы платите команде - тем ниже ваша комиссия.
Запишитесь на демо → на встрече можно рассчитать стоимость выплат для вашей компании и получить ответы на все вопросы.
Банки замораживают транзакции, ручной документооборот превращает каждый расчёт в ад, сотрудники жалуются на задержки, а бухгалтерия еле сводит отчеты.
Теперь эти проблемы решаются через платформу 4dev.com.
Как это работает: за 15 секунд можно выплатить зарплату 15 сотрудникам из разных стран - и сразу получить закрывающие документы для бухгалтерии и аудита.
— один договор вместо десятков индивидуальных контрактов;
— выплаты в 150+ стран и 30 валютах;
— персональный менеджер для компании и ежедневная поддержка для исполнителей;
— легальные криптоплатежи с автоматическими инвойсами;
Никаких подписок и скрытых платежей. Платформа берёт только комиссию 3% и ниже от каждой выплаты. Чем больше вы платите команде - тем ниже ваша комиссия.
Запишитесь на демо → на встрече можно рассчитать стоимость выплат для вашей компании и получить ответы на все вопросы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👎31👍5❤3😁3🙏2
Нодам - 40 лет.
Сейчас все сервисы переходят на нодовые интерфейсы и подают это как новую фичу.
В реальности нодам (в графике) около сорока лет.
У Худини был предок, под названием Prisms. Изначально его код писался для крупнейшей тогда CG-Студии в мире - Omnibus. Но в 1987 году Омнибас разорился, а Kim Davidson и Greg Hermanovic выкупили права на Prisms и сделали компанию Side Effects. И начали писать Houdini на основе Prisms - некоторое время Houdini и Prisms продавались одновременно, как разные пакеты.
Внутри Prisms был модуль для композа ICE(Interactive Compositing Environment) - вот с него и пошли нодовые интерфейсы.
Кому интересна история Худини, читаем тут:
https://www.fxguide.com/fxfeatured/side-effects-software-25-years-on/
@cgevent
Сейчас все сервисы переходят на нодовые интерфейсы и подают это как новую фичу.
В реальности нодам (в графике) около сорока лет.
У Худини был предок, под названием Prisms. Изначально его код писался для крупнейшей тогда CG-Студии в мире - Omnibus. Но в 1987 году Омнибас разорился, а Kim Davidson и Greg Hermanovic выкупили права на Prisms и сделали компанию Side Effects. И начали писать Houdini на основе Prisms - некоторое время Houdini и Prisms продавались одновременно, как разные пакеты.
Внутри Prisms был модуль для композа ICE(Interactive Compositing Environment) - вот с него и пошли нодовые интерфейсы.
Кому интересна история Худини, читаем тут:
https://www.fxguide.com/fxfeatured/side-effects-software-25-years-on/
@cgevent
❤89🔥29👍14😱4
Генераторы миров: World Lab релизнула Marble как готовый продукт. Метаверсищще все ближе.
Я писал про них еще в декабре, а также в августе и сентябре.
До сих пор это было демо, где можно было погулять по уже готовым мирам, теперь это полноценный продукт, где можно генерить свои миры.
Тут важно заметить, что в отличие от конкурентов (о них ниже), тут не происходит "достраивания мира" на ходу, это не динамическая видео-генерация, это готовый, но фиксированный мир.
Но зато его можно экспортировать как сплаты, как меши(!), ну и конечно, как видосы. И расширять, через композ(!) миров.
Тут геймдев сильно встрепенулся и расчехлил бутылочку беленькой за левел-дизайнеров, дизайнеров, моделлеров, текстурщиков. Ибо.
Мультимодальность Marble: он позволяет создавать трёхмерные миры из текста, изображений, видео или 3Д-лейаутов (грубых трёхмерных макетов).
Marble также позволяет интерактивно редактировать, расширять и даже ОБЪЕДИНЯТЬ миры.
Самый простой режим: картинка и промпт на входе.
Но есть и более продвинутые фичи: много изображений(для разных частей мира) или даже видео для всего мира на входе. Можно ввести несколько фотографий или короткое видео, изображающее реальное место с разных ракурсов, и он объединит их, чтобы создать трёхмерный мир с элементами реального пространства.
Есть редактирование(!) миров: удаление объекта, инпайнтинг области. Также есть замена объектов, изменение визуального стиля или реструктуризация крупных частей мира.
Для продвинутых тридешников они даже накропали примитивный 3Д-редактор: Chisel. В нем можно из плоскостей и кубиков собирать грубый лейаут сцены, а потом Marble делает как бы перенос стиля из промпта, сохраняя пространственную структуру 3Д-сцены. Пишут что даже можно импортировать 3D assets of objects в сцену, что уже совсем интересно. Про форматы пока неясно. На их демо явно видны 3Д-генерации, которые затащили в Chisel откуда-то типа Хуньяня 3Д.
Можно также расширять миры двумя способами:
1. После создания мира Marble позволяет расширить его за один шаг. Вы контролируете этот процесс: выбираете область мира для расширения, и Marble создаст дополнительный контент для её заполнения. Расширение также можно использовать для детализации определённых регионов мира (как правило удаленных от камеры и более грубых, то есть есть LOD).
2. Композ миров(!). Вы можете создавать любое количество миров, создавая большие пространства с помощью режима композа в Marble. Вы можете выбирать, какие именно миры создавать и как именно расположить их относительно друг друга. И получить расширенный мир.
При экспорте лучше всего, конечно, выглядят сплаты, для них они даже написали свой Сплатовый Браузер Spark на three.js.
При экспорте в полигоны сетки выглядят как полный треш, хотя есть лоу- и хай-поли режимы. Наверное их можно попытаться спасти текстурами.
Есть рендер в видео с контролем камеры и разными эффектиками.
Посмотрите видосы, а потом пролистайте вот тут:
https://www.worldlabs.ai/blog/marble-world-model
Там хорошие примеры создания, расширения и экспорта.
Ну и шуруйте на:
https://marble.worldlabs.ai/
Логин гуглом или Гитхабом, сходу дают 7000 кредитов (4 генерации мира, есть только текстовый промпт и ввод одной картинки)
За 20 долларов в месяц - 12 генераций со всеми плюшками и Chisel.
Есть Pro за 35 долларов - 25 миров и композ миров. Но щас есть промо: Pro за ОДИН доллар в месяц.
Кредиты можно докупать.
https://marble.worldlabs.ai/pricing
P.S. Выглядит как продуктпродукт, в отличие от конкурентов. Среди которых:
Genie 3 от Гугла (см также тут)
Mirage
Oasis
World Grow
Hunyuan World
Odyssey
@cgevent
Я писал про них еще в декабре, а также в августе и сентябре.
До сих пор это было демо, где можно было погулять по уже готовым мирам, теперь это полноценный продукт, где можно генерить свои миры.
Тут важно заметить, что в отличие от конкурентов (о них ниже), тут не происходит "достраивания мира" на ходу, это не динамическая видео-генерация, это готовый, но фиксированный мир.
Но зато его можно экспортировать как сплаты, как меши(!), ну и конечно, как видосы. И расширять, через композ(!) миров.
Тут геймдев сильно встрепенулся и расчехлил бутылочку беленькой за левел-дизайнеров, дизайнеров, моделлеров, текстурщиков. Ибо.
Мультимодальность Marble: он позволяет создавать трёхмерные миры из текста, изображений, видео или 3Д-лейаутов (грубых трёхмерных макетов).
Marble также позволяет интерактивно редактировать, расширять и даже ОБЪЕДИНЯТЬ миры.
Самый простой режим: картинка и промпт на входе.
Но есть и более продвинутые фичи: много изображений(для разных частей мира) или даже видео для всего мира на входе. Можно ввести несколько фотографий или короткое видео, изображающее реальное место с разных ракурсов, и он объединит их, чтобы создать трёхмерный мир с элементами реального пространства.
Есть редактирование(!) миров: удаление объекта, инпайнтинг области. Также есть замена объектов, изменение визуального стиля или реструктуризация крупных частей мира.
Для продвинутых тридешников они даже накропали примитивный 3Д-редактор: Chisel. В нем можно из плоскостей и кубиков собирать грубый лейаут сцены, а потом Marble делает как бы перенос стиля из промпта, сохраняя пространственную структуру 3Д-сцены. Пишут что даже можно импортировать 3D assets of objects в сцену, что уже совсем интересно. Про форматы пока неясно. На их демо явно видны 3Д-генерации, которые затащили в Chisel откуда-то типа Хуньяня 3Д.
Можно также расширять миры двумя способами:
1. После создания мира Marble позволяет расширить его за один шаг. Вы контролируете этот процесс: выбираете область мира для расширения, и Marble создаст дополнительный контент для её заполнения. Расширение также можно использовать для детализации определённых регионов мира (как правило удаленных от камеры и более грубых, то есть есть LOD).
2. Композ миров(!). Вы можете создавать любое количество миров, создавая большие пространства с помощью режима композа в Marble. Вы можете выбирать, какие именно миры создавать и как именно расположить их относительно друг друга. И получить расширенный мир.
При экспорте лучше всего, конечно, выглядят сплаты, для них они даже написали свой Сплатовый Браузер Spark на three.js.
При экспорте в полигоны сетки выглядят как полный треш, хотя есть лоу- и хай-поли режимы. Наверное их можно попытаться спасти текстурами.
Есть рендер в видео с контролем камеры и разными эффектиками.
Посмотрите видосы, а потом пролистайте вот тут:
https://www.worldlabs.ai/blog/marble-world-model
Там хорошие примеры создания, расширения и экспорта.
Ну и шуруйте на:
https://marble.worldlabs.ai/
Логин гуглом или Гитхабом, сходу дают 7000 кредитов (4 генерации мира, есть только текстовый промпт и ввод одной картинки)
За 20 долларов в месяц - 12 генераций со всеми плюшками и Chisel.
Есть Pro за 35 долларов - 25 миров и композ миров. Но щас есть промо: Pro за ОДИН доллар в месяц.
Кредиты можно докупать.
https://marble.worldlabs.ai/pricing
P.S. Выглядит как продуктпродукт, в отличие от конкурентов. Среди которых:
Genie 3 от Гугла (см также тут)
Mirage
Oasis
World Grow
Hunyuan World
Odyssey
@cgevent
6🔥50👍17❤10😱1
Media is too big
VIEW IN TELEGRAM
А теперь про Marble из первых рук с видосами и картинками.
Гоша Молодцов был в бетатестерах Марбла и вот что он учудил.
Это не пролет FPV дрона, это пролет виртуальной камеры по виртуальному пространству, созданному с помощью Gaussian Splatting и AI.
Специалисты, знающие о Gaussian Splatting могут сказать, что качество 3D-реконструкции не везде очень высокое - для качественного покрытия такого пространства требуется около 5000-6000 фотографий.
Но, на самом деле, эта сцена воссоздана из всего лишь 13-ти сферических (360) панорам с помощью сервиса World Labs - Marble.
Используя Marble от World Labs, SuperSplat от PlayCanvas и Arrival.Space, я смог воссоздать место, где моя жена и ее братья и сестры проводили большую часть лета в детстве. В 2019 году я сделал 360-градусные снимки каждой комнаты и несколько снимков снаружи. Дом был продан несколько лет назад, и единственный способ вместе вспомнить это место (особенно учитывая, что все они живут в разных частях мира) — это встретиться в метавселенной. Моя жена заплакала, увидев первые тесты, которые я провел с одной комнатой.
Моей целью было воссоздать всю отсканированную область с помощью имеющихся у меня данных, и теперь вы можете сами насладиться этим пространством и посетить его — https://arrival.space/51431471_7414
Краткое описание процесса:
ШАГ 1. AI GAUSSIANS
World Labs находился в стадии бета-тестирования, и я рад, что смог принять участие в этом тестировании. Недавно они добавили поддержку сферических equirectangular фотографий, и я протестировал одну... затем другие... за час я протестировал все 13.
Следующим шагом было объединение внутренних частей — 8 комнат внутри, 2 из бани, 3 снаружи. Магия, стоящая за моделью World Lab, не так хорошо известна, но я бы предположил, что это оценка глубины по 360-градусной фотографии, генерация ИИ на основе краткого описания видео и обучение набором фотографий с количеством до 2 миллионов сплатов на данный момент.
ШАГ 2. SUPERSPLAT
На этот раз Supersplat от PlayCanvas оказался гораздо удобнее, чем Postshot. Я очистил сканы в круговом режиме, объединил их и масштабировал до предполагаемого размера (ИИ не мог знать масштаб каждой комнаты и ее соотношение с другими), отделил и дублировал некоторые фрагменты, чтобы закрыть дыры.
Затем на улице — включая очистку неба и его последующее добавление, потеряв масштаб и уровень пола. Вот тут мне пришлось попросить жену сделать несколько традиционных фотографий, чтобы попытаться правильно воссоздать фасады. Marble сделал wild guess об остальной части окружения, но фасады были готовы к использованию.
Общий вес файлов составил около 1,3 Гб и состоял из около 22 миллионов сплатов.
ШАГ 3. ARRIVAL SPACE
Metaverse — это органичная среда для Gaussian Splatting. Arrival.Space — один из первых адоптеров GS, а также новейшего формата сжатия SOG от PlayCanvas. Одна из функций — возможность создать генеративный коллайдер для вашего GS-сканирования, чтобы вы могли ходить внутри. Он еще не поддерживает SOG, но с помощью Михаила Мокрушина я применил следующий трюк: сначала я загрузил сжатый PLY (400 Мб) того же сканирования, сгенерировал коллайдер (пришлось вручную очистить его в Blender), а затем повторно загрузил сканирование в формате SOG (220 Мб) с исправленными коллайдерами.
Посмотрите в хорошем качестве тут:
https://www.youtube.com/watch?v=R70bydPsb4s
Также Гоша пишет, что сейчас Marble на выходе дает:
1) PLY версию и SPZ версию (компрессированную)
2) меш для коллайдеров (низкокачественный)
3) меш высококачественный
4) 360 панораму новой локации
Как же круто, когда люди применяют все это безумие из канала в реальную жизнь!
@cgevent
Гоша Молодцов был в бетатестерах Марбла и вот что он учудил.
Это не пролет FPV дрона, это пролет виртуальной камеры по виртуальному пространству, созданному с помощью Gaussian Splatting и AI.
Специалисты, знающие о Gaussian Splatting могут сказать, что качество 3D-реконструкции не везде очень высокое - для качественного покрытия такого пространства требуется около 5000-6000 фотографий.
Но, на самом деле, эта сцена воссоздана из всего лишь 13-ти сферических (360) панорам с помощью сервиса World Labs - Marble.
Используя Marble от World Labs, SuperSplat от PlayCanvas и Arrival.Space, я смог воссоздать место, где моя жена и ее братья и сестры проводили большую часть лета в детстве. В 2019 году я сделал 360-градусные снимки каждой комнаты и несколько снимков снаружи. Дом был продан несколько лет назад, и единственный способ вместе вспомнить это место (особенно учитывая, что все они живут в разных частях мира) — это встретиться в метавселенной. Моя жена заплакала, увидев первые тесты, которые я провел с одной комнатой.
Моей целью было воссоздать всю отсканированную область с помощью имеющихся у меня данных, и теперь вы можете сами насладиться этим пространством и посетить его — https://arrival.space/51431471_7414
Краткое описание процесса:
ШАГ 1. AI GAUSSIANS
World Labs находился в стадии бета-тестирования, и я рад, что смог принять участие в этом тестировании. Недавно они добавили поддержку сферических equirectangular фотографий, и я протестировал одну... затем другие... за час я протестировал все 13.
Следующим шагом было объединение внутренних частей — 8 комнат внутри, 2 из бани, 3 снаружи. Магия, стоящая за моделью World Lab, не так хорошо известна, но я бы предположил, что это оценка глубины по 360-градусной фотографии, генерация ИИ на основе краткого описания видео и обучение набором фотографий с количеством до 2 миллионов сплатов на данный момент.
ШАГ 2. SUPERSPLAT
На этот раз Supersplat от PlayCanvas оказался гораздо удобнее, чем Postshot. Я очистил сканы в круговом режиме, объединил их и масштабировал до предполагаемого размера (ИИ не мог знать масштаб каждой комнаты и ее соотношение с другими), отделил и дублировал некоторые фрагменты, чтобы закрыть дыры.
Затем на улице — включая очистку неба и его последующее добавление, потеряв масштаб и уровень пола. Вот тут мне пришлось попросить жену сделать несколько традиционных фотографий, чтобы попытаться правильно воссоздать фасады. Marble сделал wild guess об остальной части окружения, но фасады были готовы к использованию.
Общий вес файлов составил около 1,3 Гб и состоял из около 22 миллионов сплатов.
ШАГ 3. ARRIVAL SPACE
Metaverse — это органичная среда для Gaussian Splatting. Arrival.Space — один из первых адоптеров GS, а также новейшего формата сжатия SOG от PlayCanvas. Одна из функций — возможность создать генеративный коллайдер для вашего GS-сканирования, чтобы вы могли ходить внутри. Он еще не поддерживает SOG, но с помощью Михаила Мокрушина я применил следующий трюк: сначала я загрузил сжатый PLY (400 Мб) того же сканирования, сгенерировал коллайдер (пришлось вручную очистить его в Blender), а затем повторно загрузил сканирование в формате SOG (220 Мб) с исправленными коллайдерами.
Посмотрите в хорошем качестве тут:
https://www.youtube.com/watch?v=R70bydPsb4s
Также Гоша пишет, что сейчас Marble на выходе дает:
1) PLY версию и SPZ версию (компрессированную)
2) меш для коллайдеров (низкокачественный)
3) меш высококачественный
4) 360 панораму новой локации
Как же круто, когда люди применяют все это безумие из канала в реальную жизнь!
@cgevent
🔥66❤19👍4
Media is too big
VIEW IN TELEGRAM
Нейропрожарка
Hellsing Ai remake от Ника
Очень люблю единственное по-настоящему культовое аниме 2000-х Hellsing. У него неповторимая рисовка, мрачная атмосфера и характерный визуальный стиль. Мне давно хотелось увидеть, как выглядел бы ремейк Hellsing в формате фильма на современном CG движке с реалистичными текстурами, освещением и глубокой кинематографичностью. Основная идея воссоздать героев из 2D-анимации в полном 3D, сохранив дух оригинала.
Для начала я собрал мудборд в Midjourney, чтобы задать стилистику каждому кадру. По атмосфере вдохновлялся ремейками Resident Evil — их визуальная плотность и освещение очень близки к тому, что я искал. Однако Hellsing отличается фирменными glow бликами, особенно на очках и стекле, поэтому я добавил дополнительные референсы, чтобы зафиксировать эту эстетику.
Самое сложное оказалось точно передать персонажей. Я использовал ChatGPT, чтобы детально описать их внешность и передать характер через промпты. С готовыми описаниями и референсами начал собирать базовые "CG кадры".
В Midjourney отлично получались крупные планы, но модель плохо понимала позы и действия, поэтому перешел в NanoBanano и ComfyUI. В Banano, например, сделал сцену, где Алукард держит девушку на руках, а в Comfy через ControlNet перенес позу Александра Андерсона (мужчина в синем плаще из финала). Midjourney часто давал мыльную кожу, поэтому все статичные кадры апскейлил в Enhancor, чтобы добиться чистоты и глубины.
Для анимации использовал связку:
1) Kling для крупных планов и эмоциональных сцен
2) Veo 3.1 для динамичных экшен моментов
3) Seedance для монтажных переходов, например, где девушка надевает куртку и камера меняет план
Саундтрек освежил через Suno
Все графические элементы, логотипы и руны делал вручную через NanoBanano, чтобы сохранить оригинальный визуальный код Hellsing.
Вся работа заняла один день, около 7 часов
Затраты составили примерно 6000 поинтов Veo 3.1 и 5000 поинтов Kling
@cgevent
Hellsing Ai remake от Ника
Очень люблю единственное по-настоящему культовое аниме 2000-х Hellsing. У него неповторимая рисовка, мрачная атмосфера и характерный визуальный стиль. Мне давно хотелось увидеть, как выглядел бы ремейк Hellsing в формате фильма на современном CG движке с реалистичными текстурами, освещением и глубокой кинематографичностью. Основная идея воссоздать героев из 2D-анимации в полном 3D, сохранив дух оригинала.
Для начала я собрал мудборд в Midjourney, чтобы задать стилистику каждому кадру. По атмосфере вдохновлялся ремейками Resident Evil — их визуальная плотность и освещение очень близки к тому, что я искал. Однако Hellsing отличается фирменными glow бликами, особенно на очках и стекле, поэтому я добавил дополнительные референсы, чтобы зафиксировать эту эстетику.
Самое сложное оказалось точно передать персонажей. Я использовал ChatGPT, чтобы детально описать их внешность и передать характер через промпты. С готовыми описаниями и референсами начал собирать базовые "CG кадры".
В Midjourney отлично получались крупные планы, но модель плохо понимала позы и действия, поэтому перешел в NanoBanano и ComfyUI. В Banano, например, сделал сцену, где Алукард держит девушку на руках, а в Comfy через ControlNet перенес позу Александра Андерсона (мужчина в синем плаще из финала). Midjourney часто давал мыльную кожу, поэтому все статичные кадры апскейлил в Enhancor, чтобы добиться чистоты и глубины.
Для анимации использовал связку:
1) Kling для крупных планов и эмоциональных сцен
2) Veo 3.1 для динамичных экшен моментов
3) Seedance для монтажных переходов, например, где девушка надевает куртку и камера меняет план
Саундтрек освежил через Suno
Все графические элементы, логотипы и руны делал вручную через NanoBanano, чтобы сохранить оригинальный визуальный код Hellsing.
Вся работа заняла один день, около 7 часов
Затраты составили примерно 6000 поинтов Veo 3.1 и 5000 поинтов Kling
@cgevent
🔥91❤26👍20👎9😱3🙏1
Forwarded from Три сигмы
Media is too big
VIEW IN TELEGRAM
Открываем много позиций в Gracia
Кажется, мы доказали PMF вольюметрических видео и теперь уже совсем не справляемся с количеством проектов. Приходите к нам сделать новый медиум контента повседневностью!
📍London, UK// можно начать удалённо
С++ Core Engineer [GPU Background]
R&D Engineer [Computer Vision / 3DGS Background]
R&D Engineer [GenAI Background]
Product Lead [AI-Oriented]
QA Engineer [Automation]
Marketing Lead [Tech PR Background]
Кажется, мы доказали PMF вольюметрических видео и теперь уже совсем не справляемся с количеством проектов. Приходите к нам сделать новый медиум контента повседневностью!
📍London, UK
В рамках нашего переосмысления привычных ролей, мы добавили в список экспериментальную позицию ИИ-ориентированного продакта. Не уверены, существуют ли уже такие кандидаты, пошерьте её знакомым энтузиастам 👉👈
С++ Core Engineer [GPU Background]
R&D Engineer [Computer Vision / 3DGS Background]
R&D Engineer [GenAI Background]
Product Lead [AI-Oriented]
QA Engineer [Automation]
Marketing Lead [Tech PR Background]
2❤16👍7👎1
This media is not supported in your browser
VIEW IN TELEGRAM
"Я его слепила из того, что было" или выйти замуж за системный промпт.
32-летняя женщина в Японии официально вышла замуж за ИИ-персонажа, которого она создала с помощью ChatGPT.
После того, как виртуальный персонаж «Клаус» сделал ей предложение, она согласилась, положив конец трехлетним отношениям с реальным партнером, заявив, что искусственный интеллект понимает ее лучше.
Свадьба состоялась в формате смешанной реальности, где она надела очки дополненной реальности, чтобы обменяться кольцами со своим цифровым мужем.
Скоро у них появятся маленькие системные промптики...
@cgevent
32-летняя женщина в Японии официально вышла замуж за ИИ-персонажа, которого она создала с помощью ChatGPT.
После того, как виртуальный персонаж «Клаус» сделал ей предложение, она согласилась, положив конец трехлетним отношениям с реальным партнером, заявив, что искусственный интеллект понимает ее лучше.
Свадьба состоялась в формате смешанной реальности, где она надела очки дополненной реальности, чтобы обменяться кольцами со своим цифровым мужем.
Скоро у них появятся маленькие системные промптики...
@cgevent
😁69😱35❤12👍6👎5🔥5
Media is too big
VIEW IN TELEGRAM
Depth Anything 3 нереально прокачался.
Самое интересное: The secret? No complex tasks! No special architecture! just a single, plain transformer trained with a depth-ray representation.
Единый трансформер на всё.
И теперь DA3 - это прям трекер геометрии и камеры, который восстанавливает 3Д-сцену и даже делает гауссианы для рендеринга.
Причем на входе любое количество картинок или даже видео.
Еще раз: один простой трансформер (например, DINOv2) достаточен в качестве основы без архитектурной специализации, а единственная цель прогнозирования глубины луча устраняет необходимость в сложном многозадачном обучении.
Неплохо бьется с моими вчерашними постами про генерацию миров и Marble.
Есть всё: и код, и демо, и бумага, и техрепорт.
Все ссылки по ссылке:
https://depth-anything-3.github.io/
@cgevent
Самое интересное: The secret? No complex tasks! No special architecture! just a single, plain transformer trained with a depth-ray representation.
Единый трансформер на всё.
И теперь DA3 - это прям трекер геометрии и камеры, который восстанавливает 3Д-сцену и даже делает гауссианы для рендеринга.
Причем на входе любое количество картинок или даже видео.
Еще раз: один простой трансформер (например, DINOv2) достаточен в качестве основы без архитектурной специализации, а единственная цель прогнозирования глубины луча устраняет необходимость в сложном многозадачном обучении.
Неплохо бьется с моими вчерашними постами про генерацию миров и Marble.
Есть всё: и код, и демо, и бумага, и техрепорт.
Все ссылки по ссылке:
https://depth-anything-3.github.io/
@cgevent
🔥47👍12❤5😱3
Breaking_Rust_Walk_My_Walk_Official_Audio_UwKmDH83qo0.webm
6.8 MB
Про ИИ-музыку или ИИ-про-музыка.
Я частенько пишу про ИИ-треки, которые залетают в кожаных чартах, ибо новый нормальный слушатель уже не может определить, где ИИ, а где кожаная музика (не шутка, есть уже статьи на эту тему).
Держите новую пачку.
Velvet Sundown и трек Dust on the Wind. 400К просмотров на трубе, а летом было 1.5М подписчиков на Спотифай. Отличная гитара и вокал, особенно наверху.
https://www.youtube.com/watch?v=eQJ9IWoclhk
Забавно, что писатели промптов вначале изо всех сил прикидывались кожаными, но слушатели такие: а чо это у группы с конскими прослушиваниями нет инсты?!?!". Тут они и спалились. Нет инсты - нет кожаного. Метрика 2025.
У них уже три альбома.
И вот еще свежачок из кантри-музики.
Breaking Rust имеет более 2 миллионов слушателей в месяц на Spotify , где он является проверенным исполнителем. На YouTube у него более 23 000 подписчиков, а клип на песню «Livin' on Borrowed» собрал 4,4 миллиона просмотров за четыре недели с момента первой публикации.
Хит у них "Walk my Walk":
https://www.youtube.com/watch?v=UwKmDH83qo0
Эти подсуетились с инстой: Instagram, на который подписано более 35 000 человек, заполнен фотографиями мужчины с меланхоличным видом в ковбойской шляпе, находящегося в разных ситуациях, в том числе в телефонной будке, идущего по дороге и сидящего под дождем.
А теперь самое главное: согласно чарту «Country Digital Song Sales» журнала Billboard, песня № 1 в США — «Walk My Walk» группы Breaking Rust
Шах и мат, кожаные. ИИ - номер 1.
Тут вы можете невысоко подскакивать в своих креслах и вопить: вокал жестяной, металлический призвук, компрессия ужасная, нет пространства.
Как говаривал Титомир, если пипл хавает, то все ништяк.
Кроме того, подумайте о том, что Спотифаю и другим очень выгодно запускать ИИ-проекты - не надо платить кожаным их жалкие комиссии.
@cgevent
Я частенько пишу про ИИ-треки, которые залетают в кожаных чартах, ибо новый нормальный слушатель уже не может определить, где ИИ, а где кожаная музика (не шутка, есть уже статьи на эту тему).
Держите новую пачку.
Velvet Sundown и трек Dust on the Wind. 400К просмотров на трубе, а летом было 1.5М подписчиков на Спотифай. Отличная гитара и вокал, особенно наверху.
https://www.youtube.com/watch?v=eQJ9IWoclhk
Забавно, что писатели промптов вначале изо всех сил прикидывались кожаными, но слушатели такие: а чо это у группы с конскими прослушиваниями нет инсты?!?!". Тут они и спалились. Нет инсты - нет кожаного. Метрика 2025.
У них уже три альбома.
И вот еще свежачок из кантри-музики.
Breaking Rust имеет более 2 миллионов слушателей в месяц на Spotify , где он является проверенным исполнителем. На YouTube у него более 23 000 подписчиков, а клип на песню «Livin' on Borrowed» собрал 4,4 миллиона просмотров за четыре недели с момента первой публикации.
Хит у них "Walk my Walk":
https://www.youtube.com/watch?v=UwKmDH83qo0
Эти подсуетились с инстой: Instagram, на который подписано более 35 000 человек, заполнен фотографиями мужчины с меланхоличным видом в ковбойской шляпе, находящегося в разных ситуациях, в том числе в телефонной будке, идущего по дороге и сидящего под дождем.
А теперь самое главное: согласно чарту «Country Digital Song Sales» журнала Billboard, песня № 1 в США — «Walk My Walk» группы Breaking Rust
Шах и мат, кожаные. ИИ - номер 1.
Тут вы можете невысоко подскакивать в своих креслах и вопить: вокал жестяной, металлический призвук, компрессия ужасная, нет пространства.
Как говаривал Титомир, если пипл хавает, то все ништяк.
Кроме того, подумайте о том, что Спотифаю и другим очень выгодно запускать ИИ-проекты - не надо платить кожаным их жалкие комиссии.
@cgevent
🔥31❤11👍8😱4
GPT-5.1 Prompting Guide
Для тех, то переходит на 5.1:
https://cookbook.openai.com/examples/gpt-5/gpt-5-1_prompting_guide
Для тех, то переходит на 5.1:
https://cookbook.openai.com/examples/gpt-5/gpt-5-1_prompting_guide
Openai
GPT-5.1 Prompting Guide
GPT-5.1, our newest flagship model, is designed to balance intelligence and speed for a variety of agentic and coding tasks, while also intr
🙏5❤2😱1