Метаверсище и ИИще

Не так давно писал про Deepseek OCR - перевод изображений в тексты.

Индийские коллеги из Datalab бахнули Чандру.
Ещё один OCR, который, конечно, побивает Мистраль и Дипсик на разных OCR тестах.

40 языков, формулы, рукописи и пр.

И все это с кодом!

Демо есть тут:
https://www.datalab.to/playground/documents/new

А код тут:
https://github.com/datalab-to/chandra

На видео - оцифровка рукописи 1913 года на Ramanujan language.

@cgevent

🔥37👍10❤6

8.73K viewsSergey Tsyptsyn ️️, edited 16:38

Метаверсище и ИИще

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Я недолюбливаю LTX Video за их отвратительное качество.

Но продуктово они делают правильные вещи, их сайт довольно ловкий с точки зрения работы с пользователем, open AI и Гуглу есть чему поучиться.

Они запустили Elements - вкомпаживание объектов в видео.

И да, они делают очень хорошие черрипикнутые демо ролики. На деле же генерация очень средняя.

@cgevent

👍31❤7👎1

7.27K viewsSergey Tsyptsyn ️️, 16:47

Метаверсище и ИИще

Все, что вы хотели знать про индийский геймдев.

Почитайте внизу, что вам вменяют в скилы и обязанности за 113 долларов в МЕСЯЦ.

Выкрадено в Линкедине.

@cgevent

2😁30😱25❤6👍2🔥2🙏1

7.83K viewsSergey Tsyptsyn ️️, edited 16:50

Метаверсище и ИИще

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

Нейропрожарка

Проект: рекламный ролик On Running (Full AI Production) от Влада.

Задача:
Сделать короткий рекламный ролик, полностью созданный нейросетями — с консистентным персонажем и нужными продуктами на герое в разных сценах.

Опыт и подход:
Это был мой первый полноценный опыт создания видео полностью в нейронках. Раньше я лишь пробовал встраивать объекты в отснятый футаж и «оживлять» кадры в Kling.
Однокнопочные решения вроде Sora с говорящими головами не подходили — хотелось сделать что-то, что не выглядит как типичная «майонезная» реклама.
В итоге я выбрал Google Veo 3.1 (через Higgsfield).

Концепт:
Идея родилась за секунды: ролик задумывался для бренда On Running, который позиционирует себя как создателя сверхлёгких кроссовок — «настолько лёгких, что будто идёшь по облакам».
От этого и оттолкнулся: герой преодолевает городские препятствия и в финале выходит к краю крыши, покрытой облаками. Он делает шаг — и идёт по облакам. Простая, но сильная визуальная метафора бренда.

Процесс:
Все изображения создавал в Nanobanana — она безлимитная на Higgs’ах и неплохо справляется с переодеванием героя и сменой фонов.
Постепенно выработал собственный пайплайн:

каждую сцену разбивал на общий, средний и крупный план;

начинал с общего, от него укрупнялся до нужной детали (лицо / обувь);

долго боролся с багом, когда Nanobanana «разворачивала» героя при боковых планах — решалось количеством генераций.

Ключевые кадры загружал в Veo 3.1, просил ChatGPT помочь с промптами, подробно описывая движения камеры.
Основная сложность — переходы между планами, например от лица к обуви: Veo принимает только одно изображение на вход, и если давал лицо, он «выдумывал» кроссовки. А мне нужна была конкретная модель. Поэтому некоторые сцены пришлось опустить.

Техническая часть:

Закадровый текст написал вместе с ChatGPT: я набросал смысл, он причесал формулировки.

Голос сгенерил в ElevenLabs (хватило бесплатного пакета).

Музыка — сток с Artlist.io.

Монтаж — Adobe Premiere,

Цветокор и финальный вид — DaVinci Resolve, добавил плёночный эффект для фактуры и чтобы скрыть «мыло».

Затраты

~8–10 часов в сумме (вечерами, в несколько подходов)

~50 $ (Higgsfield 30 + дополнительные кредиты 20)

@cgevent

🔥68👎22👍16❤4😁1

7.9K viewsSergey Tsyptsyn ️️, 16:56

Новая реклама Кока-Колы.

В коментах уже начали обсуждать, я наброшу немного деталей.
Работали три студии: Secret Level, Silverside AI and Wild Card
Картинки в основном создавались в Leonardo (непонятно на какой модели, возможно, Flux).
Анимация, как ни странно, Luma and Runway.
А конце продакшена подключили новый Клинг.
Было много клинапа и поста (несмотря на заявления в Твитторе), корректировали в основном текст.
Открывающую безумную белку генерили пару сотен раз.

В сети пригорает: Создатель «Гравити Фолз» Алекс Хирш заявил , что Coca-Cola красная, потому что сделана «из крови безработных художников».

Твитторские: "Это способ для и без того невероятно богатых руководителей добавить ещё несколько миллионов к своим годовым бонусам, полностью сократив творческие команды и заставив машину изрыгать самую скучную жижу, какую только можно вообразить"

Лучше всего посмотреть видео и разные концепты на сайте Secret Level:
https://www.secretlevel.co/portfolio/coca-cola-2/

Мнение с дивана: прошлую (довольно кривую) рекламу посмотрели миллионы. Эта набирает еще быстрее. Вам шашечки или ехать? Это ж реклама, а не фестиваль Санденс - если пипл хавает ((С) Богдан Титомир), то какая разница в чем сделано?

Э-Экономика.

@cgevent

👍79👎24😁13❤11🔥3😱3🙏1

9.14K viewsSergey Tsyptsyn ️️, 10:19

Метаверсище и ИИще

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

Сожги свою подписку. Free Affinity.

Именно с таким слоганом Canva бахнула обновленную Affinity по цене 0 долларов.
"30 октября 2025 года во время мероприятия Create Canva анонсировала обновленную версию Affinity, объединившую функции редактирования фотографий, векторной иллюстрации и верстки страниц в одном бесплатном приложении".

Чтобы скачать бесплатно, вам надо завести учетку на Canva.
Есть импорт из Фотошопа и ГПУ-ускорение для больших файлов.

https://www.affinity.studio/get-affinity

@cgevent

🔥48❤4👍4😁3👎2😱1

8.34K viewsSergey Tsyptsyn ️️, 10:28

Метаверсище и ИИще

Giri: Мне кажется Эппле уже не просто тормозит, а уже включает заднюю.

Apple по-прежнему планирует выпустить обновленную версию Siri примерно в марте следующего года. Выпуск должен сопровождаться выпуском нового продукта для умного дома с дисплеем, который можно установить на подставке с динамиком или на стене. Новые Apple TV и HomePod mini, которые скоро появятся в продаже, также «помогут продемонстрировать» новые функции Siri и Apple Intelligence в следующем году.

Новая версия Siri, по всей видимости, будет использовать Gemini от Google и включать в себя функцию веб-поиска на базе искусственного интеллекта.

Эппле мечется из стороны в сторону, то анонсируя свою новую Сири, то сотрудничество с OpenAI, теперь вот с Гугл. Так и до Дипсика дойдет.

Ну и зная Эппле - март следующего года - это январь 2027 года, который ближе к декабрю 2027.

Сири на Гугл = Гири.

@cgevent

😁44❤9👍4

7.32K viewsSergey Tsyptsyn ️️, edited 10:39

Метаверсище и ИИще

1:50

This media is not supported in your browser

VIEW IN TELEGRAM

О хоспади, аниме покусало NotebookLM.

В новом NotebookLM уже был стиль "аниме" для создания презентаций в соответствующем стиле.
Выяснилось, что этот стиль НАИБОЛЕЕ востребован (куда катится мир), но пользователям не хватает анимешности.
В ответ на это Google выкатил новый kawaii-стиль - настоящее анимеаниме для вот этих вот всех пользователей.

P.S. "Твое имя", конечно, хорошая работа, но аниме-помешательство меня сильно удивляет.

@cgevent

😁37❤14🔥5😱1

12K viewsSergey Tsyptsyn ️️, 10:51

Метаверсище и ИИще

This media is not supported in your browser

VIEW IN TELEGRAM

OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes

Тут спрашивали за генерацию панорам.

Держите вот такую опенсорсную работу от Клинга.

Они не только генерят панорамы, но и по дороге достают из них разные свойства: карты глубины, normal, albedo, roughness, and metallic.
Но самое интересное в том, что они утверждают, что могут конвертировать панорамы в 3D, причем в обычные меши, которые можно потом грузить в Блендор. Правда, хотя этот пункт на Гитхабе помечен как выполненный, мелким шрифтом написано, что пока это работает криво, типа бета.

Проект: https://yukun-huang.github.io/OmniX/
Код: https://github.com/HKU-MMLab/OmniX
Веса: https://huggingface.co/KevinHuang/OmniX

@cgevent

👍32❤3🔥1

8.16K viewsSergey Tsyptsyn ️️, 11:08

Метаверсище и ИИще

Forwarded from Хранители Легиона 🔮

Офигейте и попадайте со стульев! Университет Мэриленда и Microsoft протестировали 26 языков на всех топовых LLM — и английские промпты оказались НЕ самыми эффективными! 🤯

Результаты просто дикие:
- Польский — 88% (первое место!)
- Русский — 84% (пятое место)
- Английский — только 83.9% (шестое место!)

Пока все годами мучаются с английскими промптами, думая что так «правильнее», оказывается наш родной русский работает лучше!

Протестировали на OpenAI, Gemini, Llama — везде одинаковый результат. Даже китайский с огромной базой данных показал один из худших результатов.

Практический вывод: Сложные задачи теперь можно спокойно задавать ИИ по-русски — это эффективнее английского. Особенно когда нужна точность выполнения.

Кто бы мог подумать, что польский станет языком №1 для общения с искусственным интеллектом! 🙂

🔮 Хранители Легиона ➕

3😱64😁43👍31❤19🔥11👎7

7.36K viewsSergey Tsyptsyn ️️, 11:31

Нейпрожарка

Коммерческий ролик от Артема

Виктория Остара - Кошка🔥

Не просто коммерция.
Эмоции, чувства, красота, любовь. 🥰

Наш уже постоянный клиент Виктория, третья работа, второе стихотворение.
Она снова доверилась нам и мы снова ее не подвели.
Когда она прислала стихотворение и сказала - хочу.
Мы ей ответили - круто.
Мы не знаем, что это будет, НО это точно будет в Стамбуле.
Она сказала идею, мы ее доработали, сделали музыку и отправились в путешествие.
Самый сложный коммерческий заказ, самый эмоциональный и самый лучший.

Погрузитесь с нами и Викторией в те чувства, которые она хотела передать.

Инструменты:
Видео: клинг, вео.
Изображения: миджорни, банана.
Апскейл: магнифик, топаз.
Музыка: суно
Голос: живой
Работа 70 часов.

Добро пожаловать в Иллюзию.

Добро пожаловать в Стамбул.

@cgevent

👎46👍31🔥11❤4😁1

7.72K viewsSergey Tsyptsyn ️️, 13:21

Метаверсище и ИИще