This media is not supported in your browser
VIEW IN TELEGRAM
Не так давно писал про Deepseek OCR - перевод изображений в тексты.
Индийские коллеги из Datalab бахнули Чандру.
Ещё один OCR, который, конечно, побивает Мистраль и Дипсик на разных OCR тестах.
40 языков, формулы, рукописи и пр.
И все это с кодом!
Демо есть тут:
https://www.datalab.to/playground/documents/new
А код тут:
https://github.com/datalab-to/chandra
На видео - оцифровка рукописи 1913 года на Ramanujan language.
@cgevent
Индийские коллеги из Datalab бахнули Чандру.
Ещё один OCR, который, конечно, побивает Мистраль и Дипсик на разных OCR тестах.
40 языков, формулы, рукописи и пр.
И все это с кодом!
Демо есть тут:
https://www.datalab.to/playground/documents/new
А код тут:
https://github.com/datalab-to/chandra
На видео - оцифровка рукописи 1913 года на Ramanujan language.
@cgevent
🔥37👍10❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Я недолюбливаю LTX Video за их отвратительное качество.
Но продуктово они делают правильные вещи, их сайт довольно ловкий с точки зрения работы с пользователем, open AI и Гуглу есть чему поучиться.
Они запустили Elements - вкомпаживание объектов в видео.
И да, они делают очень хорошие черрипикнутые демо ролики. На деле же генерация очень средняя.
@cgevent
Но продуктово они делают правильные вещи, их сайт довольно ловкий с точки зрения работы с пользователем, open AI и Гуглу есть чему поучиться.
Они запустили Elements - вкомпаживание объектов в видео.
И да, они делают очень хорошие черрипикнутые демо ролики. На деле же генерация очень средняя.
@cgevent
👍31❤7👎1
Все, что вы хотели знать про индийский геймдев.
Почитайте внизу, что вам вменяют в скилы и обязанности за 113 долларов в МЕСЯЦ.
Выкрадено в Линкедине.
@cgevent
Почитайте внизу, что вам вменяют в скилы и обязанности за 113 долларов в МЕСЯЦ.
Выкрадено в Линкедине.
@cgevent
2😁30😱25❤6👍2🔥2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Нейропрожарка
Проект: рекламный ролик On Running (Full AI Production) от Влада.
Задача:
Сделать короткий рекламный ролик, полностью созданный нейросетями — с консистентным персонажем и нужными продуктами на герое в разных сценах.
Опыт и подход:
Это был мой первый полноценный опыт создания видео полностью в нейронках. Раньше я лишь пробовал встраивать объекты в отснятый футаж и «оживлять» кадры в Kling.
Однокнопочные решения вроде Sora с говорящими головами не подходили — хотелось сделать что-то, что не выглядит как типичная «майонезная» реклама.
В итоге я выбрал Google Veo 3.1 (через Higgsfield).
Концепт:
Идея родилась за секунды: ролик задумывался для бренда On Running, который позиционирует себя как создателя сверхлёгких кроссовок — «настолько лёгких, что будто идёшь по облакам».
От этого и оттолкнулся: герой преодолевает городские препятствия и в финале выходит к краю крыши, покрытой облаками. Он делает шаг — и идёт по облакам. Простая, но сильная визуальная метафора бренда.
Процесс:
Все изображения создавал в Nanobanana — она безлимитная на Higgs’ах и неплохо справляется с переодеванием героя и сменой фонов.
Постепенно выработал собственный пайплайн:
каждую сцену разбивал на общий, средний и крупный план;
начинал с общего, от него укрупнялся до нужной детали (лицо / обувь);
долго боролся с багом, когда Nanobanana «разворачивала» героя при боковых планах — решалось количеством генераций.
Ключевые кадры загружал в Veo 3.1, просил ChatGPT помочь с промптами, подробно описывая движения камеры.
Основная сложность — переходы между планами, например от лица к обуви: Veo принимает только одно изображение на вход, и если давал лицо, он «выдумывал» кроссовки. А мне нужна была конкретная модель. Поэтому некоторые сцены пришлось опустить.
Техническая часть:
Закадровый текст написал вместе с ChatGPT: я набросал смысл, он причесал формулировки.
Голос сгенерил в ElevenLabs (хватило бесплатного пакета).
Музыка — сток с Artlist.io.
Монтаж — Adobe Premiere,
Цветокор и финальный вид — DaVinci Resolve, добавил плёночный эффект для фактуры и чтобы скрыть «мыло».
Затраты
~8–10 часов в сумме (вечерами, в несколько подходов)
~50 $ (Higgsfield 30 + дополнительные кредиты 20)
@cgevent
Проект: рекламный ролик On Running (Full AI Production) от Влада.
Задача:
Сделать короткий рекламный ролик, полностью созданный нейросетями — с консистентным персонажем и нужными продуктами на герое в разных сценах.
Опыт и подход:
Это был мой первый полноценный опыт создания видео полностью в нейронках. Раньше я лишь пробовал встраивать объекты в отснятый футаж и «оживлять» кадры в Kling.
Однокнопочные решения вроде Sora с говорящими головами не подходили — хотелось сделать что-то, что не выглядит как типичная «майонезная» реклама.
В итоге я выбрал Google Veo 3.1 (через Higgsfield).
Концепт:
Идея родилась за секунды: ролик задумывался для бренда On Running, который позиционирует себя как создателя сверхлёгких кроссовок — «настолько лёгких, что будто идёшь по облакам».
От этого и оттолкнулся: герой преодолевает городские препятствия и в финале выходит к краю крыши, покрытой облаками. Он делает шаг — и идёт по облакам. Простая, но сильная визуальная метафора бренда.
Процесс:
Все изображения создавал в Nanobanana — она безлимитная на Higgs’ах и неплохо справляется с переодеванием героя и сменой фонов.
Постепенно выработал собственный пайплайн:
каждую сцену разбивал на общий, средний и крупный план;
начинал с общего, от него укрупнялся до нужной детали (лицо / обувь);
долго боролся с багом, когда Nanobanana «разворачивала» героя при боковых планах — решалось количеством генераций.
Ключевые кадры загружал в Veo 3.1, просил ChatGPT помочь с промптами, подробно описывая движения камеры.
Основная сложность — переходы между планами, например от лица к обуви: Veo принимает только одно изображение на вход, и если давал лицо, он «выдумывал» кроссовки. А мне нужна была конкретная модель. Поэтому некоторые сцены пришлось опустить.
Техническая часть:
Закадровый текст написал вместе с ChatGPT: я набросал смысл, он причесал формулировки.
Голос сгенерил в ElevenLabs (хватило бесплатного пакета).
Музыка — сток с Artlist.io.
Монтаж — Adobe Premiere,
Цветокор и финальный вид — DaVinci Resolve, добавил плёночный эффект для фактуры и чтобы скрыть «мыло».
Затраты
~8–10 часов в сумме (вечерами, в несколько подходов)
~50 $ (Higgsfield 30 + дополнительные кредиты 20)
@cgevent
🔥68👎22👍16❤4😁1
Media is too big
VIEW IN TELEGRAM
Новая реклама Кока-Колы.
В коментах уже начали обсуждать, я наброшу немного деталей.
Работали три студии: Secret Level, Silverside AI and Wild Card
Картинки в основном создавались в Leonardo (непонятно на какой модели, возможно, Flux).
Анимация, как ни странно, Luma and Runway.
А конце продакшена подключили новый Клинг.
Было много клинапа и поста (несмотря на заявления в Твитторе), корректировали в основном текст.
Открывающую безумную белку генерили пару сотен раз.
В сети пригорает: Создатель «Гравити Фолз» Алекс Хирш заявил , что Coca-Cola красная, потому что сделана «из крови безработных художников».
Твитторские: "Это способ для и без того невероятно богатых руководителей добавить ещё несколько миллионов к своим годовым бонусам, полностью сократив творческие команды и заставив машину изрыгать самую скучную жижу, какую только можно вообразить"
Лучше всего посмотреть видео и разные концепты на сайте Secret Level:
https://www.secretlevel.co/portfolio/coca-cola-2/
Мнение с дивана: прошлую (довольно кривую) рекламу посмотрели миллионы. Эта набирает еще быстрее. Вам шашечки или ехать? Это ж реклама, а не фестиваль Санденс - если пипл хавает ((С) Богдан Титомир), то какая разница в чем сделано?
Э-Экономика.
@cgevent
В коментах уже начали обсуждать, я наброшу немного деталей.
Работали три студии: Secret Level, Silverside AI and Wild Card
Картинки в основном создавались в Leonardo (непонятно на какой модели, возможно, Flux).
Анимация, как ни странно, Luma and Runway.
А конце продакшена подключили новый Клинг.
Было много клинапа и поста (несмотря на заявления в Твитторе), корректировали в основном текст.
Открывающую безумную белку генерили пару сотен раз.
В сети пригорает: Создатель «Гравити Фолз» Алекс Хирш заявил , что Coca-Cola красная, потому что сделана «из крови безработных художников».
Твитторские: "Это способ для и без того невероятно богатых руководителей добавить ещё несколько миллионов к своим годовым бонусам, полностью сократив творческие команды и заставив машину изрыгать самую скучную жижу, какую только можно вообразить"
Лучше всего посмотреть видео и разные концепты на сайте Secret Level:
https://www.secretlevel.co/portfolio/coca-cola-2/
Мнение с дивана: прошлую (довольно кривую) рекламу посмотрели миллионы. Эта набирает еще быстрее. Вам шашечки или ехать? Это ж реклама, а не фестиваль Санденс - если пипл хавает ((С) Богдан Титомир), то какая разница в чем сделано?
Э-Экономика.
@cgevent
👍79👎24😁13❤11🔥3😱3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Сожги свою подписку. Free Affinity.
Именно с таким слоганом Canva бахнула обновленную Affinity по цене 0 долларов.
"30 октября 2025 года во время мероприятия Create Canva анонсировала обновленную версию Affinity, объединившую функции редактирования фотографий, векторной иллюстрации и верстки страниц в одном бесплатном приложении".
Чтобы скачать бесплатно, вам надо завести учетку на Canva.
Есть импорт из Фотошопа и ГПУ-ускорение для больших файлов.
https://www.affinity.studio/get-affinity
@cgevent
Именно с таким слоганом Canva бахнула обновленную Affinity по цене 0 долларов.
"30 октября 2025 года во время мероприятия Create Canva анонсировала обновленную версию Affinity, объединившую функции редактирования фотографий, векторной иллюстрации и верстки страниц в одном бесплатном приложении".
Чтобы скачать бесплатно, вам надо завести учетку на Canva.
Есть импорт из Фотошопа и ГПУ-ускорение для больших файлов.
https://www.affinity.studio/get-affinity
@cgevent
🔥48❤4👍4😁3👎2😱1
Giri: Мне кажется Эппле уже не просто тормозит, а уже включает заднюю.
Apple по-прежнему планирует выпустить обновленную версию Siri примерно в марте следующего года. Выпуск должен сопровождаться выпуском нового продукта для умного дома с дисплеем, который можно установить на подставке с динамиком или на стене. Новые Apple TV и HomePod mini, которые скоро появятся в продаже, также «помогут продемонстрировать» новые функции Siri и Apple Intelligence в следующем году.
Новая версия Siri, по всей видимости, будет использовать Gemini от Google и включать в себя функцию веб-поиска на базе искусственного интеллекта.
Эппле мечется из стороны в сторону, то анонсируя свою новую Сири, то сотрудничество с OpenAI, теперь вот с Гугл. Так и до Дипсика дойдет.
Ну и зная Эппле - март следующего года - это январь 2027 года, который ближе к декабрю 2027.
Сири на Гугл = Гири.
@cgevent
Apple по-прежнему планирует выпустить обновленную версию Siri примерно в марте следующего года. Выпуск должен сопровождаться выпуском нового продукта для умного дома с дисплеем, который можно установить на подставке с динамиком или на стене. Новые Apple TV и HomePod mini, которые скоро появятся в продаже, также «помогут продемонстрировать» новые функции Siri и Apple Intelligence в следующем году.
Новая версия Siri, по всей видимости, будет использовать Gemini от Google и включать в себя функцию веб-поиска на базе искусственного интеллекта.
Эппле мечется из стороны в сторону, то анонсируя свою новую Сири, то сотрудничество с OpenAI, теперь вот с Гугл. Так и до Дипсика дойдет.
Ну и зная Эппле - март следующего года - это январь 2027 года, который ближе к декабрю 2027.
Сири на Гугл = Гири.
@cgevent
😁44❤9👍4
This media is not supported in your browser
VIEW IN TELEGRAM
О хоспади, аниме покусало NotebookLM.
В новом NotebookLM уже был стиль "аниме" для создания презентаций в соответствующем стиле.
Выяснилось, что этот стиль НАИБОЛЕЕ востребован (куда катится мир), но пользователям не хватает анимешности.
В ответ на это Google выкатил новый kawaii-стиль - настоящее анимеаниме для вот этих вот всех пользователей.
P.S. "Твое имя", конечно, хорошая работа, но аниме-помешательство меня сильно удивляет.
@cgevent
В новом NotebookLM уже был стиль "аниме" для создания презентаций в соответствующем стиле.
Выяснилось, что этот стиль НАИБОЛЕЕ востребован (куда катится мир), но пользователям не хватает анимешности.
В ответ на это Google выкатил новый kawaii-стиль - настоящее анимеаниме для вот этих вот всех пользователей.
P.S. "Твое имя", конечно, хорошая работа, но аниме-помешательство меня сильно удивляет.
@cgevent
😁37❤14🔥5😱1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes
Тут спрашивали за генерацию панорам.
Держите вот такую опенсорсную работу от Клинга.
Они не только генерят панорамы, но и по дороге достают из них разные свойства: карты глубины, normal, albedo, roughness, and metallic.
Но самое интересное в том, что они утверждают, что могут конвертировать панорамы в 3D, причем в обычные меши, которые можно потом грузить в Блендор. Правда, хотя этот пункт на Гитхабе помечен как выполненный, мелким шрифтом написано, что пока это работает криво, типа бета.
Проект: https://yukun-huang.github.io/OmniX/
Код: https://github.com/HKU-MMLab/OmniX
Веса: https://huggingface.co/KevinHuang/OmniX
@cgevent
Тут спрашивали за генерацию панорам.
Держите вот такую опенсорсную работу от Клинга.
Они не только генерят панорамы, но и по дороге достают из них разные свойства: карты глубины, normal, albedo, roughness, and metallic.
Но самое интересное в том, что они утверждают, что могут конвертировать панорамы в 3D, причем в обычные меши, которые можно потом грузить в Блендор. Правда, хотя этот пункт на Гитхабе помечен как выполненный, мелким шрифтом написано, что пока это работает криво, типа бета.
Проект: https://yukun-huang.github.io/OmniX/
Код: https://github.com/HKU-MMLab/OmniX
Веса: https://huggingface.co/KevinHuang/OmniX
@cgevent
👍32❤3🔥1
Forwarded from Хранители Легиона 🔮
Офигейте и попадайте со стульев! Университет Мэриленда и Microsoft протестировали 26 языков на всех топовых LLM — и английские промпты оказались НЕ самыми эффективными! 🤯
Результаты просто дикие:
- Польский — 88% (первое место!)
- Русский — 84% (пятое место)
- Английский — только 83.9% (шестое место!)
Пока все годами мучаются с английскими промптами, думая что так «правильнее», оказывается наш родной русский работает лучше!
Протестировали на OpenAI, Gemini, Llama — везде одинаковый результат. Даже китайский с огромной базой данных показал один из худших результатов.
Практический вывод: Сложные задачи теперь можно спокойно задавать ИИ по-русски — это эффективнее английского. Особенно когда нужна точность выполнения.
Кто бы мог подумать, что польский станет языком №1 для общения с искусственным интеллектом! 🙂
🔮 Хранители Легиона ➕
Результаты просто дикие:
- Польский — 88% (первое место!)
- Русский — 84% (пятое место)
- Английский — только 83.9% (шестое место!)
Пока все годами мучаются с английскими промптами, думая что так «правильнее», оказывается наш родной русский работает лучше!
Протестировали на OpenAI, Gemini, Llama — везде одинаковый результат. Даже китайский с огромной базой данных показал один из худших результатов.
Практический вывод: Сложные задачи теперь можно спокойно задавать ИИ по-русски — это эффективнее английского. Особенно когда нужна точность выполнения.
Кто бы мог подумать, что польский станет языком №1 для общения с искусственным интеллектом! 🙂
🔮 Хранители Легиона ➕
3😱64😁43👍31❤19🔥11👎7
Media is too big
VIEW IN TELEGRAM
Нейпрожарка
Коммерческий ролик от Артема
Виктория Остара - Кошка🔥
Не просто коммерция.
Эмоции, чувства, красота, любовь. 🥰
Наш уже постоянный клиент Виктория, третья работа, второе стихотворение.
Она снова доверилась нам и мы снова ее не подвели.
Когда она прислала стихотворение и сказала - хочу.
Мы ей ответили - круто.
Мы не знаем, что это будет, НО это точно будет в Стамбуле.
Она сказала идею, мы ее доработали, сделали музыку и отправились в путешествие.
Самый сложный коммерческий заказ, самый эмоциональный и самый лучший.
Погрузитесь с нами и Викторией в те чувства, которые она хотела передать.
Инструменты:
Видео: клинг, вео.
Изображения: миджорни, банана.
Апскейл: магнифик, топаз.
Музыка: суно
Голос: живой
Работа 70 часов.
Добро пожаловать в Иллюзию.
Добро пожаловать в Стамбул.
@cgevent
Коммерческий ролик от Артема
Виктория Остара - Кошка🔥
Не просто коммерция.
Эмоции, чувства, красота, любовь. 🥰
Наш уже постоянный клиент Виктория, третья работа, второе стихотворение.
Она снова доверилась нам и мы снова ее не подвели.
Когда она прислала стихотворение и сказала - хочу.
Мы ей ответили - круто.
Мы не знаем, что это будет, НО это точно будет в Стамбуле.
Она сказала идею, мы ее доработали, сделали музыку и отправились в путешествие.
Самый сложный коммерческий заказ, самый эмоциональный и самый лучший.
Погрузитесь с нами и Викторией в те чувства, которые она хотела передать.
Инструменты:
Видео: клинг, вео.
Изображения: миджорни, банана.
Апскейл: магнифик, топаз.
Музыка: суно
Голос: живой
Работа 70 часов.
Добро пожаловать в Иллюзию.
Добро пожаловать в Стамбул.
@cgevent
👎46👍31🔥11❤4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
MotionStream: Real-Time Video Generation with Interactive Motion Controls
Принес интересную работу от Адобченко - дальнейшее развитие идей DragDiffusion (постил аж в 2023 году).
Спойлер: Гитхаб есть, но кода там нет, вместо этого там написано, что мы отдали код на внутреннее ревью, но если они его не пропустят, то вы уж сами по нашей статье как-нибудь.
А примечательно здесь то, что все это шевелится на одной H100 с 29 FPS и 0.4s latency. То есть как бы реалтайм. Все примеры - запись экрана без ускорения.
Но поглядите внимательно на псину, когда ей поднимают правую лапу, левая неистово шеверится - родовые проблемы Diffusion моделей.
А давайте мысленно промотаем туда, где лапы не дергаются, качество огненное, крутится все гладко.
И вот есть у вас мышка для анимации - вы как собираетесь шевелить персонажа или камеру? На глазок?
Олды тут сразу смекнут, что нужен таймлайн, ключи, тангенсы и прочий обвес анимации.
Поэтому, имхо, надо запиливать такую интеграцию сразу в Блендор\Афтер. Хотя это Адобченко, могут и в свой Сабстанс вкрутить. Но вряд ли...
А пока все как обычно - для мемасов и тиктокаф сойдет.
P.S. Мне понравились анимации-симуляции: волна, чашка кофе. Если бы не кипение, то наруливание эффектов имело бы право на жизнь.
Фарш тут: https://joonghyuk.com/motionstream-web/
@cgevent
Принес интересную работу от Адобченко - дальнейшее развитие идей DragDiffusion (постил аж в 2023 году).
Спойлер: Гитхаб есть, но кода там нет, вместо этого там написано, что мы отдали код на внутреннее ревью, но если они его не пропустят, то вы уж сами по нашей статье как-нибудь.
А примечательно здесь то, что все это шевелится на одной H100 с 29 FPS и 0.4s latency. То есть как бы реалтайм. Все примеры - запись экрана без ускорения.
Но поглядите внимательно на псину, когда ей поднимают правую лапу, левая неистово шеверится - родовые проблемы Diffusion моделей.
А давайте мысленно промотаем туда, где лапы не дергаются, качество огненное, крутится все гладко.
И вот есть у вас мышка для анимации - вы как собираетесь шевелить персонажа или камеру? На глазок?
Олды тут сразу смекнут, что нужен таймлайн, ключи, тангенсы и прочий обвес анимации.
Поэтому, имхо, надо запиливать такую интеграцию сразу в Блендор\Афтер. Хотя это Адобченко, могут и в свой Сабстанс вкрутить. Но вряд ли...
А пока все как обычно - для мемасов и тиктокаф сойдет.
P.S. Мне понравились анимации-симуляции: волна, чашка кофе. Если бы не кипение, то наруливание эффектов имело бы право на жизнь.
Фарш тут: https://joonghyuk.com/motionstream-web/
@cgevent
🔥12❤9👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Юнити сделала очень странный ход.
Они бахнули Unity Studio.
Это такой недо-Блендор без моделирования (с анимацией и шейдингом), БЕЗ КОДА и с каким-то уродливым Logic Builder (одни цвета чего стоят).
В общем это сборка сцен из уже сделанных где-то ассетов, анимация и нодовый построитель взаимодействий между объектами. Ну то есть взяли и выкинули из Unity C# и сложные инструменты и сделали "создатель интерактивных 3Д-приложений".
Зачем? Для кого?
У меня от одного интерфейса Юнити уже глаза начинают кровоточить, а они собираются загонять сюда ранимых зумеров и кто там после них идет...
Можно записаться в бету тут:
https://unity.com/campaign/unity-studio
Но если просто хотите увидеть все это великолепие изнутри, то быстро пролистайте туториал:
https://learn.unity.com/tutorial/introduction-to-unity-studio
Маск нам обещает вайб-гейм-дев в следующем году, а тут такое..
@cgevent
Они бахнули Unity Studio.
Это такой недо-Блендор без моделирования (с анимацией и шейдингом), БЕЗ КОДА и с каким-то уродливым Logic Builder (одни цвета чего стоят).
В общем это сборка сцен из уже сделанных где-то ассетов, анимация и нодовый построитель взаимодействий между объектами. Ну то есть взяли и выкинули из Unity C# и сложные инструменты и сделали "создатель интерактивных 3Д-приложений".
Зачем? Для кого?
У меня от одного интерфейса Юнити уже глаза начинают кровоточить, а они собираются загонять сюда ранимых зумеров и кто там после них идет...
Можно записаться в бету тут:
https://unity.com/campaign/unity-studio
Но если просто хотите увидеть все это великолепие изнутри, то быстро пролистайте туториал:
https://learn.unity.com/tutorial/introduction-to-unity-studio
Маск нам обещает вайб-гейм-дев в следующем году, а тут такое..
@cgevent
😁24😱3❤2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
В llama.cpp сделали свой Automatic1111, ну то есть свой WebUI.
В отличие от картинок, тут нет ста тыщ параметров, поэтому все это больше похоже на Qwen Chat или chatGPT.
Точно также надо запустить свой сервак, вбить локальный адрес типа 127.0.0.1 в браузер и получить веб-интерфейс. И доступ к сотне тыщ открытых моделей. И да, можно загружать картинки или документы.
Инструкции тут: https://github.com/ggml-org/llama.cpp#hot-topics
@cgevent
В отличие от картинок, тут нет ста тыщ параметров, поэтому все это больше похоже на Qwen Chat или chatGPT.
Точно также надо запустить свой сервак, вбить локальный адрес типа 127.0.0.1 в браузер и получить веб-интерфейс. И доступ к сотне тыщ открытых моделей. И да, можно загружать картинки или документы.
Инструкции тут: https://github.com/ggml-org/llama.cpp#hot-topics
@cgevent
👍24
Еще один генератор картинок.
Микрософт выкатил в доступ СВОЙ генератор картинок MAI-Image-1
Причем вы можете его бесплатно поюзать и пощупать лимиты тут:
https://www.bing.com/images/ (чтобы увидеть эту модель нужен штатовский впн)
У них на сайте и в твитторе все сладенько, но я чуть поковырялся.
1. Очень странный выбор аспектов: 1:1, 2:3, 3:2. И все.
2. Довольно жесткий лимит на количество символов в промпте. Мало.
3. Следование промпту хорошее, но качество.. в общем потестируйте сами.
4. Цензура жоская.
5. Можно выбрать модели DALLE-3(!) и GPT-4o.
6. Есть кнопки Edit Image и Animate Image(10 генераций в режиме Fast, в Standard - несколько часов на видео).
7. Есть видеогенерация - это Сора 2, 480P, 5 sec. 10 генераций.
Го теститровать.
@cgevent
Микрософт выкатил в доступ СВОЙ генератор картинок MAI-Image-1
Причем вы можете его бесплатно поюзать и пощупать лимиты тут:
https://www.bing.com/images/ (чтобы увидеть эту модель нужен штатовский впн)
У них на сайте и в твитторе все сладенько, но я чуть поковырялся.
1. Очень странный выбор аспектов: 1:1, 2:3, 3:2. И все.
2. Довольно жесткий лимит на количество символов в промпте. Мало.
3. Следование промпту хорошее, но качество.. в общем потестируйте сами.
4. Цензура жоская.
5. Можно выбрать модели DALLE-3(!) и GPT-4o.
6. Есть кнопки Edit Image и Animate Image(10 генераций в режиме Fast, в Standard - несколько часов на видео).
7. Есть видеогенерация - это Сора 2, 480P, 5 sec. 10 генераций.
Го теститровать.
@cgevent
👍16