Нейроэстетика
3.02K subscribers
2.81K photos
120 videos
14 files
488 links
Мы живем в эпоху нейронных сетей. А у каждой эпохи должна быть своя эстетика. Проект spin-off канала @mishin_learning, посвящённый Искусству Искусственного Интеллекта.
Download Telegram
Audio
Третья версия народного музогена доступна для всех https://app.suno.ai/
🖕6🔥43😁3👌2
🫦 GPT-4o — Вот вам "HER" от OpenAI

tl:dr End-to-End Image + Text + Speech версия GPT-4

До появления GPT-4o использование режима Voice Mode с ChatGPT позволяло получать ответы со средним временем задержки в 2.8 секунды для GPT-3.5 и 5.4 секунды для GPT-4. В этом режиме были задействованы три отдельные модели:

1. Speech-to-Text переводила аудио в текст

2. Затем GPT-3.5 или GPT-4 обрабатывала текст и генерирует ответ.

3. И, наконец, третья модель переводила текст обратно в аудио.

Это означает, что модель GPT-4 не имеет доступа ко всей информации — она не воспринимает интонации, не различает голоса разных собеседников и не учитывает фоновые шумы, она не может воспроизводить смех, пение или передавать эмоции.

GPT-4o представляет собой новую модель, обученную end-to-end на трех доменах, включая текст, изображения и аудио.

👁 Блог OpenAI
🎞 YouTube OpenAI

Го тестить:
Модель ChatGPT "HER"
6🌚3🖕3👍2🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
🪩 Диффузионки позволяют ремастерить игры при помощи текстовых промптов.

Nvidia показала пайплайн ремастеринга текстур в популярном графично-нодовом интерфейсе ComfyAI.

Теперь можно не только апскейлить текстуры с определением свойств материалов для трассировки лучей, но и контролировать стиль при помощи промптов. RTX Remix — инструмент для ремастеринга классических игр с использованием технологий трассировки лучей и DLSS 3.5. И интеграция RTX Remix Toolkit с ComfyUI выглядит обещающей, позволяя модерам задавать стиль текстур с помощью текстовых промптов. Это ускоряет процесс моддинга и упрощает создание качественных текстур.

Теперь маленькие команды модеров могут быстро создавать текстуры высокого разрешения с физически корректными свойствами, освобождая время для доработки ключевых элементов.

А пока ждем обещанный Half-Life 2 RTX. Ну и я лично мечтал бы увидеть Half-Life Alyx с RTX в VR.
11👍3🖕3🤯1🌚1
Чем чаще всего генерим?
Anonymous Poll
28%
FLUX
25%
SDXL, SD3
26%
Midjourney
21%
other (Dall-E 3, etc)
🖕9👍5👾3👎1💔1
Media is too big
VIEW IN TELEGRAM
Oasis: Вселенная в трансформере

🔥 Oasis — это первая в своем роде игровая модель, полностью генерируемая нейронкой в реальном времени. Она позволяет пользователям взаимодействовать с виртуальным миром, где все элементы, включая физику, правила игры и графику, создаются и управляются нейронкой.

📕 Основные особенности Oasis:
— Пользователи могут перемещаться, прыгать, подбирать предметы, разрушать блоки и выполнять другие действия, взаимодействуя с миром, созданным ИИ.
— Вся игра генерируется на основе фундаментальной модели, без использования стандартных игровых движков.
— Oasis понимает и воспроизводит такие элементы, как строительство, физика освещения, управление инвентарем и взаимодействие с объектами.

📕 Технические аспекты:
— Oasis состоит из двух частей: пространственного автоэнкодера и диффузионной модели на основе трансформеров. Автоэнкодер основан на ViT, а основная модель — на DiT.
— Модель обучалась на открытых видеоданных Minecraft, собранных OpenAI, с использованием метода Diffusion Forcing, что позволяет генерировать последовательные кадры с учетом пользовательского ввода.
— Команда Decart создала оптимизационную инфраструктуру для модели Oasis, так как стандартные методы для LLM были неэффективны для архитектуры DiT: В современных моделях текст-видео, таких как Sora, Mochi-1 и Runway, на генерацию одной секунды видео может уходить до 10–20 секунд, даже при использовании нескольких GPU. Оптимизация Decart позволило улучшить использование GPU и минимизировать задержки, масштабируя модель для многократного использования GPU и сокращая время передачи данных.

☺️ Код и веса модели Oasis доступны для локального запуска, а также есть демо:
INFOMOREINFOGITHUBWEIGHTS(HF)DEMO

🐈‍⬛ А вот пользовательский опыт от меня:
— Это наверное самая триповая игра в которую я играл, вещи трансформируются во время перетаскивания, как только ты выбираешь камень, который рандомно сгенерировался в инвентаре и уже мечтаешь построить каменный дом, он тут же превращается в дерево.
— Милый цветочек при выборе ставит деревянное ограждение.
— Можно легко телепортнуться просто посмотрев вниз и вновь вперед.
— Вода, сундук сразу же вызывают критическую ошибку и тебя выбивает из сервера.
🐑 Идеальный симмулятор насколько хаотична жизнь.

Основной вывод от меня:
Оптимизация видео моделей невероятно развивается и скоро мы получим много опенсоурс моделек, которые смогут генерить 20+ кадров в реалтайме, еще и триповых игр. Еще больше мемов и абстрактных видео + игр. Но если мне нужно будет сделать что-то точное, что требует сохранение структуры A и положения B, я пойду делать это стандартным способ. (Blender, After Effects, Unreal Engine и так далее + предыдущее поколение уже хорошо контролируемых нейронок)
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰7👌3👨‍💻2👾2💊1
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Если и делать нейрорекламу Кока Колы, то только такую.

Согласитесь, смотрится куда круче нейрорекламы от самой Coca Cola.
😁266🤯2👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🤯 Я сейчас не шучу, Дональд Трамп сгенерировал видео и выложил на своей платформе Truth Social. Какая же это дичь..
😁16💊9🤯5🔥3🤝1
Поиграл с новой ChatGPT Images 1.5

Вот такие вариации на классику получилось сделать. Действительно отличное понимание текста.
🥰41