Сергей Булаев AI 🤖

2:31

0:44

0:56

Kyutai Labs выпустили прикольную аудио модель реального времени (пейпер, репозиторий). Если вам надоело ждать ChatGPT advanced voice - попробуйте её, она доступна всем на сайте или даже локально на процессорах Mac:

$ pip install moshi_mlx
$ python -m moshi_mlx.local_web -q 4

Moshi состоит из трёх компонентов: языковой модели Helium, нейронного аудиокодека Mimi и уникальной многопотоковой архитектуры. Система способна моделировать полнодуплексные разговоры, имитируя естественное общение, включая перекрытие речи и прерывания. Moshi работает в режиме реального времени даже на относительно скромном оборудовании.

Для обучения была создана база данных из 20 000 часов синтетических разговоров. Эти данные включают различные условия записи и акценты для пользовательских голосов, при этом голос самой Moshi остается постоянным. Это обеспечивает устойчивость системы к шумным средам и сохранение её характера.

В настоящее время выпущены две версии - с мужским и женским голосами.

Андрей Карпаты пишет:

Это действительно круто, что я могу запустить такой тип голосового взаимодействия даже на своем Macbook, что репозиторий доступен на GitHub вместе с подробной научной статьей, и я, безусловно, с нетерпением жду возможности без усилий разговаривать с нашими компьютерами напрямую, без использования промежуточных текстовых представлений, которые теряют огромное количество информационного содержания.

По-русски не говорит и не понимает 🎧

UPDATE: Запустил на своём macbook air на m2, тормозит ощутимо

🔨

Сергей Булаев AI 🤖 - об AI и не только

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1162👎1

2.48K views05:07

0:35

o1 подумала 92 секунды и переписала на html + javascript игру Stocky Boy (репозиторий). Задание ей дал Альваро Матеос, он вместе с друзьями разработал её для хакатона питоновых игр вместе с друзьями.

Промт:

[python-code]
Convert this python game to a single html + javascript game. Use all the assets and animations as in the python game. You can skip the menu for simplicity but don't miss any other part of the game. Check the details!

Сергей Булаев AI 🤖 - об AI и не только

137

2.77K views06:15

2:23

0:43

Запилил таки утром транскрайбер с Framer Motion, по просьбе подписчика пытался транскрибировать старинные песни в плохом качестве, результат не постоянен, но мне кажется, попыток с 5-8 можно в итоге получить нормальное содержание.

Современные youtube видео транскрибирует отлично. Ну русском тоже работает.

Кстати, кто может, пожалуйста побустите канал, а то подписчики растут, а реакции отваливаются :((

Сергей Булаев AI 🤖 - об AI и не только

54511

3.39K views08:54