ТЗ для AI
Ребят, у нас много новых подписчиков — повыкладываем полезные посты, которые вы возможно не видели
Сделали простую и понятную таблицу, по которой можно быстро собрать внятное техническое задание на AI.
Подходит и тем, кто только начинает, и тем, кто внедряет серьёзные корпоративные решения.
Вы конечно можете просто обратиться к нам, чтобы мы сделали ТЗ, но для своих нужд будет очень полезно)
Зачем нужен:
— Понять, как пишется ТЗ и не тратить время на его придумывание и разработку.
— Чтобы зафиксировать задачи, метрики, ограничения.
— Чтобы не забыть про данные, пользователей, интеграции.
— Чтобы быстрее согласовать проект с подрядчиком или внутри команды.
Что внутри:
— Все ключевые разделы: от целей и сценариев до архитектуры, данных и рисков.
— Примеры формулировок — чтобы проще было писать.
— Подходит для всего: от автоматизации одного процесса до больших AI-систем в компании.
Пишите что еще бы добавили)
https://docs.google.com/spreadsheets/d/1fF-lVtNaULAfSQI7tqPUnxjYmLAnOJ2rGoEDX4thNrQ/edit?usp=sharing
Ребят, у нас много новых подписчиков — повыкладываем полезные посты, которые вы возможно не видели
Сделали простую и понятную таблицу, по которой можно быстро собрать внятное техническое задание на AI.
Подходит и тем, кто только начинает, и тем, кто внедряет серьёзные корпоративные решения.
Вы конечно можете просто обратиться к нам, чтобы мы сделали ТЗ, но для своих нужд будет очень полезно)
Зачем нужен:
— Понять, как пишется ТЗ и не тратить время на его придумывание и разработку.
— Чтобы зафиксировать задачи, метрики, ограничения.
— Чтобы не забыть про данные, пользователей, интеграции.
— Чтобы быстрее согласовать проект с подрядчиком или внутри команды.
Что внутри:
— Все ключевые разделы: от целей и сценариев до архитектуры, данных и рисков.
— Примеры формулировок — чтобы проще было писать.
— Подходит для всего: от автоматизации одного процесса до больших AI-систем в компании.
Пишите что еще бы добавили)
https://docs.google.com/spreadsheets/d/1fF-lVtNaULAfSQI7tqPUnxjYmLAnOJ2rGoEDX4thNrQ/edit?usp=sharing
👍17❤8🔥4
А вот наш самый сложный кейс про оптимизацию ферросплавов.
Пришлось самим становиться металлургами, потому что без окунания в сферу чисто математикой ничего не сделать.
Нам угрожали, что если система неправильно нарекомендует, то они отправят сотни тонн бракованной стали к нам в офис в Москву – там вообще все бруталити)
Сидели и разбирались, как вообще живёт плавка: какие элементы куда “уходят”, как меняется химсостав, почему сегодня сработало, а завтра — нет. Смотрели исторические плавки, сопоставляли добавки с результатами анализа, пытались уловить логику, которой сами технологи иногда объясняют это на уровне “чувствую, что надо ещё чуть-чуть добавить”.
В итоге упаковали всё это в сервис, который подсказывает оператору, сколько и чего лучше добавить прямо по ходу процесса — чтобы попасть в нужный химсостав и не переливать дорогие ферросплавы.
Результат — минус 3–5% затрат и стабильное качество. В деньгах — сотни миллионов в год. Кейс.
Пришлось самим становиться металлургами, потому что без окунания в сферу чисто математикой ничего не сделать.
Нам угрожали, что если система неправильно нарекомендует, то они отправят сотни тонн бракованной стали к нам в офис в Москву – там вообще все бруталити)
Сидели и разбирались, как вообще живёт плавка: какие элементы куда “уходят”, как меняется химсостав, почему сегодня сработало, а завтра — нет. Смотрели исторические плавки, сопоставляли добавки с результатами анализа, пытались уловить логику, которой сами технологи иногда объясняют это на уровне “чувствую, что надо ещё чуть-чуть добавить”.
В итоге упаковали всё это в сервис, который подсказывает оператору, сколько и чего лучше добавить прямо по ходу процесса — чтобы попасть в нужный химсостав и не переливать дорогие ферросплавы.
Результат — минус 3–5% затрат и стабильное качество. В деньгах — сотни миллионов в год. Кейс.
🔥60😁13🙈6❤4⚡2
This media is not supported in your browser
VIEW IN TELEGRAM
А тут компютер вижн на Целлюлозно-бумажном производстве!
Ставили камеры напротив грузовиков, чтобы понять сколько бревен загружены. Разобрались, что такое баланс, пачка, штабель, раскатка, коэффициент полнодревесности.
Снег, влага, разные лесовозы, разные размеры и виды бруса, природа и мужики — примерно так можно описать проект.
Вот что получили:
100% точность определения сорта древесины
99%+ точность разделения на пачки
98%+ определение КПД vs. оператор
90%+ определение КПД vs. раскатка
Кейс
А как думаете почему нельзя было просто взвесить?)
Ставили камеры напротив грузовиков, чтобы понять сколько бревен загружены. Разобрались, что такое баланс, пачка, штабель, раскатка, коэффициент полнодревесности.
Снег, влага, разные лесовозы, разные размеры и виды бруса, природа и мужики — примерно так можно описать проект.
Вот что получили:
100% точность определения сорта древесины
99%+ точность разделения на пачки
98%+ определение КПД vs. оператор
90%+ определение КПД vs. раскатка
Кейс
А как думаете почему нельзя было просто взвесить?)
❤22🔥17❤🔥5⚡1👍1
Как понять, что свинюшка готова к любви? Определяем через ML
Наш самый известный, интересный и любимый кейс. Для него мы даже отрисовали иллюстрации, чтобы эта была история любви...
О проекте:
Свинки, как и люди, не всегда беременеют с первого раза. Нам надо было найти лучший момент для их осеменения, чтобы знать, какая из них точно даст потомство.
Для этого мы пускали хряка по коридору и смотрели реакцию свиноматок, а потом по камерам определяли поведение: активна она или нет, как близко подходит к хряку, трется ли задней частью об ограждение, навостряет ли ушки.
Метрики было две. Первая — метрика обнаружения, которая показывала, насколько точно мы определяем свинок в их загоне. Доля правильно найденных свиней должна быть 0,95+. Вторая метрика — точность определения поз свиней, требование к ней должно быть 0,90+.
Вот тут подробнее. А нас до сих пор чаще всего узнают по этому кейсу и всегда с улыбкой))
Наш самый известный, интересный и любимый кейс. Для него мы даже отрисовали иллюстрации, чтобы эта была история любви...
О проекте:
Свинки, как и люди, не всегда беременеют с первого раза. Нам надо было найти лучший момент для их осеменения, чтобы знать, какая из них точно даст потомство.
Для этого мы пускали хряка по коридору и смотрели реакцию свиноматок, а потом по камерам определяли поведение: активна она или нет, как близко подходит к хряку, трется ли задней частью об ограждение, навостряет ли ушки.
Метрики было две. Первая — метрика обнаружения, которая показывала, насколько точно мы определяем свинок в их загоне. Доля правильно найденных свиней должна быть 0,95+. Вторая метрика — точность определения поз свиней, требование к ней должно быть 0,90+.
Вот тут подробнее. А нас до сих пор чаще всего узнают по этому кейсу и всегда с улыбкой))
1❤🔥35😁20🔥10❤6👍2🌚2
AI-ассистент для разработчиков Альфы — вебинар!
Всем привет, давайте 2 апреля разберем, как делали ассистента (справа внизу) https://developers.alfabank.ru/ и с технической и с бизнесовой стороны.
Что покажем:
• Как устроен RAG-пайплайн (BM25 + эмбеддинги + YaGPT)
• Guardrails: как не дать боту «галлюцинировать»
• Live-демо: токены, вебхуки, ошибки, кейсы из реальной документации
• Архитектуру (FastAPI, Docker, RAG)
• Гибридный поиск и перефразирование запросов
• Разделение индексов (FAQ vs документация)
• LLM-as-a-Judge и оценку качества
• Ограничения MVP и roadmap (rerank, adaptive RAG, self-hosted LLM)
2 апреля, четверг, в 16-00 у нас на канале @r77_ai
Добавляйте в календарь https://calendar.app.google/VkLVvwqUTBuyDvEbA
Всем привет, давайте 2 апреля разберем, как делали ассистента (справа внизу) https://developers.alfabank.ru/ и с технической и с бизнесовой стороны.
Что покажем:
• Как устроен RAG-пайплайн (BM25 + эмбеддинги + YaGPT)
• Guardrails: как не дать боту «галлюцинировать»
• Live-демо: токены, вебхуки, ошибки, кейсы из реальной документации
• Архитектуру (FastAPI, Docker, RAG)
• Гибридный поиск и перефразирование запросов
• Разделение индексов (FAQ vs документация)
• LLM-as-a-Judge и оценку качества
• Ограничения MVP и roadmap (rerank, adaptive RAG, self-hosted LLM)
2 апреля, четверг, в 16-00 у нас на канале @r77_ai
Добавляйте в календарь https://calendar.app.google/VkLVvwqUTBuyDvEbA
3👍13🔥11❤5
Бывает вот просыпаешься, а ты в Forbes...
А тут как раз новость, как мы стали первыми, кто получил грант от Яндекса на свой продукт:
https://www.forbes.ru/tekhnologii/557743-yandex-b2b-tech-vydelit-biznesu-500-mln-rublej-na-razrabotku-i-vnedrenie-ii-agentov
А тут как раз новость, как мы стали первыми, кто получил грант от Яндекса на свой продукт:
https://www.forbes.ru/tekhnologii/557743-yandex-b2b-tech-vydelit-biznesu-500-mln-rublej-na-razrabotku-i-vnedrenie-ii-agentov
Forbes.ru
Yandex B2B Tech выделит бизнесу 500 млн рублей на разработку и внедрение ИИ-агентов
Yandex B2B Tech запустил Yandex AI Studio Boost — программу поддержки ИТ-компаний для внедрения ИИ в свои продукты. Как сообщили Forbes в пресс-службе «Яндекса», участники могут получить грант до 1 млн рублей на разработку ИИ-агентов и других решений
1🔥50🏆10😎6❤1
RPA vs ИИ-агенты: как выбрать архитектуру автоматизации под задачу.
Обещали по нашему вебинару с Альфой (https://xn--r1a.website/r77_ai/320) про RPA и агентов шпаргалку:
Где лучше использовать роботов, а где — ИИ. Разобрали ключевые отличия, примеры и критерии, чтобы быстрее принять решение по автоматизации:
https://docs.google.com/presentation/d/1vDtvUffRsqEaQlI6yCrX7DdlcWgE7wjfdME4g6r3_BQ/edit?usp=sharing
Подпишитесь еще на авторов, там полезный корпоративный контент про ИИ:
http://xn--r1a.website/nokiddingpartners
https://xn--r1a.website/baldvanya
Обещали по нашему вебинару с Альфой (https://xn--r1a.website/r77_ai/320) про RPA и агентов шпаргалку:
Где лучше использовать роботов, а где — ИИ. Разобрали ключевые отличия, примеры и критерии, чтобы быстрее принять решение по автоматизации:
https://docs.google.com/presentation/d/1vDtvUffRsqEaQlI6yCrX7DdlcWgE7wjfdME4g6r3_BQ/edit?usp=sharing
Подпишитесь еще на авторов, там полезный корпоративный контент про ИИ:
http://xn--r1a.website/nokiddingpartners
https://xn--r1a.website/baldvanya
1❤12🔥4❤🔥3👍1
AI-ассистент для разработчиков Альфы — Закончили — ждите запись)
Пока заходите без смс и регистрации https://live.vkvideo.ru/r77_ai
Что покажем:
• Как устроен RAG-пайплайн (BM25 + эмбеддинги + YaGPT)
• Guardrails: как не дать боту «галлюцинировать»
• Live-демо: токены, вебхуки, ошибки, кейсы из реальной документации
• Архитектуру (FastAPI, Docker, RAG)
• Гибридный поиск и перефразирование запросов
• Разделение индексов (FAQ vs документация)
• LLM-as-a-Judge и оценку качества
• Ограничения MVP и roadmap (rerank, adaptive RAG, self-hosted LLM)
Пока заходите без смс и регистрации https://live.vkvideo.ru/r77_ai
Что покажем:
• Как устроен RAG-пайплайн (BM25 + эмбеддинги + YaGPT)
• Guardrails: как не дать боту «галлюцинировать»
• Live-демо: токены, вебхуки, ошибки, кейсы из реальной документации
• Архитектуру (FastAPI, Docker, RAG)
• Гибридный поиск и перефразирование запросов
• Разделение индексов (FAQ vs документация)
• LLM-as-a-Judge и оценку качества
• Ограничения MVP и roadmap (rerank, adaptive RAG, self-hosted LLM)
3🫡12🔥3
Выпускник МФТИ собеседует студента "Центрального Университета" на ML-инженера, такого вы не видели...😵
Сходили в "Центральный университет" для публичного собеседования студента. Спасибо "ЦУ" и Кариму за смелость и экспертность — очень радостно видеть таких умных молодых ребят. Вот его резюмешка кстати.
https://youtu.be/cK72w0P2W-E
https://vkvideo.ru/video-228941334_456239066
Сходили в "Центральный университет" для публичного собеседования студента. Спасибо "ЦУ" и Кариму за смелость и экспертность — очень радостно видеть таких умных молодых ребят. Вот его резюмешка кстати.
https://youtu.be/cK72w0P2W-E
https://vkvideo.ru/video-228941334_456239066
❤23😁12🤡8👍6🤮4💩4
Конкурс по проектам ИИ на 5 млн)
Ребят, наши друзья и партнеры портал Qubu (в честь запуска) и премия "Гравитация" запускают конкурс по моделям и ИИ-проектам. Вы можете загрузить свой проект на сайт и выиграть до 1,5 млн рублей за первое место, например.
Также ищем большие компании, которые готовы дать задачки по ИИ на хакатон, чтобы ИИ-интеграторы решили ваши задачи.
Участие и для разработчиков и для заказчиков бесплатно.
Вот тут подробнее:
https://qubu.ai/landing
Залейтайте очень крутую тему ребята делают, можно и приз выиграть и прорекламиться хорошо)
Ребят, наши друзья и партнеры портал Qubu (в честь запуска) и премия "Гравитация" запускают конкурс по моделям и ИИ-проектам. Вы можете загрузить свой проект на сайт и выиграть до 1,5 млн рублей за первое место, например.
Также ищем большие компании, которые готовы дать задачки по ИИ на хакатон, чтобы ИИ-интеграторы решили ваши задачи.
Участие и для разработчиков и для заказчиков бесплатно.
Вот тут подробнее:
https://qubu.ai/landing
Залейтайте очень крутую тему ребята делают, можно и приз выиграть и прорекламиться хорошо)
🔥9❤5👍4😁1
че с людьми ахаххах
собрали 10к на ролике-собесе в ЦУ LLM-инженера (гляньте людям очень заходит) и вот такие комменты еще
весна?
собрали 10к на ролике-собесе в ЦУ LLM-инженера (гляньте людям очень заходит) и вот такие комменты еще
весна?
😁63🔥7🥰7🐳2💋1
AI-ассистент для разработчиков — кейс для "АльфаБанк".
Разбираем:
— pipeline RAG (LLM + vector DB + retrieval)
— где теряются релевантные документы
— почему top-k не спасает
— как embeddings влияют на поиск
— что даёт перефраз запроса
— кейсы, где chunking делает только хуже
Плюс:
— реальный фейл: система не отвечает на очевидный вопрос
— пошаговый разбор, где именно всё ломается
Для тех, кто уже делал RAG и понял, что "что-то не работает", ну или будет делать)
https://youtu.be/LnNkMMb9jT8
https://vkvideo.ru/video-228941334_456239067
Разбираем:
— pipeline RAG (LLM + vector DB + retrieval)
— где теряются релевантные документы
— почему top-k не спасает
— как embeddings влияют на поиск
— что даёт перефраз запроса
— кейсы, где chunking делает только хуже
Плюс:
— реальный фейл: система не отвечает на очевидный вопрос
— пошаговый разбор, где именно всё ломается
Для тех, кто уже делал RAG и понял, что "что-то не работает", ну или будет делать)
https://youtu.be/LnNkMMb9jT8
https://vkvideo.ru/video-228941334_456239067
🔥21❤10👍5😁5👎2
Чем отличается хороший ML lead от плохого? — вебинар!
Так мы разгребли сдачу проектов и возвращаемся. У нас выросло количество проектов и вот мы все чаще ищем ml-лидов и задумались — чем хороший лид отличается от плохого?
спойлер — не знания в ML.
Хороший лид:
Вкладывается в команду
Делает и ревьюит MLSD
Понимает за бизнес и видит продукт целиком
Нацелен на бизнес результат
Плохой мл лид:
Думает только о моделях и технических метриках
Не смотрит в код
Не понимает в бизнес / домен / эффекты
Ярослав сам был на роли ML лида более 5 лет и вырастил уже не менее 10 лидов, часть из которых уже CDS.
В пятницу в 16-00 на вебинаре расскажем у нас в канале https://xn--r1a.website/r77_ai
кидайте в календарь, чтобы не забыть https://calendar.app.google/ZuSZK1mrR3dWJLjz5
Так мы разгребли сдачу проектов и возвращаемся. У нас выросло количество проектов и вот мы все чаще ищем ml-лидов и задумались — чем хороший лид отличается от плохого?
спойлер — не знания в ML.
Хороший лид:
Вкладывается в команду
Делает и ревьюит MLSD
Понимает за бизнес и видит продукт целиком
Нацелен на бизнес результат
Плохой мл лид:
Думает только о моделях и технических метриках
Не смотрит в код
Не понимает в бизнес / домен / эффекты
Ярослав сам был на роли ML лида более 5 лет и вырастил уже не менее 10 лидов, часть из которых уже CDS.
В пятницу в 16-00 на вебинаре расскажем у нас в канале https://xn--r1a.website/r77_ai
кидайте в календарь, чтобы не забыть https://calendar.app.google/ZuSZK1mrR3dWJLjz5
1🔥16❤9🤡7👍3🤩1💋1
Закончили — Чем отличается хороший ML lead от плохого?
без смс и регистрации:
https://live.vkvideo.ru/r77_ai
без смс и регистрации:
https://live.vkvideo.ru/r77_ai
❤1
Чем отличается хороший ML lead от плохого? — выложили!
Вот что обсудили (ссылочные тайм-коды внутри видео):
00:00 — Почему вообще решили говорить про ML Lead
01:58 — Почему ML-проекты фейлятся
03:48 — «Neural net training fails silently» — главная проблема ML
06:28 — Почему ML Lead — это “супергерой” проекта
08:28 — Чем ML Lead отличается от Senior DS
10:08 — 3 ключевых блока ответственности ML Lead
11:48 — Delivery: за что отвечает ML Lead в проекте
15:58 — Почему ML Lead обязан ходить на встречи с заказчиком
18:18 — Что такое ML System Design на практике
21:28 — Хороший ML Lead сначала задает вопросы, а не пишет код
22:48 — Что такое Data Science Review и зачем он нужен
24:28 — Типичные silent-fail ошибки в ML
28:48 — Кейс с металлургическим заводом и data leakage
36:28 — Интерактив: кейс про сортировку алмазов
40:58 — Почему важно общаться с доменными экспертами
46:58 — Работа с командой: найм, увольнение, развитие
49:58 — Почему ML Lead должен защищать команду от хаоса
52:28 — Почему PM не заменяет ML Lead
56:58 — Нужны ли вообще PM и аналитики в ML-командах
01:02:28 — Почему ML Lead не может вести 10 проектов одновременно
01:06:28 — Как понять, что тебе пора становиться ML Lead
01:09:58 — Технический эксперт vs ML Lead — два карьерных трека
01:14:28 — Почему не всем стоит идти в лиды
01:18:28 — Разбор вопросов из чата
01:27:28 — High-level system design vs ML Lead
01:30:58 — Финальные мысли и завершение
https://youtu.be/GKy2kuyU0LI
https://vkvideo.ru/video-228941334_456239068
Вот что обсудили (ссылочные тайм-коды внутри видео):
00:00 — Почему вообще решили говорить про ML Lead
01:58 — Почему ML-проекты фейлятся
03:48 — «Neural net training fails silently» — главная проблема ML
06:28 — Почему ML Lead — это “супергерой” проекта
08:28 — Чем ML Lead отличается от Senior DS
10:08 — 3 ключевых блока ответственности ML Lead
11:48 — Delivery: за что отвечает ML Lead в проекте
15:58 — Почему ML Lead обязан ходить на встречи с заказчиком
18:18 — Что такое ML System Design на практике
21:28 — Хороший ML Lead сначала задает вопросы, а не пишет код
22:48 — Что такое Data Science Review и зачем он нужен
24:28 — Типичные silent-fail ошибки в ML
28:48 — Кейс с металлургическим заводом и data leakage
36:28 — Интерактив: кейс про сортировку алмазов
40:58 — Почему важно общаться с доменными экспертами
46:58 — Работа с командой: найм, увольнение, развитие
49:58 — Почему ML Lead должен защищать команду от хаоса
52:28 — Почему PM не заменяет ML Lead
56:58 — Нужны ли вообще PM и аналитики в ML-командах
01:02:28 — Почему ML Lead не может вести 10 проектов одновременно
01:06:28 — Как понять, что тебе пора становиться ML Lead
01:09:58 — Технический эксперт vs ML Lead — два карьерных трека
01:14:28 — Почему не всем стоит идти в лиды
01:18:28 — Разбор вопросов из чата
01:27:28 — High-level system design vs ML Lead
01:30:58 — Финальные мысли и завершение
https://youtu.be/GKy2kuyU0LI
https://vkvideo.ru/video-228941334_456239068
❤20🔥3
Чем_отличается_хороший_ML_lead_от_плохого_.pdf
7.7 MB
Задачи ML лида и презентация с вебинара
А вот еще полезные файлы с вебинара
А вот еще полезные файлы с вебинара
❤11🔥6👍5
AI агент для поиска и подбора отелей для Online Express!
Ребят, выступаем на Conversations вместе с Online Express и расскажем про наш супер кейс изнутри с техничкой и бизнес историями
Краткие тезисы доклада:
- Как выглядела исходная формулировка боли: “хотим AI-ассистента”, но никто не понимает его продуктовую форму.
- Почему первый рабочий прототип можно собрать быстро, но это почти ничего не говорит о готовности к rollout.
- Какие реальные проблемы начинаются после демо: качество, доверие, покрытие сценариев, интеграции с внутренними данными, контроль ошибок, UX.
- Почему агентная архитектура понадобилась не “ради моды”, а потому что нужен был набор инструментов, доступ к БД и управляемая оркестрация шагов.
- Как шла раскатка: от собственника и контрольной группы к полному rollout на всех турагентов.
- Какие сигналы показали, что продукт уже можно считать не демо, а рабочим инструментом.
промокод от нас на 10%: CVS26sAsR
Приходите смотреть https://conversations-ai.com/
Ребят, выступаем на Conversations вместе с Online Express и расскажем про наш супер кейс изнутри с техничкой и бизнес историями
Краткие тезисы доклада:
- Как выглядела исходная формулировка боли: “хотим AI-ассистента”, но никто не понимает его продуктовую форму.
- Почему первый рабочий прототип можно собрать быстро, но это почти ничего не говорит о готовности к rollout.
- Какие реальные проблемы начинаются после демо: качество, доверие, покрытие сценариев, интеграции с внутренними данными, контроль ошибок, UX.
- Почему агентная архитектура понадобилась не “ради моды”, а потому что нужен был набор инструментов, доступ к БД и управляемая оркестрация шагов.
- Как шла раскатка: от собственника и контрольной группы к полному rollout на всех турагентов.
- Какие сигналы показали, что продукт уже можно считать не демо, а рабочим инструментом.
промокод от нас на 10%: CVS26sAsR
Приходите смотреть https://conversations-ai.com/
❤9🔥7❤🔥6
Active listening, стек для real-time видеодиалога с аватаром и открытая модель.
Наши друзья из avaturn.live сделали крутой проект с актив листенингом, зацените:
Представьте видеозвонок, где вместо живого человека на экране — цифровой аватар: он выглядит и звучит почти как реальный собеседник. Такие решения уже используют в ассистентах, обучении и клиентской поддержке.
Но есть нюанс: такие аватары уже научились синхронизировать губы с речью, а вот слушать — пока нет.
Когда говорит человек, аватар часто выглядит как персонаж на паузе: смотрит статично, почти не реагирует и просто ждет своей реплики. Диалог из-за этого быстро становится искусственным.
Ребята из Avaturn.live как раз взялись за эту проблему и выложили AVTR-1 — открытую модель и стек для real-time видеодиалога с аватаром.
Это не просто генератор видео: AVTR-1 позволяет запустить живую сессию, где аватар отвечает пользователю в реальном времени, слушает и реагирует на собеседника.
Для создания аватара достаточно одной фотографии человека. Для самой сессии нужны два аудиопотока: речь аватара и речь человека напротив.
Главная фишка — active listening: модель учитывает речь собеседника, и за счет этого диалог выглядит естественнее.
По железу:
• RTX 3070 / 4060 Ti — реалтайм
• A100 / L40 — 2x быстрее реалтайма
Что в релизе:
• веса модели
• инференс-стек, оптимизированный под TensorRT
• демо и код для запуска живой диалоговой сессии
Если поднимать у себя ничего не хочется — просто зайдите на avaturn.live и потестируйте аватара прямо в браузере, без регистрации и возни с TensorRT.
Поддержите релиз звездой на GitHub — и, конечно, пробуйте собирать свои продукты с аватарами.
🔗 GitHub: https://github.com/avaturn-live/avtr-1
🌐 Демо в браузере: https://avaturn.live/demo
🤗 Hugging Face: https://huggingface.co/avaturn-live/avtr-1
Наши друзья из avaturn.live сделали крутой проект с актив листенингом, зацените:
Представьте видеозвонок, где вместо живого человека на экране — цифровой аватар: он выглядит и звучит почти как реальный собеседник. Такие решения уже используют в ассистентах, обучении и клиентской поддержке.
Но есть нюанс: такие аватары уже научились синхронизировать губы с речью, а вот слушать — пока нет.
Когда говорит человек, аватар часто выглядит как персонаж на паузе: смотрит статично, почти не реагирует и просто ждет своей реплики. Диалог из-за этого быстро становится искусственным.
Ребята из Avaturn.live как раз взялись за эту проблему и выложили AVTR-1 — открытую модель и стек для real-time видеодиалога с аватаром.
Это не просто генератор видео: AVTR-1 позволяет запустить живую сессию, где аватар отвечает пользователю в реальном времени, слушает и реагирует на собеседника.
Для создания аватара достаточно одной фотографии человека. Для самой сессии нужны два аудиопотока: речь аватара и речь человека напротив.
Главная фишка — active listening: модель учитывает речь собеседника, и за счет этого диалог выглядит естественнее.
По железу:
• RTX 3070 / 4060 Ti — реалтайм
• A100 / L40 — 2x быстрее реалтайма
Что в релизе:
• веса модели
• инференс-стек, оптимизированный под TensorRT
• демо и код для запуска живой диалоговой сессии
Если поднимать у себя ничего не хочется — просто зайдите на avaturn.live и потестируйте аватара прямо в браузере, без регистрации и возни с TensorRT.
Поддержите релиз звездой на GitHub — и, конечно, пробуйте собирать свои продукты с аватарами.
🔗 GitHub: https://github.com/avaturn-live/avtr-1
🌐 Демо в браузере: https://avaturn.live/demo
🤗 Hugging Face: https://huggingface.co/avaturn-live/avtr-1
🔥12❤6👍5❤🔥1💋1