Data Science by ODS.ai 🦜
44.9K subscribers
770 photos
85 videos
7 files
1.85K links
First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev
Download Telegram
Forwarded from Spark in me (Alexander)
Russian Text Normalization for Speech Recognition

Usually no one talks about this, but STT / TTS technologies contain many "small" tasks that have to be solved, to make your STT / TTS pipeline work in real life.

For example:

- Speech recognition / dataset itself;
- Post-processing - beam-search / decoding;
- Domain customizations;
- Normalization (5 => пять);
- De-Normalization (пять => 5);

We want the Imagenet moment to arrive sooner in Speech in general.
So we released the Open STT dataset.
This time we have decided to share our text normalization to support STT research in Russian.

Please like / share / repost:

- Original publication
- Habr.com article
- GitHub repository
- Medium (coming soon!)
- Support dataset on Open Collective

#stt
#deep_learning
#nlp
🎙 Vikhr Borealis ● Speech-to-Text ● Транскрипция русской речи в текст ● Portable by NerualDreming

Ссылка на оригинальный релиз: https://huggingface.co/Vikhrmodels/Borealis
Репакер: #NerualDreming
Дата обновления: 25 сентября 2025
Версия: 1.0
Категории: #stt, #speechtotext, #audiollm
Платформа: #Windows
Место на диске: 20 ГБ
Системные требования: NVIDIA GPU с не менее 6 ГБ VRAM
Совместимость: #Nvidia

🖥 Описание софта
Borealis - это первая audio llm c ASR для русского языка от команды Vikhr. Важным отличием от других моделей является поддержка пунктуации в распознанных аудио. По замерам команды Vikhr, Borealis показывает меньшее количество ошибок и лучше соблюдает пунктуацию по сравнению с Whisper.
В этой портативной сборке я сделал удобную оболочку, в которую можно загрузить как аудио, так и видео и легко превратить речь в текст. Давайте поддержим отечественного производителя!


😬 Основные возможности Vikhr Borealis:
🟣 Распознавание речи в текст для русского языка
🟣 Корректная расстановка знаков препинания
🟣 Более низкое количество ошибок по сравнению с аналогами
🟣 Возможность обработки как аудио, так и видео файлов
🟣 Удобный и простой в использовании интерфейс


💿 Установка и запуск:
⁍ Скачайте Установщик или готовое Окружение.
⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути).
⁍ Если скачали установщик, запустите файл install.bat и дождитесь окончания установки.
⁍ Для запуска программы используйте файл run_demo.bat.
⁍ Интерфейс приложения автоматически откроется в вашем браузере.


➡️ Скачать Vikhr Borealis Portable (Установщик) - сам скачает и установит все необходимые компоненты.

➡️ Скачать Vikhr Borealis Portable (Готовое окружение) - архив со всеми компонентами - скачает модели после запуска.

💬 Обсудить в чате | ⭐️ Поддержать канал

👾 НЕЙРО-СОФТ — Делаем нейросети доступнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2