Machine learning Interview

🌍🗣️ Omnilingual ASR: Многоязычное распознавание речи для 1600+ языков

Omnilingual ASR — это открытая система распознавания речи, поддерживающая более 1,600 языков, включая редкие. Она позволяет добавлять новые языки с минимальными примерами, делая технологии распознавания более доступными и инклюзивными для различных сообществ.

🚀Основные моменты:
- Поддержка более 1,600 языков, включая уникальные.
- Простота добавления новых языков без больших наборов данных.
- Использует нулевое обучение и гибкие модели для адаптации.
- Доступен на Hugging Face для демонстрации и использования.

📌 GitHub: https://github.com/facebookresearch/omnilingual-asr

#python

GitHub

GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages

Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr

😁5👍3🔥2🥰1

2.77K views19:15

Machine learning Interview

🍌Nano Banan хороша!

Промпт: "Make an infographic that explains how the transformer LLM works"

https://aistudio.google.com/

👍20🔥12🍌3❤2

2.85K views09:46

Machine learning Interview

ГигаЧат представил обновлённое семейство GigaAM-v3

Giga Acoustic Model — это класс open-source моделей для обработки речи и эмоций. В третьей версии опубликовали базовый аудиоэнкодер GigaAM-v3, улучшенные CTC и RNNT-модели, а также E2E-распознавание с поддержкой пунктуации и нормализации.

Масштаб предобучения значительно вырос: с 50 до 700 тысяч часов аудио на русском языке. Появились новые домены в обучении ASR — от колл-центров до разговорной речи.

Для всего корпуса обучающих данных восстановили пунктуацию и нормализацию через GigaChat Max Audio. Линейка CTC/RNNT и E2E позволяет выбирать между скоростью или максимальным качеством под любые сценарии.

Что по метрикам:

— Открытые датасеты (Golos, OpenSTT, Common Voice, LibriSpeech): паритет с GigaAM-v2.
— Новые домены (WER, v2-RNNT → v3-RNNT):
• речь с особенностями 27% → 19%
• колл-центр 13% → 10%
• спонтанная речь 10.3% → 7%
— Пунктуация: v3-e2e-RNNT vs reference + Whisper Forced Decoding — F1-score по запятой 84% vs 62%, остальные знаки ~паритет
— Side-by-Side (Gemini 2.5 Pro as a judge): v3-e2e-RNNT vs Whisper-large-v3 — 70:30 (колл-центр), 64:36 (Common Voice)

Больше про язык, речь и искусственный интеллект в @gigadev_channel. Подписывайтесь на канал, чтобы не пропустить всё самое интересное!

👍12🔥5

2.62K views10:35

Machine learning Interview

🌉🤖 CodexMCP: Интеграция Claude Code и Codex

CodexMCP — это мост между Claude Code и Codex, который позволяет им эффективно сотрудничать в программировании. Проект предлагает улучшенные функции, такие как многократные диалоги и параллельные задачи, что делает взаимодействие AI более интеллектуальным и продуктивным.

🚀Основные моменты:
- Поддержка многократных диалогов и параллельного выполнения задач.
- Усовершенствованное управление контекстом с сохранением сессий.
- Интеграция с Claude Code для анализа требований и архитектуры.
- Возможность отслеживания деталей вывода и обработки ошибок.

📌 GitHub: https://github.com/GuDaStudio/codexmcp

#python

👍9🥰5🔥1

2.57K views15:46

Machine learning Interview

✔️

Интересные инсайты из нового отчёта McKinsey об ИИ

- Около 88 % компаний сообщают о регулярном использовании ИИ хотя бы в одной бизнес-функции, но большинство всё ещё остаются на уровне пилотов и экспериментов - без масштабирования на всю организацию и заметного влияния на финальные показатели.

- Компании, которые уже получают значимую выгоду (≈ 6 %), используют ИИ не как инструмент повышения эффективности, а как двигатель роста и инноваций - перестраивают процессы и серьёзно инвестируют в ИИ-компетенции.

"Ожидания респондентов о влиянии ИИ на численность персонала в следующем году расходятся: 32 % ожидают сокращения, 43 % — отсутствие изменений, 13 % - рост."

Мы всё ещё на очень раннем этапе.

https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai#/

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤1🔥1

2.33K views10:00

Machine learning Interview

Forwarded from Machinelearning

🌟

LLM Council: на ваши запросы отвечает совет из языковых моделей.

Андрей Карпаты опять выходит на связь опубликовал очередной vibecode проект.

Его идея в том, что вместо того, чтобы задавать вопрос одной LLM, вы можете объединить их в «Совет моделей».

LLM Council - это простое локальное веб-приложение, с интерфейсом как у ChatGPT, но с той разницей, что запрос отправляется через Openrouter нескольким LLM. Полученные ответы перекрестно оцениваются и ранжируются, и, наконец, «модель-председатель совета» формирует окончательный ответ.

Более подробно процесс выглядит так:

🟢

Этап 1: Сбор мнений.
Запрос отправляется всем моделям по отдельности, и их ответы собираются. Ответы каждой модели отображаются в отдельной вкладке, чтобы можно было их посмотреть вручную.

🟢

Этап 2: Рецензирование.
Каждая модель получает ответы других моделей. При этом идентификаторы анонимизированы, чтобы исключить «игру в любимчиков» при оценке чужих результатов. На этом этапе ответы ранжируются их по точности и глубине анализа.

🟢Этап 3: Итоговый ответ.
Модель-председатель принимает все ответы моделей и компилирует их в единый окончательный ответ.

⚠️ Для использования нужен API-ключ OpenRouter. На платформе есть бесплатные модели

🖥

Github

@ai_machinelearning_big_data

#AI #ML #LLMCouncil #Github

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14👍3❤2🙈2🫡1

1.61K views06:01

Machine learning Interview

Джеффри Хинтон сообщил Берни Сандерсу, что ИИ может привести к массовой безработице и социальной нестабильности.

Он предупреждает: стремительное развитие ИИ способно не просто изменить работу, а заменить огромные её сегменты. Это может усилить неравенство, когда выгоду получат немногие, а многие потеряют стабильную и значимую занятость.

Если общество не подготовится заранее, такая динамика может дестабилизировать страну и вызвать серьёзные социальные потрясения.

https://www.businessinsider.com/godfather-ai-geoffrey-hinton-warns-not-ready-for-whats-coming-2025-11

👍13💊13💯4🤔2🤣2❤1🥰1

2.13K views10:04

Machine learning Interview

Искусственный интеллект больше не ограничивается лабораториями. LLM уже встроены в бизнес, продукты и инфраструктуру. Но тех, кто умеет их разворачивать, обучать и внедрять — единицы.

🦾 Курс «LLM Driven Development» от OTUS даст вам системное понимание того, как создавать и эксплуатировать AI-продукты. Вы изучите архитектуру трансформеров, тонкости работы с памятью, оптимизацию и fine-tuning моделей. Освоите LangChain, LlamaIndex, vLLM и научитесь строить мультиагентные AI-системы, объединяя модели в цепочки решений.

Научитесь внедрять LLM в реальные сервисы: от прототипа до продакшна. Поймёте, как интегрировать AI в бэкенд, собирать данные, автоматизировать MLOps и управлять жизненным циклом модели.

➡️ Старт курса уже скоро. Оставьте заявку и станьте одним из первых специалистов, кто понимает LLM не на уровне «подключить API», а на уровне архитектуры и инженерии: https://tglink.io/2820b14152aa?erid=2W5zFJoUwjn

#реклама
О рекламодателе

🤣3

1.51K views07:51

Machine learning Interview

⚡️ Вышел Claude Opus 4.5.

• Лучший результат в классе кодинга - SWE Verified впервые превышает 80%.
• Лучший результат на Arc-AGI-2 - 37.6%.
• И модель стала заметно дешевле предшественника.

Opus 4.5 примерно на 66% дешевле, чем Opus 4.1 - цена упала с примерно 15 долларов США → до 5 долларов США за миллион входящих токенов и с 75 долларов США → до 25 долларов США за миллион исходящих токенов.

Наиболее вероятные причины:
- значительное повышение эффективности модели
- улучшенная инфраструктура вывода в масштабе
- и стратегическое снижение цен для ускорения внедрения на быстрорастущем рынке.

Крупные сделки с гиперскейлерами окупились. Anthropic выдала модель, которая оказалась неожиданно сильной даже по меркам конца 2025 года.

https://www.anthropic.com/news/claude-opus-4-5

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤4🔥1

1.34K views09:02

About

Blog

Apps

Platform