Machine learning Interview
30.4K subscribers
1.49K photos
114 videos
13 files
1.01K links
Разбираем вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейронным сетям, Python.

Вопросы - @notxxx1


@itchannels_telegram -🔥лучшие it каналы

РКН: clck.ru/3FmwRz
Download Telegram
⚡️ VK RecSys Challenge проходит на датасете VK-LSVD — одном из самых масштабных датасетов для рекомендательных систем.

Датасет хронологический, без повторных user–item, с полными метаданными пользователей и клипов. Есть подсэмплы и гибко конфигурируемые выборки (urX / ipX / upX), что делает его удобным для тестирования retrieval-моделей, ранжирования и гибридных систем. Предоставлен шаблон пайплайна для воспроизводимых экспериментов.

На сам VK RecSys Challenge все еще принимают заявки, регистрация открыта до 15 декабря. Призовой фонд — 2 500 000 рублей.

https://habr.com/ru/companies/vk/articles/970350/

#RecSys #ML #Datasets #VK
5🔥2🥰1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Подробный туториал, который показывает, как с нуля собрать собственную систему распознавания аудио прямо на устройстве.

Используется модель LFM2-Audio-1.5B от LiquidAI, а все данные остаются приватными.

Полностью локальный пайплайн, который можно адаптировать под свои задачи и интегрировать где угодно.

Готовый разбор и код - по ссылке:

https://github.com/Liquid4All/cookbook/tree/main/examples/audio-transcription-cli
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥32
🚀 Step-Audio-R1 — первый аудио-LLM, который открыл масштабирование вычислений на этапе инференса для задач звука. Новый рубеж для моделей, работающих с живым аудио.

🛠️ Ключевые возможности:
- глубокое понимание аудиосигнала
- реакция в реальном времени
- масштабируемые цепочки рассуждений для аудио-задач

🔥 Производительность:
- превосходит Gemini 2.5 Pro и сопоставим с Gemini 3 на ключевых бенчмарках по аудио-reasoning
- 96% точности в режиме реального времени - выше, чем GPT Realtime и Gemini 2.5 Flash Native Audio Dialog
- латентность первого токена - всего 0.92 секунды

Step-Audio-R1 использует Modality-Grounded Reasoning Distillation (MGRD) - подход, при котором цепочки рассуждений привязываются не к "домыслам модели", а к реальным акустическим признакам сигнала.
То есть модель рассуждает, опираясь на звук, а не на абстракции из текста.

Это убирает галлюцинации, повышает надёжность и позволяет масштабировать глубину reasoning так же, как это делают текстовые R1-подобные модели, но теперь в аудио.

Новый этап: LLM, которые думают не только над текстом, но и над реальным звучанием мира.

👾Demo: https://stepaudiollm.github.io/step-audio-r1/
📄 Paper: https://arxiv.org/abs/2511.15848
🐙 GitHub: https://github.com/stepfun-ai/Step-Audio-R1
9👍6🔥5
🇨🇳 Китай представил концепт AI-ускорителя на базе 14 нм логики + 18 нм DRAM, который обещает 120 TFLOPS при 2 TFLOPS на ватт.

По заявлениям, это уровень производительности Nvidia A100, но с упором не на техпроцесс, а на упаковку и работу с памятью.

Идея такая:

- вычислительные кристаллы 14 нм размещаются прямо поверх 18 нм DRAM
- используется гибридное 3D-бондинг-соединение
- тысячи коротких медных линий дают почти «как на кристалле» пропускную способность
- память ближе к вычислениям → меньше простаивания → выше реальная производительность на ватт

Заявленные характеристики — 120 TFLOPS при ~60 Вт, что лучше старых A100 по эффективности, но значительно слабее линейки Blackwell.

Но важно понимать:

- это пока архитектурный концепт, без массового кремния
- нет открытых бенчмарков
- нет подтверждённого серийного производства
- до уровня Nvidia Blackwell и по мощности, и по эффективности ещё далеко

Тем не менее сам подход показатель: акцент переносится с гонки за «нанометрами» к близости памяти, 3D-упаковке и near-memory computing. Это то направление, куда движется весь рынок высокопроизводительного AI-железа.

На данный момент концепт скорее сигнал о намерениях, чем реальный конкурент Nvidia.

tweaktown.com/news/109123/china-says-its-homegrown-14nm-chips-rival-nvidias-4nm-chips/index.html
👍166🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
«Прожарка» специалистов по машинному обучению от ChatGPT!

Это небольшой отрывок из подкаста «Криптонит говорит» об искусственном интеллекте и машинном обучении — ИИ задаёт неудобные вопросы и прогнозирует, когда он всех заменит.

📺 VK Видео
📺
YouTube
📺 Rutube
💬
Подкаст в телеграме
🎵 Яндекс.Музыка

Смотрите и подписывайтесь на подкаст «Криптонит говорит» — обсуждаем айти, искусственный интеллект, языки программирования и криптографию.

Реклама АО НПК «Криптонит» ИНН 9701115253 Erid: 2VtzqwapzWV
💊74🍌2
🧠 Погружение в глубокое обучение: от основ до GPT

Этот репозиторий предлагает серию блокнотов, которые проведут вас через ключевые концепции глубокого обучения, от базовых элементов до создания и понимания современных моделей, таких как GPT. Каждый блокнот последовательно раскрывает темы, включая нейронные сети и сверточные архитектуры.

🚀 Основные моменты:
- Пошаговое изучение глубокого обучения.
- Создание первой нейронной сети.
- Изучение сверточных нейронных сетей.
- Погружение в архитектуры ResNet.
- Работа с моделями GPT и их настройка.

📌 GitHub: https://github.com/Infatoshi/all-of-it

#jupyter
12👍2🤔2
📌 Sony представили Video-R4: визуальную систему «размышления» для видео, работающую по принципу человеческого восприятия.

Эта мультимодальная модель использует итеративный выбор кадров, приближение фрагментов и повторное перекодирование пикселей для точного анализа видео с большим количеством текста. Такой подход имитирует то, как человек изучает сложные визуальные подсказки, и значительно превосходит предыдущие одношаговые видеомодели.

Video-R4 достигает лучшего результата в задачах видеоанализа с насыщенным текстом. Модель обучена с использованием инновационных техник SFT и RL на специализированных датасетах Video-R4-CoT-17k и Video-R4-RL-30k.

📌📌Статья: https://huggingface.co/papers/2511.17490
📌Проект: https://yunlong10.github.io/Video-R4
🔥9🥰32
✔️ Краудсорсинговая платформа Ozon Profit расширила возможности для ML-разработки

Сервис, изначально ориентированный на онлайн-разметку данных, теперь позволяет собирать информацию и в офлайн-среде по всей России. Это решение может быть особенно полезно для проектов, где требуется верификация ML-моделей в реальных условиях.

Что позволяет сервис:
• Запущены «полевые задания» — исполнители могут выполнять проверки в офлайне, посещая локации по всей стране
• В онлайне — разметка текста, изображений и видео, анализ обращений клиентов, определение эмоций, намерений и тем в комментариях и чатах
• Доступны API-интеграции для автоматизации процессов, контроль в режиме реального времени вне зависимости от масштаба проекта
• Комиссия фиксированная и не зависит от формата задач
5🔥2👏1
⚡️ Trinity Nano и Trinity Mini - новое семейство открытых MoE-моделей:

- 6B и 26B MoE (1B/3B активных параметров)
- 128 экспертов, 8 активных, 1 общий
- GQA и gated attention
- 128k контекст
- 10T токенов, обучено на 512 H200 в bf16
- Apache 2.0 и полностью открытые веса
- Созданы для агентов, function calling и долгих рассуждений
- Разработано совместно с Datology и Prime Intellect

https://huggingface.co/arcee-ai/Trinity-Mini
👍4🔥3🤔3
Forwarded from Machinelearning
✔️ Mistral AI представила Mistral 3 - новое семейство открытых ИИ-моделей, рассчитанных на работу где угодно: от ноутбуков и смартфонов до облаков и edge-устройств.


Линейка включает флагманскую Mistral Large 3 и компактные Ministral-модели - все под лицензией Apache 2.0 с коммерческим использованием.

Модели оптимизированы для широкого спектра задач: от работы на устройствах с ограниченными ресурсами до корпоративных нагрузок.

- Mistral Small 3 вышла на уровень свыше 81 % на MMLU: для компактной модели это очень высокий показатель при низких задержках.
- Mistral Medium 3.1 заняла верхние позиции в LM Arena: первое место в категории English (no style control), второе, в общем зачёте, плюс топ-3 в задачах кодирования и длинных запросов.
- Medium 3.1 показывает около 90 % качества «тяжёлых» моделей, но при существенно меньших ресурсных затратах - одно из лучших соотношений цена/производительность на рынке.

https://mistral.ai/news/mistral-3

@ai_machinelearning_big_data

#mistral #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
13👍4🥰2😁2
⚡️ Google представил бесплатный адвент-календарь для вайбкодеров.

Google выпустил бесплатный обучающий адвент-календарь, рассчитанный на 25 дней. Каждый день открывается новый короткий видеоурок со ссылками на дополнительные материалы и примерами кода, которые можно сразу использовать в проектах.

Курс последовательно проводит слушателя через ключевые этапы работы с агентами - от быстрого развёртывания базовых решений до оркестрации полноценных мультиагентных систем. Первые два урока уже доступны.

Инициатива выглядит полезной для тех, кто хочет системно разобраться в современных подходах к созданию и управлению агентами.

https://adventofagents.com/
🤪15🤔94👍2🥰2💊2
✔️ OpenAI нашла способ заставить модели признаваться в собственных галлюцинациях — в новом исследовании представили технику под названием Confessions.

Проблема, которую пытаются решить:
модели нередко стремятся «угодить» системе оценки — выдают уверенные, но неверные факты, скрывают нарушения инструкций или занимаются reward hacking, чтобы получить более высокий балл.

Как работает Confessions:

1. Модель сначала генерирует обычный ответ.
2. Затем формирует второй, независимый отчёт, в котором сама оценивает:
- нарушила ли инструкции,
- где могла ошибиться,
- какие элементы ответа были сомнительными.
3. И получает награду за честность, а не за попытку скрыть ошибку.

Идея в том, что модель начинает рассматривать своё собственное поведение как объект анализа, а не пытается «выпутаться» любыми средствами.

Результаты:
В тестах на GPT-5 Thinking вероятность того, что модель нарушит правила *и попытается это скрыть*, снизилась до 4.4%.
Важно: Confessions не устраняет галлюцинации, а работает как инструмент диагностики — помогает выявлять моменты, где модель могла «соврать» или отойти от инструкции.

https://openai.com/index/how-confessions-can-keep-language-models-honest/
23👍10🔥4
🚀 В SAMGeo совсем скоро появится поддержка сегментации изображений с помощью SAM3 - это добавит больше возможностей и упростит работу с данными дистанционного зондирования.

Интеграция сделает точную сегментацию быстрее и доступнее для всех, кто работает с геоданными.

На картинке: сегментация зданий по простому текстовому запросу «building».
Результаты выглядят многообещающе. Обновления уже на подходе.

🔗 GitHub PR: https://github.com/opengeos/segment-geospatial/pull/430
8🔥2🤔2🥰1
🚀 AWS представила новое поколение AI-инструментов: Amazon Nova 2 и Agentic-AI

✔️ Nova 2 - семейство мощных моделей для текста, изображений, видео и мультимодальных задач
✔️ Nova Act - AI-агенты, которые могут работать в браузере: кликать, заполнять формы, навигироваться по UI
✔️ Nova Forge — сервис для создания собственных моделей на базе Nova: пред-тренировка, дообучение, кастомизация

Почему это важно
- Универсальность: от чат-ботов до анализа видео и документов
- Автоматизация: агенты заменяют рутинные действия и ручные процессы
- Кастомизация: компании могут строить модели под свои данные
- Оптимальная цена-производительность: конкурент на рынке крупных моделей

#AI #AWS #AmazonNova #GenerativeAI #AgenticAI #Automation

https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models
6👍3
🚀 Tavily Deep Research: как работает новый поисковый движок Hugging Face

Tavily - это инструмент для глубокого поиска и анализа. Он не просто ищет ссылки, а собирает факты, фильтрует шум и структурирует информацию так, чтобы её мог использовать ИИ для сложных задач.

🔥 Что делает Tavily
• Ищет релевантный контент по вебу
• Отбрасывает лишнее и оставляет только важные фрагменты
• Сжимает и очищает данные перед тем, как их увидит модель
• Экономит токены и ускоряет обработку, потому что не передает «всё подряд»

🧠 Как выглядит процесс Deep Research
1. Поиск по вебу
2. Извлечение полезных частей
3. Сжатие и структурирование информации
4. Формирование финального ответа или отчета

Где это полезно
• Аналитика и исследования
• Подготовка отчетов и обзоров
• Глубокие ответы, где обычный поиск слишком поверхностный

Это подход «не просто найти информацию, а переварить и подать её как исследователь».

https://huggingface.co/blog/Tavily/tavily-deep-research
12👍3🥰2🤔2