До начала всего час! Обсудим ключевые инсайты с шести международных ML-конференций 2025 года. А ещё разберём главные тренды в самых разных сферах машинного обучения.
Главный тренд этого года — объединение каскада моделей в единой генеративной постановке. В индустрии пробуют перейти с традиционного многошагового отбора на end-to-end-нейросети. Они принимают на вход описание пользователя, а на выходе строят готовый ответ.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14👍7👎4🔥2
Недавно мы запустили Алису AI: чат с нашим ассистентом превратился в инструмент для решения широкого круга задач с помощью нейросетей разной модальности. В основе — новое поколение генеративных моделей Alice AI.
В новое семейство генеративных моделей Яндекса вошли базовая текстовая Alice AI LLM и специализированная Alice AI LLM Search, мультимодальная Alice AI VLM и картиночная Alice AI ART. Мы перестроили пайплайн их обучения так, чтобы сократить число этапов и сфокусироваться на качестве решения задач, которые на практике востребованы у пользователей наших сервисов.
и недостающие категории запросов для балансировки под реальные пользовательские запросы
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13🔥13👍10👏1
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍6🔥3👎1
Голосовые аннотации — это небольшие подсказки, которые помогают водителю не съехать с маршрута. Например, навигатор сообщает, когда стоит держаться левой стороны дороги или что скоро будет круговое движение. Но в некоторых дорожных ситуациях такие аннотации только мешают и озвучивать их не нужно. А если попытаться масштабировать технологию на другие страны, то спорных случаев становится ещё больше, ведь зачастую там другие правила и культура вождения.
В итоге неоднозначные моменты требуют пристального внимания разработчиков и добавления новых условий. А со временем система превращается в лабиринт из эвристик и региональных костылей. И когда мы подстраиваем новые правила для одной страны — это ломает логику в другой.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤21👍11🔥4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Искусственный интеллект больше не живёт в презентациях и экспериментах. В Яндексе с ним каждый день работают десятки команд, а тысячи сотрудников используют AI, чтобы быстрее решать задачи, которые ещё недавно нужно было выполнять вручную.
Весь год мы создавали, обучали, внедряли, тестировали… Но сейчас ненадолго остановимся, чтобы оглянуться назад и оценить проделанный труд.
Здесь мы объединяем результаты работы за прошедший год. В этот раз YaC полностью посвящён теме искусственного интеллекта, его применению и новым возможностям для наших пользователей.
Что внутри:
Показываем, как работают AI-агент «Найти дешевле» и новый режим «Исследовать». А ещё знакомим с технологией AI-оживления изображений и платформой Промптхаб, где пользователи делятся своими запросами и учат друг друга их писать.
AI-агенты Такси, Еды, Лавки и Доставки помогают решать повседневные задачи в городе (например, быстро собрать продуктовую корзину для борща или оформить доставку). Агент Маркета через чат ищет товары по запросу и консультирует по ним. А в Браузере можно задать Алисе AI вопросы по контенту открытой страницы или видео.
Алиса Про помогает за секунды находить нужное в документации, почте или базе знаний. А нейроюрист консультирует специалистов и мгновенно обрабатывает массивы законодательной базы и нормативных актов.
Показываем, как связываем железо с искусственным интеллектом: умные наушники с Алисой, AI-диктофон, который анализирует записи, и IP-камеру с VLM-моделью для умного дома.
Демонстрируем четвёртое поколение наших роботов-доставщиков и рассказываем о строительстве собственного завода по их производству. А ещё заглядываем под капот автономных грузовиков. Объясняем, почему они ближе к самолётам, чем к машинам.
Рассказываем о нейросети, которая анализирует МРТ новорождённых. Она автоматизирует анализ, ускоряет диагностику, а ещё помогает выявлять неврологические заболевания, чтобы вовремя назначить терапию или реабилитацию.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥9👍7❤5👎3🔥1
🍎 PackEat: самый большой CV-датасет для умных касс и систем учёта магазинов
Сергей Нестерук, инженер из Yandex Cloud, вместе с командой исследователей создал самый большой в мире открытый набор данных для систем компьютерного зрения в розничной торговле.
В датасете свыше 100 тысяч изображений фруктов и овощей — всего 34 вида и 65 сортов. Прочитать подробности можно в журнале Scientific Data, фотографии с описаниями лежат в Zenodo, а код и примеры моделей — на Kaggle.
🅿️ С помощью PackEat можно:
⚪️ Обучать алгоритмы в умных кассах и системах учёта
⚪️ Улучшать точность распознавания продуктов в супермаркетах
⚪️ Создать систему, которая автоматически подсчитывает количество единиц товара
Кстати, датасет учитывает изображения объектов с полиэтиленовыми пакетами, пересечением объектов и «шумным» фоном на прилавках.
🅿️ Немного о команде
Ключевую роль в проекте сыграли два исследователя: Сергей Нестерук и Светлана Илларионова.
⚪️ Сейчас Сергей руководит командой безопасности искусственного интеллекта Yandex Cloud. Его команда обеспечивает безопасность при использовании AI, а также разрабатывает AI-инструменты для защиты данных и безопасности продуктов и сервисов
⚪️ Светлана руководит группой «Компьютерное зрение для обработки данных» Центра ИИ Сколтеха. Ребята занимаются компьютерным зрением для обработки данных: от спутникового мониторинга окружающей среды до медицинского анализа
🔳 Подробности читайте в статье.
Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML
Сергей Нестерук, инженер из Yandex Cloud, вместе с командой исследователей создал самый большой в мире открытый набор данных для систем компьютерного зрения в розничной торговле.
В датасете свыше 100 тысяч изображений фруктов и овощей — всего 34 вида и 65 сортов. Прочитать подробности можно в журнале Scientific Data, фотографии с описаниями лежат в Zenodo, а код и примеры моделей — на Kaggle.
Кстати, датасет учитывает изображения объектов с полиэтиленовыми пакетами, пересечением объектов и «шумным» фоном на прилавках.
Ключевую роль в проекте сыграли два исследователя: Сергей Нестерук и Светлана Илларионова.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24🔥12👍8
🎄 С наступающим!
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14❤7👍3🦄1
Передаём приветы от всех ML-разработчиков и AI-энтузиастов Яндекса. В этом посте мы подводим итоги уходящего года для нашего (и вашего!) сообщества Yandex for ML:
В этом году организовали ML Party, Data Fest, большую конференцию Practical ML Conf и ML Global Recap. Если сложить все цифры, то на наших ивентах:
P. S.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉17🔥13👍5❤4🥰2👎1
Всем привет! Отдыхаете? Это правильно 😉
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3👎3🔥2
Полезный технический контент необязательно подавать в форме строго академической лекции. Люди любят, когда им рассказывают хорошие истории. Чтобы подать информацию в виде истории, нужно помнить несколько важных правил сторителлинга:
Конфликт — это начало всякого движения и развития. Опишите действующих героев, объясните проблему, которую нужно решить, покажите, зачем вообще вам пришлось пуститься в это приключение.
Люди должны понимать важность вашей истории. Раскройте контекст ситуации, опишите внутренний мир и переживания героя (особенно если герой — это вы). Объясните, почему это актуально для слушателей.
Используйте красивые и понятные метафоры, рисуйте понятные и близкие сердцу образы, будьте субъективным — пусть люди посмотрят на историю вашими глазами.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤6🤔2🔥1
🌤 Мы разработали модель глобального прогноза погоды
Всем привет, меня зовут Паша Анисимов. В Яндекс Погоде я занимаюсь задачей глобального прогноза.
В независимых погодных сервисах разработчики строят прогнозы на основе глобальных прогнозов крупных метеорологических центров. Чтобы не переживать, что данные не доедут вовремя для составления прогноза, мы решились на эксперимент.
Путь был тернистым, но в итоге мы стали первыми в мире, кто в оперативном режиме с помощью нейросетей получает собственные глобальные погодные данные и использует их для прогноза осадков для массового пользователя.
🧿 Для этого мы побороли основные проблемы нейросетевых прогнозов накопленных глобальных осадков: сократили bias, улучшили точность локализации и интенсивности сильных осадков, справились с zero‑inflated distribution.
Вкратце про наше решение:
⚪️ За пару минут просчитывает эволюцию 70 ключевых характеристик атмосферы Земли на 10 суток вперёд с шагом в 1 час
⚪️ Использует авторегрессию в латентном пространстве для экономии вычислений и совместного и согласованного обучения моделей с разным горизонтом прогноза
🔳 Читайте на Хабре:
⚪️ Как мы создали собственную глобальную модель прогноза — от выбора данных и архитектуры до распределённого обучения на 32 видеокартах
⚪️ Почему прогноз осадков — одна из самых сложных задач для нейросетей и как мы улучшили метрики (MAE, CSI, FSS, W1, bias) за счёт новых лосс‑функций и нормировки
⚪️ Как интегрировали нейросеть в сервис — тестировали на часовых накоплениях, сравнивали с WeatherNext2 от Google и внедряли в профильную модель осадков
Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML
Всем привет, меня зовут Паша Анисимов. В Яндекс Погоде я занимаюсь задачей глобального прогноза.
В независимых погодных сервисах разработчики строят прогнозы на основе глобальных прогнозов крупных метеорологических центров. Чтобы не переживать, что данные не доедут вовремя для составления прогноза, мы решились на эксперимент.
Путь был тернистым, но в итоге мы стали первыми в мире, кто в оперативном режиме с помощью нейросетей получает собственные глобальные погодные данные и использует их для прогноза осадков для массового пользователя.
Вкратце про наше решение:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍12🦄6❤4