AI VK Hub
2.12K subscribers
253 photos
18 videos
150 links
Рассказываем и показываем AI в VK 🔉
Download Telegram
Live stream started
Live stream finished (31 minutes)
Media is too big
VIEW IN TELEGRAM
🎬 На ридинг-группе 4 декабря Александр Подвойский, ML-инженер AI VK, разобрал фреймворк RecGPT от Taobao — ещё одну попытку переосмыслить классическую парадигму рекомендательных систем с помощью LLM.

Обсудили, как модель предсказывает интенты и интересы пользователя, генерирует и ранжирует кандидатов, а также формирует объяснения к рекомендациям. Поговорили о плюсах подхода, его практических ограничениях и том, насколько он действительно способен заменить традиционный стек RecSys.

Запись встречи уже ждёт вас!

#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥10👍5👏2💅1
Большинство современных рекламных и рекомендательных систем используют многостадийную архитектуру (MCA):
1. быстрая генерация пула кандидатов;
2. последующее ранжирование тяжёлой моделью.

Этот подход масштабируем, но имеет системные недостатки:
🟣несогласованность оптимизационных целей между стадиями;
🟣смещение распределений пользователей и айтемов;
🟣падение качества финальных рекомендаций, доходности и UX.

Исследователи из Meituan предлагают решение — UniROM, первую промышленную end-to-end архитектуру, которая заменяет весь каскад одной моделью, генерирующей финальный список объявлений сразу из полного пула кандидатов в Location-Based Services.

Детали

UniROM состоит из двух основных модулей:

1. RecFormer
Моделирует интересы пользователя и externalities между объявлениями:
🟣 Global Cluster-Former — снижает сложность с 𝑂(𝑁*𝑁) до 𝑂(𝑁*𝐶), где С — число кластеров;
🟣Mid-Fusion Interest Former — балансирует между ранним и поздним объединением признаков, учитывая намерения пользователя.

2. AucFormer
Генерирует финальный список объявлений. Характерные особенности:
🟣non-autoregressive присвоение позиций;
🟣permutation-aware оценка pCTR/pCVR;
🟣отдельная payment-network для корректного ценообразования в аукционе.

Обучение — двухэтапное:
1. обучение pCTR на реальных логах;
2. дообучение через RL для оптимизации аукциона и соблюдения IC/IR-ограничений.

Результаты

UniROM применили для ранжирования рекламных объявлений в городских сервисах — на один запрос приходится около 100 000 кандидатов.

Оффлайн-эксперименты показали:
🟣Recall@50 ↑ +20.4%
🟣AUC ↑ +1.48%
🟣eCTR ↑ +8.3%
🟣eRPM ↑ +11.4%

Онлайн A/B-тесты (7 дней):
🟣CTR ↑ +5.2%
🟣RPM ↑ +13.6%
🟣ROI рекламодателей ↑ +3.1%

При этом задержка выросла всего на 2.2%, несмотря на обработку пула кандидатов, увеличенного в сотни раз.

Итог: модель одновременно улучшила доход платформы, пользовательский опыт и эффективность рекламодателей — редкое сочетание для рекламных систем.

Заключение

UniROM демонстрирует, что end-to-end ранжирование может успешно заменить классическую каскадную архитектуру в реальной индустриальной среде. Такой подход:
🟣убирает рассинхрон между стадиями;
🟣учитывает externalities между объявлениями;
🟣снижает зависимость от ручного feature engineering;
🟣улучшает бизнес-показатели без серьёзного роста задержек.

Открытым остаётся вопрос масштабирования: можно ли распространить подход с 100k кандидатов до уровней, где речь идёт о десятках-сотнях миллионов?
Если это удастся, UniROM способен изменить стандарт разработки рекомендательных и рекламных систем глобального масштаба.

Обзор статьи подготовлен командой AI VK
#обзорстатьи
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1811👍4👏3🙈1
На ридинг-группе 18 декабря обсудим статью SilverTorch — фреймворк, призванный демократизировать применение больших рекомендательных нейросетей.

Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?

Ведущим будет Роман Болозовский, ML-инженер AI VK. Встреча начнется в 18.00.

🔹 18 декабря в 18:00

Zoom: ссылка
ID: 707 776 9330
Код: 464167

Параллельно запустим стрим прямо в канале AI VK Hub.

#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥179💅6🙊2👏1
Улучшаем технологии ASR в сервисах VK 😎

Команда AI VK улучшает технологии преобразования речи в текст (ASR), чтобы субтитры в видео и расшифровки голосовых сообщений стали точнее. В последней версии внедрили трансформерный декодер и в разы увеличили датасет для обучения модели. Подробности и результаты — в карточках от Максима Пихенько, руководителя отдела речевых технологий.

#aivk #asr #ml
🔥236👏4🎉2💅2
AI VK Hub
На ридинг-группе 18 декабря обсудим статью SilverTorch — фреймворк, призванный демократизировать применение больших рекомендательных нейросетей. Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?…
📢 Сегодня на ридинг-группе разбираем фреймворк SilverTorch — обещание демократизировать большие рекомендательные нейросети (для тех, у кого пара сотен A100 под столом 😉).

Начинаем через 20 минут!
Ждём вас в Zoom или на трансляции в AI VK Hub.
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥118👍3👏1
Live stream started
Live stream finished (47 minutes)
📍 VK RecSys Challenge 2025: итоги ML-соревнования

Мы подвели итоги VK RecSys Challenge 2025 — ежегодного соревнования по разработке рекомендательных алгоритмов. В этом году фокус был на одной из самых сложных задач в RecSys — cold start.

Масштаб
🟣~800 исследователей из 14 стран
🟣3900 решений
🟣219 команд и индивидуальные участники
🟣География: Россия, Казахстан, Беларусь, Узбекистан и др.

Задача
Участникам нужно было предсказать, кому будет интересен новый клип, даже если он ещё ни разу не показывался пользователям.

Данные
Для соревнования был открыт датасет VK-LSVD:
🟣40 млрд обезличенных пользовательских взаимодействий
🟣20 млн коротких видео
Один из крупнейших публичных датасетов для задач рекомендаций и cold start.

Формат
🟣Общая секция
🟣Студенческая секция (ВШЭ, ИТМО, МГУ, МФТИ и др.)

Награды
🟣Призовой фонд — 2 500 000 ₽
🟣Победители уже объявлены на странице соревнования, ими стали:

⠀⠀1. madgnome
⠀⠀2. Maksim Kuzin
⠀⠀3. Elves do RePlay

⠀⠀Студенческий трек:
⠀⠀1. Онего
⠀⠀2. Andrey Kuznetsov
⠀⠀3. maxvol goes brrr

🏆 Награждение пройдет в январе 2026 на Data Ёлке в Москве и Санкт-Петербурге.

VK RecSys Challenge — это не только соревнование, но и способ посмотреть, какие подходы к рекомендациям работают на реальных индустриальных данных и куда движется RecSys сегодня.

➡️ Лидерборд и подробности — по ссылке

#RecSysChallenge #RecSys #LSVD
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾199🎉7🔥5💅3
Media is too big
VIEW IN TELEGRAM
🎬 На ридинг-группе 18 декабря Роман Болозовский, ML-инженер AI VK, разобрал статью про SilverTorch — фреймворк, который предлагает упростить работу с крупными рекомендательными моделями и расширить к ним доступ.

Поговорили о месте SilverTorch в экосистеме рекомендательных систем, его возможностях масштабирования, о том, какие задачи он реально закрывает, и где заявленная «демократизация» по-прежнему требует внушительных вычислительных ресурсов. Также обсудили практические кейсы использования и потенциальную ценность инструмента для команд и исследователей.

Запись ридинг-группы уже здесь — можно посмотреть в удобное время.

#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍96👏1🤩1
Одна из проблем классических рекомендательных систем — они хорошо улавливают поведенческое сходство пользователей, но слабо учитывают, кто именно этот пользователь и в какой социальной роли он потребляет контент. В результате рекомендации могут быть релевантны по интересам, но логически несогласованны с контекстом и ролью пользователя.

Исследователи из Уханьского университета совместно с Kuaishou Technology предложили подход Who You Are Matters, который объединяет коллаборативную фильтрацию, пространство социальных ролей и логические связи, извлечённые с помощью LLM, для более согласованного ранжирования контента.

Детали

1. Пространство социальных ролей

Авторы вводят дискретное пространство тегов, интерпретируемое как социальные роли пользователей и айтемов:
🟣последовательность позитивных взаимодействий пользователя дополняется последовательностью тегов;
🟣последовательности айтемов и тегов кодируются SASRec-подобной моделью для построения пользовательского эмбеддинга;
🟣эмбеддинг айтема формируется агрегацией его тегов.

Таким образом, рекомендации зависят не только от истории кликов, но и от согласованности ролей пользователя и контента.

2. Логическое согласование с помощью LLM

Дополнительно используется LLM, который по заданным промптам строит два ориентированных графа:
🟣U2I — логические связи от тегов пользователя к тегам айтемов;
🟣I2U — связи в обратном направлении.

Обход этих графов позволяет получить набор тегов, логически согласованных с текущей ролью пользователя. Эти теги используются для введения штрафа за логическую несогласованность между рекомендациями модели и логикой, извлечённой LLM.

3. Обучение

Обучение ведётся с использованием:
🟣binary cross-entropy для задачи ранжирования;
🟣контрастивного обучения, чтобы похожие пользователи и айтемы имели согласованные теги.

Результаты

Модель протестирована как в оффлайн-экспериментах, так и в промышленной системе видеорекомендаций.

🟣В A/B-тестах получен рост положительных взаимодействий примерно на 0.9% или увеличение diversity выдачи на 0.1% (в зависимости от конфигурации)
🟣В оффлайн-экспериментах на индустриальных данных и открытых датасетах Books и Movies метод показал устойчивый прирост по NDCG@K и MRR@K — от нескольких до десятков процентов по сравнению с SOTA-подходами, использующими только коллаборативный сигнал или контентные эмбеддинги.

Отдельно отмечается эффект transfer learning: пространство тегов и графы U2I/I2U, обученные на внутренних данных, успешно переносятся на открытые датасеты после выравнивания тегов, что указывает на обобщаемость выученной логики.

Подход демонстрирует, что интеграция социальных ролей и логических ограничений, извлечённых с помощью LLM, позволяет сделать рекомендации не только более точными, но и более осмысленными с точки зрения пользовательского контекста.

Обзор статьи подготовлен командой AI VK
#обзорстатьи
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥176👍6😁1🎉1
Всем привет!
Вышло большое интервью с Андреем Зимовновым, руководителем направления рекомендаций AI VK, в котором он подробно рассказывает про рекомендации, метрики, подходы и векторы будущего развития отрасли.

Ключевые тезисы, которые будут особенно полезны ML-инженерам:

➡️ Рекомендательная система как продукт. В VK подход к развитию рекомендательной системы идентичен подходу к разработке отдельного продукта, у которого есть свои свойства и акторы.

➡️ Баланс метрик важнее time spent. Важно развивать все свойства рекомендаций, а не ориентироваться только на time spent. Иногда улучшение качества рекомендаций, то есть точное попадание в сиюминутный интерес пользователя, может снижать time spent.

➡️ Discovery-платформа — фундамент для рекомендаций, поиска и рекламы. Она формирует точные профили интересов каждого пользователя, помогает быстрее запускать модели.

➡️ Мультимодальные модели и технологии глубокого понимания контента. Современные мультимодальные модели учатся улавливать тонкие смыслы в контенте, эмоции, настроение. В какой-то перспективе алгоритмы рекомендаций научатся понимать и сарказм.

➡️ Переоценённые тренды и будущее рекомендаций. Reinforcement Learning всё ещё считается перспективным, но пока не показывает значимых практических преимуществ в рекомендациях. Потенциал — диалоговые рекомендации, когда пользователь взаимодействует с рекомендациями на естественном языке.


🔗 Читайте полное интервью здесь

#recsys #discovery #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1915👍3👏3💅2
Привет, коллеги! 🎄

Перед праздниками делимся с вами подборкой статей от команд VK — для тех, кто работает с ML-системами в продакшне, интересуется рекомендациями, поиском, мультимодальностью и данными «в бою», а не в вакууме.

➡️ Датасет VK-LSVD: как тестировать рекомендательные алгоритмы на реальных данных
Рассказываем про VK-LSVD — открытый датасет для оценки рекомендательных систем, на базе которого прошёл VK RecSys Challenge 2025. В статье подробно разобрали, как формировался датасет, какие сценарии пользовательского поведения он покрывает, какие метрики используются и какие ограничения важно учитывать при офлайн-оценке. Полезно для тех, кто проектирует или валидирует recsys-пайплайны и хочет сравнивать модели в условиях, близких к реальному продукту.

➡️ Что такое шопсы и как мы размечаем shoppable-контент
Глубокий разбор того, как устроена разметка коммерческого контента в соцсети: от определения сущностей и таксономии до процессов контроля качества и масштабирования разметки. Авторы показывают, почему разметка — это не «вспомогательная» задача, а ключевой элемент ML-систем, влияющий на обучение моделей, их устойчивость и бизнес-метрики. Материал особенно полезен для тех, кто работает с CV, мультимодальностью и e-commerce-сценариями.

➡️ MARKER: собираем русскоязычный мультимодальный датасет для оценки VLM
Практический кейс создания датасета для оценки vision-language моделей в русскоязычном контексте. В статье — мотивация, принципы дизайна заданий, сложности с лингвистическими и визуальными искажениями, а также выводы о том, почему прямой перенос англоязычных бенчмарков плохо работает. Отличное чтиво для тех, кто занимается VLM, мультимодальными LLM или оценкой качества моделей за пределами English-first мира.

➡️ Рекомендации историй ВКонтакте: от простой эвристики до ML-системы
Эволюция рекомендательной системы сторис: от базовых правил и эвристик к полноценной ML-архитектуре. Степан Малькевич, руководитель команды рекомендаций ленты ВКонтакте, подробно описывает этапы развития, проблемы роста, работу с холодным стартом, сигналами вовлечённости и онлайновыми ограничениями. Статья хорошо показывает, как реальные продуктовые требования формируют архитектуру ML-системы и почему «идеальная модель» редко возможна в продакшене.

➡️ Как мы внедряли семантический поиск по сообществам ВКонтакте: про раков, астрологию и затянувшийся таймлайн проекта
Честный рассказ о внедрении семантического поиска: от первых прототипов до интеграции в продукт. В статье много про организационные и технические сложности — выбор моделей, качество эмбеддингов, работу с шумными данными, инфраструктурные ограничения и постоянные изменения требований. Особенно ценно для тех, кто запускает semantic search или retrieval-системы в больших продуктах и хочет понимать реальные риски и компромиссы.

🎁 Пусть эти материалы станут полезным чтением на длинных выходных — или источником идей для новых ML-экспериментов в следующем году

#aivk #статьи
Please open Telegram to view this post
VIEW IN TELEGRAM
17🔥12👍5👏2💅2
Всем привет!

Начинаем 2026-й с краткого обзора того, чем 2025 год стал для AI-индустрии — фокус на технологии, инфраструктуру и инженерные последствия.

📌 Итоги 2025: что важно запомнить

🟣AI стал системной технологией, а не экспериментом
Time назвал «Человеком года» не одного лидера, а коллективный образ — Architects of AI. ИИ перешёл из R&D в основу стратегий крупнейших техкомпаний.

🛍 Социальная коммерция: соцсети + e-commerce

➡️ Конвергенция платформ
🟣Покупки в ленте через AI-рекомендации и интерактивные форматы → ВКонтакте появился новый формат — шопсы
🟣Лайв-шоппинг и встроенные витрины стали стандартом видеоплатформ: TikTok Shop уже привлёк 200 000+ малых бизнесов в Великобритании.

Соцсети становятся AI-driven коммерческими экосистемами с нативной конверсией.

⚙️ Мультимодальные модели — из R&D в продакшен

➡️ В 2025 мультимодальные модели вышли в продукты: рынок ≈ $2,5 млрд, CAGR ~37%

🟣Мультимодальные модели используются для построения контентных эмбеддингов видеороликов (видео + звук + текст), которые затем применяются в рекомендациях VK
🟣On-device AI: рост локальных мультимодальных моделей — Google Gemma 3n выполняет задачи прямо на смартфонах при ограниченной памяти

🚀 LLM: многополярный мир

➡️ Конец монополий
OpenAI, Google (Gemini), Anthropic — больше не единственные.
Китай догнал западные модели по качеству, стал лидером опенсорса, Kimi K2 — №1 среди open-source моделей (artificialanalysis.ai)

➡️ Reasoning стал стандартом
Модели берут сложные бенчмарки (Humanity’s Last Exam), растёт качество reasoning-сценариев (код, анализ).

➡️ Ускорение прогресса
По данным Epoch AI, темпы улучшения топ-моделей почти удвоились.

➡️ Россия: крупные, но точечные апдейты

🖼 Визуал: редактирование стало нормой

➡️ Генерация → редактирование изображений
Поворотный момент — GPT Image 1 (март 2025).

Дальше рынок быстро стандартизировал:
🟣multi-image input
🟣сохранение портретного сходства
🟣корректный текст на изображениях (включая русский)

К концу года — Flux, Nano Banana, Qwen Image Edit и др. как стандартные инструменты.

➡️ Видео: звук, персонажи, сцены

Модели обучились:
🟣синхронной речи и звуку
🟣удержанию сцен
🟣вертикальным форматам

Лидеры:
🟣США: Sora 2, Veo 3.1, Runway Gen-4.5
🟣Китай: Kling 2.6, Wan 2.6, Seedance 1.5 Pro

В опенсорсе доминирует Китай; Kandinsky 5.0 — №1 LMArena.

🤖 Агентные системы — новая архитектурная норма

➡️ AI-агенты перестали быть фичей:
🟣оформились как архитектура: планирование, tool-calling, автономные цепочки
🟣одновременно проявились ключевые риски — безопасность, стоимость, контроль

➡️ Vibe coding стал массовым
Термин Андрея Карпатого быстро превратился в практику:
🟣описание цели → агент пишет код
🟣резкое снижение порога входа

Для инженеров это означает новые риски:
🟣рост техдолга
🟣потерю понимания системы
🟣усложнение поддержки и отладки

🖥 Браузеры = AI-агенты

➡️ Сдвиг от поиска к действиям
Браузеры движутся в сторону: аналитики, работы с историей, агентских действий (формы, бронирования, покупки)

➡️ Цена удобства — безопасность
Промпт-инъекции и смежные атаки становятся системным риском.

👆 Инфраструктура: главный bottleneck

➡️ Nvidia — $5 трлн капитализации
ИИ-чипы — стратегический ресурс, конкурентов по масштабу нет.

➡️ Упёрлись не только в чипы
Ключевые ограничения: энергия, сети, датацентры.

Массовое строительство ЦОД и повторное использование тепла (ЕС, США) — долгосрочный тренд.

📎 Слова года — маркеры реальности
🟣Vibe coding — новый стиль разработки
🟣Slop — индустриальный ИИ-шум и мусорный контент
🟣В РФ: «промпт», «слоп» — официально зафиксированы языковыми институтами

Вывод

2025 год дал не только технологический рывок, но и чёткое понимание ограничений ИИ.
Фундамент заложен. Дальше — инженерия, контроль и зрелые практики, а не бесконечный хайп.

#дайджест #aivk #итоги2025
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2316👍9👏2💅1
Data Ёлка 2026 — одно из ключевых событий года для ML и Data Science сообщества

24 января VK и ODS проведут Data Ёлку одновременно в Москве, Санкт-Петербурге и онлайн. Программа пройдёт в формате «стерео»: один трек — глубокие инженерные разборы RecSys, NLP, MLOps, CodeGen и других направлений, второй — прикладные инсайты и обсуждение главных технологических трендов индустрии.

🏆 Отдельный блок посвящен разбору лучших сабмитов VK RecSys Challenge и награждению победителей соревнования по рекомендательным системам на датасете VK-LSVD. Ведущий — Александр Пославский, руководитель отдела рекомендательных технологий AI VK.

👤 Владимир Байкалов, ведущий исследователь AI VK подведет итоги года в RecSys.

👤 Степан Малькевич, руководитель группы рекомендаций Ленты ВКонтакте AI VK, расскажет про современные алгоритмические ленты контента в социальных сетях.

Также у микрофона эксперты Сбера, МТС, Авито, Газпром нефти, ИТМО и других ведущих команд.

Регистрация на мероприятие открыта до 22 января включительно:
➡️ Москва
➡️ Санкт-Петербург

#DataЁлка2026 #RecSysChallenge #RecSys #LSVD
Please open Telegram to view this post
VIEW IN TELEGRAM
23🔥10👍7💅3👏1