Media is too big
VIEW IN TELEGRAM
Запись встречи уже доступна — приятного просмотра!
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23❤9🔥6🤓1🤝1
Мы открыли доступ к датасету VK-LSVD — это ~40 млрд взаимодействий между 10 млн пользователей и 20 млн видео, плюс контентные эмбеддинги и часть анонимизированных пользовательских фичей.
По меркам открытых рекомендательных датасетов — это очень большой и редкий набор данных. Но есть ещё один важный плюс: все взаимодействия сохранены в хронологическом порядке. Это сильно упрощает разбиение на train / val / test и улучшает воспроизводимость экспериментов — настоящий подарок для исследователей RecSys.
Кому полезно:
На Хабре мы подробно рассказали:
#RecSysChallenge #RecSys #LSVD
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥21❤7🎉2🍾2
Новая версия мультимодели на базе Gemini 3 Pro: поддержка 4K, до 14 изображений при редактировании и сохранение портретного сходства нескольких людей. Модель умеет искать изображения в вебе и использовать их при генерации. Улучшено качество текста, включая русский. Все картинки помечаются SynthID.
Флагманская модель улучшила результаты в кодинге, Excel, аналитике и агентных сценариях. Впервые добавлена функция «бесконечного чата» — память сжимается без разрыва диалога. Лидер на SWE-bench Verified и в тестах на устойчивость к атакам.
Модели генерации изображений с поддержкой до 10 входных фото, 4K-разрешения и корректным отображением текста. Полная версия требует ≈ 90 ГБ VRAM, FP8-вариант снижает память на 40 %. Есть опенсорс-версия на Hugging Face.
Новая функция на базе GPT-5 mini: уточняет запросы и подбирает товары, работает как Deep Research для шопинга. Доступна всем пользователям.
Распознаёт и отслеживает объекты в фото и видео, понимает текстовые команды («выдели жёлтый автобус»), создаёт 3D-реконструкции по одному снимку. Применяется для подсветки объектов, трекинга и размытия лиц. Доступна на Hugging Face.
*Компания Meta признана в России экстремистской организацией, её деятельность запрещена.
Документ стандартизирует подход к измерению выгоды от AI-проектов: рост доходов, снижение расходов, оптимизация штата, управление рисками. Включает метрики и методы — от рандомизированных экспериментов до альтернативного моделирования.
Датасет VK-LSVD помогает тестировать алгоритмы рекомендаций: сейчас на его базе проходит VK RecSys Challenge
#дайджест #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🔥6👏3👍2🎉1
На ридинг-группе 4 декабря обсудим очередную попытку разрушить классическую парадигму рекомендательных систем – фреймворк RecGPT от компании Taobao.
Китайский комбайн умеет предсказывать интент и интересы пользователя, генерировать и ранжировать айтемы-кандидаты и даже объяснять рекомендации.
Ведущим будет Александр Подвойский, ML-инженер AI VK.
🔹 4 декабря в 18:00
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
#ридинггруппа #aivk
Китайский комбайн умеет предсказывать интент и интересы пользователя, генерировать и ранжировать айтемы-кандидаты и даже объяснять рекомендации.
Ведущим будет Александр Подвойский, ML-инженер AI VK.
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20❤15👍8👏2💅1
Трансформеры остаются главным рабочим инструментом для текста, видео, аудио и других модальностей. Они хорошо работают, дают сильные метрики — но у них есть один серьёзный минус: квадратичный рост вычислений с длиной входа.
На практике это означает либо ограничение контекста, либо медленный инференс.
За последние годы было две большие волны попыток решить проблему квадратичной сложности:
1. Линейные attention-механизмы
Позволяли получить линейную сложность, но выигрывали по скорости только на очень длинных последовательностях и зачастую были хуже по качеству. В реальных задачах классический трансформер часто оказывался и быстрее, и точнее.
2. State Space Models (SSM)
Дают и качество, и линейную сложность, но ценой больших ограничений:
— необходимость низкоуровневого CUDA-кода, чтобы работало быстро,
— работа только на свежих Nvidia GPU,
— поддерживают только авторегрессионное моделирование как в архитектурах типа GPT.
Например, применить SSM из коробки к распространенным задачам вроде классификации документов (где тот же BERT чувствует себя отлично) непросто. А если нужно задеплоить на сотни разных устройств, то и практически невозможно
Мы разобрали статью, в которой автор предлагает новый подход:
Автор рассматривает новую архитектуру DenseAttention, которую мы уже обсуждали ранее. Она отлично показывает себя в языковом моделировании и других задачах, а также работает в любых сценариях на любом оборудовании. Теперь он вместе со своей научной группой выделяет ингредиенты, которые делают ее одновременно эффективной и качественной и которые можно применить и к другим архитектурам с линейной сложностью:
Сейчас группа тестирует эти и другие приемы на различных архитектурах, подбирая универсальную формулу, которую можно применить к любым существующим механизмам линейного внимания, чтобы радикально повысить его качество моделирования и сбросить наконец трансформер с королевского пьедестала.
Обзор статьи подготовлен командой AI VK
#обзорстатьи #transformers
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤14👏2🎉2👨💻2
AI VK Hub
На ридинг-группе 4 декабря обсудим очередную попытку разрушить классическую парадигму рекомендательных систем – фреймворк RecGPT от компании Taobao. Китайский комбайн умеет предсказывать интент и интересы пользователя, генерировать и ранжировать айтемы-кандидаты…
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤5👍3👏2
Media is too big
VIEW IN TELEGRAM
Обсудили, как модель предсказывает интенты и интересы пользователя, генерирует и ранжирует кандидатов, а также формирует объяснения к рекомендациям. Поговорили о плюсах подхода, его практических ограничениях и том, насколько он действительно способен заменить традиционный стек RecSys.
Запись встречи уже ждёт вас!
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥10👍5👏2💅1
Большинство современных рекламных и рекомендательных систем используют многостадийную архитектуру (MCA):
1. быстрая генерация пула кандидатов;
2. последующее ранжирование тяжёлой моделью.
Этот подход масштабируем, но имеет системные недостатки:
🟣 несогласованность оптимизационных целей между стадиями;
🟣 смещение распределений пользователей и айтемов;
🟣 падение качества финальных рекомендаций, доходности и UX.
Исследователи из Meituan предлагают решение — UniROM, первую промышленную end-to-end архитектуру, которая заменяет весь каскад одной моделью, генерирующей финальный список объявлений сразу из полного пула кандидатов в Location-Based Services.
Детали
UniROM состоит из двух основных модулей:
1. RecFormer
Моделирует интересы пользователя и externalities между объявлениями:
🟣 Global Cluster-Former — снижает сложность с 𝑂(𝑁*𝑁) до 𝑂(𝑁*𝐶), где С — число кластеров;
🟣 Mid-Fusion Interest Former — балансирует между ранним и поздним объединением признаков, учитывая намерения пользователя.
2. AucFormer
Генерирует финальный список объявлений. Характерные особенности:
🟣 non-autoregressive присвоение позиций;
🟣 permutation-aware оценка pCTR/pCVR;
🟣 отдельная payment-network для корректного ценообразования в аукционе.
Обучение — двухэтапное:
1. обучение pCTR на реальных логах;
2. дообучение через RL для оптимизации аукциона и соблюдения IC/IR-ограничений.
Результаты
UniROM применили для ранжирования рекламных объявлений в городских сервисах — на один запрос приходится около 100 000 кандидатов.
Оффлайн-эксперименты показали:
🟣 Recall@50 ↑ +20.4%
🟣 AUC ↑ +1.48%
🟣 eCTR ↑ +8.3%
🟣 eRPM ↑ +11.4%
Онлайн A/B-тесты (7 дней):
🟣 CTR ↑ +5.2%
🟣 RPM ↑ +13.6%
🟣 ROI рекламодателей ↑ +3.1%
При этом задержка выросла всего на 2.2%, несмотря на обработку пула кандидатов, увеличенного в сотни раз.
Итог: модель одновременно улучшила доход платформы, пользовательский опыт и эффективность рекламодателей — редкое сочетание для рекламных систем.
Заключение
UniROM демонстрирует, что end-to-end ранжирование может успешно заменить классическую каскадную архитектуру в реальной индустриальной среде. Такой подход:
🟣 убирает рассинхрон между стадиями;
🟣 учитывает externalities между объявлениями;
🟣 снижает зависимость от ручного feature engineering;
🟣 улучшает бизнес-показатели без серьёзного роста задержек.
Открытым остаётся вопрос масштабирования: можно ли распространить подход с 100k кандидатов до уровней, где речь идёт о десятках-сотнях миллионов?
Если это удастся, UniROM способен изменить стандарт разработки рекомендательных и рекламных систем глобального масштаба.
Обзор статьи подготовлен командой AI VK
#обзорстатьи
1. быстрая генерация пула кандидатов;
2. последующее ранжирование тяжёлой моделью.
Этот подход масштабируем, но имеет системные недостатки:
Исследователи из Meituan предлагают решение — UniROM, первую промышленную end-to-end архитектуру, которая заменяет весь каскад одной моделью, генерирующей финальный список объявлений сразу из полного пула кандидатов в Location-Based Services.
Детали
UniROM состоит из двух основных модулей:
1. RecFormer
Моделирует интересы пользователя и externalities между объявлениями:
2. AucFormer
Генерирует финальный список объявлений. Характерные особенности:
Обучение — двухэтапное:
1. обучение pCTR на реальных логах;
2. дообучение через RL для оптимизации аукциона и соблюдения IC/IR-ограничений.
Результаты
UniROM применили для ранжирования рекламных объявлений в городских сервисах — на один запрос приходится около 100 000 кандидатов.
Оффлайн-эксперименты показали:
Онлайн A/B-тесты (7 дней):
При этом задержка выросла всего на 2.2%, несмотря на обработку пула кандидатов, увеличенного в сотни раз.
Итог: модель одновременно улучшила доход платформы, пользовательский опыт и эффективность рекламодателей — редкое сочетание для рекламных систем.
Заключение
UniROM демонстрирует, что end-to-end ранжирование может успешно заменить классическую каскадную архитектуру в реальной индустриальной среде. Такой подход:
Открытым остаётся вопрос масштабирования: можно ли распространить подход с 100k кандидатов до уровней, где речь идёт о десятках-сотнях миллионов?
Если это удастся, UniROM способен изменить стандарт разработки рекомендательных и рекламных систем глобального масштаба.
Обзор статьи подготовлен командой AI VK
#обзорстатьи
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤11👍4👏3🙈1
На ридинг-группе 18 декабря обсудим статью SilverTorch — фреймворк, призванный демократизировать применение больших рекомендательных нейросетей.
Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?
Ведущим будет Роман Болозовский, ML-инженер AI VK. Встреча начнется в 18.00.
🔹 18 декабря в 18:00
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
#ридинггруппа #aivk
Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?
Ведущим будет Роман Болозовский, ML-инженер AI VK. Встреча начнется в 18.00.
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤9💅6🙊2👏1
Улучшаем технологии ASR в сервисах VK 😎
Команда AI VK улучшает технологии преобразования речи в текст (ASR), чтобы субтитры в видео и расшифровки голосовых сообщений стали точнее. В последней версии внедрили трансформерный декодер и в разы увеличили датасет для обучения модели. Подробности и результаты — в карточках от Максима Пихенько, руководителя отдела речевых технологий.
#aivk #asr #ml
Команда AI VK улучшает технологии преобразования речи в текст (ASR), чтобы субтитры в видео и расшифровки голосовых сообщений стали точнее. В последней версии внедрили трансформерный декодер и в разы увеличили датасет для обучения модели. Подробности и результаты — в карточках от Максима Пихенько, руководителя отдела речевых технологий.
#aivk #asr #ml
🔥23❤6👏4🎉2💅2
AI VK Hub
На ридинг-группе 18 декабря обсудим статью SilverTorch — фреймворк, призванный демократизировать применение больших рекомендательных нейросетей. Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?…
Начинаем через 20 минут!
Ждём вас в Zoom или на трансляции в AI VK Hub.
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤8👍3👏1
Мы подвели итоги VK RecSys Challenge 2025 — ежегодного соревнования по разработке рекомендательных алгоритмов. В этом году фокус был на одной из самых сложных задач в RecSys — cold start.
Масштаб
Задача
Участникам нужно было предсказать, кому будет интересен новый клип, даже если он ещё ни разу не показывался пользователям.
Данные
Для соревнования был открыт датасет VK-LSVD:
Один из крупнейших публичных датасетов для задач рекомендаций и cold start.
Формат
Награды
⠀⠀1. madgnome
⠀⠀2. Maksim Kuzin
⠀⠀3. Elves do RePlay
⠀⠀Студенческий трек:
⠀⠀1. Онего
⠀⠀2. Andrey Kuznetsov
⠀⠀3. maxvol goes brrr
VK RecSys Challenge — это не только соревнование, но и способ посмотреть, какие подходы к рекомендациям работают на реальных индустриальных данных и куда движется RecSys сегодня.
#RecSysChallenge #RecSys #LSVD
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾19❤9🎉7🔥5💅3
Media is too big
VIEW IN TELEGRAM
Поговорили о месте SilverTorch в экосистеме рекомендательных систем, его возможностях масштабирования, о том, какие задачи он реально закрывает, и где заявленная «демократизация» по-прежнему требует внушительных вычислительных ресурсов. Также обсудили практические кейсы использования и потенциальную ценность инструмента для команд и исследователей.
Запись ридинг-группы уже здесь — можно посмотреть в удобное время.
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍9❤6👏1🤩1