ML for Value / Ваня Максимов

➡️ Навигация по каналу v3

На связи Ваня Максимов @Ivan_maksimov - AI & Analytics Head в Яндекс.Маркете, 10+ лет в DS

Сложилось сразу 2 фактора: канал дорос до 5.5К подписчиков и наступило аж 400 дней на новом месте работы -- пора сделать апдейт про канал и меня

Чем я занимаюсь?
Магия дискавери: помогаю найти неочевидные и полезные товары в Я.Маркете.
На фотках к посту 3 неочевидных товара, которые я нашел в своих же рекомендациях

Кстати, "магия дискавери" - реальное название одной команды в я.картах!

Поформальнее, руковожу командами AI для персонализации и продуктовыми аналитиками:
60% - рексис: DL + классика + аналитика
20% - поиск и crm: персональное ранжирование + аналитика
15% - content intelligence с LLM, скажем так
5% - реклама

До этого из области RecSys построил с нуля все рекомендации в Delivery Club, внедрил R&D в Wildberries
А еще активно зарабатывал деньги для компаний классическим ML: оптимизация цен и промо-акций, автоматический заказ товаров на склады, планирование смен курьеров. Ну и конечно А/В тестировал все это дело! Довелось даже построить 2 платформы А/В: в Delivery Club и Лавке

На канале пишу о том, как преодолеть путь от ML модели до реального Value для бизнеса. И какие грабли я собрал на этом пути за 10 лет

👍 Самые залайканные / обсуждаемые посты с хэштегами
- Как впихнуть все интересы пользователя в один экран приложения? Новинки в DL RecSys: ARGUS-1B #recsys
- Серия про оптимизацию цен на товары #pricing
- Прогноз спроса и метрики регрессии: от RMSE до WAPE. Сколько товаров заказать на склад? #timeseries
- 13 способов ускорить АВ тест или “не CUPED-ом единым” #ab
- 70% фейлят ML system design собеседование #hiring #system_design
- Что тебя ждет при переходе team lead —> head of ML #career

💡Написать мне: @Ivan_maksimov
Можно позвать меня рассказать что-то интересное на конференции или в вашей компании, обсудить занятную ml-задачу, или проконсультироваться на счет ml-проекта

👍33🔥16❤6✍4😢2

4.79K views07:56

ML for Value / Ваня Максимов

ML for Value / Ваня Максимов pinned a photo

08:44

ML for Value / Ваня Максимов

С наступающим Новым Годом 🎄🎅

Уходящий год выдался очень насыщенным: я сильно погрузился в lifelong рекомендации с огромным контекстом истории юзера (argus и llm x recsys), пробовал дружить персонализацию и промо (тут еще многое впереди!), расширялся в content intelligence, crm и поиск

А еще много путешествовал и тренировался в одном из топ теннисных центров на Тенерифе: немало последил за тренировками игроков топ-30 мира и сам сильно прокачался. В общем, было насыщенно!

Желаю, чтобы в 2026 у вас было еще больше впечатлений и чтобы исполнились все ваши ML-ные мечты: вкатиться в IT или вырасти в навыках/грейде, опубликовать статью на А* конфе, обучить SOTA модель, найти свое призвание и идеальную компанию

Ну и чтобы модельки учились, деньги мутились - ml4value все же 👍

Please open Telegram to view this post

VIEW IN TELEGRAM

❤37👍18🎄9👎1🤣1

3.06K viewsedited 13:32

ML for Value / Ваня Максимов

[1/3] Что случилось в мире рекомендаций и поиска за 2024-25гг?

За последние 2 года в мире recsys идет революция не меньше изобретения attention и gpt. С интересом наблюдаю и применяю многое в работе - хочу поделиться, что происходит в нашем мире:)

1. Large Recsys Models
LRM, получается? 😅

Еще год-два назад SOTA SASRec работал с максимум 512 последними действиями (заказы, корзины, лайки, клики) пользователя. Естественно, у многих юзеров даже за 6 мес действий больше, а у активных контекст переполнялся за 1 месяц

И вот вышла революционная статья Actions Speak Louder than words с генеративной recsys моделью HSTU-8к. Основная фишка: меняем парадигму обучения с next action prediction на генеративную. По факту, чуть по-другому собираем датасет и эффективнее считаем матричные произведения

Это позволяет ускориться х5-х15 раз (снижается сложность О(seq_len^3) до О(seq_len^2). И, собственно, скейлиться до длины последовательности в 8к и размера модели в 1.5В параметров

Хайп HSTU подхватили и другие компании: Вышли более эффективные реализации вроде Argus-8k от Яндекса (мы в Я.Маркете тоже его используем), модели с 100k контекстом от Kuaishou и другие

2. Маленький «словарь» товаров с Semantic IDs 📕
Годами область RecSys отличалась от NLP по факту размером словаря. В NLP - это 30-100к благодаря эффективным токенайзерам, а в рексис 10-100М, тк «слово» = товар, а уникальных товаров много

Эта проблема мешала масштабированию моделек, холодному старту, качеству обучения и еще в десятках мест поменьше

Рисерчеры из Google придумали Better Generalization with Semantic IDs. Берут контентные вектора товаров (текст, картинка) и хитро последовательно кластеризуют их через RQ-VAE. Основная фишка в том, что финальный id товара = сумме id его кластеров

semantic_itemid = cluster_iter1 + cluster_iter2

Кластеров всего ~10-100K. Вуаля, наш словарь как у LLM — опять же можно масштабировать модели и делать генеративное обучение как в llm

3. Рекомендации в один шаг🦵
Классика рекомендаций: отбираем топ-1к товаров-кандидатов легкой моделью (обычно двухбашенная модель: вектор юзера х вектор товара + инференс через faiss). Затем переранжируем более тяжелой моделью. Из-за такой схемы на первом этапе кандидатогегерации могут теряться релевантные товары

OneRec объединили генерацию кандидатов, ранжирование и еще реранкер по разнообразию в один шаг! Честно говоря, сам еще продолжаю разбираться: там серия из 5 статей страниц на 200. Но это явно будет hot topic и в 2026

4. LLM-ки нашли свое место в RecSys 🧐
Нам долго обещали, что LLM заменят чисто рекомендательные модели, но нет. Попыток было много, в итоге пришли к компромиссу: LLM генерит «интерес пользователя» текстом (одежда для походов, декор в японском стиле), а более классические recsys модели - товары внутри этих интересов. Вариантов реализации много, мне нравится RecGPT: можно считать в оффлайн, не так много запросов к llm (ну как.. 10-100М, а не миллиарды-триллионы), можно прикручивать SGR и другие приятности

Хотя бы одно из этих улучшений внедрено в прод хорошо если в 10-20 компаниях в мире, с огромными приростами метрик. Так что сейчас - самое время внедрять это у вас, если еще не успели!)

В следующей части будут продуктовые recsys & search изменения: без статей, но с картинками 🖼

Please open Telegram to view this post

VIEW IN TELEGRAM

👍48❤16🆒4👎3🔥3

2.94K viewsedited 11:34

ML for Value / Ваня Максимов

[2/3] Продуктовые изменения в мире recsys & search и около них за 2024-25гг
Больше про маркетплейсы, такая уж специфика у меня

1. VR-примерка одежды у крупных продавцов (Zara, ASOS)
Наконец-та!

Убийца маржи всех маркетплейсов (особенно fashion) - возвраты. Если их заметно снизить, то ecom вполне может совсем уничтожить оффлайн-магазины

Обычно возврат идет после «примерки» одежды или товара в интерьере. В 2025 появились наконец приличные open-source virtual try-on модельки и компании стали их понемногу внедрять. Пока все же в тестовом режиме (фото 1)

2. PUGC - Professional user generated content
Ощущение, что уже 50+% карточек товаров и отзывов сгенерированы LLM-кой: пользователям нужны пруфы, что товар хороший. Тут в бой идет контент от экспертов (PUGC)

В Lazada вместо фотки товара уже по дефолту стоит его видео-обзор от продавца (фото 2)

В Китае процветает реинкарнация магазина на диване: social ecom

В России эта история пока не особо летит, но посмотрим, что нам сулит Новый год

3. Казино и игры в каждый продукт
Дают возможность получать баллы за заход в приложение/игры внутри и крутить колесо призов - обычно, случайная скидка на категорию или бренд

Механика простая, но прилично растит частотность. Есть в Lazada, Озоне, Я.Маркете, вот недавно запустилась даже в Золотом Яблоке! (Фото 3-5)

4. Маркетплейсы в GPT и GPT в маркетплейсах
Самое сладкое оставил в конце

General LLM заходят в ecom/кино/книги и другие классические области рексис и поиска. Посоветоваться с llm-кой перед крупной покупкой или выбрать с ней сериал на вечер становится нормой. Сами AI-браузеры стали делать лендинги для товаров прямо в результатах своих ответов: первая заметная коллаба случилась между Perplexity и Shopify (фото 6-7)

Но и сами маркетплейсы внедряют AI-ассистенты у себя. Мне пока заходят точечные юзкейсы: выбор подарка, уточнение про товар, сравнение товаров и тп. Никак уж не могу не упомянуть наш ai-ассистент в Я.Маркете (фото 8)

Интересно, кто в итоге победит в этой битве? Или каждое решение займут свою нишу?

5. Супер-пупер аппы
Поиск информации агрегируется в супераппах (да, chatgpt - тоже суперапп). Думаю, года через 3-4 около 80% всей потребляемой информации будет приходиться на ~10 супераппов (пара соцсетей, мессенджер, маркетплейс, банк и может еще пара сервисов). И сейчас многие пробуют таким супераппом стать или усилить существующий апп

Этот год запомнился попыткой WB стать супераппом: они купили Рив Гош, тревел-оператора Fun&Sun, строят отель в Египте, ну и конечно запустили Wibes (фото 9)

Еще Яндекс.Go не так заметно добавил много новых сервисов (бери заряд, межгород, аптеки, помощник) и кросс-сервисного ai-помощника, пока посмотреть можно через лист ожидания (фото 10)

Ничего не имею против супераппов - это хороший способ привлекать и монетизировать аудиторию. Посмотрим, что из всего этого выйдет 🍿

Дайте знать, интересно ли в канале читать не только про ML, но и про продукт

❤️ - кайф и про продукт
👍 - норм, если не слишком часто
👎 - только ML, только хардкор

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤82👍17👎8⚡5

3.33K views09:36

ML for Value / Ваня Максимов

[3/3] Тщетные надежды и мечты

Очень надеялся, что в рексис или поиске будет прорыв в этих темах в 2025, но он пока не случился

1. Economic recsys research
А именно, внятное объединение recsys + pricing/promo в единую систему

Даже в самом простом виде: продавец дал скидку 30%, но в кандидаты товар чаще попадать не стал, тк обычные двубашенный кандген ничего про скидку не знает

В более сложном: мы можем сами давать скидку + наливать трафик на товар рекомендациями. Как правило, просто скидка на не самый популярный товар не работает, тк никто о ней не знает. А наливание трафика без скидок - непонятно, в чем доп вэлью (и прирост конверсий) пользователя

2. Крутые решения по сбору наборов/образов

В сопутствующих товарах все еще рулят статистические методы. А в визуальной сопутке (одежда) дальше статьи 2017 года от ASOS на базе сближения векторов товаров от картиночного энкодера, мир особо не продвинулся

3. Long-term eval
- Почти все текущие датасеты имеют feedback loop: надо предсказать позитивы, смещенные на то, что показывала прод модель рекомендаций
- Все же мы эвалим точность next action или в лучшем случае actions за последующие 1-2 недели. А вот long-term эффект на LTV считает мало кто и особо про это не рассказывают (тут конечно nda, все дела)
- RL в recsys, который мог бы все это решить, все же пока скорее мертв в нашей сфере 💀

А на какие прорывы в 2026г надеетесь вы?

🔥15👍3

2.7K viewsedited 09:16

ML for Value / Ваня Максимов

Middle+ ML engineers ко мне в команду рекомендаций Я.Маркета (3 вакансии)
300-400к руб на руки
Москва, Спб или remote
*если вы senior - тоже пишите, договоримся)

Наша команда рекомендаций Яндекс.Маркета делает персональные рекомендации товаров на главной странице, подбирает похожие и сопутствующие товары, персонализирует поиск, crm-коммуникации и другие поверхности. Мы - бизнесовая команда, которая приносит прямой прирост выручки/прибыли компании в АВ-тестах. Баланс бизнес-рисерч у нас 80-20

Сейчас мы ищем уверенных ML инженеров на 3 трека: нейросетевые рекомендации, более классический recsys + discovery, СRM-персонализация.
Внутри команды со временем трек можно менять, это скорее фокус на ближайшие полгода

1. Нейросетевые рекомендации
Предстоит работать в первую очередь над трансформерной моделью ARGUS-8k, глубоко погружаться в архитектуру

- Добавление новых входных данных для нейросетей: поисковые запросы, новые типы действий (шеринг ссылки на товар), фичи пользователей и тп
- Эксперименты с эмбеддингом товара: что из текстового описания и характеристик использовать, как учесть картинки товаров, semantic id и дп
- Эксперименты с архитектурой: добавление отдельной головы под новый таргет, изменение лосса и тп
- Адаптация моделей под сценарии: рекомендации на главной странице, товары-аналоги (учет контекста основного товара), поиск (учет контекста поискового запроса)
- Анализ наших данных и поиск точек роста в ML-моделях через новые таргеты, входные данные или фичи

2. RecSys и Discovery
Нужно оптимизировать не только количество действий пользователя в моменте (заказы, корзины и тп), но и учитывать юнит экономику товара
+ оптимизировать долгосрочный LTV пользователя. С нейронками работать тоже нужно, но без настолько глубокого погружения как в выкансии выше: и BERT-ы для похожих товаров учить, и LLM-ки применять, и многое другое.
Основы нашей архитектуры рекомендаций можно посмотреть в докладе на highload

- Эксперименты с таргетом ранжирующих моделей: как учесть юнит экономику товаров? как балансировать текущий интерес и новые discovery категории для пользователя?
- Discovery брендов: например, как любителям одежды показывать новые фэшн-бренды?
- Lifelong рекомендации: как запомнить релевантные интересы пользователя из далекого прошлого? Купил сноуборд 1,5 года назад (интерес/хобби - катание на сноуборде) -> рекомендуем ботинки для сноуборда или горнолыжный шлем сейчас
- Развитие моделей для подбора товаров-аналогов: коллаборативная фильтрация, статистическая со-встречаемость (PMI, swing, ...), BERT и тп
- Внедрять и улучшать LLM для рекомендаций
- Анализ наших данных и поиск точек роста в ML-моделях через новые таргеты, фичи или бизнес-логику

3. Персонализация CRM
- Строить ML-модели склонности к покупке категорий и брендов (Catboost, ALS, LightFM, трансформерные модели)
- Uplift-модели для коммуникаций с пользователем
- Определять персональную контактную политику (как часто коммуницировать? в какие дни и время?)
- Запускать АВ-тесты и влиять на бизнес-метрики
- Анализ наших данных и поиск точек роста в ML-моделях через новые таргеты, фичи или бизнес-логику

Что жду от кандидата
- Опыт работы в ML/DL от 1 года
- Python, Airflow
- SQL
- A/B тестирование и статистика
- Классический ML: catboost и способы генерации фич, ml-метрики
- Базовые знания в DL: эмбеддинги, типы слоев, функции активации, attention
- (доп для DL) Глубокое понимание нейросетей в NLP или RecSys: BERT-подобные модели

Будет плюсом
- Продакшен опыт работы с задачами поиска или рекомендаций
- Опыт работы с LLM: rag, sgr, so
- (доп для DL) Опыт с нейросетевыеми моделями рекомендаций: SASRec, HSTU

🔤 Резюме можно присылать напрямую мне в лс - @Ivan_maksimov

UPD 22 янв. Спасибо большое всем, кто откликнулся! Я не ожидал, что будет так много желающих: на ближайшие пару недель мы заняли все слоты собеседующих:) Поэтому временно резюме больше не принимаю, чтобы оперативнее отсобесить текущий пул кандидатов. Если откроем найм вновь - обязательно сообщу 😊

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

ARGUS: как масштабировать рекомендательные трансформеры

Привет! Меня зовут Кирилл Хрыльченко. Я руковожу командой, которая занимается R&D для рекомендательных технологий в Яндексе. Одна из наших основных задач — развивать...

1🔥28❤12👍10😱1

3.78K viewsedited 07:34

ML for Value / Ваня Максимов

Не проводи АВ-тест, пока не прочитаешь этот пост
Да-да, это кликбейтный заголовок)

Остановись на минутку. Вероятно, прямо сейчас у тебя идет какой-то АВ-тест. Вот скажи, зачем ты его проводишь?
Вроде понятно, что это нужно для честного замера метрик. Но зачем их честно замерять? Попробуй ответить на несколько подряд идущих "Зачем?"

Не только же для аналитического удовольствия мы АВ-тесты крутим 😅

А зачем нужны АВ-тесты на мой взгляд, можно почитать ниже:

1. Не катить в прод красные фичи с падением бизнес-мерик + находить баги
Все хотят новой фичей нанести благо компании (все же, да?). Но по ходу написания фич периодически вылезают проблемы: забыли корнер кейс, не рассчитали нагрузку, отсортировали реком ленту в обратном порядке (тут и я грешен) - все это не всегда можно отловить на ручном/авто-тестировании. АВ как финальный босс покажет явные слабости и баги

2. Не катить в прод серые фичи без изменения метрик = сильно снижаем тех долг и упрощаем систему
Это нас частично избавляет от напиливания фич ради фичей, а не реальной пользы. Плюс, меньше кода в проде - проще система, быстрее внедрять изменения и меньше времени на тех долг. По сути, экономия на часах разработки ну или на токенах ai-агентов, если вы уже в будущем, где они пишут подакшен код)

3. Понимать, что работает, а что нет = выявлять направления развития
Если просто делать тикеты без оценки эффекта, то не получится узнать, что реально дает доп метрики и на чем стоит фокусироваться. Можно год оптимизировать UI и гордо говорить, что мы молодцы. А можно посмотреть на результаты пары АВ и увидеть, что конверсия от этого прекрасного UI не меняется - гораздо раньше переключиться на что-то другое

4. Оценивать команды по реальному вкладу
Я сторонник того, что практически любую метрику можно свести к итоговому эффекту на выручку/прибыль компании. Соответственно, работу любой команды над ее метрикой можно свести к влиянию на выручку/прибыль = легко оценить их вклад и сравнить между собой

Я знаю единственный кейс, где это и правда сложно: команды, которые строят совсем новые направления, такие мини-стартапы внутри компании. И то только потому, что их влияние долгосрочное, а не в моменте. Но и его оценить можно (существует же оценка стоимости стартапов как-никак)

💬 Можете поспорить со мной про DWH, BI, поддержку и другие команды, кого якобы "нельзя оценить в приросте денег компании" в комментариях:)

❤16👍9🔥6🗿3💅2

3.42K viewsedited 11:12

ML for Value / Ваня Максимов

LLM долгосрочные интересы пользователя

Понемногу LLM-ки находят полезное применение в рекомендациях!

Обычная реком система упрощенно устроена так:
- Модель на короткой realtime истории пользователя (SLIM, SASRec, …) вытаскивает товары текущего интереса
- Модель на очень длинной offline истории пользователя (часто ALS, LightFM) вытаскивает некие долгосрочные интересы
- Их результаты смешиваются и переранжируются

Есть гипотеза, что кусочек с длинной историей можно обрабатывать LLM-кой и вытаскивать оттуда доп профит!

Отчасти такой подход сработал в Taobao (их модель RecGPT v2). Ну и мы в Я.Маркете тоже внедрили свою адаптацию - Влад из моей команды недавно рассказал об этом на ML Party

Подход относительно простой, но с кучей подводных камней: о них как раз в нашем докладе 😎

❤8👍6🔥4😎1

2.57K views08:07

About

Blog

Apps

Platform