This media is not supported in your browser
VIEW IN TELEGRAM
Привет, это Алексей Чубуков, аналитик группы поиска и назначения водителей в Яндекс Такси. В этом посте я расскажу, как наша команда на 13% снизила нагрузку на сервис.
В 2023 году мы запустили в прод ML-модель, которая прогнозировала вероятность заказа на этапе пина (когда пользователь уже ввёл адрес, но ещё не нажал «Заказать»). Если показатель был высокий, система заранее начинала искать водителя, чтобы ускорить подачу.
В своё время эта фича доказала эффективность на экспериментах, но с тех пор рынок такси сильно изменился. У нас были сомнения насчёт того, сколько пользы модель приносит теперь и не стоит ли выделить эти вычислительные ресурсы на что-то другое.
Допустим, у нас есть два пользователя: Таня (попала в тестовую группу) и Саша (попал в контрольную группу). Они работают в одном бизнес-центре и вечером после работы хотят уехать домой. Ребята одновременно нажимают на кнопку «Заказать», но Таня получает водителя чуть быстрее, потому что находится в тестовой группе, и ей назначается ближайший исполнитель. А Саше достаётся ближайший оставшийся исполнитель, который может быть далеко. Саша недоволен, он отменяет такси и едет домой на метро.
Это хороший пример сетевого эффекта, когда одна группа влияет на другую и меняет результаты исследования.
Нам не подходит рандомизация на уровне пользователя, поэтому мы начали делить группы по зоне и времени. Например, в Казани с 08:00 до 09:00 мы раскатывали на 100% пользователей контрольный алгоритм, а с 09:00 до 10:00 — тестовый. И так далее, чередуя периоды. Таким образом, внутри одного временного окна все пользователи находились в одинаковых условиях, и сетевые эффекты были сведены к минимуму.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26❤11👍10❤🔥2😢1👾1
Уже 12 сентября в Москве состоится главный IT-ивент года — big tech night. Яндекс, Сбер, X5, Т-Банк и Lamoda откроют двери своих офисов для тех, кто любит технологии.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🔥4👀2
Привет! На связи Николай Олигеров. Сейчас я работаю в Яндекс Путешествиях, а до этого был продуктовым аналитиком в Лавке — именно про неё будет моя история. Однажды мы с командой поняли, что больше не можем доверять своей событийной аналитике: параметры терялись, обсуждения затягивались, триггеры срабатывали не тогда, когда это было нужно.
На верхнем уровне всё устроено довольно просто:
Почему выбрали Яндекс AppMetrica: по сути, это self-service-аналитика с минимальным порогом входа для менеджеров. Параметры приходят в JSON-структуре, легко парсятся, а события покрывают весь пользовательский путь. Это сильно ускоряет скоринг фич и любые продуктовые исследования.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10🔥5👏4👍2
Привет! Это важный пост для аналитиков: мы зафиналили список выступлений и спикеров на Data Driven 2025. Это большая конференция от бизнес-группы Поиск и Рекламные технологии: обсудим, как аналитику влиять на бизнес, искать новые точки роста и определять цифровое будущее нашего мира.
Собираемся 20 сентября в Москве и онлайн. Будут доклады наших экспертов, игры, нетворкинг и воркшоп. Для самых активных участников мы уже приготовили подарки: станции с Алисой и радиоуправляемых роботов.
Доклады для продуктовых, data-аналитиков и Data Scientists:
Доклады для data-инженеров, системных и BI-аналитиков:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤5👍3
Об этом нам рассказали ребята из Яндекс Такси: старший ML-разработчик Михаил Суворов и аналитик группы поиска и назначения водителей Алексей Чубуков.
Когда вы выбираете точку назначения в Яндекс Такси, вы сразу же видите примерное время подачи по каждому тарифу. Это и есть estimated time of arrival, или просто ETA. А от того, насколько корректно мы его посчитаем, зависит, какой тариф вы выберете. И поедете ли на такси вообще.
Действительно, можно использовать эвристики. Например, брать последние статистики времени подачи по району и времени суток или оценивать время по ближайшему к пользователю водителю.
Эвристики дают неплохую оценку, но ML помогает нам сделать её ещё точнее, так как мы лучше учитываем актуальное состояние маркетплейса. А нам важно, где именно окажутся свободные водители через 30 секунд и какие заказы они перехватят.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15❤5👍2✍1😍1🆒1