Yandex for Analytics
7.19K subscribers
358 photos
22 videos
133 links
Канал для аналитиков от Яндекса. Рассказываем о событиях, обсуждаем кейсы, знакомимся с командами и внимательно смотрим на данные.

Чат: t.me/YandexDataDriven
Вопросы: @Ekaterina_Lyagina

Все каналы Яндекса по стекам: https://xn--r1a.website/addlist/Hrq31w2p1vUyOGZi
Download Telegram
Как ML помогает победить неопределённость (и уверенно нажать на кнопку заказа)

Об этом нам рассказали ребята из Яндекс Такси: старший ML-разработчик Михаил Суворов и аналитик группы поиска и назначения водителей Алексей Чубуков.

💎 Для начала определим, в чём проблема. А если вы и так всё знаете про ETA, сразу переходите к карточкам — там только ML.

🈂️ Что такое ETA

Когда вы выбираете точку назначения в Яндекс Такси, вы сразу же видите примерное время подачи по каждому тарифу. Это и есть estimated time of arrival, или просто ETA. А от того, насколько корректно мы его посчитаем, зависит, какой тариф вы выберете. И поедете ли на такси вообще.

🈂️ Почему рассчитать ETA так сложно

🔵 Это всегда прогноз. Когда пользователь смотрит на список тарифов, ни один водитель ещё не взял его заказ
🔵 Мы работаем с очень динамичной системой. На дороге всё меняется ежесекундно. Кто-то берётся за заказы, кто-то их заканчивает, а другие успевают далеко уехать
🔵 Даже водители по соседству не всегда доступны. Возможно, у них включён режим, по которому они получают заказы только в направлении дома (мы называем это «репозишен»)
🔵 У нас высокая нагрузка на систему. Это сотни тысяч сессий/прогнозов, которые должны обновляться за доли секунды
🔵 Мы двусторонний маркетплейс. У водителя есть выбор, и он может не взять ваш заказ, а мы продолжим искать другую машину

🈂️ Почему бы не решить эти проблемы без ML

Действительно, можно использовать эвристики. Например, брать последние статистики времени подачи по району и времени суток или оценивать время по ближайшему к пользователю водителю.

Эвристики дают неплохую оценку, но ML помогает нам сделать её ещё точнее, так как мы лучше учитываем актуальное состояние маркетплейса. А нам важно, где именно окажутся свободные водители через 30 секунд и какие заказы они перехватят.

👳 Поэтому мы и внедрили ML для предсказания ETA. Об этом в карточках

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥155👍21😍1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
📦 Бережём нервы курьеров и горячую пиццу клиентов

Всем привет! Это Дмитрий Ефимов, руководитель отдела эффективности и аналитики логистики в Яндекс Еде. В посте расскажу про один из наших ключевых алгоритмов — диспатч и то, как мы сделали его ещё умнее с помощью отложки, а заодно улучшили КПД доставки. Объясню, как такие алгоритмы работают и почему это выгодно всем: и бизнесу, и курьерам, и клиентам.

Что это вообще такое

Мы оптимизируем время доставки с помощью диспатча. Это алгоритм, который выбирает исполнителя под конкретный заказ. Также у нас есть система отложки — механизм, который решает, стоит ли назначать курьера прямо сейчас или лучше подождать. Раньше всё было просто. Есть заказ → есть свободный курьер рядом → идеально, назначаем! Но появляется риск приехать слишком рано и ждать, пока приготовят заказ. Это неэффективно: курьер теряет время, сервис теряет деньги, а еда остывает.

Сейчас под капотом работает более хитрый алгоритм, который учитывает:

🔵 Когда приготовят еду

🔵 Время, за которое курьер доедет до ресторана

🔵 Сколько курьеров и заказов в районе

Теперь, если мы знаем, что еда не будет готова, мы откладываем назначение исполнителя до следующего цикла расчёта, который происходит каждые 10–20 секунд. Это выгодно всем:

«Если мы захолдили курьера, у него, скорее всего, найдётся более хороший заказ. И очень часто за этот срок происходит именно перевыбор курьера».


Как мы тестируем такие штуки

С помощью свитчбэков — попеременного включения и выключения фичи каждые 2 часа. Это единственный способ объективно оценить изменения в логистике, где обычные A/B-тесты не работают из-за сетевых эффектов. Сначала аккуратно проверяем на городах-миллионниках (но не в Москве и Питере, чтобы не устроить коллапс), потом — на маленьких городах.

И что в итоге

🔵 В пиковые часы, когда курьеров не хватает, отложка экономит до 2 минут на каждый заказ

🔵 Это дало нам до 1,5% экономии времени в целом

🔵 Даже в масштабах полугода мы сберегли миллионы лишних часов

Если вам интересно, как мы внедряем такие улучшения и делаем логистику эффективнее, смотрите полную версию моего доклада на ютубе и в VK Видео.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥139👍4❤‍🔥2🆒2💘1
😎 big tech night online

Уже скоро мы встретимся в Москве. Если вы не успели зарегистрироваться на офлайн, не переживайте: всё самое важное будет доступно! Мы подготовили онлайн-студию с контентом, отличающимся от офлайн-формата.

🙌 Вас ждут выступления спикеров из компаний-организаторов и лидеров индустрии. Представим разные форматы: дискуссии, интервью, истории разработчиков и интерактив с аудиторией.

Программа включает две студии:

🤯 Hard — обсуждение управления командами, использования ИИ в разработке и реализации крупных проектов.

🤯 Soft — развлекательное шоу с неформальной атмосферой, где разработчики поделятся своими историями, хобби и side-проектами.

Если хотите охватить как можно больше интересных и полезных тем, можно переключаться между студиями.

📆 Онлайн-трансляция пройдёт 12 сентября с 18:00 до 21:00 мск. Напоминаем, что трансляция начнётся в день мероприятия, но рекомендуем заранее отметить дату в календаре!

😌 Зарегистрируйтесь на сайте, чтобы получить ссылку на трансляцию, и посмотрите программу онлайн-студии.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
3
🧑‍💻 Проводим А/В-тесты, ставим опыты, кастомизируем сайты

Мы принесли вам полезный инструмент — Varioqub. Его разработали ребята из Яндекса, чтобы удобно проводить А/В-тесты и кастомизировать их под разную аудиторию.

В основу инструмента легли методы и подходы, которые мы используем уже 15 лет. А лучше познакомиться с ним помогут цифры:

🔵 ≈7000 сайтов и приложений запустили в сервисе хотя бы один А/В-тест
🔵 ≈40 000 А/В-экспериментов проведено в нём за всё время
🔵 ≈500 проходят прямо сейчас

Varioqub позволяет создавать самые разные эксперименты: от изменения текста и цвета кнопок до редиректа, добавления виджетов и рекламных блоков. По итогам опытов с фичами инструмент создаёт подробный и наглядный отчёт.

🧑‍💻 Решение уже готово к использованию — инструкции к подключению и открытый код лежит на гитхабе. И ждёт вас 😊

А для особо пытливых мы записали целый курс по инструменту и А/В-тестам. Смотрите полный плейлист в VK Видео.

Уже скоро мы расскажем про новые обновления и реальные кейсы с применением Varioqub. Следите за уведомлениями!

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
14🔥9👍7🐳3
😏 Начинаем трансляцию через час!

Совсем скоро офисы Яндекса, Сбера, X5, Т-Банка и Lamoda откроют двери для гостей. Но если вы не можете прийти лично, скорее подключайтесь к онлайн-студии и смотрите выступления экспертов из индустрии, интересные дискуссии, интервью и рассказы разработчиков.

Онлайн-трансляция будет с 18:00 до 21:00 мск
Программа находится тут

Присоединяйтесь к нам и окунитесь в мир технологий!

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62
This media is not supported in your browser
VIEW IN TELEGRAM
3🔥2
🧑‍💻 Как аналитика и исследования дополняют друг друга

Привет! Меня зовут Эльвира Демина. Я исследователь пользовательского опыта в отделе аналитики международных исследований бизнес-группы Поиск и Рекламные технологии. И если вы уже хотите спросить «У нас же есть команда маркетинговой аналитики, зачем нам ещё какие-то исследования?», то этот пост для вас. Давайте разбираться вместе.

Для чего нужны маркетинговые исследования

Чтобы помочь бизнесу понять мотивы пользователей. Аналитика показывает цифры и факты, а исследования объясняют причины, которые стоят за ними.

Получается, эти подходы дополняют друг друга

🈂️ Например, аналитика показывает, что 85% новых пользователей ушли от нас в первый месяц. И исследования как раз позволят поговорить с ними и узнать, почему так вышло. А ещё мы можем делать это в динамике (спустя 3, 6 или 12 месяцев), чтобы следить, меняются ли причины

🈂️ Другой пример — метрики конкурентов. Ведь аналитика работает только с нашими собственными показателями. А в исследовании мы одной анкетой можем спросить и своих пользователей, и чужих. И узнать, в чём мы сильнее, а в чём отстаём

Когда точно нужно проводить исследования

🈂️ Новый продукт. Представьте, что вам нужно запустить линейку подгузников или корма для животных. А в вашей команде ни у кого нет ни детей, ни питомцев. Вы в принципе не в курсе, что по-настоящему важно для вашей аудитории. Цена? Состав? Упаковка? Размер? Без разговоров с реальными людьми здесь не обойтись

🈂️ Тренды на рынке. Пока вы считали конкурентами компании А, B и C и следили за их метриками, на рынок могли ворваться новые игроки G, P и T. И перевернуть его с ног на голову. Регулярные исследования рынка позволят держать руку на пульсе

🈂️ Новый рынок. Ваш сервис экспресс-доставки продуктов пользуется популярностью. Но вы выходите в страны Средней Азии, и на фокус-группах выясняется, что люди не хотят им пользоваться. Почему? Здесь часто устраивают большие семейные посиделки. И людям кажется, что в сумку велокурьера не поместится достаточно продуктов, а значит, проще самим съездить в магазин на машине

🈂️ Эффективный маркетинг. Вы провели крутую кампанию, и ваша бабушка хвалит красивый ролик по ТВ. Это мило, но вам важно знать, увидела ли этот ролик именно ваша целевая аудитория. И изменили ли вы её отношение к себе

🈂️ Новый интерфейс. Вам и вашей команде дизайнеров все кнопки в приложении кажутся очевидными (вы жили этим проектом месяцами), а новому пользователю — нет. Исследования помогают посмотреть на продукт глазами того, кто видит его впервые

🈂️ Ребрендинг. Всегда неплохо получить взгляд со стороны. Чтобы выяснить, ваш новый логотип — это действительно сердечко или что-то более двусмысленное. И правильно ли вы выбрали цвет, чтобы вас не перепутали с другим брендом

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥312011❤‍🔥3👍1👏1🥴1
💠 Привет, это Yandex for Analytics

Здесь аналитики Яндекса рассказывают о своих командах и сервисах, над которыми работают. Внутри: реальные кейсы, гипотезы и методики. А ещё информация о предстоящих митапах и конференциях.

🔍 Давайте вместе смотреть, что скрывается за данными:

🈂️ Долгое путешествие от «кека» до «скуфа». Рассказываем про самые важные новые слова последних десяти лет

🈂️ Роль пет-проектов в вашем резюме. Поговорим, зачем в резюме кандидата должны быть личные проекты

🈂️ Как правильно лениться с пользой для дела. Объясняем, почему настоящая аналитическая лень — не про прокрастинацию, а про разумную экономию ресурсов

🈂️ Решаем и разбираем аналитические задачки. Это отличный способ не забывать базу и поддерживать форму

🈂️ Из науки в аналитику. Ирина Барских рассказала, как стать лидом аналитики после 5+ лет в науке и R&D-департаменте

Какие ещё каналы мы советуем:

💎 Yandex for Developers

💎 Yandex for ML

💎 Yandex for Teamleads

💎 Yandex for Analytics на ютубе

💎 «Яндекс для разработчиков» в VK

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍7🔥4🥰1😁1
🧑‍💻 Скучали по задачам? Предлагаем освежить в памяти математическую статистику

Недавно мы уже предлагали вам порассуждать про игральные кубики. В комментариях к посту вы заметили, что кубики бывают не только честные — учли это в новой задаче.

Продолжаем вспоминать базу вместе. На старт, внимание, решаем

У вас есть шестигранный игральный кубик. Вы бросаете его 120 раз. Значение 6 выпало 30 раз. Честный ли кубик вам достался?


🐚 Опубликовали правильный ответ с разбором. Но если вы видите задачу в первый раз, поделитесь своим решением в комментариях!

#задачи_для_аналитиков

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤‍🔥4🔥42
📆 Data Driven уже сегодня!

Мы собрали опытных аналитиков, чтобы поговорить о том, как влиять на бизнес, находить новые точки роста и определять цифровое будущее мира с помощью data-driven-подхода. Кстати, полную программу можно посмотреть на нашем сайте.

☁️ А для всех, кто не сможет посетить ивент вживую, мы запускаем прямые трансляции по стекам. Начнём в 12:00 мск. Заваривайте чай и подключайтесь!

Трек Data to Insights: доклады для продуктовых, data-аналитиков и data scientists

🔵 Наш сайт
🔵 VK Видео
🔵 Ютуб

Трек Data to Artifacts: доклады для data-инженеров, системных и BI-аналитиков

🔵 Наш сайт
🔵 VK Видео
🔵 Ютуб

Ещё в нашем чатике у вас есть возможность задать интересующий вопрос любому из докладчиков. Главное — добавить к сообщению хештег #вопрос_фамилия_спикера

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤‍🔥51
🫐 Был ли кубик честным? Давайте разбираться

Публикуем ответ на задачу, которую предложили вам в прошлую пятницу.

Чтобы описать все возможные варианты развития событий, сформулируем гипотезы:

🔵 Нулевая гипотеза (H₀). Кубик честный. Тогда вероятность выпадения 6 по определению равна отношению благоприятного исхода к количеству всех возможных исходов: p₀ = 1 / 6 ≈ 0,1667

🔵 Альтернативная гипотеза (H₁). Кубик нечестный. А значит, вероятность выпадения 6 не равна 1/6.

Если кубик честный, то его поведение подчиняется биномиальному распределению вероятностей, которое описывает количество успехов для фиксированного количества независимых испытаний с двумя возможными исходами: успех или неудача.

Посчитаем стандартную ошибку для биномиального распределения:

SE = sqrt (p₀ × (1 − p₀) / n) ≈ 0,034

Z-тест — классический статистический метод, с помощью которого можно проверить гипотезу о среднем значении в выборке. Он позволяет оценить, является ли статистически значимой разница между реальным и гипотетическим значением выборки.

Метрика, используемая для такой оценки, называется z-статистикой. Посчитаем её:

z = (p − p₀) / SE = (30 / 120 − 0,1667) / 0,034 ≈ 2,45

Чтобы сделать вывод о честности кубика, сравниваем z-статистику с критическим значением — табличной величиной, зависящей от желаемого уровня значимости. Популярная величина уровня значимости — 0,05, то есть 95% достоверности. Критическое значение для неё — 1,96.

|z| = 2,45 > 1,96

Это значит, что отличие статистически значимо. И наш кубик с большой вероятностью окажется нечестным:
6 выпадает чаще, чем ожидалось для честного кубика (p < 0,05).


Совет. В работе мы чаще всего используем готовые калькуляторы. Иногда полезно вспомнить, как они работают — это помогает лучше понимать границы применимости разных критериев.

Хотите ещё задачек? Поддержите нас лайками!

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3313❤‍🔥6🔥2💘2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Покажите класс в крупном IT-соревновании

Мы открыли регистрацию на восьмой Yandex Cup! Это международный чемпионат по программированию с финалом в Стамбуле. Призовой фонд в этом году составляет 12 миллионов рублей. Среди направлений соревнования есть «Аналитика». И ещё 5 вариантов, если вы спец на все руки.

Yandex Cup 2025 состоит из трёх этапов:

🔵 20–29 октября пройдёт пробный тур, где участники смогут познакомиться с платформой и форматом задач прошлых лет
🔵 2 ноября состоится квалификация, лучшие участники каждого направления пройдут в финал
🔵 Финал и церемония награждения Yandex Cup 2025 состоятся 5–7 декабря в Стамбуле

🛎 Полный список направлений, подробности и форма регистрации уже на сайте чемпионата. Успейте отправить заявку до 29 октября.

🗳 Надеемся увидеть вас среди победителей!

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
🧑‍💻 На стыке данных и стратегии

Привет! Это Рома Васильев, руководитель аналитики международного Поиска в Яндексе.

👳 В этих карточках я расскажу, как пришёл в аналитику и чем занимаюсь сейчас.

Подписывайтесь на мой канал: там я делюсь мыслями про карьеру и развитие в аналитике данных. Например, рассказываю, как сотруднику или руководителю подготовиться к ревью и чем харды на самом деле отличаются от софтов.

Подписывайтесь:
💬 @Yandex4Analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
21🔥12❤‍🔥6👍2👾1