Kantor.AI
11.7K subscribers
157 photos
13 videos
5 files
197 links
Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap

РКН: 5140322136
Download Telegram
Kantor.AI
Почему MLщики не торгуют и правда ли это На лекциях часто спрашивают, почему MLщики не идут торговать на биржу с помощью алгоритмов. Единичные примеры разумеется есть и их все знают (даже те, кто задают эти вопросы на лекции))). Но массового явления не наблюдается.…
Дальнейшие изыскания привели к интересным находкам. Первая - что есть целое направление инфобиза про как заниматься трейдингом на питоне)) Ценники на доступ к материалом с первого же этапа солидные, из чего возникает гипотеза, что дальше может быть какой-то офер на 25/50/100к. Так что как минимум можно сказать, что заработать на трейдинге можно независимо от успешности трейдинга, главное, чтобы торговали при этом не вы. И помимо совсем примитивных вариантов в духе предложений ботов в комментах тг каналов, есть чуть более продвинутые штуки с питончиком и прохладными лозунгами типа "Join 1,510 alumni that are using Python to make money"
😁22🤩3💯2
Кроме того, я вспомнил, что знакомился много лет назад с Георгием Черемовским, фаундером Wunderfund ( wunderfund.io ). От него я узнал, что они запустили соревнование как раз для тех, кому интересно применять ML в трейдинге. И в нем можно сейчас поучаствовать: wundernn.io , $13600 призового фонда, срок проведения до 1 декабря
🤡50😁15🔥11👎62
Про GPT в Алисе

Бывает, скажешь что-нибудь эдакое Алисе — например, ругнешься невзначай в ответ на её «в данную минуту на улице плюс шесть» в сентябре, а она подхватит и ответит как живая. С развитием больших языковых моделей это хоть и приятно, но не удивительно. Но вопрос-то в другом: насколько в ней действительно «сидит» GPT, а где всё ещё работают старые сценарные схемы?

На прошедшем big tech night 12 сентября как раз был доклад Павла Капли, руководителя продуктовой разработки Алисы, посвящённый этой теме. Выделил для себя главное:

1. Раньше Алиса жила на сценариях: «услышала intent → выбрала готовый ответ».

2. Теперь команда двигается к агентности: ИИ сам строит логику решения задачи, вызывает нужные инструменты по шагам, а не идёт по заранее заданным веткам.

3. Первые прототипы работали по 15 секунд на запрос, но инженерная оптимизация позволила добиться скорости и стабильности.

4. Результаты внедрения на ТВ-станциях: перезапросы ↓ 11,41 %, ошибки «извините» ↓ 16,09 %, «не смогла» ↓ 15,58 %.

Итог простой: GPT внутри Алисы не только работает, но и улучшает пользовательские метрики и даёт системе возможность понимать сложные команды вроде «включи Титаник на громкости 30». Если хотите узнать больше об архитектурной революции в Алисе — смотрите запись доклада вот тут.
35👍15😁4🤡2
Если бы вы нанимали Chief Data Officer'а в большую компанию, что бы вы ожидали от него и что спрашивали на входе?
😁194👍1
А теперь представьте, что вы выбираете, в какую компанию пойти работать как Chief Data Officer. На что вы бы обращали внимание? (Помимо зарплаты и в каком городе офис))
😁9😈2👍1
Продолжая тему соревнований: МТС в своем канале пишет, что на их True Tech Champ можно будет как порешать задачки на алгоритмы, так и поучаствовать в битве роботов. Выглядит как довольно неплохой способ развлечься :)

По своему опыту с МТС True Tech проектами могу сказать, что коллеги очень круто вкладываются в проведение True Tech Champ и True Tech Conf, так что должно быть классно.
10🤔5👍1👎1
Forwarded from МТС True Tech Champ
МТС True Tech Champ 2025: измерение технологий

Запускаем третий сезон ИТ-чемпионата по программированию! В этом году он станет еще масштабнее, а задания — сложнее. Листай карточки, чтобы узнать подробности. Рассказали о треках, формате соревнований, призовом фонде и программе офлайн-мероприятия.

Успей зарегистрироваться до 20 октября, если планируешь участвовать 😉
13👍2🔥1
Визуализация, которой пользуются: правила для составления дашбордов

Красивый дашборд, все кивают, а решение принимают интуитивно. Видели? Я видел десятки раз. Проблема не в данных, а в том, что экран не отвечает на управленческий вопрос.

Как это починить:

1️⃣ Сначала вопрос, потом график. Что именно хотим решить: перераспределить бюджет, снять риск, ускорить воронку. Если вопроса нет, втыкание в дашборд в 90% случаев только ест время.

2️⃣ Один экран — один тезис. Если тезисов два, это два экрана. Концентрация конечна.

3️⃣ Единицы и масштабы без сюрпризов. Подписи в явных единицах, проценты форматированы, шкала с нуля, если это не разрушает смысл.

4️⃣ Сравнение обязательно. Вчера, план, соседний кластер. Без контекста цифра - это просто красивая цифра.

5️⃣ Действие в зависимости от данных. Внизу экрана if-else: если метрика падает - что делаем завтра, если растет - что усиливаем.

Практические проверки, которые реально помогают:

⚠️ Если смысл не считывается за 5 секунд, меняем визуал или выносим тезис в заголовок.

⚠️ Если по информации на экране нельзя принять решение, убираем декоративный шум и добавляем то, чего не хватает для принятия решения :)

⚠️ Если спорите о цифрах, а не о действиях, значит нет понятной операционализации метрики.

К сожалению, на совещаниях и комитетах, где уже нужно принять 5-10 решений за час-два, уже некогда копать. Если из вашего дашборда непонятно, что делать дальше, на этих встречах будут смотреть не на него, а на экспрессивность каждого оратора за столом и заботливо подготовленные и положенные на слайды графики, а значит решение станет еще дальше от реальных данных и появится лишний простор для манипуляций. Дашборды работают, когда вся организация использует как источник информации именно одни и те же дашборды, а не десяток различных картинок из десятка различных презентаций десятка заинтересованных лиц.
1💯31👍11🔥85
Как считать эффект от AI без магии

"Модель повысит прибыль на X процентов". Звучит бодро, но что именно считать и как не самообмануться? 🤔

Много раз наблюдал у DSов кейс: команда принесла красивый AUC и демо. Далее звучат вопросы руководителя: где деньги, какие риски и срок окупаемости? И тут все резко усложняется.

Если коротко, рабочая схема такая:

🎯 Сформулируйте бизнес-единицу эффекта: деньги / время / риск. Пример: плюс рубли к выручке, минус часы операции, минус вероятность дефекта.

🔗 Привяжите модель к решению: какое действие изменится? (раньше звонили всем - теперь звоним топ 20 процентов скоринга)

🧮 Посчитайте дельту: uplift к текущему подходу.

🧱 Оцените инфраструктурные издержки: железо, лицензии, люди, поддержка, деградация качества и дальнейшая поддержка.

🧪 Сделайте контрольный A/B-эксперимент, длительность не меньше одного бизнес цикла и достаточная для статзначимости допустимого для бизнеса прироста (как минимум покрывающего затраты, но обычно - дающего хороший ROI).

📊 Финал: P&L табличка на 12 месяцев: эффект - затраты = маржа. Сценарии: базовый, оптимистичный, пессимистичный.

Чудес не бывает: крутая модель без внедрения в процессы = просто презентация с красивыми картинками, а даже простая эвристика, встроенная в бизнес-процесс может давать реальный прирост денег 💸 Выбор, что делать (и что не делать) в основном диктуется в коммерческой компании экономикой.

Как вы сейчас считаете экономику своих ML внедрений? Что чаще всего стреляет в ногу - доступность и качество данных, точность моделей, процессы или ожидания?
23👍11🫡8
Истории успеха - это часто истории выживших, уверовавших в себя после подмены причин и следствий 🤔

Читаешь или слушаешь: человек «поверил в себя», сделал «смелый шаг» - и вот она, карьера/экзит/прорыв. Красиво. Но за кадром остаются десятки тех, кто сделал то же самое и не взлетел. Мы читаем не правило, а исключение, у которого всё совпало: контекст, тайминг, люди рядом, удача.

Пара наблюдений из практики:

- Сверяйте урок с распределением, а не с яркой биографией. Если тезис не выдерживает «а что с теми, кто делал так же, но…», перед вами байка, а не принцип.

- Ищите контр-примеры. «Уровень менеджера измеряется стоимостью его ошибки» - звучит броско, пока не вспомнишь авиадиспетчера, оператора на АЭС, хирурга. Там ставка ошибки запредельна, но это не «самые большие менеджеры». Значит, метрика - мимо.

- Проверяйте переносимость правил. Лозунг «рискуй» в венчуре и в операционке критической инфраструктуры - разные виды спорта.

- Отделяйте агентность от везения. Да, усилия важны. Но одинаковые усилия в разных контекстах дают разный результат.

Ещё один неприятный угол: легче рассуждать о «силе воли» и «правильных решениях», когда тебя не прижимало жизнью. Кто не попадал жёстко, часто недооценивает роль случайности, здоровья, семейных обстоятельств, войны, регуляторики - всего, что сильнее любого «майндсета».

Это не повод перестать вдохновляться примерами. Просто держим в голове фильтр: история ≠ инструкция, яркая судьба ≠ доказательство правила. И главное - если вы сделали всё, что могли, а не получилось, это не автоматически «ваша вина». В игре всегда много факторов, часть из них вне нашего контроля.

А какие «красивые правила» вам приходилось пересматривать после столкновения с реальностью?
👍70💯33🔥2815
В этом году меня позвали в экспертный совет премии RuCode и я сразу согласился, во многом из интереса к тому, какие будут заявки, кто будет подаваться и с какими проектами :)

Оказалось, у премии аж 11 номинаций за популяризацию и использование ИИ. Так что возможностей проявить себя у участников много.

Поучаствовать могут:

образовательные и научные организации

преподаватели школ, СПО и вузов

школьники и студенты

разработчики и исследователи

популяризаторы науки и блогеры


На тему пробовать/не пробовать участвовать: раньше я довольно сдержанно относился ко всякого рода премиям, пока одна из них не дала мне классную карьерную возможность. Также может получиться и у вас: генеральный партнер премии - компания MWS (отвечающая за IT в экосистеме МТС), также в партнерах есть Сбер и Астра, так что есть возможность не только потешить эго и испытать соревновательный азарт, но и засветиться на HR-радарах крупных компаний

Заявку можно заполнить на сайте до 20 октября ⚡️
18🔥8🤯5👍4🤔2
Возвращаюсь сейчас с data driven top 100 из Черногории (очень необычная конфа для топов аналитики и CDO без заготовленных докладов с максимумом нетворка и обсуждения реально интересных для руководителя тем). Вспомнил, насколько ж это круто три дня подряд плотно пообщаться с умными людьми из твоей сферы и с похожим бэкграундом.

Как отрефлексирую, напишу подробнее, но главное - решил еще больше времени уделять общению с коллегами по цеху, т.к. три дня конфы показали, насколько это дает и много ценных идей, и хорошую такую моральную поддержку :)
🔥5617👍7
Как поступить в ШАД: часть 1

Все знают, что в Школу Анализа Данных Яндекса очень непросто поступить, но многие все равно туда очень хотят. Проблема в чем: желающих так много, что просто поговорить с ними недостаточно, приходится делать вступительные, которые за долгое время стали многоступенчатыми. Вопрос в том, что спрашивать на таких вступительных. Коллеги из Яндекса, когда много лет назад вводили экзамен, поступили просто: начали давать задачки на высшмат и алгоритмы, потому что это вроде как неплохо знать до обучения, и потому что понятно как проверять и дает относительно честный способ для ранжирования.

Отдельный момент, что человек, который разложит функцию в степенной ряд без ошибок, и человек, который где-то налажает в арифметике, не факт что имеют разный потенциал в изучении анализа данных и ML в частности. Но тут логика в другом: поступающих так много, что просто нужна какая-то процедура ранжирования, которая будет более-менее стабильна и к ней можно будет подготовиться.

Раньше подготовка (рассказываю на примере однокурсника с Физтеха) была устроена так: смотришь темы экзамена, обкладываешься учебниками по матану, линалу, теорверу и алгоритмам, и вспоминаешь изученное на Физтехе или в МГУ (сюрприз, после появления письменного экзамена просто того что ты там учился и все расшарил могло не хватить, надо было готовиться). И даже тогда были "залетные" ребята из других вузов, но их было мало и часто готовились они по принципу "иду к преподу с мехмата и прошу подсказать, что читать и что разбирать, чтобы такое решить". Надо заметить, что если препода с условного  мехмата такое спрашивал кто-то из, например, РУДН или МИСиС, препод обычно не отказывал в помощи (в тех историях, которые знаю). Потому что это настолько редкая и уникальная ситуация, что человек тянется к настолько дополнительным знаниям, что помочь такому человеку очень хочется.

Продолжение следует
🔥2919