Ошибки при внедрении Generative AI решений
Перевод статьи Chip Huyen - Common pitfalls when building generative AI applications
Chip Huyen, сооснователь Claypot AI, автор популярного блога и книги "Designing Machine Learning Systems", а также эксперт, не нуждающийся в дополнительном представлении среди ML-специалистов, опубликовала статью про основные ошибки при разработке и внедрении генеративных AI-решений. Составили для вас перевод.
Итак, самые распространенные ошибки:
Использование GenAI, когда он не нужен
GenAI часто применяют для задач, где традиционные методы эффективнее. Например, оптимизацию энергопотребления можно решить простым планированием действий в часы с низкими тарифами, а не через сложные LLM-модели. Многие компании ошибочно внедряют AI ради хайпа, игнорируя более дешевые и надежные решения, такие как линейное программирование или rule-based системы.
Эксперименты с GenAI должны включать анализ того, не добавляет ли их использование избыточной сложности и костов.
Путаница между «плохим продуктом» и «плохим AI»
Провалы AI-продуктов часто связаны не с технологией, а с плохим UX. Например, чат-бот Intuit изначально провалился из-за неочевидного интерфейса: пользователи не понимали, что ему писать. Решением стали подсказки с примерами вопросов, что резко улучшило вовлеченность.
Важно уделять большое внимание тому, как AI-решение может улучшить бизнес-процесс. Например, LinkedIn не сразу осознал, что для пользователей наиболее полезна не простая оценка их навыков и метча с интересной вакансией, а рекомендации по их улучшению. Самое важное - не модель, а то, как ваш продукт решает конкретные боли пользователей.
Начинать со слишком сложного
Многие команды усложняют систему, используя агентские фреймворки или векторные БД, когда достаточно простых взаимодействий через API. Например, выбор семантического кэширования вместо поиска по ключевым словам добавляет ненужные зависимости и ошибки.
Если внедрять сложные решения сразу, это добавляет избыточную сложность в логику системы и замедляет дебаггинг. Лучше начинать с минимально рабочего решения, а затем масштабировать, когда базовые принципы проверены и стабильны.
Переоценка раннего успеха
Первые 80% результата достигаются быстро, но последующие улучшения требуют непропорционально много усилий. Например, LinkedIn потратил 4 месяца на доводку продукта с 80% до 95% качества из-за борьбы с галлюцинациями.
Стартапы сталкиваются с аналогичными проблемами: компромиссы между точностью и скоростью, сложности в интерпретации запросов. Кроме того, изменения в API-моделях или их ненадежность могут «сломать» уже работающий продукт.
Отказ от человеческой оценки
Оценка с помощью AI не заменяет людей: автооценка зависит от промптов и могут быть субъективными. Например, если автооценка хвалит ответы, а пользователи их ненавидят, это сигнал пересмотреть метрики.
Ручная проверка 30–1000 примеров ежедневно помогает находить паттерны, которые алгоритмы пропускают. Как показал пример Intuit, даже небольшие изменения в интерфейсе, выявленные через обратную связь, кардинально меняют восприятие продукта.
Сила - в комбинации человеческих проверок и автооценки.
Краудсорсинг сценариев использования
Выбор сценариев использования GenAI решений без стратегии приводит к разрозненности и дублированию усилий. Компании создают множество однотипных решений (например, чат-ботов для Slack, помощников для кодинга, и text-to-SQL вариаций), но не фокусируются на высокоэффективных кейсах.
Без приоритизации по ROI команды тратят ресурсы на «удобные» задачи, а не на те, что приносят реальную ценность. Стратегия должна учитывать не только техническую реализуемость, но и влияние на бизнес-метрики.
***
Вот такие вот советы от Chip Huyen. Самое классное, что они полностью применимы и к классическому ML. Книга "Rules of ML" от Google - нетленна. А ее первое правило в особенности.
Что вы бы добавили к этим советам из своей практики?
Ваш @Reliable ML
#business #reliable_ml #llm #generative_ai
Перевод статьи Chip Huyen - Common pitfalls when building generative AI applications
Chip Huyen, сооснователь Claypot AI, автор популярного блога и книги "Designing Machine Learning Systems", а также эксперт, не нуждающийся в дополнительном представлении среди ML-специалистов, опубликовала статью про основные ошибки при разработке и внедрении генеративных AI-решений. Составили для вас перевод.
Итак, самые распространенные ошибки:
Использование GenAI, когда он не нужен
GenAI часто применяют для задач, где традиционные методы эффективнее. Например, оптимизацию энергопотребления можно решить простым планированием действий в часы с низкими тарифами, а не через сложные LLM-модели. Многие компании ошибочно внедряют AI ради хайпа, игнорируя более дешевые и надежные решения, такие как линейное программирование или rule-based системы.
Эксперименты с GenAI должны включать анализ того, не добавляет ли их использование избыточной сложности и костов.
Путаница между «плохим продуктом» и «плохим AI»
Провалы AI-продуктов часто связаны не с технологией, а с плохим UX. Например, чат-бот Intuit изначально провалился из-за неочевидного интерфейса: пользователи не понимали, что ему писать. Решением стали подсказки с примерами вопросов, что резко улучшило вовлеченность.
Важно уделять большое внимание тому, как AI-решение может улучшить бизнес-процесс. Например, LinkedIn не сразу осознал, что для пользователей наиболее полезна не простая оценка их навыков и метча с интересной вакансией, а рекомендации по их улучшению. Самое важное - не модель, а то, как ваш продукт решает конкретные боли пользователей.
Начинать со слишком сложного
Многие команды усложняют систему, используя агентские фреймворки или векторные БД, когда достаточно простых взаимодействий через API. Например, выбор семантического кэширования вместо поиска по ключевым словам добавляет ненужные зависимости и ошибки.
Если внедрять сложные решения сразу, это добавляет избыточную сложность в логику системы и замедляет дебаггинг. Лучше начинать с минимально рабочего решения, а затем масштабировать, когда базовые принципы проверены и стабильны.
Переоценка раннего успеха
Первые 80% результата достигаются быстро, но последующие улучшения требуют непропорционально много усилий. Например, LinkedIn потратил 4 месяца на доводку продукта с 80% до 95% качества из-за борьбы с галлюцинациями.
Стартапы сталкиваются с аналогичными проблемами: компромиссы между точностью и скоростью, сложности в интерпретации запросов. Кроме того, изменения в API-моделях или их ненадежность могут «сломать» уже работающий продукт.
Отказ от человеческой оценки
Оценка с помощью AI не заменяет людей: автооценка зависит от промптов и могут быть субъективными. Например, если автооценка хвалит ответы, а пользователи их ненавидят, это сигнал пересмотреть метрики.
Ручная проверка 30–1000 примеров ежедневно помогает находить паттерны, которые алгоритмы пропускают. Как показал пример Intuit, даже небольшие изменения в интерфейсе, выявленные через обратную связь, кардинально меняют восприятие продукта.
Сила - в комбинации человеческих проверок и автооценки.
Краудсорсинг сценариев использования
Выбор сценариев использования GenAI решений без стратегии приводит к разрозненности и дублированию усилий. Компании создают множество однотипных решений (например, чат-ботов для Slack, помощников для кодинга, и text-to-SQL вариаций), но не фокусируются на высокоэффективных кейсах.
Без приоритизации по ROI команды тратят ресурсы на «удобные» задачи, а не на те, что приносят реальную ценность. Стратегия должна учитывать не только техническую реализуемость, но и влияние на бизнес-метрики.
***
Вот такие вот советы от Chip Huyen. Самое классное, что они полностью применимы и к классическому ML. Книга "Rules of ML" от Google - нетленна. А ее первое правило в особенности.
Что вы бы добавили к этим советам из своей практики?
Ваш @Reliable ML
#business #reliable_ml #llm #generative_ai
🔥23👍13❤3❤🔥1😁1🤝1
Data Fest 2025 - Call for Papers
Собираем доклады на Reliable ML и Career
Дорогие друзья, уже месяц как наступила весна, а значит пора готовиться к Data Fest!
В этом году мы с Димой решили вложиться в 2 секции: Reliable ML и Career. Секции будут офлайн в Мск в конце мая.
Ждем от вас заявок на доклады!
Отправляйте их в форму сюда. Или - при любых вопросах - можно напрямую написать мне или Диме.
На чем хотим сфокусироваться в этом году?
Reliable ML - на земле все только и говорят об агентах и LLM, а кто уже внедрил, преодолел граблии написал костыли, измерил эффект и готов этим поделиться? Давайте поговорим о кейсах работы с LLM и агентами, а также о том, как повысить их надежность и полезность в реальных процессах.
Career - что меняется в карьерных навыках и ожиданиях от дата-ролей в связи с активным развитием больших языковых моделей? Может быть, появляются новые роли? Или какие-то роли, связанные с работой дата-специалистов, становятся критичными для успеха ML-проектов. Хотелось бы сконцентрироваться на том, что делать как работнику, так и работодателю в дивном новом мире.
Ждем ваших заявок!
Ваш @Reliable ML
#business #tech #reliable_ml #career #data_fest
Собираем доклады на Reliable ML и Career
Дорогие друзья, уже месяц как наступила весна, а значит пора готовиться к Data Fest!
В этом году мы с Димой решили вложиться в 2 секции: Reliable ML и Career. Секции будут офлайн в Мск в конце мая.
Ждем от вас заявок на доклады!
Отправляйте их в форму сюда. Или - при любых вопросах - можно напрямую написать мне или Диме.
На чем хотим сфокусироваться в этом году?
Reliable ML - на земле все только и говорят об агентах и LLM, а кто уже внедрил, преодолел грабли
Career - что меняется в карьерных навыках и ожиданиях от дата-ролей в связи с активным развитием больших языковых моделей? Может быть, появляются новые роли? Или какие-то роли, связанные с работой дата-специалистов, становятся критичными для успеха ML-проектов. Хотелось бы сконцентрироваться на том, что делать как работнику, так и работодателю в дивном новом мире.
Ждем ваших заявок!
Ваш @Reliable ML
#business #tech #reliable_ml #career #data_fest
👍10✍2🔥1🤔1
Reliable ML на Data Fusion 2025
Ждем всех на конференции сегодня
Сегодня с Димой помогаем в проведении конференции Data Fusion 2025.
- Лучшие практики CDO: как оседлать волну популярности AI? В 18:00-19:00 в зале Физика с крутыми CDO поговорим о том, какова реальная полезность LLM, как это измерить и что вообще может сделать CDO для улучшения пути компании с внедрением AI-решений. Ведущий - Ира Голощапова.
- Кейс-сессия «Малые генеративные модели». В 18:50-19:20 в зале Фотон поговорим о возможностях, перспективах и сценариях применения малых генеративных моделей. Какими техническими, организационными и экономическими преимуществами они обладают? Обсудим все этапы - от постановки задачи и обучения до внедрения и поддержки. Ведущий - Дмитрий Колодезев.
Все, кто на месте, подходите пообщаться!
Ваш @Reliable ML
#business #tech #reliable_ml #data_fusion
Ждем всех на конференции сегодня
Сегодня с Димой помогаем в проведении конференции Data Fusion 2025.
- Лучшие практики CDO: как оседлать волну популярности AI? В 18:00-19:00 в зале Физика с крутыми CDO поговорим о том, какова реальная полезность LLM, как это измерить и что вообще может сделать CDO для улучшения пути компании с внедрением AI-решений. Ведущий - Ира Голощапова.
- Кейс-сессия «Малые генеративные модели». В 18:50-19:20 в зале Фотон поговорим о возможностях, перспективах и сценариях применения малых генеративных моделей. Какими техническими, организационными и экономическими преимуществами они обладают? Обсудим все этапы - от постановки задачи и обучения до внедрения и поддержки. Ведущий - Дмитрий Колодезев.
Все, кто на месте, подходите пообщаться!
Ваш @Reliable ML
#business #tech #reliable_ml #data_fusion
👍4🔥4❤3
Датафест 2025
24 мая в офисе VK на Ленинградском проспекте 39 на Датафесте будут две крутых секции от ReliableML:
😎 Секция Reliable ML 😎
Расписание еще утрясается. В основном про то, как из изоленты и палок, которыми сейчас являются агенты и языковые модели, собирать устойчивые, надежные и полезные системы.
👩💼 Всеми любимая секция Карьера 🧑💼
Доклады:
* LLM-tools в поиске работы. Открывающий доклад Антона Воронова про самое главное
* Почему сильные ML-кандидаты до вас не доходят — и как это исправить. Анастасия Никулина расскажет, как починить сломанный найм
* Как выстроить новый отдел в большой компании. Артем Каледин, практические советы для тимлмида и не только
* DS в промышленности: как попасть и дорасти до Head of DS. Юрий Кацер расскажет про карьерные треки и особенности датасаенса в промышленности
🥂 После официальной части будет неофициальная. Можно будет пообщаться с Дмитрием и Ириной. Вконтакт устраивает афтепати 🥂
Регистрация на мероприятие https://ods.ai/events/fest2025-vk-msc говорят, что мест мало ;-)
Приходите ;-)
Ваш @Reliable ML
#datafest #reliable_ml #career
24 мая в офисе VK на Ленинградском проспекте 39 на Датафесте будут две крутых секции от ReliableML:
😎 Секция Reliable ML 😎
Расписание еще утрясается. В основном про то, как из изоленты и палок, которыми сейчас являются агенты и языковые модели, собирать устойчивые, надежные и полезные системы.
👩💼 Всеми любимая секция Карьера 🧑💼
Доклады:
* LLM-tools в поиске работы. Открывающий доклад Антона Воронова про самое главное
* Почему сильные ML-кандидаты до вас не доходят — и как это исправить. Анастасия Никулина расскажет, как починить сломанный найм
* Как выстроить новый отдел в большой компании. Артем Каледин, практические советы для тимлмида и не только
* DS в промышленности: как попасть и дорасти до Head of DS. Юрий Кацер расскажет про карьерные треки и особенности датасаенса в промышленности
🥂 После официальной части будет неофициальная. Можно будет пообщаться с Дмитрием и Ириной. Вконтакт устраивает афтепати 🥂
Регистрация на мероприятие https://ods.ai/events/fest2025-vk-msc говорят, что мест мало ;-)
Приходите ;-)
Ваш @Reliable ML
#datafest #reliable_ml #career
1❤7🔥6👍2
24 мая – Career & Teamlead – Reliable ML - Data Fest 2025
Программа секции
Всем привет! Публикуем финальное расписание секции Career & Teamlead от Reliable ML.
Есть апдейты в расписании: Дима Колодезев расскажет нам как AI уже сейчас меняет рынок IT труда. А Антон Воронов расскажет про LLM-tools в поиске работы 1 июня, на онлайн-дне Reliable ML (да-да, он тоже будет!).
Уже в эту субботу ждем вас в офисе VK на Ленинградском 39 на секции Career & Teamlead от Reliable ML. Стартуем в 18:00 в зале "Кинозал".
До встречи!
Ваш @Reliable ML
#datafest #reliable_ml #career
Программа секции
Всем привет! Публикуем финальное расписание секции Career & Teamlead от Reliable ML.
Есть апдейты в расписании: Дима Колодезев расскажет нам как AI уже сейчас меняет рынок IT труда. А Антон Воронов расскажет про LLM-tools в поиске работы 1 июня, на онлайн-дне Reliable ML (да-да, он тоже будет!).
Уже в эту субботу ждем вас в офисе VK на Ленинградском 39 на секции Career & Teamlead от Reliable ML. Стартуем в 18:00 в зале "Кинозал".
До встречи!
Ваш @Reliable ML
#datafest #reliable_ml #career
👍9❤1
24 мая – Reliable LLM - Data Fest 2025
Программа секции
В этот раз мы решили объединить нашу традиционную секцию Reliable ML про внедрение эффективных ML-решений с докладами секции Advanced LLM. Тем более, что секция в этом году с фокусом на разработку решений именно на основе LLM.
Получилось вполне себе норм название - Reliable LLM.
Публикуем финальное расписание секции. Будет 5 огненных докладов про практические кейсы, сложности и их преодоление в разработке решений с LLM.
В эту субботу ждем вас в офисе VK на Ленинградском 39 на секции Career & Teamlead от Reliable ML. Стартуем в 18:00 в зале "Кинозал".
До встречи!
Ваш @Reliable ML
#datafest #reliable_ml #career
Программа секции
В этот раз мы решили объединить нашу традиционную секцию Reliable ML про внедрение эффективных ML-решений с докладами секции Advanced LLM. Тем более, что секция в этом году с фокусом на разработку решений именно на основе LLM.
Получилось вполне себе норм название - Reliable LLM.
Публикуем финальное расписание секции. Будет 5 огненных докладов про практические кейсы, сложности и их преодоление в разработке решений с LLM.
В эту субботу ждем вас в офисе VK на Ленинградском 39 на секции Career & Teamlead от Reliable ML. Стартуем в 18:00 в зале "Кинозал".
До встречи!
Ваш @Reliable ML
#datafest #reliable_ml #career
👍7🔥5
Data Fest 2025 и Reliable ML в гостях у VK
Будем рады увидеться!
В 11:00 стартует Data Fest 2025. Сегодня - в гостях у VK!
Проведём с Димой две секции - Карьера и Reliable LLM.
А Дима ещё и расскажет про новые тренды рынка труда.
Трансляцию главного зала можно будет смотреть вот здесь.
Всех ждём! Послушать доклады и поболтать.
У нас всё идеально готово, правда!
Ваш @Reliable ML
#datafest #reliable_ml #career
Будем рады увидеться!
В 11:00 стартует Data Fest 2025. Сегодня - в гостях у VK!
Проведём с Димой две секции - Карьера и Reliable LLM.
А Дима ещё и расскажет про новые тренды рынка труда.
Трансляцию главного зала можно будет смотреть вот здесь.
Всех ждём! Послушать доклады и поболтать.
У нас всё идеально готово, правда!
Ваш @Reliable ML
#datafest #reliable_ml #career
🔥14
1 июня – Online - Career & Reliable ML - Data Fest 2025
Программа онлайн-дня Reliable ML
В это воскресенье с 10 утра в spatial.chat будем не только показывать, но и обсуждать красивое и интересное:
- В секции Career узнаем про то, как прокачать софт-скиллы, и какие LLM-тулы использовать, чтобы найти работу и зарплату мечты. Разовьем тему в то, какие компетенции нужны для прокачки в тимлидстве.
- В секции Reliable ML поговорим про организацию процессов в DS и ML-Readability.
Публикуем финальное расписание на 1 июня.
Ждем вас в spatial.chat. Пароли, явки, адреса опубликуем в канале перед стартом секции.
До встречи!
Ваш @Reliable ML
#datafest #reliable_ml #career #online
Программа онлайн-дня Reliable ML
В это воскресенье с 10 утра в spatial.chat будем не только показывать, но и обсуждать красивое и интересное:
- В секции Career узнаем про то, как прокачать софт-скиллы, и какие LLM-тулы использовать, чтобы найти работу и зарплату мечты. Разовьем тему в то, какие компетенции нужны для прокачки в тимлидстве.
- В секции Reliable ML поговорим про организацию процессов в DS и ML-Readability.
Публикуем финальное расписание на 1 июня.
Ждем вас в spatial.chat. Пароли, явки, адреса опубликуем в канале перед стартом секции.
До встречи!
Ваш @Reliable ML
#datafest #reliable_ml #career #online
🔥10
1 июня – Online - Career & Reliable ML - Data Fest 2025
Скоро начинаем!!!
Всем привет! В 10:00 - уже меньше чем через час - стартуем наш онлайн-день Reliable ML!
Ссылка для входа тут, пароль - datafest2025_0106. Далее - в комнату Reliable ML. Расписание докладов постом выше.
Всех очень ждем!
Запись потом будет, а шансов вживую задать ваши вопросы спикерам - нет!
Ваш @Reliable ML
#datafest #reliable_ml #career #online
Скоро начинаем!!!
Всем привет! В 10:00 - уже меньше чем через час - стартуем наш онлайн-день Reliable ML!
Ссылка для входа тут, пароль - datafest2025_0106. Далее - в комнату Reliable ML. Расписание докладов постом выше.
Всех очень ждем!
Запись потом будет, а шансов вживую задать ваши вопросы спикерам - нет!
Ваш @Reliable ML
#datafest #reliable_ml #career #online
🔥6
Всем привет!
Представляем вашему внимаю первый выпуск подкаста "Капитанский мостик", он посвящен важным новостям прошедшей недели; ведущие - Валентин Малых и Дмитрий Колодезев; видео тут:
VK Video
YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизируйтесь через ODS.ai)
Представляем вашему внимаю первый выпуск подкаста "Капитанский мостик", он посвящен важным новостям прошедшей недели; ведущие - Валентин Малых и Дмитрий Колодезев; видео тут:
VK Video
YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизируйтесь через ODS.ai)
🔥23👨💻8❤7
10 июля - Data Day 2025
Обсуждаем данные в банках
10 июля буду на одной из панельных дискуссий на конференции Data Day 2025. Приходите пообщаться.
В этом году за организацию Data Day отвечает Саша Толмачев. Саша классно выступил в прошлом году у нас на Data Fest про стратегию данных [Youtube, Rutube], и конференцию собирает классную.
Я (Ира) буду в панельной дискуссии про создание открытой рабочей группы по совместному применению данных финтеха, с 18:00. Вместе решим, как и когда найти общее велью от данных в отрасли.
Ваш @Reliable ML
#business #conference
Обсуждаем данные в банках
10 июля буду на одной из панельных дискуссий на конференции Data Day 2025. Приходите пообщаться.
В этом году за организацию Data Day отвечает Саша Толмачев. Саша классно выступил в прошлом году у нас на Data Fest про стратегию данных [Youtube, Rutube], и конференцию собирает классную.
Я (Ира) буду в панельной дискуссии про создание открытой рабочей группы по совместному применению данных финтеха, с 18:00. Вместе решим, как и когда найти общее велью от данных в отрасли.
Ваш @Reliable ML
#business #conference
👍13❤4🔥2🤔2
Капитанский мостик #2
Подкаст Валентина Малых и Дмитрия Колодезева
Вышел второй выпуск подкаста "Капитанский мостик": от Дмитрия Колодезева (тг: Reliable ML) и Валентина Малых (тг: Valuable AI). Выпуск посвящен новостям прошедшей недели.
- VK Video
- YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Ваш @Reliable ML
#reliable_ml #подкаст
Подкаст Валентина Малых и Дмитрия Колодезева
Вышел второй выпуск подкаста "Капитанский мостик": от Дмитрия Колодезева (тг: Reliable ML) и Валентина Малых (тг: Valuable AI). Выпуск посвящен новостям прошедшей недели.
- VK Video
- YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Ваш @Reliable ML
#reliable_ml #подкаст
👍11🔥6💊1
Капитанский мостик #3
Подкаст Валентина Малых и Дмитрия Колодезева
Представляем вашему внимаю третий выпуск подкаста "Капитанский мостик", он как всегда посвящен важным новостям прошедшей недели; ведущие - Дмитрий Колодезев (тг: Reliable ML) и Валентин Малых (тг: Valuable AI).
Видео тут:
VK Video
YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Ваш @Reliable ML
#reliable_ml #подкаст
Подкаст Валентина Малых и Дмитрия Колодезева
Представляем вашему внимаю третий выпуск подкаста "Капитанский мостик", он как всегда посвящен важным новостям прошедшей недели; ведущие - Дмитрий Колодезев (тг: Reliable ML) и Валентин Малых (тг: Valuable AI).
Видео тут:
VK Video
YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Ваш @Reliable ML
#reliable_ml #подкаст
🔥7❤1
Капитанский мостик #4
Подкаст Валентина Малых и Дмитрия Колодезева
Вышел уже четвертый выпуск подкаста "Капитанский мостик", с обсуждением важных новостей прошедшей недели. Ведущие - Дмитрий Колодезев (тг: Reliable ML) и Валентин Малых (тг: Valuable AI).
Видео тут:
VK Video
YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Ваш @Reliable ML
#reliable_ml #подкаст
Подкаст Валентина Малых и Дмитрия Колодезева
Вышел уже четвертый выпуск подкаста "Капитанский мостик", с обсуждением важных новостей прошедшей недели. Ведущие - Дмитрий Колодезев (тг: Reliable ML) и Валентин Малых (тг: Valuable AI).
Видео тут:
VK Video
YouTube
Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Ваш @Reliable ML
#reliable_ml #подкаст
🔥8❤3
Капитанский мостик с Ириной Голощаповой
Подкаст Валентина Малых и Дмитрия Колодезева
В эти выходные Ирина и Дмитрий будут разбирать новости недели про искусственный интеллект и машинное обучение.
Присылайте новости для обсуждения, можно в комментариии к этому посту.
Ваш @Reliable ML
#reliable_ml #подкаст
Подкаст Валентина Малых и Дмитрия Колодезева
В эти выходные Ирина и Дмитрий будут разбирать новости недели про искусственный интеллект и машинное обучение.
Присылайте новости для обсуждения, можно в комментариии к этому посту.
Ваш @Reliable ML
#reliable_ml #подкаст
🔥20❤8👍1
Капитанский мостик #8
Всем привет!
Публикуем обещанный восьмой выпуск еженедельного подкаста "Капитанский мостик", в котором обсуждаем новости из мира ИИ за прошедшую неделю и не только. Ведущие выпуска - Дмитрий Колодезев и Ирина Голощапова (Reliable ML).
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
Всем привет!
Публикуем обещанный восьмой выпуск еженедельного подкаста "Капитанский мостик", в котором обсуждаем новости из мира ИИ за прошедшую неделю и не только. Ведущие выпуска - Дмитрий Колодезев и Ирина Голощапова (Reliable ML).
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
🔥10❤4
ODS как часть жизни
Минутка ностальгии и вдохновения
В этом году, оказывается, уже 10й год как неравнодушное комьюнити data science, созданное Лешей Натекиным, проводит крупнейшую конференцию по данным и ML - Data Fest. Конфа отгремела еще в мае-июне, а уже совсем скоро - 12 сентября - планируется отпраздновать 10 лет кайфовых лет конференционного угара в кругу тех, кто когда либо принимал участие в выступлениях или организации мероприятий сообщества.
Много раз у меня спрашивали: "Ира, скоро дата фест, будешь в этом году что-то организовывать?". И я каждый раз удивляюсь вопросу, поскольку в голову даже не приходит мысли, что можно не организовывать, не делиться всяким интересным, что произошло за год, не пообщаться снова с теми, у кого горят глаза и кто готов хоть всю ночь обсуждать данные и DS. Поэтому хмыкаю в ответ что-то типа "Да как можно, буду обязательно". Вопросы другие надо решать: сколько секций и какие делать, кого позвать и выступать ли самой)
Потому что ODS - давно прочная часть жизни, и часть меня. И не потому что надо пиар и личный бренд (хотя это не раз помогало, не спорю!), а потому что ну как жеж круто, когда ты рядом с теми, кто искренне любит свое дело.
А еще спрашивают, зачем мне все это. А тут, кажется, и про путь в DS тогда надо вещать. Тем более, что он как минимум начинался забавно) Расскажу в следующем посте, если это вам интересно!
А сейчас просто хочется сказать, как я рада, что будет пятница и удастся увидеть столько любимых людей ❤️
Ваш @Reliable ML
#reliable_ml #data_fest #ods
Минутка ностальгии и вдохновения
В этом году, оказывается, уже 10й год как неравнодушное комьюнити data science, созданное Лешей Натекиным, проводит крупнейшую конференцию по данным и ML - Data Fest. Конфа отгремела еще в мае-июне, а уже совсем скоро - 12 сентября - планируется отпраздновать 10 лет кайфовых лет конференционного угара в кругу тех, кто когда либо принимал участие в выступлениях или организации мероприятий сообщества.
Много раз у меня спрашивали: "Ира, скоро дата фест, будешь в этом году что-то организовывать?". И я каждый раз удивляюсь вопросу, поскольку в голову даже не приходит мысли, что можно не организовывать, не делиться всяким интересным, что произошло за год, не пообщаться снова с теми, у кого горят глаза и кто готов хоть всю ночь обсуждать данные и DS. Поэтому хмыкаю в ответ что-то типа "Да как можно, буду обязательно". Вопросы другие надо решать: сколько секций и какие делать, кого позвать и выступать ли самой)
Потому что ODS - давно прочная часть жизни, и часть меня. И не потому что надо пиар и личный бренд (хотя это не раз помогало, не спорю!), а потому что ну как жеж круто, когда ты рядом с теми, кто искренне любит свое дело.
А еще спрашивают, зачем мне все это. А тут, кажется, и про путь в DS тогда надо вещать. Тем более, что он как минимум начинался забавно) Расскажу в следующем посте, если это вам интересно!
А сейчас просто хочется сказать, как я рада, что будет пятница и удастся увидеть столько любимых людей ❤️
Ваш @Reliable ML
#reliable_ml #data_fest #ods
❤42🔥8👍2
Компании, использующие GenAI, зарабатывают больше
Нажимай сюда, чтобы узнать как...
Если щелкнули по ссылке, то она поможет разобраться, как отличить манипуляцию с data-driven выводами от реальности. Это вводная статья про причинно-следственный анализ и отличие корреляции от причинности. Если захочется углубиться, то вот тут у Димы расписан целый путь в мир Causal Inference.
Google Cloud в своем свежем обзоре The ROI of AI 2025 ярко заявляют о том, что компании, внедряющие AI в прод, зарабатывают больше... чем раньше. Звучит классно и как то, что очень хочется сейчас слышать, правда?
Но, как обычно, есть нюансы.
- Как понять, что причинно-следственная связь именно такая? А не наоборот, например. Возможно, GenAI внедряют те компании, которые зарабатывают больше, и могут себе позволитькупить много видеокарт экспериментировать. Или вообще есть третий фактор.
- Если вчитаться в слайд на скрине, то выясняется, что вывод сделан на основе доли CEO, ответивших положительно на вопрос про влияние AI на business growth. И доля эта высокая - 56% опрошенных. Только вот незадача - доля эта снизилась на 7 п.п. относительно 2024 г. Доля CEO, готовых публично говорить об эффекте AI, существенно снизилась. Но это почему-то не попало в фокусы отчета.
- Справа слайда также дана прекрасная картинка: где сравнивается доля ответивших про размер эффекта AI на рост бизнеса - среди тех, кто ответил положительно на первый вопрос про влияние AI. Какое из различий в % 2025 vs 2024 на слайде является статзначимым, и какие выводы мы можем сделать, предлагаю решить вам 😊
А какие вам встречались неоднозначные выводы из данных в жизни/работе?
P.S. Сам отчет от Google Cloud, на самом деле, интересный. Кроме этого слайда есть много информации, которая реально полезна. И хочется поблагодарить авторов отчета, что они приводят достаточно много деталей про опросы, чтобы внимательный читатель смог сам провалидировать выводы.
Отличного вам воскресенья и не забываем, что correlation doesn't imply causality.
Ваш @Reliable ML
#reliable_ml #causal_ml #causality
Нажимай сюда, чтобы узнать как...
Если щелкнули по ссылке, то она поможет разобраться, как отличить манипуляцию с data-driven выводами от реальности. Это вводная статья про причинно-следственный анализ и отличие корреляции от причинности. Если захочется углубиться, то вот тут у Димы расписан целый путь в мир Causal Inference.
Google Cloud в своем свежем обзоре The ROI of AI 2025 ярко заявляют о том, что компании, внедряющие AI в прод, зарабатывают больше... чем раньше. Звучит классно и как то, что очень хочется сейчас слышать, правда?
Но, как обычно, есть нюансы.
- Как понять, что причинно-следственная связь именно такая? А не наоборот, например. Возможно, GenAI внедряют те компании, которые зарабатывают больше, и могут себе позволить
- Если вчитаться в слайд на скрине, то выясняется, что вывод сделан на основе доли CEO, ответивших положительно на вопрос про влияние AI на business growth. И доля эта высокая - 56% опрошенных. Только вот незадача - доля эта снизилась на 7 п.п. относительно 2024 г. Доля CEO, готовых публично говорить об эффекте AI, существенно снизилась. Но это почему-то не попало в фокусы отчета.
- Справа слайда также дана прекрасная картинка: где сравнивается доля ответивших про размер эффекта AI на рост бизнеса - среди тех, кто ответил положительно на первый вопрос про влияние AI. Какое из различий в % 2025 vs 2024 на слайде является статзначимым, и какие выводы мы можем сделать, предлагаю решить вам 😊
А какие вам встречались неоднозначные выводы из данных в жизни/работе?
P.S. Сам отчет от Google Cloud, на самом деле, интересный. Кроме этого слайда есть много информации, которая реально полезна. И хочется поблагодарить авторов отчета, что они приводят достаточно много деталей про опросы, чтобы внимательный читатель смог сам провалидировать выводы.
Отличного вам воскресенья и не забываем, что correlation doesn't imply causality.
Ваш @Reliable ML
#reliable_ml #causal_ml #causality
🔥11❤5👍1
Следуй за мечтой и любимым делом
Про мой путь в DS
В преддверии Data Fest X захотелось вспомнить, как все начиналось.
Может, и Диму уговорю потом поделиться)
Услышала я о словосочетании data science в первом декрете. Вроде что-то прикольное, математика и данные. Пока сын спал на балконе (а это слава небесам, были аж 1-2 часа в день!), я стала почитывать книги и проходить курсеру. Оказалось, что многие методы, которыми давно пользуюсь в экономических исследованиях, теперь называются такими красивыми словами - data science.
После декрета вышла с кучей новых идей как применить свои новые навыки в работе - это оказалось очень нужным почти в каждом проекте. Было очень вдохновляюще автоматизировать и вычислять за дни то, что раньше казалось вообще невозможным (хоть эксель и почти всемогущ).
А еще присоединилась к небольшой тусовке интересующихся data science - она называлась Open Data Science. Прочитала там доклад про R и Python - на уже втором настоящем Data Fest. Не потому, что классно это умела, а чтобы самой разобраться в теме и начать применять. Доклад внезапно оказался популярен и дальше много раз пригодился - как минимум два раза помог мне с поиском работы.
В итоге после 8 лет НИОКР в экономике и финансах, перешла в бизнес, в Х5 Group. Пришла я туда на позицию макроэкономиста, но за год, автоматизировав свою работу, предложила столько идей и столько наделала ML экспериментов, что собрался целый отдел. С ним мы дальше внедрили кучу полезных ML моделей в финансах и управлении рисками, а также помогли с развитием АБ.
А еще продолжила выступать на дата фестах, общаться в слаке ODS, и начала организовывать секции. Новое и интересное, что я могла, как экономист, привнести в ML - это causality и интерпретируемость. То, что у экономиста в крови. На почве любви к этой теме мы объединили наши усилия с Димой. Наши секции Causal ML и Interpretable ML не один год были топовыми по отзывам.
Параллельно - поскольку зудело - в качестве развлечения затеялся пет-проект на стыке анализа больших данных и экономики: макроиндексы инфляционных и кризисных ожиданий на базе анализа комментов населения в СМИ. Проект разросся до своего сайта, им заинтересовались центральные банки России, Казахстана и немножко Англии. РФ и Казахстан даже потом строили аналоги наших индексов. Это развлечение позволило нам с другом не только защитить научные работы и опубликовать статьи в классных журналах, но и поучаствовать в совместных исследованиях с Manchester University.
Из Х5 перешла в Ленту - вместе с Пашей (DSvs) и крутой командой строить big data. Построили. Развивается, и рассказывает, кстати, о достижениях.
А еще мы продолжали с Димой вести секции. Постепенно к темам Causal ML и Interpretable ML добавили наш опыт внедрения ML - как организовать работу команд, построить процессы, и задизайнить ML систему так, чтобы она в итоге дошла до прода и принесла положительное велью. Так получился Reliable ML.
А вместе с ним получились еще один пет-проект - ML System Design Doc и мегакрутой Димин курс по ML System Design. За то, как документ помогает улучшить процессы ML-команд, а курс - научиться делать дизайн ML систем, нас до сих пор благодарят на конференциях. Это стоит всех усилий.
Теперь я уже около 3х лет снова в финансовой сфере - продолжаю развивать ML, генерить и внедрять классные идеи, уже в роли CDO. И намного больше понимаю, как важна хорошая стратегия данных, как много значит не только умение делать ML, но и организовать улучшения на всех слоях работы с данными.
А еще мы продолжаем с Димой развивать тему Reliable ML/AI. Тащим телеграм-канал (хоть и не всегда успеваем!), каждый год участвуем в организации феста. Идей у нас по прежнему очень много: ведь вокруг нас по-прежнему люди с горящими глазами. И это такой кайф, что не передать.
В чем тут мораль каждый решит сам.
Для меня в том, как важно искренне любить свое дело и делиться знаниями с теми, кто эту любовь разделяет.
Для себя важно. А карьера и отдача придут.
Ваш @Reliable ML
#reliable_ml #data_fest #ods #мысли
Про мой путь в DS
В преддверии Data Fest X захотелось вспомнить, как все начиналось.
Может, и Диму уговорю потом поделиться)
Услышала я о словосочетании data science в первом декрете. Вроде что-то прикольное, математика и данные. Пока сын спал на балконе (а это слава небесам, были аж 1-2 часа в день!), я стала почитывать книги и проходить курсеру. Оказалось, что многие методы, которыми давно пользуюсь в экономических исследованиях, теперь называются такими красивыми словами - data science.
После декрета вышла с кучей новых идей как применить свои новые навыки в работе - это оказалось очень нужным почти в каждом проекте. Было очень вдохновляюще автоматизировать и вычислять за дни то, что раньше казалось вообще невозможным (хоть эксель и почти всемогущ).
А еще присоединилась к небольшой тусовке интересующихся data science - она называлась Open Data Science. Прочитала там доклад про R и Python - на уже втором настоящем Data Fest. Не потому, что классно это умела, а чтобы самой разобраться в теме и начать применять. Доклад внезапно оказался популярен и дальше много раз пригодился - как минимум два раза помог мне с поиском работы.
В итоге после 8 лет НИОКР в экономике и финансах, перешла в бизнес, в Х5 Group. Пришла я туда на позицию макроэкономиста, но за год, автоматизировав свою работу, предложила столько идей и столько наделала ML экспериментов, что собрался целый отдел. С ним мы дальше внедрили кучу полезных ML моделей в финансах и управлении рисками, а также помогли с развитием АБ.
А еще продолжила выступать на дата фестах, общаться в слаке ODS, и начала организовывать секции. Новое и интересное, что я могла, как экономист, привнести в ML - это causality и интерпретируемость. То, что у экономиста в крови. На почве любви к этой теме мы объединили наши усилия с Димой. Наши секции Causal ML и Interpretable ML не один год были топовыми по отзывам.
Параллельно - поскольку зудело - в качестве развлечения затеялся пет-проект на стыке анализа больших данных и экономики: макроиндексы инфляционных и кризисных ожиданий на базе анализа комментов населения в СМИ. Проект разросся до своего сайта, им заинтересовались центральные банки России, Казахстана и немножко Англии. РФ и Казахстан даже потом строили аналоги наших индексов. Это развлечение позволило нам с другом не только защитить научные работы и опубликовать статьи в классных журналах, но и поучаствовать в совместных исследованиях с Manchester University.
Из Х5 перешла в Ленту - вместе с Пашей (DSvs) и крутой командой строить big data. Построили. Развивается, и рассказывает, кстати, о достижениях.
А еще мы продолжали с Димой вести секции. Постепенно к темам Causal ML и Interpretable ML добавили наш опыт внедрения ML - как организовать работу команд, построить процессы, и задизайнить ML систему так, чтобы она в итоге дошла до прода и принесла положительное велью. Так получился Reliable ML.
А вместе с ним получились еще один пет-проект - ML System Design Doc и мегакрутой Димин курс по ML System Design. За то, как документ помогает улучшить процессы ML-команд, а курс - научиться делать дизайн ML систем, нас до сих пор благодарят на конференциях. Это стоит всех усилий.
Теперь я уже около 3х лет снова в финансовой сфере - продолжаю развивать ML, генерить и внедрять классные идеи, уже в роли CDO. И намного больше понимаю, как важна хорошая стратегия данных, как много значит не только умение делать ML, но и организовать улучшения на всех слоях работы с данными.
А еще мы продолжаем с Димой развивать тему Reliable ML/AI. Тащим телеграм-канал (хоть и не всегда успеваем!), каждый год участвуем в организации феста. Идей у нас по прежнему очень много: ведь вокруг нас по-прежнему люди с горящими глазами. И это такой кайф, что не передать.
В чем тут мораль каждый решит сам.
Для меня в том, как важно искренне любить свое дело и делиться знаниями с теми, кто эту любовь разделяет.
Для себя важно. А карьера и отдача придут.
Ваш @Reliable ML
#reliable_ml #data_fest #ods #мысли
🔥51❤32❤🔥7💯2👍1
Causal Inference Workshop #1
Всем привет! Мы запускаем серию воркшопов по анализу причинно-следственных связей (causal inference).
Формат - академическая пара, онлайн, будем разбирать по одной теме за раз.
Каждое занятие будет разбирать одну практическую тему,
Первое занятие - 27.09.2025 с 12:00 до 14:00 мск.
Тема: "Введение в Causal Inference. Причинно-следственные связи без А/Б тестов. Ортогонализация"
Разберем базовые понятия Causal Inference, несколько примеров "как делать не надо" и одну простую технику, как можно делать.
У участников останутся ноутбуки с примерами и инструкциями, можно будет задать свои вопросы.
Занятия бесплатные. Записи в открытом доступе не будет. Технического ограничения на размер группы нет, но в слишком большой группе никто не успеет ничего спросить, поэтому в какой-то момент набор закроем.
Чтобы записаться, пишите в комментариях к этому посту - зачем вам изучать Causal Inference. Будем добавлять в закрытый канал воркшопа.
Ваш @Reliable ML
#reliable_ml #causal_inference #workshop
UPD: в анонсе по ошибке написали октябрь. Сентябрь, конечно же. Исправили
UPD2: начали добавлять в группу семинара, в течение нескольких дней всех добавим.
UPD3: запись закрыта, все, кто успели написать - переходите по ссылке https://xn--r1a.website/+2qetSFTf9H84ODJi в канал.
Те, кто не успели - не надо переходить, не сработает.
Всем привет! Мы запускаем серию воркшопов по анализу причинно-следственных связей (causal inference).
Формат - академическая пара, онлайн, будем разбирать по одной теме за раз.
Каждое занятие будет разбирать одну практическую тему,
Первое занятие - 27.09.2025 с 12:00 до 14:00 мск.
Тема: "Введение в Causal Inference. Причинно-следственные связи без А/Б тестов. Ортогонализация"
Разберем базовые понятия Causal Inference, несколько примеров "как делать не надо" и одну простую технику, как можно делать.
У участников останутся ноутбуки с примерами и инструкциями, можно будет задать свои вопросы.
Занятия бесплатные. Записи в открытом доступе не будет. Технического ограничения на размер группы нет, но в слишком большой группе никто не успеет ничего спросить, поэтому в какой-то момент набор закроем.
Ваш @Reliable ML
#reliable_ml #causal_inference #workshop
UPD: в анонсе по ошибке написали октябрь. Сентябрь, конечно же. Исправили
UPD2: начали добавлять в группу семинара, в течение нескольких дней всех добавим.
UPD3: запись закрыта, все, кто успели написать - переходите по ссылке https://xn--r1a.website/+2qetSFTf9H84ODJi в канал.
Те, кто не успели - не надо переходить, не сработает.
❤33🔥12