Есть ли рисерч в Лаборатории машинного обучения?
🧪 Лаборатория по определению ассоциируется с исследованиями, но в нашей команде нет рисерча в классическом представление - мы не пишем статьи в цитируемые журналы и не выступаем на научных конференциях. Более того, 95% наших моделей идут в продашкн.
❓ Какими же исследованиям мы занимаемся и когда переключимся на общепринятые?
💭 Лаборатория образовалась вместе с централизацией функции анализа данных в банке полтора года назад, когда data science был в зачаточной стадии в компании. На тот момент существовало большое количество процессов принятий решений непокрытых моделями машинного обучение. В виду этого обстоятельства, мы в первую очередь сфокусировались на внедрении в ключевые процессы банка нейронные сетей и полностью отказались от привычного рисерча. Более того, Лаборатория является абсолютным лидером в банке по количеству внедренных в продашн моделей. В результате, у бизнеса сформировалось доверие к сеткам, что поможет в будущем их развитию.
👉 Исследования своевременны тогда, когда вы уже выжали максимум для бизнеса за счет общедоступных инструментов и для совершения следующего шага вам требуются делать прорыв в области. В противном случае, исследования не принесут пользы бизнесу, ибо не ясно какой именно процесс нуждается в улучшении.
👉 В практически-ориентированном анализе данных исследования отличаются от тех, что вы можете прочитать на arxiv.
💭 Постановка задач в новом бизнес-процессе в терминах комплекса моделей машинного обучения считается исследованием. Переход с простой аналитики принятии решений на модельный тоже можно отнести к этой области. Добавление новых данных для усиления действующих моделей также считается исследованием, но уже направленное на анализ самого источника.
💭 Процесс внедрения нейронных сетей для различных бизнес-задач становится уже такой же рутиной, как и подбор гипер-параметров для градиентного бустинга. Модели с ноги заходят в 80% core-задач банка и выжимают максимум из данных (как минимум в соревнованиях никто больше не выжал). Не смотря на этот практически полезный факт, ключевые идеи не являются новаторскими и очевидны всем, кто раньше занимался NLP.
❓Как отказаться от рутины и перейти к исследованиям?
👉 Сервисы по автоматическому обучению и внедрению моделей в продакшн позволяют избавить дата сайентистов от рутинных задач и перейти, наконец, к исследованиям в классическом понимании. В результате, вы ускоряете TTM и находите время на развитие мозгов сервиса - исследования.
💭 Мы уже оптимизировали задачу семантического анализа произвольной коллекции текстовых документов. В следующем году оптимизируем и построение нейронных сетей для core-бизнес задач.
🙅♂️ В итоге, сейчас в Лаборатории практически нет классического рисерча, но он обязательно появится после перевода рутины в сервисы.
👋 P.S. пишите в ЛС если вы сейчас тоже в отпуске в Бангкоке.
#research
#ML_Lab
🧪 Лаборатория по определению ассоциируется с исследованиями, но в нашей команде нет рисерча в классическом представление - мы не пишем статьи в цитируемые журналы и не выступаем на научных конференциях. Более того, 95% наших моделей идут в продашкн.
❓ Какими же исследованиям мы занимаемся и когда переключимся на общепринятые?
💭 Лаборатория образовалась вместе с централизацией функции анализа данных в банке полтора года назад, когда data science был в зачаточной стадии в компании. На тот момент существовало большое количество процессов принятий решений непокрытых моделями машинного обучение. В виду этого обстоятельства, мы в первую очередь сфокусировались на внедрении в ключевые процессы банка нейронные сетей и полностью отказались от привычного рисерча. Более того, Лаборатория является абсолютным лидером в банке по количеству внедренных в продашн моделей. В результате, у бизнеса сформировалось доверие к сеткам, что поможет в будущем их развитию.
👉 Исследования своевременны тогда, когда вы уже выжали максимум для бизнеса за счет общедоступных инструментов и для совершения следующего шага вам требуются делать прорыв в области. В противном случае, исследования не принесут пользы бизнесу, ибо не ясно какой именно процесс нуждается в улучшении.
👉 В практически-ориентированном анализе данных исследования отличаются от тех, что вы можете прочитать на arxiv.
💭 Постановка задач в новом бизнес-процессе в терминах комплекса моделей машинного обучения считается исследованием. Переход с простой аналитики принятии решений на модельный тоже можно отнести к этой области. Добавление новых данных для усиления действующих моделей также считается исследованием, но уже направленное на анализ самого источника.
💭 Процесс внедрения нейронных сетей для различных бизнес-задач становится уже такой же рутиной, как и подбор гипер-параметров для градиентного бустинга. Модели с ноги заходят в 80% core-задач банка и выжимают максимум из данных (как минимум в соревнованиях никто больше не выжал). Не смотря на этот практически полезный факт, ключевые идеи не являются новаторскими и очевидны всем, кто раньше занимался NLP.
❓Как отказаться от рутины и перейти к исследованиям?
👉 Сервисы по автоматическому обучению и внедрению моделей в продакшн позволяют избавить дата сайентистов от рутинных задач и перейти, наконец, к исследованиям в классическом понимании. В результате, вы ускоряете TTM и находите время на развитие мозгов сервиса - исследования.
💭 Мы уже оптимизировали задачу семантического анализа произвольной коллекции текстовых документов. В следующем году оптимизируем и построение нейронных сетей для core-бизнес задач.
🙅♂️ В итоге, сейчас в Лаборатории практически нет классического рисерча, но он обязательно появится после перевода рутины в сервисы.
👋 P.S. пишите в ЛС если вы сейчас тоже в отпуске в Бангкоке.
#research
#ML_Lab
👍14🔥5❤2😁1
Что вы выберете для табличных данных: бустинг или MLP?
🤖 Большой пласт задач машинного обучения на практике - задачи на табличных данных, которые чаще всего решаются при помощи градиентного бустинга. Стандартная для табличных данных MLP-архитектура обычно имеет хуже качество и требует больше ресурсов для обучения и тюнинга.
🤔 Можно ли применять глубокое обучение более эффективно?
🔍 Yandex Research активно занимается исследованиями в этой области. ИМХО, лучшие статьи на эту тему, прошедшие на NeurIPS c 90+ цитированиями:
[1] - Revisiting Deep Learning Models for Tabular Data, 2021
[2] - On Embeddings for Numerical Features in Tabular Deep Learning, 2022
💪 Сетки рвут бустинг несмотря на то, что работы фокусируются на изначально сложных для глубокого обучения задачах, на которых доминируют бустинги традиционно доминируют. Более того, в статье идет сравнение с хорошо натюненными бустингами.
👀 Взляните на ключевые результаты из статьи. В списке ниже указаны модели и их среднее места по задачам в бенчмарке (меньше - лучше).
- Классический MLP - 8.5
- XGBoost - 4.6
- Transformer и кусочно-линейные эмбеддинги - 3.7
- CatBoost - 3.6
- MLP и эмбеддинги с периодическими активациями - 3.0
Рассмотрим основные идеи и техники, помогающие улучшить качество ваших нейронок:
🌟 Архитектурные модификации. Простая модификация MLP c добавлением BatchNorm и пробросных связей подобно ResNet уже показывает существенные улучшения по сравнению с базовым вариантом и является хорошим бейзлайном. Однако, системные приросты показывает предложенная в [1] трансформер-архитектура, изначально использующая эмбеддинги фичей и механизм внимания.
🌟 Эмбеддинги для числовых фичей. Обычно числовые фичи передаются в MLP напрямую, но можно добиться буста качества за счет расширения их размерность, применяя для этого эмбеддинги. Любые варианты эмбеддингов числовых фичей существенно бустят табличные модели и снижают разницу между архитектурными конфигурациями. Для максимального улучшения в работе [2] выделяются две более сложные схемы организации эмбеддингов - с использованием кусочно-линейных функций и периодических активаций.
🅰️ В практике Лаборатории табличные данные появляются в разных форматах: как в виде структурированных фичей, так и в виде сырых последовательностей. Наибольший интерес вызывает применение глубокое обучение там, где оно изначально имеет преимущества - это могут быть чисто неструктурированные данные, или же объединение их с табличными фичами для получения одной сильной модели.
🤔 Отметим следующий интересный факт - чем больше данных имеется, тем менее сильно влияют различные архитектурные модификации и другие техники. Это особенно относятся к табличным данным - зачастую задачи на них и общая структура самих данных куда более простые, чем на неструктурированных доменах вроде картинок или текстов, и возможность полностью описать задачу большим числом данных становится абсолютно реальной на практике.
Потестить различные техники из статей можно в песочнице нашего соревнования на Boosters, причем как на чисто табличных агрегатах, так и на последовательных данных. У двух статей есть открытый исходный код, так что с реализациями мучиться не придется.
🤔 Слово "бустинг" в этом посте оказалось популярнее множества слов {"mlp", "сетка"}.
💬 Автор поста @oasidorshin ответит на ваши вопросы про сравнение сеток с бустингами в комментариях.
#mlsysdesign #dl_in_finance
🤖 Большой пласт задач машинного обучения на практике - задачи на табличных данных, которые чаще всего решаются при помощи градиентного бустинга. Стандартная для табличных данных MLP-архитектура обычно имеет хуже качество и требует больше ресурсов для обучения и тюнинга.
🤔 Можно ли применять глубокое обучение более эффективно?
🔍 Yandex Research активно занимается исследованиями в этой области. ИМХО, лучшие статьи на эту тему, прошедшие на NeurIPS c 90+ цитированиями:
[1] - Revisiting Deep Learning Models for Tabular Data, 2021
[2] - On Embeddings for Numerical Features in Tabular Deep Learning, 2022
💪 Сетки рвут бустинг несмотря на то, что работы фокусируются на изначально сложных для глубокого обучения задачах, на которых доминируют бустинги традиционно доминируют. Более того, в статье идет сравнение с хорошо натюненными бустингами.
👀 Взляните на ключевые результаты из статьи. В списке ниже указаны модели и их среднее места по задачам в бенчмарке (меньше - лучше).
- Классический MLP - 8.5
- XGBoost - 4.6
- Transformer и кусочно-линейные эмбеддинги - 3.7
- CatBoost - 3.6
- MLP и эмбеддинги с периодическими активациями - 3.0
Рассмотрим основные идеи и техники, помогающие улучшить качество ваших нейронок:
🌟 Архитектурные модификации. Простая модификация MLP c добавлением BatchNorm и пробросных связей подобно ResNet уже показывает существенные улучшения по сравнению с базовым вариантом и является хорошим бейзлайном. Однако, системные приросты показывает предложенная в [1] трансформер-архитектура, изначально использующая эмбеддинги фичей и механизм внимания.
🌟 Эмбеддинги для числовых фичей. Обычно числовые фичи передаются в MLP напрямую, но можно добиться буста качества за счет расширения их размерность, применяя для этого эмбеддинги. Любые варианты эмбеддингов числовых фичей существенно бустят табличные модели и снижают разницу между архитектурными конфигурациями. Для максимального улучшения в работе [2] выделяются две более сложные схемы организации эмбеддингов - с использованием кусочно-линейных функций и периодических активаций.
🅰️ В практике Лаборатории табличные данные появляются в разных форматах: как в виде структурированных фичей, так и в виде сырых последовательностей. Наибольший интерес вызывает применение глубокое обучение там, где оно изначально имеет преимущества - это могут быть чисто неструктурированные данные, или же объединение их с табличными фичами для получения одной сильной модели.
🤔 Отметим следующий интересный факт - чем больше данных имеется, тем менее сильно влияют различные архитектурные модификации и другие техники. Это особенно относятся к табличным данным - зачастую задачи на них и общая структура самих данных куда более простые, чем на неструктурированных доменах вроде картинок или текстов, и возможность полностью описать задачу большим числом данных становится абсолютно реальной на практике.
Потестить различные техники из статей можно в песочнице нашего соревнования на Boosters, причем как на чисто табличных агрегатах, так и на последовательных данных. У двух статей есть открытый исходный код, так что с реализациями мучиться не придется.
🤔 Слово "бустинг" в этом посте оказалось популярнее множества слов {"mlp", "сетка"}.
💬 Автор поста @oasidorshin ответит на ваши вопросы про сравнение сеток с бустингами в комментариях.
#mlsysdesign #dl_in_finance
🔥33👍8❤4
Что вы выберете для табличных данных?
Anonymous Poll
79%
Boosting
6%
MLP
10%
Random Forest
2%
KNN
3%
Другое (укажите в комментариях)
Масштаб стажерских проектов в Лаборатории
🏆 Проект Лаборатории занял первое место во внутреннем конкурсе "Alfa Award 2021" в категории "сверхэффективность". Экспертное жюри, далее, сотрудники Альфы выбирали среди всех проектов банка — это не был конкурс для стажеров.
🎁 Победителей на бизнес-завтрак пригласил CEO Альфы.
💰 Команда получила материальное вознаграждение в размере 1 млн. рублей.
📸 Бывшие стажеры (сейчас middle DS) Лаборатории набора 2021, Владимир Верхошинский, команда клиентского опыта Альфа-Банка.
💬 Расскажите о своих стажерских проектах в комментариях.
#команда #стажировки
#карьера #ML_Lab
🏆 Проект Лаборатории занял первое место во внутреннем конкурсе "Alfa Award 2021" в категории "сверхэффективность". Экспертное жюри, далее, сотрудники Альфы выбирали среди всех проектов банка — это не был конкурс для стажеров.
🎁 Победителей на бизнес-завтрак пригласил CEO Альфы.
💰 Команда получила материальное вознаграждение в размере 1 млн. рублей.
📸 Бывшие стажеры (сейчас middle DS) Лаборатории набора 2021, Владимир Верхошинский, команда клиентского опыта Альфа-Банка.
💬 Расскажите о своих стажерских проектах в комментариях.
#команда #стажировки
#карьера #ML_Lab
🔥24👍7🏆1
Трудности перевода
🤔 Модель ровно по три раза выбрала мужской и женский род.
Как думаете почему так произошло❓
- Модель переобучилась под конкретный датасет.
- Модель не уверена в своем ответе.
- Новый вид борьбы с дискриминацией. 🤡
Как можно исправить эту проблему❓
- Постобработка текста после перевода.
- Добавление специальных токенов, определяющих пол автора.
💬 Расскажите, как вы добавляете пользовательские признаки в nlp-модели для перевода и чат-бота.
📨 Какие сейчас самые актуальные статьи по этой теме?
#mlsysdesign
🤔 Модель ровно по три раза выбрала мужской и женский род.
Как думаете почему так произошло❓
- Модель переобучилась под конкретный датасет.
- Модель не уверена в своем ответе.
- Новый вид борьбы с дискриминацией. 🤡
Как можно исправить эту проблему❓
- Постобработка текста после перевода.
- Добавление специальных токенов, определяющих пол автора.
💬 Расскажите, как вы добавляете пользовательские признаки в nlp-модели для перевода и чат-бота.
📨 Какие сейчас самые актуальные статьи по этой теме?
#mlsysdesign
😁23🔥3🤔2
Итоги 2022 года
💸 Что мы сделали значимого для Альфы?
⁃ Доработали нейронные сети - они стали классом моделей №1 в кредитном скоринге для клиентов Альфы.
⁃ Разработали внутреннюю модель чат-бота - обслуживаем ей 40% обращений клиентов.
⁃ Задеплоили в продашн 18 моделей и 1 сервис.
🗣 Что мы сделали для сообщества Data Science?
⁃ Разработали образовательный трек DL in Finance.
⁃ Провели 2 соревнования по анализу данных.
⁃ Выступили 21 раз на митапах, конференциях и образовательных программах.
⁃ Опубликовали 7 статей на хабр и 1 статью в печатном журнале.
⁃ Запустили магистратуру в МФТИ и стали менторами.
🏅 Как отметили наш вклад?
⁃ Data Fest 3.0 Top-1 трек по количеству участников.
⁃ Три призовых места в соревнованиях по анализу данных.
⁃ Первое место во внутреннем конкурсе проектов Alfa Award в категории сверхэффективность.
⁃ Статус номинанта в Forbes top 30 under 30.
📝 Какие результаты тг-канала "Нескучный Data Science" за этот год?
⁃ 4300+ подписчиков.
⁃ 350к суммарное количество просмотров.
⁃ 68 постов.
⁃ 2400+ реакций.
⁃ ~1700 пересылок постов.
⁃ ~500 комментариев.
🙏 Спасибо всем, кто был со мной на протяжении этого года и тем, кто присоединился недавно. Огромное спасибо за ваши реакции, пересылки постов и комментарии. Буду стараться и в следующем году радовать вас полезным контентом и личным опытом. Помните, то, что не пережил, не станет стихами.
💪 Следующий год будет полон новых вызовов и как следствие новых побед. Мы точно справимся, ведь каждый член команды обладает сильными техническими навыками, лидерскими качествами, огромной целеустремленностью и достаточной энергией чтобы преодолеть любые препятствия. Более того, работа в слаженной команде, преследующий общие цели не даст оступиться на пути к цели.
🙏 Благодарен каждому члену команды Лаборатории за то, что работает со мной в одной команде. Знаете, они могли попасть практически в любую команду, но выбрали именно Лабораторию.
По традиции, желаю всем в новом году работать в команде единомышленников, где ваша работа будет восприниматься вами в качестве хобби. 🎉🎉🎉
#ML_Lab
⁃ Доработали нейронные сети - они стали классом моделей №1 в кредитном скоринге для клиентов Альфы.
⁃ Разработали внутреннюю модель чат-бота - обслуживаем ей 40% обращений клиентов.
⁃ Задеплоили в продашн 18 моделей и 1 сервис.
🗣 Что мы сделали для сообщества Data Science?
⁃ Разработали образовательный трек DL in Finance.
⁃ Провели 2 соревнования по анализу данных.
⁃ Выступили 21 раз на митапах, конференциях и образовательных программах.
⁃ Опубликовали 7 статей на хабр и 1 статью в печатном журнале.
⁃ Запустили магистратуру в МФТИ и стали менторами.
🏅 Как отметили наш вклад?
⁃ Data Fest 3.0 Top-1 трек по количеству участников.
⁃ Три призовых места в соревнованиях по анализу данных.
⁃ Первое место во внутреннем конкурсе проектов Alfa Award в категории сверхэффективность.
⁃ Статус номинанта в Forbes top 30 under 30.
📝 Какие результаты тг-канала "Нескучный Data Science" за этот год?
⁃ 4300+ подписчиков.
⁃ 350к суммарное количество просмотров.
⁃ 68 постов.
⁃ 2400+ реакций.
⁃ ~1700 пересылок постов.
⁃ ~500 комментариев.
🙏 Спасибо всем, кто был со мной на протяжении этого года и тем, кто присоединился недавно. Огромное спасибо за ваши реакции, пересылки постов и комментарии. Буду стараться и в следующем году радовать вас полезным контентом и личным опытом. Помните, то, что не пережил, не станет стихами.
💪 Следующий год будет полон новых вызовов и как следствие новых побед. Мы точно справимся, ведь каждый член команды обладает сильными техническими навыками, лидерскими качествами, огромной целеустремленностью и достаточной энергией чтобы преодолеть любые препятствия. Более того, работа в слаженной команде, преследующий общие цели не даст оступиться на пути к цели.
🙏 Благодарен каждому члену команды Лаборатории за то, что работает со мной в одной команде. Знаете, они могли попасть практически в любую команду, но выбрали именно Лабораторию.
По традиции, желаю всем в новом году работать в команде единомышленников, где ваша работа будет восприниматься вами в качестве хобби. 🎉🎉🎉
#ML_Lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Linkedin
Друзья, поздравляю всех с новым годом! :slowpoke:
Желаю вам в новом году работать в команде, состоящей не только из умных и отзывчивых…
Желаю вам в новом году работать в команде, состоящей не только из умных и отзывчивых…
Друзья, поздравляю всех с новым годом! :slowpoke:
Желаю вам в новом году работать в команде, состоящей не только из умных и отзывчивых коллег, но также близких вам по духу!
P.S. Пожелайте нам найти хорошего фотографа в следующем году для корпоратива)
Желаю вам в новом году работать в команде, состоящей не только из умных и отзывчивых коллег, но также близких вам по духу!
P.S. Пожелайте нам найти хорошего фотографа в следующем году для корпоратива)
👍54🔥27❤7🎉7
Как стать Head of Data Science?
🤦♂️Ребят, вы че издеваетесь? Я понимаю, что вам хочется просто расслабиться и наслаждаться жизнью. И не думать о курсах по анализу данных, пользе DS для бизнеса, kaggle, резюме и собеседованиях.
🙅 Я понимаю, что вы уже не верите курсам от популярных блоггеров за 100k+ рубасов, как и они сами. Эти курсы нужно проходить больше месяца, а вам нужно в DS еще вчера.
🙏 Сегодня мне захотелось, чтобы через мой продукт смог пройти каждый. Чтобы у каждого была возможность обучаться и расти вместе со мной. Разработал для вас минутный курс, который позволит вам сразу стать Head of DS всего за три строчки кода.
🤙 Делитесь курсом с друзьями, чтобы не скучать в одиночку в бизнес джете.
📈 Прошедшие обучение говорят, что вы сможете стать kaggle grandmaster, если перепишите этот курс в одну строчку и сможете вычеркнуть Иван Иваныча из него навсегда.
🤡 Начинайте этот рабочий год с хорошего настроения, год будет тяжелым. Смех - это лучшее противоядие от стресса.
💬 Пишите о своих историях успеха после прохождения курса в комментариях.
#карьера
🤦♂️Ребят, вы че издеваетесь? Я понимаю, что вам хочется просто расслабиться и наслаждаться жизнью. И не думать о курсах по анализу данных, пользе DS для бизнеса, kaggle, резюме и собеседованиях.
🙅 Я понимаю, что вы уже не верите курсам от популярных блоггеров за 100k+ рубасов, как и они сами. Эти курсы нужно проходить больше месяца, а вам нужно в DS еще вчера.
🙏 Сегодня мне захотелось, чтобы через мой продукт смог пройти каждый. Чтобы у каждого была возможность обучаться и расти вместе со мной. Разработал для вас минутный курс, который позволит вам сразу стать Head of DS всего за три строчки кода.
🤙 Делитесь курсом с друзьями, чтобы не скучать в одиночку в бизнес джете.
📈 Прошедшие обучение говорят, что вы сможете стать kaggle grandmaster, если перепишите этот курс в одну строчку и сможете вычеркнуть Иван Иваныча из него навсегда.
🤡 Начинайте этот рабочий год с хорошего настроения, год будет тяжелым. Смех - это лучшее противоядие от стресса.
💬 Пишите о своих историях успеха после прохождения курса в комментариях.
#карьера
😁77👍13🤣12👎7🍌4❤1🍾1
Масштаб проектов Junior NLP DS в Лаборатории
📝 Про развитие чат-бота в Альфе вышла статья, где техническая часть с моих слов адаптирована под широкую аудиторию.
💪 Перечислю наши ключевые достижения:
- Разработали и внедрили свое решение, включающее порядка десятка моделей для различных направлений бизнеса. В течении этого года менялась инфраструктура для исполнения моделей, поэтому работу пришлось дублировать и быть первопроходцами на новой инфраструктуре.
- Показали лучшее качество по результатам а/б-теста по сравнению со внешним решением.
- Построили совместно с бизнесом с нуля процесс разметки данных, предварительно убедив банк в его необходимости.
🤔 К сожалению, без взятия дополнительной ответственности не обошлось. При обслуживании большого количества клиентов, для банка крайне важна стабильность решения. Сейчас мы дублируем инфраструктуру и выстроили несколько линий поддержки решения. Однако, в момент тестирования и перехода со внешнего решения на внутреннее этого ничего не было. Дата сайентист вместе с выделенным MLOPs на протяжении трех месяцев аккумулировали на себе задачи команды сопровождения. Благодаря нашей бизнес-ориентированности, мы становимся первым выбором для внутреннего заказчика в задачах обработки естественного языка.
👶 Как вы могли догадаться, всю техническую часть затащил всего один Junior DS. Впереди нас еще ждет огромный пласт работ, после выполнения которого, нам действительно будет не за что краснеть.
🗣 В этом году мы будем часто рассказывать про результаты работы nlp-направления: чат-боты, голосовые роботы, помощники операторам, работа с обратной связью клиентов и артефактами коммуникации с ними.
👋 Более того, мы будем масштабироваться и искать будущих лидеров в нашу команду.
💬 Набросьте нам в комментариях, что бы вы улучшили в нашем чат-боте.
#nlp #ML_Lab
📝 Про развитие чат-бота в Альфе вышла статья, где техническая часть с моих слов адаптирована под широкую аудиторию.
💪 Перечислю наши ключевые достижения:
- Разработали и внедрили свое решение, включающее порядка десятка моделей для различных направлений бизнеса. В течении этого года менялась инфраструктура для исполнения моделей, поэтому работу пришлось дублировать и быть первопроходцами на новой инфраструктуре.
- Показали лучшее качество по результатам а/б-теста по сравнению со внешним решением.
- Построили совместно с бизнесом с нуля процесс разметки данных, предварительно убедив банк в его необходимости.
🤔 К сожалению, без взятия дополнительной ответственности не обошлось. При обслуживании большого количества клиентов, для банка крайне важна стабильность решения. Сейчас мы дублируем инфраструктуру и выстроили несколько линий поддержки решения. Однако, в момент тестирования и перехода со внешнего решения на внутреннее этого ничего не было. Дата сайентист вместе с выделенным MLOPs на протяжении трех месяцев аккумулировали на себе задачи команды сопровождения. Благодаря нашей бизнес-ориентированности, мы становимся первым выбором для внутреннего заказчика в задачах обработки естественного языка.
👶 Как вы могли догадаться, всю техническую часть затащил всего один Junior DS. Впереди нас еще ждет огромный пласт работ, после выполнения которого, нам действительно будет не за что краснеть.
🗣 В этом году мы будем часто рассказывать про результаты работы nlp-направления: чат-боты, голосовые роботы, помощники операторам, работа с обратной связью клиентов и артефактами коммуникации с ними.
👋 Более того, мы будем масштабироваться и искать будущих лидеров в нашу команду.
💬 Набросьте нам в комментариях, что бы вы улучшили в нашем чат-боте.
#nlp #ML_Lab
vc.ru
Как в Альфа-Банке создали чат-бот, который понимает и отвечает, словно человек — Альфа-Банк на vc.ru
Это был абсолютный тупик. Осенью 2021 года команда чат-бота пыталась найти решение: уже третий месяц автоматизация запросов клиентов в приложении Альфа-Банка и в мобильном банке Альфа-Онлайн плавала между 38-40% и никак не хотела повышаться. Вдобавок другие…
🔥28👍11❤5
Десять важных вопросов перед трудоустройством в Data Science
Собеседование в компании, где будет вам честью поработатьбесплатно, может отнимать до пяти часов вашего времени. Вас попросят порешать гномиков и другие задачи во время интервью, а после него вы скорее всего будете заниматься менее интеллектуальным трудом и ботать гномиков к следующему собесу, посматривая в сторону леса вакансий.
Как определить будет ли ваша работа нескучным Data Science? Очень просто, нужно всего лишь очень подробно опросить своего будущего работодателя и поискать о нем информацию в сети. Никогда на это не жалейте времени, например, в последний раз лично потратил на это мероприятие четыре месяца.
Подготовил для вас десять важных вопросов, ответы на которые обязательно нужно знать до трудоустройства на новое место работы. Простым перечислением статья не ограничивается — подробно аргументирую, почему считаю ответ на каждый из вопросов обязательным до принятия решения. Не остался в стороне и рассказал, как обстоят дела в Лаборатории.
💬 А какие вопросы вы задаете работодателю перед трудоустройством?
🙏 Прочитав статью, вы надеюсь поймете, что для автора значит "Нескучный Data Science" и, наконец, почему этот канал называется именно так. Однако, не переживайте, в одном из будущих юбилейных постов дам более явное объяснение.
Если вы в поиске места работа, то желаю вам найти свой "Нескучный Data Science Jobs". Если вы в поисках команды, то приложите все усилия, чтобы создать его.
#статьи #карьера
Собеседование в компании, где будет вам честью поработать
Как определить будет ли ваша работа нескучным Data Science? Очень просто, нужно всего лишь очень подробно опросить своего будущего работодателя и поискать о нем информацию в сети. Никогда на это не жалейте времени, например, в последний раз лично потратил на это мероприятие четыре месяца.
Подготовил для вас десять важных вопросов, ответы на которые обязательно нужно знать до трудоустройства на новое место работы. Простым перечислением статья не ограничивается — подробно аргументирую, почему считаю ответ на каждый из вопросов обязательным до принятия решения. Не остался в стороне и рассказал, как обстоят дела в Лаборатории.
💬 А какие вопросы вы задаете работодателю перед трудоустройством?
🙏 Прочитав статью, вы надеюсь поймете, что для автора значит "Нескучный Data Science" и, наконец, почему этот канал называется именно так. Однако, не переживайте, в одном из будущих юбилейных постов дам более явное объяснение.
Если вы в поиске места работа, то желаю вам найти свой "Нескучный Data Science Jobs". Если вы в поисках команды, то приложите все усилия, чтобы создать его.
#статьи #карьера
🔥23👍8❤6
#карьера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥7⚡3❤2
Как стать Kaggle competition master?
🤔 Хотите стать Kaggle Master, но не знаете с чего начать?
Начните со статьи @oasidorshin, который уже успешно прошел этот путь.
⏳ Потратьте 14 минут вашего драгоценного времени, и вы узнаете:
⁃ Зачем нужно участвовать в соревнованиях, особенно если ищите работу в индустрии?
⁃ Сколько времени занял путь автора до заветного титула?
⁃ Как правильно валидироваться и подняться на 400+ мест на private leaderboard?
⁃ Как побеждать в соревнование без серьезных инвестиций в железо?
⁃ Какие методы ансамблирования заходят?
🧐 Не хотите становиться Kaggle Master?
Все равно прочтите статью и узнаете:
⁃ Как анализ данных помогает питомникам животных найти хозяев?
⁃ Какой пайплайн зашел в задаче регрессии на данных изображений?
⁃ Как трансформеры можно использовать в задачах компьютерного зрения?
🎯 Мы стараемся привлекать первоклассных игроков в Лабораторию, ведь они так любят работать вместе с другими первоклассными игроками.
🙏 Очень рады, что автор статьи из всех вариантов выбрал стажировку именно у нас. Как вы могли догадаться, он станет постоянным членом нашей команды в ближайшее время.
💬 Задавайте ваши вопросы автору статьи в комментариях и плюсуйте его достижение 💪 на habr.
#статьи #карьера #соревнования
🤔 Хотите стать Kaggle Master, но не знаете с чего начать?
Начните со статьи @oasidorshin, который уже успешно прошел этот путь.
⏳ Потратьте 14 минут вашего драгоценного времени, и вы узнаете:
⁃ Зачем нужно участвовать в соревнованиях, особенно если ищите работу в индустрии?
⁃ Сколько времени занял путь автора до заветного титула?
⁃ Как правильно валидироваться и подняться на 400+ мест на private leaderboard?
⁃ Как побеждать в соревнование без серьезных инвестиций в железо?
⁃ Какие методы ансамблирования заходят?
🧐 Не хотите становиться Kaggle Master?
Все равно прочтите статью и узнаете:
⁃ Как анализ данных помогает питомникам животных найти хозяев?
⁃ Какой пайплайн зашел в задаче регрессии на данных изображений?
⁃ Как трансформеры можно использовать в задачах компьютерного зрения?
🎯 Мы стараемся привлекать первоклассных игроков в Лабораторию, ведь они так любят работать вместе с другими первоклассными игроками.
🙏 Очень рады, что автор статьи из всех вариантов выбрал стажировку именно у нас. Как вы могли догадаться, он станет постоянным членом нашей команды в ближайшее время.
💬 Задавайте ваши вопросы автору статьи в комментариях и плюсуйте его достижение 💪 на habr.
#статьи #карьера #соревнования
🔥37👍7🐳4👏2
Эффективный алгоритм найма дата сайентистов
😲 Существует очень простой и интуитивный алгоритм найма, по которому набираю себе команду уже почти 5 лет. Хочу поделиться с вами этими пятью шагами.
1️⃣ Составляешь описание вакансии самостоятельно. Описываешь подробно требования к кандидату и что ему предстоит делать. Таким образом экономишь свое время и относишься с уважением к времени соискателей.
2️⃣ Публикуешь вакансию в ODS, linkedin, Нескучный Data Science Jobs. Отвечаешь на все вопросы сообщества по теме вакансии.
3️⃣ Выбираешь кандидатов для телефонного звонка. Подчеркиваешь ценность позиции личным звонком.
4️⃣ Проводишь одно часовое собеседование. Спрашиваешь только то, что пригодится на работе.
5️⃣ Передаешь кандидата на оформление в отдел кадров. Заводишь заявку на доступы для ускорения онбординга.
🤔 Кому-то покажется, что я "капитаню". Однако, по моим наблюдениям, не все нанимающие менеджеры знают об этом алгоритме и продолжают искать на hh.ru. Более того, некоторые DSы до сих пор не знают, что эффективнее всего искать работу в ODS.
💬 Какой алгоритм найма используете вы? Какой опыт трудоустройства вам больше всего запомнился?
#карьера
😲 Существует очень простой и интуитивный алгоритм найма, по которому набираю себе команду уже почти 5 лет. Хочу поделиться с вами этими пятью шагами.
1️⃣ Составляешь описание вакансии самостоятельно. Описываешь подробно требования к кандидату и что ему предстоит делать. Таким образом экономишь свое время и относишься с уважением к времени соискателей.
2️⃣ Публикуешь вакансию в ODS, linkedin, Нескучный Data Science Jobs. Отвечаешь на все вопросы сообщества по теме вакансии.
3️⃣ Выбираешь кандидатов для телефонного звонка. Подчеркиваешь ценность позиции личным звонком.
4️⃣ Проводишь одно часовое собеседование. Спрашиваешь только то, что пригодится на работе.
5️⃣ Передаешь кандидата на оформление в отдел кадров. Заводишь заявку на доступы для ускорения онбординга.
🤔 Кому-то покажется, что я "капитаню". Однако, по моим наблюдениям, не все нанимающие менеджеры знают об этом алгоритме и продолжают искать на hh.ru. Более того, некоторые DSы до сих пор не знают, что эффективнее всего искать работу в ODS.
💬 Какой алгоритм найма используете вы? Какой опыт трудоустройства вам больше всего запомнился?
#карьера
👍34🤔4👎3💯3❤2
Проактивный алгоритм найма
Алгоритм гораздо проще предыдущего, ведь состоит из одного пункта. 🎉
⚠️ Будьте готовы, что вам не только ответят отказом, но и вовсе проигнорируют.
Готовы? Открывайте! 👇
1️⃣ Напишите самостоятельно заинтересовавшему вас специалисту в личку на LinkedIn.
💁♂️ Подсказка: Обратите особое внимание на иконку "open to work".
➕ Большой плюс этой социальной сети - вы видите сразу резюме и ваше видят тоже.
🤔 Скорее всего, я не первый его придумал - очень часто по этому алгоритму пытаются схантить меня.
🤔 Уверен, это один из лучших форматов для закрытия Team Lead.+ позиций.
😅 В тот день открытых дверей на Физтехе мы с Демидом проявили проактивность и раздали больше сотни стикер-паков.
🤣 Не зарегистрировались в LinkedIn - ошибка, не добавились в друзья - фатальная ошибка.
#карьера
Алгоритм гораздо проще предыдущего, ведь состоит из одного пункта. 🎉
⚠️ Будьте готовы, что вам не только ответят отказом, но и вовсе проигнорируют.
Готовы? Открывайте! 👇
💁♂️
➕
🤔 Скорее всего, я не первый его придумал - очень часто по этому алгоритму пытаются схантить меня.
🤔 Уверен, это один из лучших форматов для закрытия Team Lead.+ позиций.
😅 В тот день открытых дверей на Физтехе мы с Демидом проявили проактивность и раздали больше сотни стикер-паков.
🤣 Не зарегистрировались в LinkedIn - ошибка, не добавились в друзья - фатальная ошибка.
#карьера
👍23🔥7⚡2
Алгоритм получения 300k/сек для студентов
💸 Хотите заработать 300k/сек не отходя от ВУЗа и не кричать "свободная касса"?
🎓 Учитесь на 3-4 курсе в ВУЗе?
👇 Действуйте по алгоритму ниже, если ответили "да" на оба вопроса.
✈️ Перешлите пост знакомым студентам в противном случае.
1️⃣ Открываете страницу стипендии Альфа-Шанс.
2️⃣ Заполняете заявку на грант.
3️⃣ Отправьте заявку меньше, чем за 1 секунду.
🗣 В прошлом году очень активно лично рассказывали об этой стипендии на всех днях карьеры.
ИМХО, сейчас не очень высокая конкуренция и большой шанс ее получить.
📈 Кстати, в начале моей учебы на Физтехе, стандартная(без троек) стипендия составляла 2.5k, а повышенная(одни пятерки) 3к. К счастью, за 6 лет обучения, она выросла в два раза.
🤑 Существовали и другие стипендии. "Абрамовка" - доставалась небольшому числу топ-студентов по среднему баллу на каждом факультете и составляла 8к. ПГАС - стипендия за научные или спортивные достижения размером порядка 15к.
👆 Эта стипендия больше всех вышеперечисленных!
Всегда учился без троек, один раз даже получил повышенную + Абрамовку.
💬 Как часто вы пересекались со стипендией во время учебы?
#карьера
💸 Хотите заработать 300k/сек не отходя от ВУЗа и не кричать "свободная касса"?
🎓 Учитесь на 3-4 курсе в ВУЗе?
👇 Действуйте по алгоритму ниже, если ответили "да" на оба вопроса.
2️⃣
3️⃣
🗣 В прошлом году очень активно лично рассказывали об этой стипендии на всех днях карьеры.
ИМХО, сейчас не очень высокая конкуренция и большой шанс ее получить.
📈 Кстати, в начале моей учебы на Физтехе, стандартная(без троек) стипендия составляла 2.5k, а повышенная(одни пятерки) 3к. К счастью, за 6 лет обучения, она выросла в два раза.
🤑 Существовали и другие стипендии. "Абрамовка" - доставалась небольшому числу топ-студентов по среднему баллу на каждом факультете и составляла 8к. ПГАС - стипендия за научные или спортивные достижения размером порядка 15к.
👆 Эта стипендия больше всех вышеперечисленных!
Всегда учился без троек, один раз даже получил повышенную + Абрамовку.
💬 Как часто вы пересекались со стипендией во время учебы?
#карьера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19👎3🔥3❤1🙏1
Лидер vs эффективный менеджер
🔎 Уже в следующем месяце буду искать в Лабораторию Team Lead DS в NLP.
Выделяю для себя два класса руководителей: эффективный менеджер и лидер.
✍️ Различаю их по двум ключевых маркерам:
👉 Если ты внутри команды, то отчет по срокам задач будет единственным форматом коммуникации, интересующим эффективного менеджера. Лидер же будет приходить часто к тебе с новыми идеями, пытаясь тебя и команду максимально вовлекать в процесс брейншторма и совместного планирования реализации амбициозных задач.
👉 Группа лидеров команд обычно фокусируется на том, как совместными силами их команд сделать классный продукт, совершить бизнес-прорыв или поменять устоявшийся неоптимальный порядок вещей для клиентов компании или ее сотрудников.
Если этих маркеров недостаточно, то вот что пишут на сайтах про лидерство.
⚠️ Осторожно высокопарный слог!
1. Руководитель управляет, лидер изменяет и совершенствует.
2. Руководитель — это копия, лидер — это оригинал.
3. Руководитель поддерживает, лидер развивается.
4. Руководитель фокусируется на системах и структуре, лидер фокусируется на людях.
5. Руководитель полагается на контроль, лидер внушает доверие.
6. Замысел руководителя краткосрочный, у лидера далекие перспективы.
7. Руководитель спрашивает, каким образом и когда, лидер спрашивает, что и почему.
8. Руководитель смотрит на нижнюю строчку с «Итого», лидер поднимает глаза на горизонт.
9. Руководитель подражает, лидер создает.
10. Руководитель принимает текущее положение дел, лидер бросает ему вызов.
11. Руководитель — классический бравый солдат, лидер — это только он сам.
12. Руководитель делает все правильно, лидер делает правильные вещи.
Очевидно, что сочетание лучших качеств от обоих типов - идеальный вариант руководителя. Однако,
💬 Вы бы предпочли работать с эффективным менеджером или лидером?
💬 Какое оптимальное соотношение лидеров и эффективных менеджеров в компании?
Опросы вас ждут в комментариях к посту.👇
🔜 В следующий раз расскажу на что обращаю внимание при поиске Тим Лидов.
#карьера
🔎 Уже в следующем месяце буду искать в Лабораторию Team Lead DS в NLP.
Выделяю для себя два класса руководителей: эффективный менеджер и лидер.
✍️ Различаю их по двум ключевых маркерам:
👉 Если ты внутри команды, то отчет по срокам задач будет единственным форматом коммуникации, интересующим эффективного менеджера. Лидер же будет приходить часто к тебе с новыми идеями, пытаясь тебя и команду максимально вовлекать в процесс брейншторма и совместного планирования реализации амбициозных задач.
👉 Группа лидеров команд обычно фокусируется на том, как совместными силами их команд сделать классный продукт, совершить бизнес-прорыв или поменять устоявшийся неоптимальный порядок вещей для клиентов компании или ее сотрудников.
Если этих маркеров недостаточно, то вот что пишут на сайтах про лидерство.
⚠️ Осторожно высокопарный слог!
2. Руководитель — это копия, лидер — это оригинал.
3. Руководитель поддерживает, лидер развивается.
4. Руководитель фокусируется на системах и структуре, лидер фокусируется на людях.
5. Руководитель полагается на контроль, лидер внушает доверие.
6. Замысел руководителя краткосрочный, у лидера далекие перспективы.
7. Руководитель спрашивает, каким образом и когда, лидер спрашивает, что и почему.
8. Руководитель смотрит на нижнюю строчку с «Итого», лидер поднимает глаза на горизонт.
9. Руководитель подражает, лидер создает.
10. Руководитель принимает текущее положение дел, лидер бросает ему вызов.
11. Руководитель — классический бравый солдат, лидер — это только он сам.
12. Руководитель делает все правильно, лидер делает правильные вещи.
Очевидно, что сочетание лучших качеств от обоих типов - идеальный вариант руководителя. Однако,
💬 Вы бы предпочли работать с эффективным менеджером или лидером?
💬 Какое оптимальное соотношение лидеров и эффективных менеджеров в компании?
Опросы вас ждут в комментариях к посту.👇
🔜 В следующий раз расскажу на что обращаю внимание при поиске Тим Лидов.
#карьера
👍16🔥7❤6🐳4👎2
Как лидерам и эффективными менеджерами ужиться в одной компании?
📊 По результатам опроса в канале и linkedin, большинство(~80%) ответивших предпочитают работать под руководством лидера. Более того, опрошенные предпочитают работать в компаниях, где лидеров больше, чем эффективных менеджеров.
Всегда ли нужны лидеры вашей команде?
👉 Вам точно нужен лидер если вы создаете что-то новое или меняете старые парадигмы в компании. Лидер, в отличии от фантазера, не только генерирует вижн, но и отвечает за конечный результат.
👉 Вам точно нужен лидер, если область его компетенций не является core-бизнесом компании, но необходима бизнесу для развития.
👉 Вам точно нужен хотя бы один лидер чтобы иметь альтернативную точку зрения и не погрязнуть в рутинных процессах, пока другие компании меняют рынок.
👉 Часто лидер эффективно менторит команду и растит лидеров внутри, но не всегда)
Эффективные менеджеры точно не нужны?
👉 В свою очередь, эффективные менеджеры точно нужны для управления уже состоявшимися процессами и командами или их шаблонного построения.
👉 В случаях, когда предстоит выполнять не самую интересную, но важную работу без эффективного менеджера команда не справится, а компания забуксует.
👉 Необходимость эффективных менеджеров возрастает, если требуется жестко контролировать результат работы команды.
Есть ли противоречия или конфликт между этими ролями?
🤔 Роли тесно связаны между собой - лидеры выступают локомотивом для создания будущих процессов, пока эффективные менеджеры поддерживают устоявшиеся. Далее, часть новых процессов становится эффективной рутиной, которые передаются эффективным менеджерам и так далее. Правильный баланс между этим роля в компании позволяет не упустить новые возможности и не расшатать фундамент в погоне за ними.
🤝 Избежать конфликтов помогает взаимное уважение сильных сторон каждого и правильное распределение задач, согласно уровню компетенций и реального опыта, а не только грейда.
Как в Лаборатории?
📈 На данном этапе мы отдаем предпочтение лидерам, так как мы меняем парадигмы Data Science в компании. Мы делаем огромный фокус на ответственность чтобы бизнес нам доверял, а мы помогали ему становиться более технологичным.
💬 Результаты опросов в комментариях. 👇
#карьера
📊 По результатам опроса в канале и linkedin, большинство(~80%) ответивших предпочитают работать под руководством лидера. Более того, опрошенные предпочитают работать в компаниях, где лидеров больше, чем эффективных менеджеров.
Всегда ли нужны лидеры вашей команде?
👉 Вам точно нужен лидер если вы создаете что-то новое или меняете старые парадигмы в компании. Лидер, в отличии от фантазера, не только генерирует вижн, но и отвечает за конечный результат.
👉 Вам точно нужен лидер, если область его компетенций не является core-бизнесом компании, но необходима бизнесу для развития.
👉 Вам точно нужен хотя бы один лидер чтобы иметь альтернативную точку зрения и не погрязнуть в рутинных процессах, пока другие компании меняют рынок.
👉 Часто лидер эффективно менторит команду и растит лидеров внутри, но не всегда)
Эффективные менеджеры точно не нужны?
👉 В свою очередь, эффективные менеджеры точно нужны для управления уже состоявшимися процессами и командами или их шаблонного построения.
👉 В случаях, когда предстоит выполнять не самую интересную, но важную работу без эффективного менеджера команда не справится, а компания забуксует.
👉 Необходимость эффективных менеджеров возрастает, если требуется жестко контролировать результат работы команды.
Есть ли противоречия или конфликт между этими ролями?
🤔 Роли тесно связаны между собой - лидеры выступают локомотивом для создания будущих процессов, пока эффективные менеджеры поддерживают устоявшиеся. Далее, часть новых процессов становится эффективной рутиной, которые передаются эффективным менеджерам и так далее. Правильный баланс между этим роля в компании позволяет не упустить новые возможности и не расшатать фундамент в погоне за ними.
🤝 Избежать конфликтов помогает взаимное уважение сильных сторон каждого и правильное распределение задач, согласно уровню компетенций и реального опыта, а не только грейда.
Как в Лаборатории?
📈 На данном этапе мы отдаем предпочтение лидерам, так как мы меняем парадигмы Data Science в компании. Мы делаем огромный фокус на ответственность чтобы бизнес нам доверял, а мы помогали ему становиться более технологичным.
💬 Результаты опросов в комментариях. 👇
#карьера
👍17❤4🔥3👎2
Как найти хорошего DS Team Lead?
При найме на руководящую позицию нередко делают основной акцент на софт скиллы. В некоторых случаях и вовсе ими ограничиваются. Однако на одних софт скиллах далеко не уедешь, ведь приходится отвечать за результаты всей команды.
🤔 Какая может быть природа таких заблуждений? Одним может показаться, что хардовая часть вовсе не зависит от тим лида, ведь он сам практически не пишет код. Другим причудиться, что успешность проектов зависит только от трудолюбия и скиллов команды и, конечно же от навыка руководителя правильно коммуницировать внутри и вовне, а также правильно презентовать результаты. В результате этих суждений, методом исключений хард скиллов, как раз остаются только софт скиллы.
Кто-то приходит к мысли, что хорошим DS Team Lead может стать любой менеджер. Тем не менее, хороших Тим Лидов, которых я встречал в индустрии, объединяют следующие факторы: они все в прошлом Senior DS и имеют опыт успешной монетизации данных. Далее, подробно расскажу, почему это так важно.
✅ Бывший Senior Data Scientist
➕ Качественный найм. Вспомним еще раз, что код пишет не тим лид, а его команда. Тем не менее существует небольшая проблема - нужно нанять эту команду. Более того, любой руководитель должен стараться нанимать людей скилловее себя. Как распознать эти скиллы, если у тебя нет базы? Например, сейчас все пишут про BERT на позицию в NLP, но как среди них отобрать тех, кто шарит, если никогда сам его не обучал? Никак, все кандидаты для тебя будут одинаковые. Когда харды неразличимы, то решение будет приниматься на основании софтов. Выход, кажется, есть - переадресовать синьору техническую часть собеседования. А кто наймет синьора?)
➕ Принятие несложных технических решений самостоятельно. Отсутствие технической экспертизы у руководителя нередко тормозит процесс принятия решений или, что хуже, даже приводит к неправильным решениям. Вы наверно слышали о встречах в составе 10 менеджеров вертикали и двух разработчиков. Теперь вы знаете первопричину. В некоторых компаниях дата сайентистами могут управлять даже проджект менеджеры. Знаете, это обычно печальное зрелище, так как на любой технический вопрос другого Тим Лида, требуется консультация команды, которую нужно закинуть в следующий двухнедельный спринт(
➕ Развитие команды. А тут зачем база? Безусловно, существуют курсы по закрытию теоретических пробелов, можно учиться у более опытных коллег в команде, код ревью адресовать синьорам. Тем не менее, как выявить западающие компетенции и начать их развивать у конкретного члена команды?
➕ Минимизация микроменеджмента и бюрократии. Представьте, что вы не вдупляете, чем занимается ваша команда, но отвечаете за результат. Какие ваши действия? Правильно, вы попытаетесь проконтролировать все этапы работы команды. Чем больше вы не в теме, тем больше микроменеджмента и бюрократии стоит от вас ожидать. Если вы в теме, то по косвенным признакам, подобно опытному преподу на экзамене, вы сразу выявите студента, который не выучил материал, что вам позволит не мешать работать остальной части команды.
➕ Признание от сильной команды. Не разбираясь в базе, будет сложно выстраивать коммуникацию с командой. Будет невозможно понять, о чем они там говорят на встречах. В конфликтных ситуациях по техническим вопросам, будет сложно быстро понять кто прав, а кто нет. Наконец, будет тяжело оценить по достоинству инициативы, с которыми будут приходить заряженные члены команды. В итоге, часть решений будет принята неправильно, коммуникация будет скорее формальная, а вовлеченность команды и признание руководителя пониженными.
#карьера
При найме на руководящую позицию нередко делают основной акцент на софт скиллы. В некоторых случаях и вовсе ими ограничиваются. Однако на одних софт скиллах далеко не уедешь, ведь приходится отвечать за результаты всей команды.
🤔 Какая может быть природа таких заблуждений? Одним может показаться, что хардовая часть вовсе не зависит от тим лида, ведь он сам практически не пишет код. Другим причудиться, что успешность проектов зависит только от трудолюбия и скиллов команды и, конечно же от навыка руководителя правильно коммуницировать внутри и вовне, а также правильно презентовать результаты. В результате этих суждений, методом исключений хард скиллов, как раз остаются только софт скиллы.
Кто-то приходит к мысли, что хорошим DS Team Lead может стать любой менеджер. Тем не менее, хороших Тим Лидов, которых я встречал в индустрии, объединяют следующие факторы: они все в прошлом Senior DS и имеют опыт успешной монетизации данных. Далее, подробно расскажу, почему это так важно.
✅ Бывший Senior Data Scientist
➕ Качественный найм. Вспомним еще раз, что код пишет не тим лид, а его команда. Тем не менее существует небольшая проблема - нужно нанять эту команду. Более того, любой руководитель должен стараться нанимать людей скилловее себя. Как распознать эти скиллы, если у тебя нет базы? Например, сейчас все пишут про BERT на позицию в NLP, но как среди них отобрать тех, кто шарит, если никогда сам его не обучал? Никак, все кандидаты для тебя будут одинаковые. Когда харды неразличимы, то решение будет приниматься на основании софтов. Выход, кажется, есть - переадресовать синьору техническую часть собеседования. А кто наймет синьора?)
➕ Принятие несложных технических решений самостоятельно. Отсутствие технической экспертизы у руководителя нередко тормозит процесс принятия решений или, что хуже, даже приводит к неправильным решениям. Вы наверно слышали о встречах в составе 10 менеджеров вертикали и двух разработчиков. Теперь вы знаете первопричину. В некоторых компаниях дата сайентистами могут управлять даже проджект менеджеры. Знаете, это обычно печальное зрелище, так как на любой технический вопрос другого Тим Лида, требуется консультация команды, которую нужно закинуть в следующий двухнедельный спринт(
➕ Развитие команды. А тут зачем база? Безусловно, существуют курсы по закрытию теоретических пробелов, можно учиться у более опытных коллег в команде, код ревью адресовать синьорам. Тем не менее, как выявить западающие компетенции и начать их развивать у конкретного члена команды?
➕ Минимизация микроменеджмента и бюрократии. Представьте, что вы не вдупляете, чем занимается ваша команда, но отвечаете за результат. Какие ваши действия? Правильно, вы попытаетесь проконтролировать все этапы работы команды. Чем больше вы не в теме, тем больше микроменеджмента и бюрократии стоит от вас ожидать. Если вы в теме, то по косвенным признакам, подобно опытному преподу на экзамене, вы сразу выявите студента, который не выучил материал, что вам позволит не мешать работать остальной части команды.
➕ Признание от сильной команды. Не разбираясь в базе, будет сложно выстраивать коммуникацию с командой. Будет невозможно понять, о чем они там говорят на встречах. В конфликтных ситуациях по техническим вопросам, будет сложно быстро понять кто прав, а кто нет. Наконец, будет тяжело оценить по достоинству инициативы, с которыми будут приходить заряженные члены команды. В итоге, часть решений будет принята неправильно, коммуникация будет скорее формальная, а вовлеченность команды и признание руководителя пониженными.
#карьера
👍25❤3🔥2
✅ Обширный опыт успешной монетизации данных
➕ Оптимальная постановка задачи. Успех ml-проекта зависит от глубины понимания оптимизируемого бизнес-процесса, качества и доступности данных, способа интеграции решения, скиллов команды и готовности инфраструктуры. Успешный опыт монетизации данных, позволяет оценить все эти факторы и поставить задачу на старте таким образом, чтобы в минимально возможные сроки можно было получить максимум пользы для компании. Богатый доменный опыт позволяет сразу использовать лучшую практику с учетом специфики бизнеса компании. Хорошим показателем является доведение до бизнес-применения 90+% разрабатываемых моделей в команде.
➕ Продажа и отмена ml-проектов. В силу относительной молодости области анализа данных руководители непрофильных команд редко понимают, как правильно ставить задачи, что машинное обучение может и, главное, как применять его для улучшения своих процессов. Задача руководителя команды - помочь своим коллегам из смежных команд в этом непростом пути поиска точек применения машинного обучения, а также в грамотном объяснении случаев, где оно вовсе не требуется.
🤔 Если вы подаетесь на позицию DS Team Lead, то тщательно изучайте опыт вашего руководителя.
С ростом грейда руководителя должен расти опыт успешной монетизации данных. Тем не менее хардовой опыт является обязательным, ведь рыба гниет с головы.
💬 Верю, что можно прийти на позицию DS Team Lead, будучи синьором и на месте прокачать софт скиллы и набраться опыта со старшим руководителем в монетизации данных. Однако в обратное не верю, а вы?
#карьера
➕ Оптимальная постановка задачи. Успех ml-проекта зависит от глубины понимания оптимизируемого бизнес-процесса, качества и доступности данных, способа интеграции решения, скиллов команды и готовности инфраструктуры. Успешный опыт монетизации данных, позволяет оценить все эти факторы и поставить задачу на старте таким образом, чтобы в минимально возможные сроки можно было получить максимум пользы для компании. Богатый доменный опыт позволяет сразу использовать лучшую практику с учетом специфики бизнеса компании. Хорошим показателем является доведение до бизнес-применения 90+% разрабатываемых моделей в команде.
➕ Продажа и отмена ml-проектов. В силу относительной молодости области анализа данных руководители непрофильных команд редко понимают, как правильно ставить задачи, что машинное обучение может и, главное, как применять его для улучшения своих процессов. Задача руководителя команды - помочь своим коллегам из смежных команд в этом непростом пути поиска точек применения машинного обучения, а также в грамотном объяснении случаев, где оно вовсе не требуется.
🤔 Если вы подаетесь на позицию DS Team Lead, то тщательно изучайте опыт вашего руководителя.
С ростом грейда руководителя должен расти опыт успешной монетизации данных. Тем не менее хардовой опыт является обязательным, ведь рыба гниет с головы.
💬 Верю, что можно прийти на позицию DS Team Lead, будучи синьором и на месте прокачать софт скиллы и набраться опыта со старшим руководителем в монетизации данных. Однако в обратное не верю, а вы?
#карьера
🔥23👍11
😮💨 Отсмотрел порядка 200 резюме на позицию DS NLP в Лабораторию, сегодня поделюсь обратной связью по формату подачи, оформлению резюме и ссылкой на более подробный разбор по теме составления резюме.
🤔 Хотите попасть на собеседование? Мыслите, как собеседующий еще на этапе отклика на вакансию. Главная цель нанимающего менеджера - найти лучшего кандидата за минимальное количество собеседований. Не стоит ожидать максимально честный экзамен для всех желающих, в виду его конечного временного ресурса.
Воронка приглашений на собеседование начинается с этапа получения резюме.
Топ ошибок по формату текущей подачи:
🤦♂️ Ссылка на резюме на HH.ru, которая не открывается даже после авторизации.
😐 Ссылка на резюме на yandex/google-диск или сайт-резюме. Не на всех рабочих компьютерах открываются внешние ссылки. Каждый дополнительный клик может снизить конверсию в отклик. Открывать сайт, который доступен только через vpn не каждый рекрутер будет.
🤔 Стандартное название вместо “ NameSurname.pdf”: "резюме.pdf", "cv.pdf", "ds.pdf". Его не только неудобно искать, но и можно случайно затереть другим кандидатом.
⚠️ Лучше не подавать резюме в pdf-формате hh.ru или word-файлом.
По той же причине, по которой лучше не делать большой фокус на курсы на Я.Практикум/GeekBrains - низкая конверсию в успех отпугивает собеседующего. Обычно с hh.ru приходят резюме тех, кто еще не успел интегрироваться в DS-сообщество или не научился техать резюме (нередко коррелирует с опытом программирования).
🧑💻 На что обращает внимание нанимающий менеджер?
Хотите повысить шанс попасть на собеседование - сделайте акцент на том, что указано в вакансии. Напишите свои сильные стороны относительно конкретной позиции в начале резюме. Не расписывайте подробно нерелевантный опыт в своем резюме.
🤔 Нет времени мастерить резюме под каждый отклик?
Укажите в тексте письма кратко ваши сильные стороны для этой позиции. Будет лучше, сочинения на тему вашей высокой мотивации найти работу.
Другие советы по составлению резюме читайте в канале @start_ds.
#карьера
🤔 Хотите попасть на собеседование? Мыслите, как собеседующий еще на этапе отклика на вакансию. Главная цель нанимающего менеджера - найти лучшего кандидата за минимальное количество собеседований. Не стоит ожидать максимально честный экзамен для всех желающих, в виду его конечного временного ресурса.
Воронка приглашений на собеседование начинается с этапа получения резюме.
Топ ошибок по формату текущей подачи:
🤦♂️ Ссылка на резюме на HH.ru, которая не открывается даже после авторизации.
😐 Ссылка на резюме на yandex/google-диск или сайт-резюме. Не на всех рабочих компьютерах открываются внешние ссылки. Каждый дополнительный клик может снизить конверсию в отклик. Открывать сайт, который доступен только через vpn не каждый рекрутер будет.
🤔 Стандартное название вместо “ NameSurname.pdf”: "резюме.pdf", "cv.pdf", "ds.pdf". Его не только неудобно искать, но и можно случайно затереть другим кандидатом.
⚠️ Лучше не подавать резюме в pdf-формате hh.ru или word-файлом.
По той же причине, по которой лучше не делать большой фокус на курсы на Я.Практикум/GeekBrains - низкая конверсию в успех отпугивает собеседующего. Обычно с hh.ru приходят резюме тех, кто еще не успел интегрироваться в DS-сообщество или не научился техать резюме (нередко коррелирует с опытом программирования).
🧑💻 На что обращает внимание нанимающий менеджер?
Хотите повысить шанс попасть на собеседование - сделайте акцент на том, что указано в вакансии. Напишите свои сильные стороны относительно конкретной позиции в начале резюме. Не расписывайте подробно нерелевантный опыт в своем резюме.
🤔 Нет времени мастерить резюме под каждый отклик?
Укажите в тексте письма кратко ваши сильные стороны для этой позиции. Будет лучше, сочинения на тему вашей высокой мотивации найти работу.
Другие советы по составлению резюме читайте в канале @start_ds.
#карьера
👍43❤7😁3👎2👏1
Команда "Лаборатория" заняла 1 первое место в задаче «Защита» на Data Fusion.
Соревнование проходило в новом формате:
1️⃣ отбираются топ-10 команд по задачам Атаки и Защиты против решений организаторов
2️⃣ лучшие решения сражаются против друг друга
В задаче можно было подменять только в 3% транзакций категорию трат и ее размер.
🚀 В задаче атаки команде удавалось пробивать исходное решения на 41 п. п. ROC AUC.
💪 Самая успешная атака смогла ухудшить решения Лаборатории всего на 2 п.п. ROC AUC.
📈 Улучшили нейронку организаторов на 5 п.п. ROC AUC практически без данных.
Подключайтесь завтра на конференцию в 16:50 (2 стрим) и узнаете:
- Как повысить робастность ваших моделей
- Как обучать нейронками бустинги
- Как архитектурно улучшать модели, если практически нет данных
P.S. каждый победитель получит премию от 🅰️
#соревнования #ML_Lab
Соревнование проходило в новом формате:
В задаче можно было подменять только в 3% транзакций категорию трат и ее размер.
🚀 В задаче атаки команде удавалось пробивать исходное решения на 41 п. п. ROC AUC.
💪 Самая успешная атака смогла ухудшить решения Лаборатории всего на 2 п.п. ROC AUC.
Подключайтесь завтра на конференцию в 16:50 (2 стрим) и узнаете:
- Как повысить робастность ваших моделей
- Как обучать нейронками бустинги
- Как архитектурно улучшать модели, если практически нет данных
P.S. каждый победитель получит премию от 🅰️
#соревнования #ML_Lab
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35🔥26👍19👎1
Media is too big
VIEW IN TELEGRAM
Революция в кредитном скоринге full video
🧠 ChatGPT уже изучила курс DL in Finance и понимает, как провести революцию в кредитном скоринге.
📺 Посмотрите ролик для внутреннего конкурса проектов и узнаете, насколько наши с ней взгляды совпадают.
🤔 Сейчас нейронки уже стабильно улучшают core-бизнес процессы компании на протяжении почти трех лет. Самое время рассказать, что было на старте проекта, с какими сложностями мы столкнулись и как их преодолели:
💪 Не было понимания зачем нужны нейронные сети - показали их эффективность в core-бизнес направлениях.
🔍 Не было инфраструктуры для применения моделей - нашли ресурсы внутри компании без дополнительной закупки.
🦾 Не было места в очереди на получение доступов в ближайшие три месяца - научились открывать двери без специального доступа по пропуску.
📨 Не было интеграции с кредитным конвеером - передавали файлики по почте на протяжении полутора лет.
🧑💻 На этот раз у нас не было бюджета на оператора и актерские курсы - сделали все сами.
🔜 В ближайшее время выпустим статью про нейронку для объединения всех нейронок (транзакции x2, бки, другое), оставайтесь на связи.
Команда освоила новую профессию, ставьте 🔥если вам понравилось видео.
P.S. знаю, что у второго актера начинает появляться фан-база.
💬 В каком формате вы показываете бизнесу ценность Data Science?)
#автоматизация_ds #ML_Lab #видео
🧠 ChatGPT уже изучила курс DL in Finance и понимает, как провести революцию в кредитном скоринге.
📺 Посмотрите ролик для внутреннего конкурса проектов и узнаете, насколько наши с ней взгляды совпадают.
🤔 Сейчас нейронки уже стабильно улучшают core-бизнес процессы компании на протяжении почти трех лет. Самое время рассказать, что было на старте проекта, с какими сложностями мы столкнулись и как их преодолели:
💪 Не было понимания зачем нужны нейронные сети - показали их эффективность в core-бизнес направлениях.
🔍 Не было инфраструктуры для применения моделей - нашли ресурсы внутри компании без дополнительной закупки.
🦾 Не было места в очереди на получение доступов в ближайшие три месяца - научились открывать двери без специального доступа по пропуску.
📨 Не было интеграции с кредитным конвеером - передавали файлики по почте на протяжении полутора лет.
🧑💻 На этот раз у нас не было бюджета на оператора и актерские курсы - сделали все сами.
🔜 В ближайшее время выпустим статью про нейронку для объединения всех нейронок (транзакции x2, бки, другое), оставайтесь на связи.
Команда освоила новую профессию, ставьте 🔥если вам понравилось видео.
P.S. знаю, что у второго актера начинает появляться фан-база.
💬 В каком формате вы показываете бизнесу ценность Data Science?)
#автоматизация_ds #ML_Lab #видео
🔥36👍9❤4👎4🙈4🤯2🌭2😱1