Data Secrets | Карьера
6.49K subscribers
1.05K photos
47 videos
1 file
1.16K links
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

Прислать вакансию/сотрудничество: @veron_28

https://telega.in/c/data_secrets_career
Download Telegram
#Шереметьево: Аналитик больших данных
#Офис

⚙️ Требования:
• Высшее техническое / экономическое образование;
• Опыт работы от 1 лет (в области построения предиктивных моделей/
обработки bigdata);
• Знание ключевых библиотек анализа и обработки данных, принципов работы основных алгоритмов классификации, кластеризации и регрессии в различных программных средах;
• Уверенное владение MS Excel (в т.ч. VBA, сводные таблицы, массивы и т.п.);
• Знание #sql, понимание принципов построения реляционных БД;
• Аналитический склад ума;
• Умение работать в условиях жёстких сроков, ответственность;
• Грамотная устная и письменная речь.

⚡️ Что делать:
• Построение системы хранения и обработки данных для аналитических механизмов;
• Определение оптимальной программной среды разработки (alteryx, python, r, cuda и пр.);
• Разработка внутренних библиотек для использования в модели расчета ресурсов;
• Разработка специальных программных решений, направленные на ускорение и оптимизацию работы алгоритмов расчета;
• Разработка, оценка и актуализация модели #ML;
• Выявление закономерностей и структуры данных для использования в модели расчета ресурсов;
• Разработка метрики оценки для формирования рекомендательных моделей на основе больших данных;
• Разработка рекомендательных моделей на основе больших данных;
• Разработка и актуализация сопроводительной документации к модели машинного обучения.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Иннотех: Data engineer
#Офис #Москва

⚙️ Требования:
#sql;
• Понимание основных концепций DWH;
• Знание Git;
• Понимание основных банковских процессов (достаточно одного): кредитование, процессинг, депозиты или других;
• Опыт работы с реляционными и noSQL базами данных;
• Опыт работы с различными СУБД в роли разработчика / аналитика витрин данных.

⚡️ Что делать:
• Проектирование и разработка витрин данных (Hive-SQL, Spark) с погружением в бизнес-процессы и аналитику данных;
• Уточнение требований заказчика, системный анализ, изучение бизнес-процессов систем источников;
• Доработка существующих витрин;
• Автоматизация процессов обновления данных (AirFlow);
• Тестирование нового функционала и витрин в DataLake;
• Выстраивание процессов Data Governance на инфраструктуре Hadoop совместно с CDO Банка;
• Контроль качества данных в хранилище (Hadoop) – постановка задач, анализ;
• Предоставление экспертной поддержки внутренним потребителям (data analysts,data scientists).

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#IVI: Разработчик ETL / Data Engineer
#Офис #Москва

⚙️ Требования:
#sql на уровне анализа производительности запросов;
• Уверенно владеете #python;
• Опыт в разработке хранилищ данных в роли разработчика на протяжении всего жизненного цикла проекта от 3 лет;
• Имеете опыт работы с реляционными СУБД;
• Есть опыт программирования БД (SQL или PL-SQL или T-SQL), опыт написания сложных запросов и хранимых процедур (Vertica, Oracle, ClickHouse, Postgre);
• Опыт внедрения и приемки системы;
• У вас есть опыт разработки документации: технический (функциональный) дизайн, или техническое задание, или техническая спецификация.

⚡️ Что делать:
• Разрабатывать и поддерживать ETL процедуры в Informatica PowerCenter, airflow;
• Оптимизировать базу и процедуры загрузки;
• Проектировать, реализовывать и внедрять распределённые системы обработки и хранения данных;
• Работать с реляционными/NoSQL базами данных;
• Разрабатывать и поддерживать процедуры автоматизации аналитической инфраструктуры;
• Участвовать в развитии архитектуры хранилища.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Сбер: Data Analyst
#Офис #Мск

⚙️ Требования:
• Опыт работы от 1,5 лет;
• Знание #sql, #python;
• Навыки работы с BI системами (MS Power BI, Qlik Sense, Tableau);
• Навыки работы с витринами данных.

⚡️ Что делать:
• Анализ и подготовка данных;
• Выявление, формирование и согласование требований к результатам работ;
• Планирование и организация работ с использованием технологий больших данных;
• Управление защитой и обеспечением конфиденциальности BigData.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Wildberries: ML Инженер
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Уверенное знание #python, опыт разработки на нем;
• Уверенное владение основными #ML-библиотеками (numpy, pandas, sklearn и т.п.);
• Понимание классических методов и алгоритмов машинного обучения, #CV, #NLP, опыт их применения на практике;
• Опыт работы с NLP/CV;
• Опыт самостоятельного ведения задач на разных этапах проекта.

⚡️ Что делать:
• Улучшать системы автоматического матчинга товаров, включающие в себя как модели DL (NLP/CV), так и классический ML;
• Планировать эксперименты, обучение моделей, оценивать их качество и интегрировать в пайплайны;
• Оценивать результаты обучения моделей и отслеживать их производительность;
• Писать алгоритмы пред- и постобработки изображений/текстов.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Автомакон: Lead Data Engineer
#Удаленно

⚙️ Требования:
• Опыт лидирования команд разработки;
• Опыт программирования на #python (не менее 3-х лет);
#sql и опыт работы с базами данных;
• Опыт работы с Apache Airflow;
• Опыт оптимизации SQL запросов;
• Опыт работы с GreenPlum/СlickHouse;
• Понимание концепций построения хранилищ данных (DWH);
• Опыт работы со Spark.

⚡️ Что делать:
• Лидирование команды разработки ДатаИнженеров;
• Проведение ревью;
• Проектирование процессов ETL/ELT, выбор инструментов под конкретные задачи;
• Извлечение, преобразование, загрузка данных и их обработка, ETL/ELT (Python/Airflow);
• Создание и развитие процессов управления данными и их качеством;
• Оптимизация процессов поставки данных (Kafka/Spark/dbt);
• Работа с DWH.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Самокат: Data Scientist/Machine Learning Engineer (NLP)
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы с #ML моделями от 3 лет (классическими и #NLP, с NLP не менее 2 лет);
• Опыт разработки на #python в ML от 3 лет;
• Опыт продуктивизации классических/NLP моделей;
• Структурное мышление, системный подход.

⚡️ Что делать:
• Классификация текста/диалога, перефразирование, генерация текста, кластеризация текста/картинок;
• Выделение трендов в отзывах, анализ их динамики, классификация/кластеризация отзывов (Самокат, Мегамаркет, App Store, Google Play, соцсети, СМИ, телефония);
• Разработка чатбота консультанта для подбора товаров на МегаМаркет;
• Модерация контента (отзывы, вопросы, ответы, комментврии), определение оптимальной бонусной цены за оставленный отзыв, генерация ответов на пользовательские вопросы по товарам, разработка суммаризированного отзыва;
• Генерация контента на карочке товара для повышения внешниго трафика из Google, Яндекс.

➡️ Кому подойдет:
Сейчас несколько команд в поиске опытного ML-инженера/дата-сайентиста, которому предстоит заниматься задачами NLP.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Руководитель ML-команды разработки генеративных моделей в международное направление Алисы (LLM)
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Отлично знаете математику;
• Работали с нейросетевыми моделями обработки текстов;
• Хорошо знаете #python;
• Имеете руководящий опыт или были ментором;
• Хорошо владеете английским языком: способны просмотреть свежую статью в arXiv и за несколько минут понять, в чём основная идея авторов и каких результатов им удалось достичь.

⚡️ Что делать:
• Руководство командой разработки;
• Обучать #LLM понимать и вести диалог на других языках. Для улучшения качества ответов нужно будет экспериментировать с методами #RL;
• Оптимизация инференса.

➡️ Кому подойдет:
Команда учит Алису вести естественный и интересный диалог, быть эмпатичной и человечной. Следующая цель — научить её делать это качественно на других языках. Алиса уже умеет говорить на казахском, а Yango анонсировал ассистента на арабском языке.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Озон: Руководитель группы Data Science (DL), Рекомендации и персонализация
#Офис #Москва

⚙️ Требования:
• Опыт работы в роли Data Scientist / #ML Engineer от 4х лет;
• Опыт руководства командой DS/MLE от 3х человек;
• Опыт решения сложных прикладных задач с помощью #DL;
• Понимание трендов развития и последних достижений в различных доменах Deep Learning;
• Уверенное владение #python.

⚡️ Что делать:
• Руководить командой специалистов DS/DL, нанимать инженеров в команду (команда до 8 человек);
• Разрабатывать эффективные системы обучения и выводить в продакшн большие #рексис;
• Совместно с руководителями смежных команд разрабатывать и реализовывать архитектуру всей системы рекомендаций;
• Создавать и развивать метрики качества обучения.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#X5: Data engineer (Python Hadoop Spark)
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Опыт работы с #python от 2 лет;
• Опыт с Hadoop, Hive, Spark;
• Знание #sql;
• Знание классических алгоритмов и структур данных;
• Опыт работы с docker;
• Умение пользоваться git'ом и работать в команде.

⚡️ Что делать:
• Писать пайплайны по работе с данными с использованием Airflow, Spark;
• Оптимизировать расчеты фичей для модели для выдерживания SLA при масштабировании продукта под большее количество магазинов;
• Настраивать мониторинги и алертинги качества данных и фичей с использованием Zabbix, Grafana;
• Писать unit тесты (pytest), тесты для различных участков #ML пайплайна, участвовать в код ревью.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Мегафон: Data Scientist
#Офис #Москва

⚙️ Требования:
• Уверенные знания алгоритмов #ML, принципов их работы, ключевых особенностей и ограничений;
• Отличное владение инструментами анализа данных, библиотеками машинного обучения;
• Наличие успешно завершенных проектов с использованием технологий анализа данных и машинного обучения;
• Знания в области AB-тестирования и статистики.

⚡️ Что делать:
• Участие во всех этапах жизненного цикла ML-продуктов – от бизнес-анализа до имплементации и поддержки готовых решений;
• Генерация гипотез, дизайн и проведение A/B тестов;
• Разработка моделей машинного обучения на основе табличных данных (классификация, регрессия, uplift);
• Написание production-ready кода для автоматизации офферинга;
• Оценка эффектов на бизнес-KPI как для существующих, так и для потенциальных решений.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#МТС: Senior Data Scientist [NUUM]
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Знания #python и #sql, а также опыт интеграции с Go сервисами;
• Опыт работы с #рексис для контента или поисковыми системами для маркетплейсов/классифайдов;
• Понимание чем look-a-like отличается от response и uplift;
• Опыт работы с A/B-тестами и анализа результатов экспериментов;
• Опыт работы с разными методами матричной факторизации для извлечения информации из истории просмотров, взаимодействие с видео и поиска;
• Умение строить текстовый эмбеддинги для разных типов контента, в том числе с использованием вспомогательной ручной и #ML-разметки.

⚡️ Что делать:
• Формулировать с продуктовой командой гипотезы улучшения рекомендаций;
• Совершенствовать с операционной командой и командой #CV существующую разметку;
• Перекладывать бизнес-задачи на язык математики и валидировать результаты через A/B тесты.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Самокат: Data Scientist CV (Generative Design)
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы в #DL направлении от 3 лет;
• Хорошие знания классических #ML моделей и DL;
• Решение image2image задач #CV, генерации изображений и видео с помощью GANs, Diffusion models.

⚡️ Что делать:
• Генерация контента (генерация фонов товаров и теней);
• Виртуальная примерка одежды / косметики / интерьеров / предметов мебели.
• И все это с помощью последних наработок в области генеративного CV.

➡️ Кому подойдет:
Команда ищет специалиста в компьютерном зрении, который будет использовать, проводить исследования и индустриально применять диффузионные модели и другие виды генеративных подходов для решения задач бизнеса.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Точка: TeamLead Data Scientist
#Удаленно

⚙️ Требования:
• Опыт лидирования команды дата-сайентистов, умеешь нанимать и растить людей;
• Умеешь договариваться с другими командами и переводит бизнес-требования в #ML-задачи;
• Опыт работы с #NLP: transformers, #LLM, NLU;
• Есть представление о методах и применении классического ML;
• Знаешь #python и ООП, есть опыт выведения моделей в прод.

⚡️ Что делать:
• Лидировать команду из 3–4 дата-сайентистов;
• Взаимодействовать с другими командами для улучшения процессов обслуживания клиентов;
• Разрабатывать и выводить в прод модели машинного обучения (преимущественно NLP) совместно с командой разработки, проводить А/В-тесты.

➡️ Кому подойдет:
Предстоит лидировать небольшую команду, которая внедряет и развивает ML в различных процессах обслуживания клиентов Точки. Идеальный кандидат самостоятельно может разрабатывать и внедрять ML-модели. Больше всего команда работает с NLP задачами, поэтому команда ожидает экспертизы в этой области. Но в команде бывают и задачи классического ML.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Руководитель NLP-команды в Алису
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Большой опыт в #NLP;
• Руководили #ML-командой;
• Разбираетесь в современных подходах к обучению #LLM и следите за новыми статьями.

⚡️ Что делать:
• Предстоит проводить SFT- и RL-эксперименты с обучением YandexGPT для улучшения Алисы, реализовывать #RAG для долгосрочной памяти, создавать LLM, способные выполнять цепочки function calling и поддерживать контекстный диалог;
• Руководить командой из четырёх ML-разработчиков и непосредственно отвечать за несколько продуктовых направлений, определять задачи, проводить code review и активно взаимодействовать со смежными командами;
• Нужно будет дистиллировать модели и оптимизировать архитектуры для работы на большом потоке реальных запросов пользователей.

➡️ Кому подойдет:
Команда занимается внедрением #LLM, которые улучшают текущие сценарии, выполняют сложные цепочки действий, поддерживают контекст и используют долгосрочную память

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Иннотех: Data Scientist
#Офис #Москва

⚙️ Требования:
• Хорошие знания и опыт практического применения теорвера и матстата;
• Знание основных алгоритмов и методов #ML и анализа данных;
• Опыт разработки моделей на языках #python или R;
• Знание основного инструментария стэка Python: Jupyter, Pandas, Scikit-learn, Statsmodels или аналогов в R;
• Опыт работы с базами данных, владение #sql;
• Хорошие знания английского языка.

⚡️ Что делать:
• Разработка поведенческих моделей досрочного погашения срочных продуктов Банка и моделей динамики продуктов Банка;
• Разработка прогностических моделей эластичности спроса на банковские продукты;
• Разработка финансовых моделей для ценообразования продуктов Банка с учетом риска и анализа финансовой рентабельности продуктовых предложений Банка;
• Прикладной анализ данных и разработка моделей по другим направлениям для повышения эффективности бизнес-процессов, снижения затрат Банка и снижения рисков.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#ТБанк: ML-инженер рекламной платформы
#Гибрид / #Офис / #Удаленно

⚙️ Требования:
• Высшее техническое образование или вы студент последних курсов;
• Опыт работы в индустриальных #ML-проектах от 2 лет — включая этап доставки предсказаний и моделей до прода;
• Опыт в построении #рексис;
• Уверенно владеете ML и #DL;
• Умеете программировать на #python, знаете стандартные библиотеки и фреймворки — PyTorch, Tensorflow 2.0, Jax;
• Хорошо знаете #sql;
• Умеете работать с Git и Docker;
• Умеете работать в unix-подобных системах и с удаленными серверами;
• Будет плюсом опыт создания и поддержания CI/CD-пайплайнов, создания и настройки систем мониторинга качества модели, опыт работы с клиентами баз данных, Kafka, Airflow, опыт работы в AdTech-проектах или проектах по автоматизации маркетинга.

⚡️ Что делать:
• Ставить ML-задачи и определять подходящий стек ML-моделей, собирать и предобрабатывать датасеты для обучения моделей;
• Разрабатывать ML-модели c нуля, проводить эксперименты по повышению качества и сравнивать разные подходы;
• Участвовать в подготовке и проведении A/B-тестов;
• Внедрять модели в прод через обновляемые по расписанию витрины и их поддержку или написание API-микросервисов на K8s;
• Настраивать мониторинг качества модели и бизнес-метрик, проводить диагностику и поддерживать стабильность ML-pipelines;
• Читать статьи и разбирать новые подходы к персонализации рекламы.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#BestDoctor: Data Engineer
#Офис / #Гибрид / #Москва

⚙️ Требования:
• Опыт написания и отладки ETL-процессов с использованием #python;
• Опыт работы с data стеком (pandas, numpy, sqlalchemy);
• Опыт написания #sql-скриптов;
• Знание основ Docker;
• Умение пользоваться git.

⚡️ Что делать:
• Разрабатывать, проводить ревью и тестировать ETL-скрипты;
• Обеспечивать стабильную работу #ML-моделей в production, писать API ML-моделей;
• Участвовать в процессе описания документации и автоматизации ML-пайплайнов.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Wildberries: Data Scientist в команду логистики
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Структурное и системное мышление;
• Умение вести коммуникацию с бизнесом;
• Подтвержденный бизнес результат внедрения разработанных #ML алгоритмов;
• Умение применять на практике алгоритмы классического ML;
• Хорошее знание алгоритмов и структур данных;
• Уверенное владение классическим ML-стеком: Pandas, SKLearn, Numpy, Prophet, statsmodels, XGBoost/LightGBM/Catboost
• Опыт работы с базами данных #sql.

⚡️ Что делать:
• Прогнозировать нагрузку на логистику;
• Оценивать время в пути для товаров;
• Моделировать цены на перевозки.

➡️ Кому подойдет:
Команда логистики ищет Senior Data Scientist. Команда управляет процессом с момента сборки товара на складе до его получения клиентом. Предстоит заниматься оптимизацией работы логистики, для того чтобы товары всегда приезжали вовремя и даже быстрее.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Авиасейлс: Product Analyst
#Удаленно

⚙️ Требования:
• Опыт в продуктовой аналитике от 3 лет;
• Желание развивать и улучшать один из лучших продуктов на рынке тревел;
• Понимание основных продуктовых метрик, умение подбирать метрики для решения продуктовых задач;
• Продвинутое владение #sql;
• Понимание теорвера и матстата для дальнейшего применения в A/B тестировании;
• Умение обрабатывать данные и писать код на #python;
• Умение наглядно и просто визуализировать сложные данные;
• Интерес к решению задач с применением #ML.

⚡️ Что делать:
• Помогать команде формулировать и проверять гипотезы на всех этапах воронки;
• Разрабатывать удобные дашборды и мониторинги продуктовых метрик;
• Подбирать метрики и оценивать эффективность новых фичей продукта;
• Искать узкие места и точки роста продукта, анализировать, где плохо работает и почему;
• Оценивать и моделировать экономику продаж билетов и доп.услуг.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Точка: MLOps-инженер\Python-разработчик
#Удаленно

⚙️ Требования:
• Опыт разработки сервисов на #python от 3 лет;
• Есть опыт работы в качестве MLOps от 1 года;
• Есть опыт работы с разными элементами #ML-инфраструктуры: FeatureStore, ModelRegistry и др;
• Опыт работы с БД;
• Понимаешь специфику работы DS;
• Есть опыт развёртывания или поддержки К8s в проде.

⚡️ Что делать:
• Кастомизировать JupyterHub для работы в нескольких кластерах;
• Реализовать раздельное хранение секретов в коммунальных Airflow и JupyterHub;
• Разработать кастомный SSH прокси-сервера для работы с JupyterHub.

➡️ Кому подойдет:
Команда ищет MLOps-инженера, который будет развивать и поддерживать инфраструктуру для ML.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM