Data Secrets | Карьера
6.49K subscribers
1.05K photos
47 videos
1 file
1.16K links
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

Прислать вакансию/сотрудничество: @veron_28

https://telega.in/c/data_secrets_career
Download Telegram
#Озон: Data Scientist, Маркетплейс, Антибот
#Офис #Москва

⚙️ Требования:
• Опыт построения классификаторов;
• Умение решать задачи leetcode-medium;
• Хорошая математическая база;
• Знание основ статистики и #ML;
• Уверенное знание #python;
• Уверенное знания #sql;
• Знание основных Python библиотек для Data Science;
• Развитое аналитическое системное мышление.

⚡️ Что делать:
• Анализ трафика, выявление закономерностей в нём;
• Построение моделей по детектированию ботов;
• Разбор инцидентов блокировок системой;
• Поддержка и доработка имеющихся проектов;
• Взаимодействие с коллегами и участие в новых проектах.

➡️ Кому подойдет:
Задача команды - защищать ключевые сервисы Ozon от паразитного бот-трафика. Если ты вдохновляешься возможностью поработать сразу со многими инструментами, не боишься высоких нагрузок и больших объемов данных, команда ждет твой отклик.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Ингосстрах: Data Scientist
#Офис / #Гибрид / #Удаленно
#Мск

⚙️ Требования:
• Высшее техническое образование;
• Уверенное понимание методов как классического скоринга, так и #ML;
• Четкое понимание метрик качества работы моделей и их интерпретации;
• Знание #sql, T-SQL;
• Опыт работы с #R и/или #python;
• Знание математической статистики и теории вероятностей;
• Релевантный опыт работы в банковском/страховом секторе (блок Риски, Финансы, СРМ).

⚡️ Что делать:
• Построение, валидация и поддержка скоринговых модели для страховых продуктов на основе транзакционной и поведенческой информации;
• Анализ и обработка больших массивов данных;
• Создание витрин и озер данных;
• Взаимодействие с поставщиками внешних данных (телеком, кредитные бюро, гео-данные);
• Совершенствование конвейера онлайн-страхования для ОСАГО, КАСКО.

➡️ Кому подойдет:
Ищут активного и целеустремленного коллегу, который имеет опыт работы с большими данными, знает основы финансового анализа, применяет инструменты ML/DS в своей работе.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Иннотех: Data Scientist NLP и LLM
#Офис #Москва

⚙️ Требования:
• Высшее математическое/техническое образование;
• Понимание принципов работы с #LLM;
• Уверенное знание математики, статистики и машинного обучения;
• Владение #python и опыт практического применения алгоритмов #ML: нейронные сети, композиционные алгоритмы, #NLP;
• Уверенное владение #sql.

⚡️ Что делать:
• Проведение исследований, проверка гипотез команды с использованием LLM;
• Совершенствование LLM моделей, используя промт-инжиниринг. Векторизация документов (для RAG сервиса);
• Преобразование изображения текста в машиночитаемый формат(OCR);
• Разработка и внедрение моделей (NLP\классический ML\графовые сети) в промышленные системы;
• Поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Wildberries: Senior Data Scientist (NLP) в автоматизацию коммуникаций
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Опыт в области анализа данных и #ML от 3х лет;
• Знание #python, методов работы с большими данными;
• Опыт работы с библиотеками: Scikit-learn, HuggingFace, PyTorch;
• Опыт работы с #LLM;
• Знание теорий вероятностей и математической статистики;
• Знание алгоритмов и структур данных.

⚡️ Что делать:
• Использовать историю взаимодействия с пользователем для улучшения моделей чат-бота;
• Участвовать в исследовательских проектах в области #NLP, публиковать статьи и доклады на конференциях;
• Создавать и обучать модели машинного обучения и NLP для понимания и обработки текстовых запросов пользователей.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#ПСБ: Data Scientist
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Опыт работы в банке, преимуществом будет опыт работы в среднем и малом бизнесе;
• Владение #sql, #python и основными библиотеками анализа данных;
• Владение знаниями в направлениях: Recommender Systems, Transformers, Auto-encoders;
• Умение объяснять сложные вещи простыми словами;
• Умение работать с различными источниками данных;
• Умение управлять жизненным циклом #ML моделей.

⚡️ Что делать:
• Предсказание оттока клиентов;
• Предсказание и расчет склонности к покупке;
• Прогноз доходности клиентов;
• Построение различных предиктивных моделей и запуск на prod;
• Создание и развитие #рексис;
• Мониторинг эффективности моделей, дообучение, корректировка моделей.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Спортмастер: Data scientist (Персонализация)
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Опыт использования и внедрения алгоритмов #ML;
• Знание базовых алгоритмов и структур данных, понимание плюсов и минусов;
• Уверенное знание математической статистики, умение применять для решения задач;
• Уверенное знание #sql и готовность писать эффективные запросы;
• Уверенное владение #python (библиотеки работы с данными);
• Технический английский на уровне чтения статей и участия в конференциях.

⚡️ Что делать:
• Использовать алгоритмы машинного обучения для решения бизнес-задач;
• Исследовать данные с целью получения новых признаков клиентов;
• Разрабатывать требования для сбора данных, дизайн A/B тестов;
• Заниматься написанием эффективного кода для получения агрегатов данных клиентов;
• Развивать инфраструктуру для автоматического построения и использования моделей машинного обучения.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#MyGames: Machine Learning Engineer
#Удаленно

⚙️ Требования:
• Знание основных алгоритмов и структур данных, а также их реализация в стандартных библиотеках;
#python;
• Английский на уровне чтения на технической документации;
• Знание матстата, теорвера, алгебры и т.д.;
• Опыт поддержки полного жизненного цикла моделей;
• Опыт практического применения алгоритмов #ML.

⚡️ Что делать:
• Подготовка и анализ данных;
• Построение моделей ML для прогнозирования;
• Анализ и построение моделей машинного обучения и эвристических подходов для пресечения мошеннического трафика;
• Анализировать историю пользователей с аукционов рекламы;
• Проведение A/B-тестов для версий модели.

➡️ Кому подойдет:
MYGAMES — ведущий европейский разработчик и издатель, движимый целью: создавать крутые игры, покоряющие сердца игроков по всему миру.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Beeline: Data analyst/Data Scientist
#Офис / #Гибрид / #Удаленно
#Мск

⚙️ Требования:
• Знание основ матстата и теорвера;
#python, #sql, опыт работы Hadoop;
• Знание программных пакетов, используемых для анализа данных и #ML;
• Опыт работы в области анализа данных и машинного обучения от 2-х лет.

⚡️ Что делать:
• Подготовка массивов данных для разработки предиктивных моделей;
• Разработка и поддержка предиктивных моделей склонности к продукту/оттоку из активной базы;
• Разработка отчетности по основным метрикам предиктивной способности моделей;
• Использование алгоритмов машинного обучения для решения бизнес задач подразделения;
• Взаимодействие с бизнес-заказчиками в части набора фичей и презентации результатов отработки модели;
• Визуализация данных, полученных в результате применения алгоритмов машинного обучения.

➡️ Кому подойдет:
Команда в поисках специалиста в проект «Роуминг» в качестве старшего аналитика данных.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Data scientist в команду информационной безопасности
#Офис / #Гибрид
#Москва #Спб

⚙️ Требования:
• Обучали #ML-модели и внедряли их в продакшен;
• Умеете формулировать задачи в терминах ML, понимаете, как измерить результат, знакомы с разными алгоритмами и можете выбрать подходящий;
• Заботитесь о высоком качестве конечного продукта;
• Готовы погружаться в новые технологии;
• Самостоятельны, хотите браться за новые задачи, для которых нет готового решения.

⚡️ Что делать:
• Создавать решения на базе методов машинного обучения и анализа данных;
• Внедрять аналитические решения в продукты и процессы ИБ;
• Исследовать актуальные вызовы информационной безопасности на предмет применения ML и анализа данных, оценивать возможный эффект.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Озон: Data Engeneer, Эффективность рекламы
#Офис #Москва

⚙️ Требования:
• Хорошее знание #python;
• Опыт разработки DWH, построения ETL пайплайнов (Spark, #sql);
• Понимание основ классического #ML и математической статистики;
• Развитое продуктовое мышление;
• Проактивность, интерес к сфере рекламы и задачам в Computational Advertising.

⚡️ Что делать:
• Разрабатывать пайплайны подготовки данных для ML команды;
• Настраивать процессы регулярной заливки фичей в фича-сторы;
• Строить дашборды для поиска разладок;
• Разрабатывать инструменты аналитики качества ML моделей.

➡️ Кому подойдет:
Команда занимается полным циклом разработки продукта: от аналитики для помощи бизнесу в поиске проблем и точек роста до упаковки готового решения в сервис.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#VK: Data Scientist (реклама и медиа)
#Офис / #Гибрид
#Мск

⚙️ Требования:
#sql, #python;
• Знания в области математической статистики, эконометрики;
• Понимание основных алгоритмов #ML;
• Опыт анализа данных от 2-х лет.

⚡️ Что делать:
• Анализ данных для поиска точек роста ключевых метрик;
• Проведение и статистическая оценка экспериментов;
• Разработка и автоматизация отчетности для задач R&D;
• Ad hoc аналитика;
• Сбор и обработка больших данных.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#VK: ML - программист
#Офис / #Гибрид
#Мск

⚙️ Требования:
• Высшее техническое образование;
• Наличие релевантного коммерческого опыта от 1 года;
• Умение разрабатывать пайплайны для эффективной обработки данных в #python, Pyspark;
• Желание заниматься и развиваться в задачах с классическим #ML, а также в задачах с развитием инфраструктуры development и production;
• Глубокие знания классического ML;
• Сильные математические знания;
• Знание #sql и основ баз данных.

⚡️ Что делать:
• Выполнение adhoc задач по применению существующих моделей и сервисов;
• Разработка различных моделей машинного обучения на новых данных;
• Изучение и обработка данных из различных источников;
• Внедрение регулярного расчёта новых признаков, улучшение мониторинга качества данных;
• Генерация и проверка гипотез по повышению качества текущих моделей и создания новых, более высокого качества;
• Развитие инфраструктуры существующих сервисов;
• Написание продуктивизируемых пайплайн скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Иннотех: Ведущий разработчик (BIG DATA Моделирование РБ)
#Офис #Москва

⚙️ Требования:
• Знание #sql;
• Хорошее знание устройства Hadoop,Spark,Hive/Impala;
• Опыт разработки на #python/#java;
• Понимание основных концепций DWH;
• Понимание базовых команд Git и основных принципов работы.

⚡️ Что делать:
• Заниматься проектированием и разработкой витрин данных для анализа и моделирования;
• Заниматься мониторингом и оптимизацией процессов сборки витрин;
• Заниматься загрузкой и обработкой данных из различных источников;
• Заниматься поддержкой и развитием базы знаний;
• Предоставлять экспертную поддержку внутренним потребителям(data analysts,data scientists).

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Сбер: Junior Data Scientist в Дивизион "Корпоративное взыскание"
#Офис #Мск

⚙️ Требования:
• Bachelor's/Master's/PhD (Mathematics, Computer Science, Physics, Engineering, Economics);
• Опыт работы DS 3+ года (желательно опыт наставничества/руководства);
• Библиотеки: Pandas, Scikit-learn, Lightgbm, XGBoost, Catboost, Tensorflow (pytorch);
• Знание #sql;
• Понимание статистики и теории вероятности;
• Продукты: Hadoop, PySpark, Hive.

⚡️ Что делать:
• Определения наилучшей стратегии работы с проблемными активами;
• Прогнозирование развития бизнеса, оценка финансового состояния клиента;
• Формирования рекомендаций для сотрудников, работающих с проблемными активами;
• Антифрод и форензик;
• Работы с изображениями, оценка бизнеса/имущества клиента;
• Формирования рекомендаций для сайта продаж Сбера.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Спортмастер: Middle Data Engineer
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Уверенное владение #python;
• Опыт использования эко-системы Hadoop: HDFS, Apache AirFlow, Hive, Kafka,Spark;
• Знание #sql;
• Опыт работы с реляционными базами данных (Oracle).

⚡️ Что делать:
• Реализация ETL в Hadoop (с помощью Airflow);
• Работа с различными источниками данных: Oracle, MS SQL, API личных кабинетов, микросервисы;
• Батч и стримы с помощью PySpark и Kafka;
• Подготовка витрин для анализа (Hive + Spark+ SQL).

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Разработчик компьютерного зрения в SportTech
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Умеете писать продакшен-код на #python;
• Обучали нейронные сети на PyTorch или в других фреймворках;
• Ускоряли нейросетевые модели #CV, знакомы с инструментами деплоя. Имели дело с ОNNX, TensorRT, mmdeploy;
• Решали задачи компьютерного зрения.

⚡️ Что делать:
• Оптимизация и масштабирование сервиса. Команда планирует увеличивать количество обрабатываемых матче, для этого нужно существенно сократить количество потребляемых ресурсов при минимальных потерях в качестве;
• Анализировать видео матчи и подсчитывать всё более сложные статистики при помощи AI.

➡️ Кому подойдет:
Яндекс — официальный поставщик данных для Российской Премьер-Лиги (РПЛ). Менее чем за год команда разработала технологическое решение для подсчёта фитнес-данных (дистанции, скорости, ускорения/рывки) и других статистик (например, тактико-тактических действий) в режиме реального времени. Разработчики ищут опытного инженера компьютерного зрения, чтобы сделать алгоритмы еще более точными и быстрыми.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#2GIS: Data Scientist в команду NLP
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы над #NLP-задачами от двух лет;
• Хорошее знание #python;
• Опыт работы с PyTorch и/или TensorFlow + NumPy, sklearn;
• Опыт работы с инструментами разработки и CI/CD — Git, Jenkins, GitLab, Jira;
• Опыт работы с брокерами сообщений: rabbitmq, kafka;
• Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т. п.), #LLM (+ методов их тюнинга RLHF, Lora);
• Знание классических методов —классические языковые модели, tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM;
• Опыт использования библиотек — kenlm, transformers, nltk, pyonmttok, vowpalwabbit, gensim и т.п.

⚡️ Что делать:
• Заниматься майнингом данных, дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий;
• В UGC-задачах — извлечение фактов из отзывов компаний, модерация отзывов, суммаризация;
• Разрабатывать системы исправления опечаток, транслитерации, улучшаем точность и полноту поиска;
• В ближайшем будущем предполагается решать задачи автоматической генерации различного контента.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Самокат: Senior Data Analyst (DS проекты)
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы с базами данных и Hadoop в DS проектах не менее 3 лет;
#sql, Spark, #python, Hadoop, Python DA (графики, статистики, аналитика в Jupyter);
• Навык подготовка данных со спецификой обработки для DS проектов;
• Опыт проведения АБ-тестов;
• Опыт работы с Gitlab, Jira, Confluence;
• Желание участвовать в полном цикле проекта (грумминг, планирование, стенд апы, ретроспективы, проектные встречи).

⚡️ Что делать:
• Генерация гипотез по применению данных в рамках DS проекта;
• Оценка качества данных вместе с DS;
• Базовая аналитика данных вместе с DS;
• Построение BaseLine моделей;
• Создание витрин для нужд DS;
• Совместное написание/оптимизация запросов;
• Настраивание мониторинга/логирования;
• Помощь в планировании и проведении пилотов DS.

➡️ Кому подойдет:
команда сейчас в поиске Senior Data Analyst в группу DS внепродуктовых проектов и усиления ключевых инициатив​​​​​​​.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#PositiveTechnologies: ML Engineer / Data Scientist
#Удаленно

⚙️ Требования:
• Опыт работы на #ML позиции >2 лет;
• Понимание основ статистики, техник машинного обучения в частности #DL, а также опыт работы с какими-то конкретными задачами;
#python, опыт с другими языками тоже приветствуются;
• Опыт работы с Linux-based ОС, Docker;
• Знания основ CS: алгоритмы и структуры данных;
• Опыт работы в командах c agile/kanban процессами;
• Опыт доведения прототипов до прода.

⚡️ Что делать:
• Применять техники машинного обучения/статистики/анализа данных или понимать, что можно решить проще и эффективнее традиционными способами для продуктов PT;
• Внедрять решения в продукты, включая проектирование частей МЛ-компонент, использующих МЛ-модели, написания кода для частей, использующих МЛ-компоненты продукта, проходить код ревью и взаимодействовать с разработчиками продуктов, различных их частей;
• Также предстоит сталкиваться и думать над актуальными проблемами МЛ-безопасности (как offence так и defence) и способами их решения.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Автомакон: Middle MLE/DS + NLP
#Удаленно

⚙️ Требования:
• Уверенное знание #python (3.8+);
• Понимание основных #ML и #DL алгоритмов (от решающих деревьев до трансформеров);
• Хорошее владение PyTorch, Docker;
• Опыт работы в ML от 1,5 лет.

⚡️ Что делать:
• Разработка #NLP решений;
• Hабота с текстовыми данными, экспериментирование с моделью и фичами, описание экспериментов во внутренней документации;
• Деплой модели в продакшн.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#VK: ML Developer
#Офис #Москва

⚙️ Требования:
• Знание классических алгоритмов и структур данных;
• Знание классических #ML-моделей;
• Опыт решения задач с применением алгоритмов машинного обучения;
• Отличное знание #sql и #python;
знание математической статистики и теории вероятностей;
• Опыт работы с большими данными.

⚡️ Что делать:
• Разрабатывать рекомендательные системы;
• Описывать поведение пользователей;
выдвигать и проверять гипотезы, проводить А/B-тесты;
• Взаимодействовать со смежными командами.

➡️ Кому подойдет:
Команда Data Office ищет опытного ML-разработчика, который усилит команду и будет разрабатывать и внедрять новые решения в рекомендательные системы VK Play.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM