Data Secrets | Карьера
6.49K subscribers
1.05K photos
47 videos
1 file
1.16K links
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

Прислать вакансию/сотрудничество: @veron_28

https://telega.in/c/data_secrets_career
Download Telegram
#Спортмастер: Middle Data Engineer
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Уверенное владение #python;
• Опыт использования эко-системы Hadoop: HDFS, Apache AirFlow, Hive, Kafka,Spark;
• Знание #sql;
• Опыт работы с реляционными базами данных (Oracle).

⚡️ Что делать:
• Реализация ETL в Hadoop (с помощью Airflow);
• Работа с различными источниками данных: Oracle, MS SQL, API личных кабинетов, микросервисы;
• Батч и стримы с помощью PySpark и Kafka;
• Подготовка витрин для анализа (Hive + Spark+ SQL).

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Разработчик компьютерного зрения в SportTech
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Умеете писать продакшен-код на #python;
• Обучали нейронные сети на PyTorch или в других фреймворках;
• Ускоряли нейросетевые модели #CV, знакомы с инструментами деплоя. Имели дело с ОNNX, TensorRT, mmdeploy;
• Решали задачи компьютерного зрения.

⚡️ Что делать:
• Оптимизация и масштабирование сервиса. Команда планирует увеличивать количество обрабатываемых матче, для этого нужно существенно сократить количество потребляемых ресурсов при минимальных потерях в качестве;
• Анализировать видео матчи и подсчитывать всё более сложные статистики при помощи AI.

➡️ Кому подойдет:
Яндекс — официальный поставщик данных для Российской Премьер-Лиги (РПЛ). Менее чем за год команда разработала технологическое решение для подсчёта фитнес-данных (дистанции, скорости, ускорения/рывки) и других статистик (например, тактико-тактических действий) в режиме реального времени. Разработчики ищут опытного инженера компьютерного зрения, чтобы сделать алгоритмы еще более точными и быстрыми.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#2GIS: Data Scientist в команду NLP
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы над #NLP-задачами от двух лет;
• Хорошее знание #python;
• Опыт работы с PyTorch и/или TensorFlow + NumPy, sklearn;
• Опыт работы с инструментами разработки и CI/CD — Git, Jenkins, GitLab, Jira;
• Опыт работы с брокерами сообщений: rabbitmq, kafka;
• Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т. п.), #LLM (+ методов их тюнинга RLHF, Lora);
• Знание классических методов —классические языковые модели, tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM;
• Опыт использования библиотек — kenlm, transformers, nltk, pyonmttok, vowpalwabbit, gensim и т.п.

⚡️ Что делать:
• Заниматься майнингом данных, дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий;
• В UGC-задачах — извлечение фактов из отзывов компаний, модерация отзывов, суммаризация;
• Разрабатывать системы исправления опечаток, транслитерации, улучшаем точность и полноту поиска;
• В ближайшем будущем предполагается решать задачи автоматической генерации различного контента.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Самокат: Senior Data Analyst (DS проекты)
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы с базами данных и Hadoop в DS проектах не менее 3 лет;
#sql, Spark, #python, Hadoop, Python DA (графики, статистики, аналитика в Jupyter);
• Навык подготовка данных со спецификой обработки для DS проектов;
• Опыт проведения АБ-тестов;
• Опыт работы с Gitlab, Jira, Confluence;
• Желание участвовать в полном цикле проекта (грумминг, планирование, стенд апы, ретроспективы, проектные встречи).

⚡️ Что делать:
• Генерация гипотез по применению данных в рамках DS проекта;
• Оценка качества данных вместе с DS;
• Базовая аналитика данных вместе с DS;
• Построение BaseLine моделей;
• Создание витрин для нужд DS;
• Совместное написание/оптимизация запросов;
• Настраивание мониторинга/логирования;
• Помощь в планировании и проведении пилотов DS.

➡️ Кому подойдет:
команда сейчас в поиске Senior Data Analyst в группу DS внепродуктовых проектов и усиления ключевых инициатив​​​​​​​.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#PositiveTechnologies: ML Engineer / Data Scientist
#Удаленно

⚙️ Требования:
• Опыт работы на #ML позиции >2 лет;
• Понимание основ статистики, техник машинного обучения в частности #DL, а также опыт работы с какими-то конкретными задачами;
#python, опыт с другими языками тоже приветствуются;
• Опыт работы с Linux-based ОС, Docker;
• Знания основ CS: алгоритмы и структуры данных;
• Опыт работы в командах c agile/kanban процессами;
• Опыт доведения прототипов до прода.

⚡️ Что делать:
• Применять техники машинного обучения/статистики/анализа данных или понимать, что можно решить проще и эффективнее традиционными способами для продуктов PT;
• Внедрять решения в продукты, включая проектирование частей МЛ-компонент, использующих МЛ-модели, написания кода для частей, использующих МЛ-компоненты продукта, проходить код ревью и взаимодействовать с разработчиками продуктов, различных их частей;
• Также предстоит сталкиваться и думать над актуальными проблемами МЛ-безопасности (как offence так и defence) и способами их решения.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Автомакон: Middle MLE/DS + NLP
#Удаленно

⚙️ Требования:
• Уверенное знание #python (3.8+);
• Понимание основных #ML и #DL алгоритмов (от решающих деревьев до трансформеров);
• Хорошее владение PyTorch, Docker;
• Опыт работы в ML от 1,5 лет.

⚡️ Что делать:
• Разработка #NLP решений;
• Hабота с текстовыми данными, экспериментирование с моделью и фичами, описание экспериментов во внутренней документации;
• Деплой модели в продакшн.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#VK: ML Developer
#Офис #Москва

⚙️ Требования:
• Знание классических алгоритмов и структур данных;
• Знание классических #ML-моделей;
• Опыт решения задач с применением алгоритмов машинного обучения;
• Отличное знание #sql и #python;
знание математической статистики и теории вероятностей;
• Опыт работы с большими данными.

⚡️ Что делать:
• Разрабатывать рекомендательные системы;
• Описывать поведение пользователей;
выдвигать и проверять гипотезы, проводить А/B-тесты;
• Взаимодействовать со смежными командами.

➡️ Кому подойдет:
Команда Data Office ищет опытного ML-разработчика, который усилит команду и будет разрабатывать и внедрять новые решения в рекомендательные системы VK Play.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Аналитик на направление поиска и рекомендаций в Маркет
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Аналитически мыслите;
• Хорошо знаете математику и основы статистики;
• Понимаете #sql и использовали в работе хотя бы один ЯП;
• Видите за числами физический смысл и находите причины явлений;
• Умеете аргументировать свою точку зрения;
• Готовы отстаивать результаты исследований;
• Проводили A/B-тесты.

⚡️ Что делать:
• Развивать систему метрик;
• Совершенствовать инструменты для анализа A/B-тестов;
• Создавать новые фичи и подборки товаров для алгоритмов #ML.

➡️ Кому подойдет:
Электронная коммерция — одно из приоритетных направлений развития Яндекса, а Яндекс Маркет — ключевой сервис электронной коммерции и один из крупнейших маркетплейсов в стране. Команда развивает метрики, инструменты для анализа, создаёт новые фичи и проводит большое количество исследований.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Сбер: Аналитик
#Офис #Мск

⚙️ Требования:
• Высшее образование
опыт работы с аналогичными функциональными обязанностями от 1 года;
• Опыт взаимодействия и постановки задач смежным командам, уверенные знания теорвера и матстата;
• Средний уровень владения #sql, #python, Excel;
• Внимание к деталям, умение формировать выводы на основе проведенных исследований.

⚡️ Что делать:
• Проведение аналитических исследований на основе данных, извлечение полезной информации и формирование выводов для улучшения бизнес-процессов;
• Выполнение ad-hoc запросов по предоставлению данных и формированию отчетности
взаимодействие с бизнес-заказчиками/разработчиками/смежными командами для сопровождение процессов миграции в части аналитики;
• Анализ отклонений и ошибок в данных.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Иннотех: Data аналитик (Виртуальные ассистенты)
#Офис #Москва

⚙️ Требования:
• Опыт работы с базами данных, навыки написания сложных #sql-запросов, процедур, пакетов, оптимизации кода;
• Опыт работы с Big Data;
• Владение методами анализа данных и моделирования (#python + библиотеки для анализа данных);
• Ответственность и самостоятельность.

⚡️ Что делать:
• Развитие внутреннего сервиса по построению рекомендаций для сотрудников;
• Разработка и реализация различных метрик операционного качества;
• Обработка ошибок в роли 3й линии поддержки;
• Сопровождение изменений в ПО и интеграции с внешними источниками;
• Работа с базами данных и техническое описание процессов;
• Запуск пилотов, стабилизационные работы и контроль;
• Поиск, проработка и реализация сценариев по оптимизации операционного качества.

➡️ Кому подойдет:
Команда строит умную систему, основанную на максимальных знаниях о сотрудниках Банка, которая формирует персональные рекомендации, позволяющие повысить эффективность работы на каждом уровне управления.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#2GIS: Тимлид команды разработки AI
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт: от 3-х лет в роли тимлида или ведущего разработчика, от 2-х лет в разработке или data science;
• Технические навыки: #python, опыт работы с фреймворками для написания #LLM пайплайнов (LangChain, LlamaIndex и т.п.), опыт деплоя сервисов в прод (особенно GPU сервисов);
• Управленческие навыки: умение эффективно координировать работу команды, опыт проведения код-ревью, разработка и внедрение стратегий развития;
• Базовое понимание техник промптинга, #RAG-систем, AI-агентов, опыт работы с LLM, таких как ChatGPT.

⚡️ Что делать:
• Координация работы разработчиков, постановка задач, контроль сроков и качества выполнения;
• Определение приоритетов, разработка планов по развитию сервисов, основанных на LLM;
• Участие в проектировании и разработке ключевых компонентов, проведение код-ревью, помощь команде в решении сложных технических задач;
• Деплой и настройка сервисов в Kubernetes, мониторинг и оптимизация их работы;
• Анализ качества генеративных моделей, внедрение лучших практик и методов улучшения.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Wildberries: ML Engineer в команду Мониторинга цен конкурентов
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Уверенное знание #python, опыт разработки на нем;
• Уверенное владение основными #ML-библиотеками (numpy, pandas, sklearn и т.п.);
• Понимание классических методов и алгоритмов машинного обучения, #CV, #NLP, опыт их применения на практике;
• Опыт работы с NLP/CV;
• Опыт самостоятельного ведения задач на разных этапах проекта.

⚡️ Что делать:
• Улучшать системы автоматического матчинга товаров, включающие в себя как модели #DL (NLP/CV), так и классический ML;
• Планировать эксперименты, обучение моделей, оценивать их качество и интегрировать в пайплайны;
• Оценивать результаты обучения моделей и отслеживать их производительность;
• Писать алгоритмы пред- и постобработки изображений/текстов.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#VK: Data Scientist
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Уверенное владение #python и #sql;
• Знание #ML и опыт работы с ML-библиотеками;
• Опыт работы с Hadoop (Spark, Hive, HDFS);
• Знание классических алгоритмов и структур данных;
• Хорошая математическая подготовка;
• Уверенная работа в командной строке.

⚡️ Что делать:
• Исследование данных (ad hoc аналитика, сегментация/кластеризация, антифрод и др.);
• Разработка и тестирование новых признаков, интерпретируемых и неинтерпретируемых (эмбеддингов);
• Построение и оптимизация ML-моделей;
• Создание метрик оценки качества data-продуктов;
• Разработка продакшен пайплайнов для процессинга данных, в том числе с использованием ML.

➡️ Кому подойдет:
Команда находится в поиске самостоятельного специалиста по большим данным и машинному обучению, который будет помогать создавать новые и развивать существующие data-продукты.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#АльфаБанк: Middle Data Scientist Розничный бизнес
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Общий опыт работы в этом направлении – от 3 лет;
• Hard skills: #python, bash, git, #sql, Hadoop; BitBucket (Git).
• Умение выбирать метрику под бизнес-задачу;
• Опыт написания кода в прод;
• Опыт проведение АБ тестов.

⚡️ Что делать:
• Построение моделей склонности, uplift моделей, моделей регрессии;
• Пилотирование (проработка дизайна пилота) и вывод моделей в прод;
• Развивать и поддерживать внутренний фреймворк для разработки моделей;
• Общаться с product owner’ами и выявлять потребности бизнеса.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Профи: Тимлид продуктовой аналитики кластера «Специалисты»
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
• Опыт в продуктовой аналитике от четырёх лет;
• Прикладной опыт в A/B-тестировании;
• Уверенное владение #sql, #python;
• Опыт управления аналитиками: наём, обучение и развитие, постановка целей и планирование ресурсов;
• Знание статистики;
• Продуктовое мышление. На метриках ты видишь не только цифры, но и поведение пользователей, изменения в продукте.

⚡️ Что делать:
• Улучшить инфраструктуры для продуктовых аналитиков кластера;
• Обсуждать и ревьюить результаты работы аналитиков;
• Включиться в процессы найма, расширять и развивать команду;
• Контролировать качество данных;
• Самостоятельно вести одно из направлений кластера;
• Находить новые возможности и способы, как аналитика может приносить больше ценности.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Автомакон: Data - инженер
#Удаленно

⚙️ Требования:
• Опыт программирования на #python (не менее 2-х лет);
• Знания #sql и опыт работы с базами данных;
• Опыт работы с Apache Airflow;
• Опыт написания процессов загрузки данных (ETL);
• Оптимизация SQL запросов;
понимание принципов работы данными;
• Опыт работы с СlickHouse/GreenPlum;
понимания концепций построения хранилищ данных.

⚡️ Что делать:
• Извлечение, преобразование, загрузка данных и их обработка;
• Формирование отчетов, визуализация данных;
• Создание и развитие процессов управления данными и их качеством;
работа с высоконагруженными базами;
разработка хранимых процедур, функций.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Озон: Senior ML Engineer (Senior Data Scientist), Маркетплейс, Цены и анализ конкурентов
#Офис #Москва

⚙️ Требования:
• Коммерческий опыт в DS от 3 лет;
• Знание #ML;
• Знание #python и PySpark;
• Знание алгоритмов и структур данных;
• Проактивность, большое желание развиваться и развивать людей вокруг;
• Желание развиваться в области #CV и #NLP.

⚡️ Что делать:
• Обучение и выкатка в прод новых моделей (ML / CV / NLP) - в зависимости от экспертизы;
• Исследование новых подходов для улучшения ключевых метрик матчинга;
• Написание и оптимизация алгоритмов обработки данных на PySpark;
• Постановка и декомпозиция задач для себя и коллег;
• Поиск новых способов создания ценности для компании.

➡️ Кому подойдет:
Среди текущих целей команды есть такие, как повышение полноты матчинга за счёт обучения новых текстовых и картиночных моделей, продвинутой работы с атрибутами и различных усовершенствований пайплайна. Также команда занимается разработкой сервиса real-time матчинга товаров.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Самокат: Senior Data Scientist CV
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️ Требования:
• Опыт работы в #CV от 3х лет;
• Опыт работы с #ML алгоритмами: регрессией; бустингом;
• Опыт работы с #python, #sql, Spark;
• Опыт проектной работы над бизнес DS проектами;
• Знания Gitlab, Jira, Confluence.

⚡️ Что делать:
• Полный цикл Data Science (от идеи до составление плана доработок модели по результатам пилота и его реализации).

➡️ Кому подойдет:
Группа DS внепродуктовых проектов и усиления ключевых инициатив в поисках коллеги, который поможет улучшить текущие показатели.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#НЛМК: Старший разработчик DWH / data engineer (hadoop)
#Офис / #Гибрид / #Удаленно
#Москва

⚙️ Требования:
#python (основные пакеты Numpy, Pandas, SCiPy и др), #sql;
• Знание фреймворков потоковой обработки данных: Kafka Streaming and Connect, Flink, Spark Streaming;
• Опыт работы с реляционными системами управления базами данных (SQL);
• Опыт работы с системами управления базами данных (NoSQL), Владение git.

⚡️ Что делать:
• Обеспечение поддержки и развития хранилищ данных по направлению BI;
• Опыт построения DWH, #DL.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#АльфаБанк: Специалист по интеллектуальному анализу данных (PD, LGD розничные риски)
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Образование: высшее, специальность: прикладная математика и информатика, экономика (финансы/математические модели в финансах);
• Опыт работы по специальности 1-3 года;
• Основы классических алгоритмов #ML;
• Современные методы прикладной статистики;
• Базовый ML-стек #python;
• Метрики оценки качества моделей;
• Письменная коммуникация;
• Бизнес-анализ.

⚡️ Что делать:
• Разрабатывать и улучшать ML модели в части розничных кредитных рисков;
• Формировать запросы в базы данных;
• Вести деловую коммуникацию с коллегами и бизнес-заказчиками;
• Готовить презентационные материалы с результатами работы;
• Презентовать результаты работы на внутренних встречах;
• Работать над исправлением ошибок в написанном коде;
• Участвовать в поддержке и развитии внутренних инструментов по автоматизации разработки моделей и проверке гипотез.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
#Яндекс: Аналитик-разработчик в Антифрод & Антиробот
#Офис / #Гибрид
#Москва

⚙️ Требования:
• Хорошо знаете математику, основы теорвера и матстата;
• Хорошо знаете основы #sql;
• Работали с #ML-моделями и понимаете, где они нужны, а где избыточны;
•Владеете #python, использовали популярные библиотеки для анализа данных (рandas, Matplotlib, Scikit-learn и др.).

⚡️ Что делать:
• Искать аномалии;
• Обучать ML модели;
• Придумывать и реализовывать новые фичи;
• Делать продуктовые метрики;
• Расследовать инциденты и ситуации, когда ничего непонятно.

➡️ Кому подойдет:
Команда ищет сильного аналитика, которому интересны алгоритмы анализа данных для поиска аномалий, обнаружения мошеннических действий, DDoS-атак и нежелательного контента.

🚀Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM