Data Secrets | Карьера

#Яндекс: ML-разработчик в команду ML Laboratory
#Офис #Москва

⚙️

Требования:
• Хорошо понимаете принципы #ML и применяли их на практике;
• Знаете классические алгоритмы и структуры данных;
• Знаете #python и #cpp;
• Самостоятельны и готовы браться за новые задачи, для которых нет готового решения.

⚡️

Что делать:
• Генерировать и проверять гипотезы, которые помогут улучшить работу моделей;
• Разрабатывать методы оценки и контроля качества моделей;
• Дообучать #LLM под конкретные задачи, определять оптимальный набор данных для файнтюна модели;
• Совершенствовать методы сбора обучающих данных и их обработки, процедуры и инфраструктуру обучения моделей;
• Исследовать RL-подходы.

➡️

Кому подойдет:
Бизнес Яндекса зависит от многих факторов, в том числе от скорости, с которой идеи превращаются в продакшен-процессы. Цель команды — ускорить процесс этого превращения.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

1.17K views15:12

Data Secrets | Карьера

#VK: ML Engineer (LLM)
#Офис / #Гибрид
#Спб

⚙️

Требования:
• Хорошо пишете на #python;
ꔷ Прекрасно владеете PyTorch или JAX;
ꔷ Отлично понимаете концепции #DL и можете свободно их применять;
ꔷ Знаете классические и современные подходы к обработке #NLP, отлично разбираетесь в Transformer-моделях;
ꔷ Имели опыт работы с языковыми моделями, диалоговыми системами или суммаризацией.

⚡️

Что делать:
• Заниматься претрейном #LLM;
ꔷ Экспериментировать с алайнментом через SFT и Human Feedback, исследовать возможность применения LLM на продуктовых задачах, заниматься разработкой бенчмарков для оценки качества LLM.

➡️

Кому подойдет:
Команда развивает передовые технологии машинного обучения и искусственного интеллекта. Ищут разработчика, который поможет в исследовании и решении разнообразных задач, связанных с большими языковыми моделями (LLM).

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

887 views11:17

Data Secrets | Карьера

#Иннотех: Data Scientist NLP и LLM
#Офис #Москва

⚙️

Требования:
• Высшее математическое/техническое образование;
• Понимание принципов работы с #LLM;
• Уверенное знание математики, статистики и машинного обучения;
• Владение #python и опыт практического применения алгоритмов #ML: нейронные сети, композиционные алгоритмы, #NLP;
• Уверенное владение #sql.

⚡️

Что делать:
• Проведение исследований, проверка гипотез команды с использованием LLM;
• Совершенствование LLM моделей, используя промт-инжиниринг. Векторизация документов (для RAG сервиса);
• Преобразование изображения текста в машиночитаемый формат(OCR);
• Разработка и внедрение моделей (NLP\классический ML\графовые сети) в промышленные системы;
• Поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

865 views09:11

Data Secrets | Карьера

#Wildberries: Senior Data Scientist (NLP) в автоматизацию коммуникаций
#Офис / #Гибрид
#Москва

⚙️

Требования:
• Опыт в области анализа данных и #ML от 3х лет;
• Знание #python, методов работы с большими данными;
• Опыт работы с библиотеками: Scikit-learn, HuggingFace, PyTorch;
• Опыт работы с #LLM;
• Знание теорий вероятностей и математической статистики;
• Знание алгоритмов и структур данных.

⚡️

Что делать:
• Использовать историю взаимодействия с пользователем для улучшения моделей чат-бота;
• Участвовать в исследовательских проектах в области #NLP, публиковать статьи и доклады на конференциях;
• Создавать и обучать модели машинного обучения и NLP для понимания и обработки текстовых запросов пользователей.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

860 views11:17

Data Secrets | Карьера

#2GIS: Data Scientist в команду NLP
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️

Требования:
• Опыт работы над #NLP-задачами от двух лет;
• Хорошее знание #python;
• Опыт работы с PyTorch и/или TensorFlow + NumPy, sklearn;
• Опыт работы с инструментами разработки и CI/CD — Git, Jenkins, GitLab, Jira;
• Опыт работы с брокерами сообщений: rabbitmq, kafka;
• Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т. п.), #LLM (+ методов их тюнинга RLHF, Lora);
• Знание классических методов —классические языковые модели, tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM;
• Опыт использования библиотек — kenlm, transformers, nltk, pyonmttok, vowpalwabbit, gensim и т.п.

⚡️

Что делать:
• Заниматься майнингом данных, дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий;
• В UGC-задачах — извлечение фактов из отзывов компаний, модерация отзывов, суммаризация;
• Разрабатывать системы исправления опечаток, транслитерации, улучшаем точность и полноту поиска;
• В ближайшем будущем предполагается решать задачи автоматической генерации различного контента.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

907 views08:26

Data Secrets | Карьера

#2GIS: Тимлид команды разработки AI
#Офис / #Гибрид / #Удаленно
#Москва #Спб

⚙️

Требования:
• Опыт: от 3-х лет в роли тимлида или ведущего разработчика, от 2-х лет в разработке или data science;
• Технические навыки: #python, опыт работы с фреймворками для написания #LLM пайплайнов (LangChain, LlamaIndex и т.п.), опыт деплоя сервисов в прод (особенно GPU сервисов);
• Управленческие навыки: умение эффективно координировать работу команды, опыт проведения код-ревью, разработка и внедрение стратегий развития;
• Базовое понимание техник промптинга, #RAG-систем, AI-агентов, опыт работы с LLM, таких как ChatGPT.

⚡️

Что делать:
• Координация работы разработчиков, постановка задач, контроль сроков и качества выполнения;
• Определение приоритетов, разработка планов по развитию сервисов, основанных на LLM;
• Участие в проектировании и разработке ключевых компонентов, проведение код-ревью, помощь команде в решении сложных технических задач;
• Деплой и настройка сервисов в Kubernetes, мониторинг и оптимизация их работы;
• Анализ качества генеративных моделей, внедрение лучших практик и методов улучшения.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

823 viewsedited 13:07

Data Secrets | Карьера

#Яндекс: NLP-разработчик
#Офис
#Москва #Спб #Екб

⚙️

Требования:
• Работали с #LLM;
• Разрабатывали на #python;
• Хорошо знаете принципы #ML и #NLP;
• Работали с PyTorch или другими #DL-фреймворками;
• Готовы общаться с заказчиками и вести проекты;
• Хотите искать идеи и формулировать задачи.

⚡️

Что делать:
• Предстоит автоматизировать с помощью BERT/YaGPT процессы по выявлению некорректных или критичных ответов в службах поддержки, а также предлагать новые подходы и идеи, искать точки роста, чтобы наращивать качество ответов;
• Работа по обучению и внедрению LLM для автоматизации выдачи персонализированных ответов в поддержках E-com & Ridetech;
• Внедрением инструментов на основе LLM, чтобы улучшать и ускорять работу операторов различных служб поддержки.

➡️

Кому подойдет:
Команда автоматизирует работу служб поддержки и колл-центров. В основе платформы лежат большие данные и алгоритмы работы с ними.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

833 views15:07

Data Secrets | Карьера

#ИТМО: Разработчик open-source решений в области AI/ML на Python
#Офис #Спб

⚙️

Требования:
• Высшее образование;
• Опыта коммерческой или близкой к ней разработки от 1 года;
• Знание #python и связанного прикладного инструментария (IDE, git и т. д.);
• Уверенное владение принципами SOLID, ООП, паттернами проектирования и архитектурными паттернами;
• Понимание базовых концепций методов #ML, желание улучшать свои знания в этой области;
• Понимание принципов рефакторинга, обеспечения качества кода, модульного и интеграционного тестирования;
• Знание основных алгоритмов и структур данных;
• Английский язык от B2.

⚡️

Что делать:
• Разработка AutoML-фреймворка, объединяющего методы оптимизации и #LLM;
• Разработка фреймворка для работы с LLM;
• Разработка открытых инструментах для решения предметных задач с помощью LLM;
• Разработка библиотеки для эволюционной оптимизации графовых структур.

➡️

Кому подойдет:
Вакансия ориентирована на Upper-Junior разработчиков, готовых как разрабатывать код, так и участвовать во взаимном код-ревью, обсуждениях архитектурных концепций и подобных активностях.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

845 views09:07

Data Secrets | Карьера

#Яндекс: ML-разработчик генеративных моделей в международное направление Алисы (LLM)
#Офис / #Гибрид
#Москва #Спб

⚙️

Требования:
• Отлично знаете математику и классические алгоритмы и структуры данных;
• Понимание принципов #ML;
• Понимание и опыт #DL, опыт работы с PyTorch (или др.), #python;
• Английский на уровне понимания научных статей.

⚡️

Что делать:
• Обучать #LLM понимать и вести диалог на других языках. Для улучшения качества ответов нужно будет экспериментировать с #RL и обогащением моделей с помощью внешних источников данных;
• Экспериментировать с разными подходами к сбору обучающих данных и к оценке качества моделей;
• Экспериментировать с новыми нейросетевыми архитектурами и пробовать уменьшать модели без потери качества ответов.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

848 views11:21

Data Secrets | Карьера

#Яндекс: Руководитель ML-команды разработки генеративных моделей в международное направление Алисы (LLM)
#Офис / #Гибрид
#Москва

⚙️

Требования:
• Отлично знаете математику;
• Работали с нейросетевыми моделями обработки текстов;
• Хорошо знаете #python;
• Имеете руководящий опыт или были ментором;
• Хорошо владеете английским языком: способны просмотреть свежую статью в arXiv и за несколько минут понять, в чём основная идея авторов и каких результатов им удалось достичь.

⚡️

Что делать:
• Руководство командой разработки;
• Обучать #LLM понимать и вести диалог на других языках. Для улучшения качества ответов нужно будет экспериментировать с методами #RL;
• Оптимизация инференса.

➡️

Кому подойдет:
Команда учит Алису вести естественный и интересный диалог, быть эмпатичной и человечной. Следующая цель — научить её делать это качественно на других языках. Алиса уже умеет говорить на казахском, а Yango анонсировал ассистента на арабском языке.

🚀Откликнуться

Please open Telegram to view this post

VIEW IN TELEGRAM

812 views07:06

About

Blog

Apps

Platform