Data Secrets | Карьера
6.49K subscribers
1.05K photos
47 videos
1 file
1.16K links
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

Прислать вакансию/сотрудничество: @veron_28

https://telega.in/c/data_secrets_career
Download Telegram
Сколько получают ML-инженеры в России?

По данным Habr, джуны на должности ML-инженера в среднем получают от 83 до 168 тысяч рублей, мидлы — от 167 до 297 тысяч, сеньоры — от 313 до 474 тысяч.

Однако, если верить GeekLink, по сравнению с 24-м годом зарплаты снизились: средний размер оплаты труда инженера машинного обучения на 1 сентября 2025 года составляет 275 448 рублей в месяц. По сравнению с прошлым месяцем это значение уменьшилось на 3%.

Год назад в этот период средняя зарплата инженера машинного обучения составляла 352 133 рубля в месяц, что означает падение на 76 685 рублей (или на 22% в процентном соотношении).
22
Middle Data Scientist в Korona Tech
Удаленно / Гибрид / Офис в Санкт-Петербурге

Предстоит: обработка сырых данных; генерация гипотез; построение пайплайна обработки данных; подготовка и проведение А/В тестов... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Карьерный апгрейд: куда сейчас двигаться ML-специалисту

Возможно, многие уже заметили, что рынок хочет видеть инженеров, которые умеют создавать работающие LLM-системы в продакшене.

Если вы тоже задумывались о таком шаге, ловите находку — возможно, самый хардовый осенний курс по LLM от AI Talent Hub x GIGASCHOOL.

Главный плюс: он не про "попробовать LLM", а про то, как начать строить полноценные системы. Именно этот навык сейчас в жестком дефиците.

Что прокачаете:
Дообучение моделей: от классического fine-tuning до современных PEFT, LoRA и RLHF.
Инструменты пайплайна: работа с LangChain, LangGraph и векторными БД.
Сборка RAG-систем: от инфопоиска до защиты моделей от вредоносных промптов.
Проектирование и деплой: как собирать рабочие архитектуры, пайплайны, деплоить, трекать и версионировать.

По сути, это полный цикл работы LLM-инженера. И это не просто теория — каждая тема разбирается на практике, так что по итогу у вас будет не только сертификат, но и опыт с готовыми наработками в виде кода.

Кто будет вести? Здесь тоже всё серьезно — лекции читают практики из крупных AI-команд:
— Александр Потехин (NLP Lead, X5 Tech)
— Кристина Желтова (Директор по разработке моделей, Газпромбанк)
— Евгений Кокуйкин (CEO HiveTrace)

Такой состав спикеров гарантирует, что вы будете учиться на реальных кейсах, а не на абстрактных примерах.

Занятия стартуют 15 октября, но не стоит расслабляться, ведь совсем скоро (10 числа) стоимость курса повысится.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Data Secrets | Карьера
Еще один гайд по написанию идеальной научной статьи Ранее мы уже говорили о том, как написать статью так, чтобы ее приняли к публикации. Помимо содержательной части (всевозможных доказательств и описания проделанной работы), важно помнить: идеальная статья…
Советы по написанию научной статьи

Распространённое и часто запутанное требование к статьям — новизна результатов, то есть то, что ранее не было описано. Что это значит? Это означает, что ваша работа существует в контексте уже созданного, а новизна в данном случае расширяет уже созданное.

Чтобы не попасть впросак и не создать очередной велосипед — задайте себе вопросы:
Используются ли инновационные методы или это стандартные приёмы?
Является ли это глубоким концептуальным прорывом?
Это простое расширение стандартных идей?
Является ли работа естественным следствием более амбициозного заявления из другой статьи?

Ключевое решение — предельно ясно обозначить, что является новым, а что нет, особенно во введении и разделе «Связанные работы». Щедро цитируйте релевантные статьи и объясняйте, чем ваша работа от них отличается.

Если с идей все хорошо и она действительно новая, то ее хорошо бы и доказать. В ML в качестве доказательств обычно используют эксперименты. Ваша цель — обосновать результат со всеми техническими подробностями для заинтересованного, но скептически настроенного читателя.

Уделите много времени на этапе первоначального исследования. Главная ловушка при попытке «написать отличный научный рассказ — искушение игнорировать неудобные, противоречивые результаты. Не позволяйте этому случиться.

Советы:
Предположите, что вы совершили ошибку. В чём именно она заключается? Представьте, что в ваших доказательствах есть пробел. Где он? Попытайтесь его найти.
Привлекайте к обсуждению других исследователей, особенно более опытных.
Подробно разбирайте ограничения. Если вы заметили проблемы, разрабатывайте и проводите новые эксперименты для их проверки. Это особенно важно для амбициозных или неожиданных заявлений.
Хорошие эксперименты позволяют различать гипотезы: для одного явления часто существует несколько правдоподобных объяснений. Смысл эксперимента в том, чтобы его результаты значительно различались в зависимости от истинности той или иной гипотезы (то есть обеспечивали байесовское доказательство). Если результаты достаточно различны, а эксперимент надёжен, то одна хорошая работа может опровергнуть множество гипотез.

Обязательно спросите себя:
🟦 Можете ли вы доверять своим результатам? Обязательно спросите себя:
🟦 Насколько надёжен мой эксперимент?
🟦 Насколько он зашумлён?
🟦 Существует ли альтернативное объяснение моим результатам?

⁉️ Важно учитывать: Частая ошибка при выборе метода доказательства — вы начинаете доказывать эффективность методики, показывая, что она даёт хорошие результаты, вместо того чтобы продемонстрировать, что она даёт лучшие результаты, чем альтернативные варианты.
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Senior Data Engineer
Удаленно / Гибрид / Офис в Москве

Предстоит: Проведение аудита существующих дата-пайплайнов, выявление узких мест и точек отказа; Проектирование и реализация целевой архитектуры загрузки, трансформации и хранения данных под высокую нагрузку... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
LLM вылетает из GPU-памяти в длинных диалогах. Ваши действия?

Правильный ответ — не «докупить GPU» и не «обрезать контекст».

Проблема обычно кроется в KV Cache — его объем растет линейно с каждым токеном.
GPU Память = Веса модели + KV Cache

При длинном контексте KV Cache может съедать в 10 раз больше памяти, чем сама модель. Модель на 7B параметров с контекстом 8K? Это ~4GB только под кэш.

Главная ошибка: KV Cache простаивает в дорогой GPU-памяти между запросами пользователя. Пока он думает 30 секунд, его кэш на 2GB блокирует новые запросы.

Диагностика от Senior инженера:
Высокая загрузка GPU + низкая пропускная способность = Узкое место — KV Cache
OOM-ошибки на длинных контекстах = Нужна стратегия оффлоудинга (выгрузки)
Простаивающие сессии = Убитые ресурсы GPU

Метрика, отличающая сеньера от джуна: Time-to-First-Token (TTFT) при переиспользовании кэша. NVIDIA сообщает об ускорении TTFT в 14x при перезагрузке кэша против его пересчета.

Но тут интервьюер может уточнить:
Какой размер KV Cache для 32K токенов?
Как вы handlingите многопользовательские сессии?
Куда выгружаете неактивный кэш?

Иерархия памяти, которая приведет к повышению:
Junior: Держит всё в GPU памяти до самого OOM.
Senior: Выгружает по схеме: GPU → Оперативная память → SSD → Сетевое хранилище.
Principal: Внедряет predictive offloading на основе аналитики использования.

Но и этого интревьюеру может быть недостаточно, он может задать и такой вопрос:
«Как вы рассчитываете оптимальные пороги для выгрузки?»

Правильный ответ: «По формуле: Стоимость_передачи < Стоимости_пересчета. Профилируем шаблоны доступа, замеряем задержки хранилищ и внедряем predictive offloading».

Масштабирование инференса в большинстве случаев это на 80% управление памятью и на 20% оптимизация вычислений.
26
Senior ETL/DWH Developer
Гибрид / Офис в Москве

Предстоит: Разработка и оптимизация архитектуры Хранилища данных, проектирование слоев данных; Создание, поддержка и оптимизация высоконагруженных ETL-процессов; Интеграция данных из внутренних/внешних источников (API, файловые хранилища, БД)... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Research Scientist в Криптонит
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге

Предстоит: Ведением исследовательских работ в области математики, Computer Science, электроники, телекоммуникаций и сетей, смежных областях... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
В Студия Данных открыто три вакансии: NLP Engineer/LLMOps Engineer/RAG Engineer
От 350.000 до 450.000₽
Удаленно / Гибрид / Офис

Над какими задачи можно будет поработать: Служба клиентского сервиса — суфлёр для операторов и умные чат-боты для клиентов; Юристы — co-pilot для подготовки возражений на иски и анализа входящих договоров; Тендровики — приоритезация опубликованных закупок, анализ предложений и проверка документации претендентов на соответствие требованиям... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Привет, ML-специалист! 😎 Надоели базовые туториалы и предсказуемые датасеты? Пора разобраться с тем, что действительно крутит этот мир — рекомендательными системами!

Приглашаем на бесплатный вебинар продвинутого курса «Machine Learning. Advanced», где будем вскрывать матричные разложения без анестезии!

На вебинаре с Марией Тихоновой (Senior Data Scientist, SberDevices):
— Изучим специфику построения RS
— Разложим по полочкам матричные разложения
— Научимся создавать свои рекомендательные системы

Это ваш шанс не просто послушать, а протестировать обучение на курсе! А если решите остаться — ловите промокод MLADV_10 для выгодного зачисления.

👉Регистрируйтесь сейчас - напомним перед вебинаром: https://otus.pw/dn8n/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Лекции по Computer Vision от Стэнфорда

Если вы давно хотели вкатиться в CV, то это отличная возможность. Опытные преподаватели Стэнфорда расскажут базу, которая лежит в основе компьютерного зрения, а также поделятся гайдами и современными подходами. В курсе разбирают классические и современные темы: image classification, detection, RNN, LSTM, end-to-end модели, а также обучение моделей — от backpropagation до отладки. Лекции этого года, поэтому материал еще совсем свежий.
18
Senior разработчик ML в JETLYN
От 250.000 до 320.000₽
Удаленно на территории РФ

Предстоит: Разработка программных решений с использованием нейросетевых и классических моделей машинного обучения. Внедрение современных методов машинного обучения; Формирование требований к данным для создания моделей... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Senior Data Scientist
250.000₽
Удаленно (гражданство РФ, РБ)

Требуется Data Scientist на проект СУЭК, старта проекта: ASAP или месяц
Продолжительность проекта (от 3х месяцев): до 31.12.2025 с перспективой продления... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Senior ML-инженер
До 6.000$
Удаленно

Предстоит: Работа в компании Априори Глобал, совместный проект и задачи с компанией в США; Проекты agents and agentic platform... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
3 вещи, которые CEO Scale AI ценит в кандидатах

Временный генеральный директор Scale AI Джейсон Дроге рассказал, что он ищет в кандидатах при найме.

Набор качеств получился интересным: любознательность, умение смиренно сотрудничать и лидерство.

Если с любознательностью и лидерством всё понятно, то суть «смиренного сотрудничества» он пояснил на примере:
«Всякий раз, когда я нанимал людей, я пытался собрать почти что организм из сильных сторон и свести конфликты к минимуму».

При этом Дроге подчеркнул, что для успеха в организации в целом важнее именно эти три черты, а не прямой опыт: «Мир меняется... Весь предыдущий опыт не обязательно напрямую применим». Однако для некоторых узких экспертных ролей опыт, по его словам, всё же остается критически важным.
7
Senior Data Scientist
250.000₽
Удаленно

Предстоит: Разработка программного кода; Участие в разработке ИИ продуктов отдела; Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Ai архитектор в Raft Digital Solutions

Предстоит: Разработка архитектурных решений для AI-приложений с учетом требований клиентов и современных технологий
... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5