Подборка открытых вакансий 🔵
Middle/Senior Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве
Middle/Senior ML-разработчик в Яндекс
Офис в Москве
Middle Data Engineer в МТС
Офис в Москве
Junior/Middle MLOps Engineer в Lamoda
Офис в Москве
Data Analyst в Сбер
От 110.000₽
Офис в Санкт-Петербурге
Junior/Middle Data Engineer в Wildberries
Удаленно
Middle/Senior Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве
Middle/Senior ML-разработчик в Яндекс
Офис в Москве
Middle Data Engineer в МТС
Офис в Москве
Junior/Middle MLOps Engineer в Lamoda
Офис в Москве
Data Analyst в Сбер
От 110.000₽
Офис в Санкт-Петербурге
Junior/Middle Data Engineer в Wildberries
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Middle/Senior Data Scientist в Raft Digital Solutions
Удаленно
Предстоит: Создание и оптимизация RAG-систем; Разработка, обучение и внедрение моделей машинного обучения в связке с LLM... Узнать подробнее🔵
Удаленно
Предстоит: Создание и оптимизация RAG-систем; Разработка, обучение и внедрение моделей машинного обучения в связке с LLM... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
😵💫Ваши пайплайны работают безупречно, но бизнес почему-то плачет? Виноват не код, а хаос в требованиях!
Приглашаем на бесплатный вебинар курса «Data Warehouse Analyst» — «Искусство сбора требований: мастерство дата инженера против хаоса бизнеса»: https://otus.pw/VthQ/
🔈Спикер — Александра Гамаева, TeamLead в крупном банке. Она научит вас:
— Выявлять скрытые требования, которые бизнес не озвучил (но обязательно вспомнит после деплоя).
— Задавать правильные вопросы, чтобы ваш ETL не превратился в технический долг.
— Проектировать устойчивую архитектуру, которая переживет даже самые безумные правки.
Это вебинар курса, где вы прокачаете не только hard skills, но и главный софт-скилл дата-инженера — общение с бизнесом.
👉Регистрируйтесь сейчас - напомним перед занятием: https://otus.pw/VthQ/
🎁 Понравится вебинар — приходите на курс с выгодой по промокодуDWH10 .
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Приглашаем на бесплатный вебинар курса «Data Warehouse Analyst» — «Искусство сбора требований: мастерство дата инженера против хаоса бизнеса»: https://otus.pw/VthQ/
🔈Спикер — Александра Гамаева, TeamLead в крупном банке. Она научит вас:
— Выявлять скрытые требования, которые бизнес не озвучил (но обязательно вспомнит после деплоя).
— Задавать правильные вопросы, чтобы ваш ETL не превратился в технический долг.
— Проектировать устойчивую архитектуру, которая переживет даже самые безумные правки.
Это вебинар курса, где вы прокачаете не только hard skills, но и главный софт-скилл дата-инженера — общение с бизнесом.
👉Регистрируйтесь сейчас - напомним перед занятием: https://otus.pw/VthQ/
🎁 Понравится вебинар — приходите на курс с выгодой по промокоду
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Сколько получают ML-инженеры в России?
По данным Habr, джуны на должности ML-инженера в среднем получают от 83 до 168 тысяч рублей, мидлы — от 167 до 297 тысяч, сеньоры — от 313 до 474 тысяч.
Однако, если верить GeekLink, по сравнению с 24-м годом зарплаты снизились: средний размер оплаты труда инженера машинного обучения на 1 сентября 2025 года составляет 275 448 рублей в месяц. По сравнению с прошлым месяцем это значение уменьшилось на 3%.
Год назад в этот период средняя зарплата инженера машинного обучения составляла 352 133 рубля в месяц, что означает падение на 76 685 рублей (или на 22% в процентном соотношении).
По данным Habr, джуны на должности ML-инженера в среднем получают от 83 до 168 тысяч рублей, мидлы — от 167 до 297 тысяч, сеньоры — от 313 до 474 тысяч.
Однако, если верить GeekLink, по сравнению с 24-м годом зарплаты снизились: средний размер оплаты труда инженера машинного обучения на 1 сентября 2025 года составляет 275 448 рублей в месяц. По сравнению с прошлым месяцем это значение уменьшилось на 3%.
Год назад в этот период средняя зарплата инженера машинного обучения составляла 352 133 рубля в месяц, что означает падение на 76 685 рублей (или на 22% в процентном соотношении).
❤22
Middle Data Scientist в Korona Tech
Удаленно / Гибрид / Офис в Санкт-Петербурге
Предстоит: обработка сырых данных; генерация гипотез; построение пайплайна обработки данных; подготовка и проведение А/В тестов... Узнать подробнее🔵
Удаленно / Гибрид / Офис в Санкт-Петербурге
Предстоит: обработка сырых данных; генерация гипотез; построение пайплайна обработки данных; подготовка и проведение А/В тестов... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Карьерный апгрейд: куда сейчас двигаться ML-специалисту
Возможно, многие уже заметили, что рынок хочет видеть инженеров, которые умеют создавать работающие LLM-системы в продакшене.
Если вы тоже задумывались о таком шаге, ловите находку — возможно, самый хардовый осенний курс по LLM от AI Talent Hub x GIGASCHOOL.
Главный плюс: он не про "попробовать LLM", а про то, как начать строить полноценные системы. Именно этот навык сейчас в жестком дефиците.
Что прокачаете:
➖ Дообучение моделей: от классического fine-tuning до современных PEFT, LoRA и RLHF.
➖ Инструменты пайплайна: работа с LangChain, LangGraph и векторными БД.
➖ Сборка RAG-систем: от инфопоиска до защиты моделей от вредоносных промптов.
➖ Проектирование и деплой: как собирать рабочие архитектуры, пайплайны, деплоить, трекать и версионировать.
По сути, это полный цикл работы LLM-инженера. И это не просто теория — каждая тема разбирается на практике, так что по итогу у вас будет не только сертификат, но и опыт с готовыми наработками в виде кода.
Кто будет вести? Здесь тоже всё серьезно — лекции читают практики из крупных AI-команд:
— Александр Потехин (NLP Lead, X5 Tech)
— Кристина Желтова (Директор по разработке моделей, Газпромбанк)
— Евгений Кокуйкин (CEO HiveTrace)
Такой состав спикеров гарантирует, что вы будете учиться на реальных кейсах, а не на абстрактных примерах.
Занятия стартуют 15 октября, но не стоит расслабляться, ведь совсем скоро (10 числа) стоимость курса повысится.
Возможно, многие уже заметили, что рынок хочет видеть инженеров, которые умеют создавать работающие LLM-системы в продакшене.
Если вы тоже задумывались о таком шаге, ловите находку — возможно, самый хардовый осенний курс по LLM от AI Talent Hub x GIGASCHOOL.
Главный плюс: он не про "попробовать LLM", а про то, как начать строить полноценные системы. Именно этот навык сейчас в жестком дефиците.
Что прокачаете:
По сути, это полный цикл работы LLM-инженера. И это не просто теория — каждая тема разбирается на практике, так что по итогу у вас будет не только сертификат, но и опыт с готовыми наработками в виде кода.
Кто будет вести? Здесь тоже всё серьезно — лекции читают практики из крупных AI-команд:
— Александр Потехин (NLP Lead, X5 Tech)
— Кристина Желтова (Директор по разработке моделей, Газпромбанк)
— Евгений Кокуйкин (CEO HiveTrace)
Такой состав спикеров гарантирует, что вы будете учиться на реальных кейсах, а не на абстрактных примерах.
Занятия стартуют 15 октября, но не стоит расслабляться, ведь совсем скоро (10 числа) стоимость курса повысится.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Data Secrets | Карьера
Еще один гайд по написанию идеальной научной статьи Ранее мы уже говорили о том, как написать статью так, чтобы ее приняли к публикации. Помимо содержательной части (всевозможных доказательств и описания проделанной работы), важно помнить: идеальная статья…
Советы по написанию научной статьи
Распространённое и часто запутанное требование к статьям — новизна результатов, то есть то, что ранее не было описано. Что это значит? Это означает, что ваша работа существует в контексте уже созданного, а новизна в данном случае расширяет уже созданное.
Чтобы не попасть впросак и не создать очередной велосипед — задайте себе вопросы:
➖ Используются ли инновационные методы или это стандартные приёмы?
➖ Является ли это глубоким концептуальным прорывом?
➖ Это простое расширение стандартных идей?
➖ Является ли работа естественным следствием более амбициозного заявления из другой статьи?
❗ Ключевое решение — предельно ясно обозначить, что является новым, а что нет, особенно во введении и разделе «Связанные работы». Щедро цитируйте релевантные статьи и объясняйте, чем ваша работа от них отличается.
Если с идей все хорошо и она действительно новая, то ее хорошо бы и доказать. В ML в качестве доказательств обычно используют эксперименты. Ваша цель — обосновать результат со всеми техническими подробностями для заинтересованного, но скептически настроенного читателя.
Уделите много времени на этапе первоначального исследования. Главная ловушка при попытке «написать отличный научный рассказ — искушение игнорировать неудобные, противоречивые результаты. Не позволяйте этому случиться.
Советы:
➖ Предположите, что вы совершили ошибку. В чём именно она заключается? Представьте, что в ваших доказательствах есть пробел. Где он? Попытайтесь его найти.
➖ Привлекайте к обсуждению других исследователей, особенно более опытных.
➖ Подробно разбирайте ограничения. Если вы заметили проблемы, разрабатывайте и проводите новые эксперименты для их проверки. Это особенно важно для амбициозных или неожиданных заявлений.
➖ Хорошие эксперименты позволяют различать гипотезы: для одного явления часто существует несколько правдоподобных объяснений. Смысл эксперимента в том, чтобы его результаты значительно различались в зависимости от истинности той или иной гипотезы (то есть обеспечивали байесовское доказательство). Если результаты достаточно различны, а эксперимент надёжен, то одна хорошая работа может опровергнуть множество гипотез.
Обязательно спросите себя:
🟦 Можете ли вы доверять своим результатам? Обязательно спросите себя:
🟦 Насколько надёжен мой эксперимент?
🟦 Насколько он зашумлён?
🟦 Существует ли альтернативное объяснение моим результатам?
⁉️ Важно учитывать: Частая ошибка при выборе метода доказательства — вы начинаете доказывать эффективность методики, показывая, что она даёт хорошие результаты, вместо того чтобы продемонстрировать, что она даёт лучшие результаты, чем альтернативные варианты.
Распространённое и часто запутанное требование к статьям — новизна результатов, то есть то, что ранее не было описано. Что это значит? Это означает, что ваша работа существует в контексте уже созданного, а новизна в данном случае расширяет уже созданное.
Чтобы не попасть впросак и не создать очередной велосипед — задайте себе вопросы:
Если с идей все хорошо и она действительно новая, то ее хорошо бы и доказать. В ML в качестве доказательств обычно используют эксперименты. Ваша цель — обосновать результат со всеми техническими подробностями для заинтересованного, но скептически настроенного читателя.
Уделите много времени на этапе первоначального исследования. Главная ловушка при попытке «написать отличный научный рассказ — искушение игнорировать неудобные, противоречивые результаты. Не позволяйте этому случиться.
Советы:
Обязательно спросите себя:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Senior Data Engineer
Удаленно / Гибрид / Офис в Москве
Предстоит: Проведение аудита существующих дата-пайплайнов, выявление узких мест и точек отказа; Проектирование и реализация целевой архитектуры загрузки, трансформации и хранения данных под высокую нагрузку... Узнать подробнее🔵
Удаленно / Гибрид / Офис в Москве
Предстоит: Проведение аудита существующих дата-пайплайнов, выявление узких мест и точек отказа; Проектирование и реализация целевой архитектуры загрузки, трансформации и хранения данных под высокую нагрузку... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
LLM вылетает из GPU-памяти в длинных диалогах. Ваши действия?
Правильный ответ — не «докупить GPU» и не «обрезать контекст».
Проблема обычно кроется в KV Cache — его объем растет линейно с каждым токеном.
GPU Память = Веса модели + KV Cache
При длинном контексте KV Cache может съедать в 10 раз больше памяти, чем сама модель. Модель на 7B параметров с контекстом 8K? Это ~4GB только под кэш.
Главная ошибка: KV Cache простаивает в дорогой GPU-памяти между запросами пользователя. Пока он думает 30 секунд, его кэш на 2GB блокирует новые запросы.
Диагностика от Senior инженера:
Высокая загрузка GPU + низкая пропускная способность = Узкое место — KV Cache
OOM-ошибки на длинных контекстах = Нужна стратегия оффлоудинга (выгрузки)
Простаивающие сессии = Убитые ресурсы GPU
Метрика, отличающая сеньера от джуна: Time-to-First-Token (TTFT) при переиспользовании кэша. NVIDIA сообщает об ускорении TTFT в 14x при перезагрузке кэша против его пересчета.
Но тут интервьюер может уточнить:
Какой размер KV Cache для 32K токенов?
Как вы handlingите многопользовательские сессии?
Куда выгружаете неактивный кэш?
Иерархия памяти, которая приведет к повышению:
Junior: Держит всё в GPU памяти до самого OOM.
Senior: Выгружает по схеме: GPU → Оперативная память → SSD → Сетевое хранилище.
Principal: Внедряет predictive offloading на основе аналитики использования.
Но и этого интревьюеру может быть недостаточно, он может задать и такой вопрос:
«Как вы рассчитываете оптимальные пороги для выгрузки?»
Правильный ответ: «По формуле:
Масштабирование инференса в большинстве случаев это на 80% управление памятью и на 20% оптимизация вычислений.
Правильный ответ — не «докупить GPU» и не «обрезать контекст».
Проблема обычно кроется в KV Cache — его объем растет линейно с каждым токеном.
GPU Память = Веса модели + KV Cache
При длинном контексте KV Cache может съедать в 10 раз больше памяти, чем сама модель. Модель на 7B параметров с контекстом 8K? Это ~4GB только под кэш.
Главная ошибка: KV Cache простаивает в дорогой GPU-памяти между запросами пользователя. Пока он думает 30 секунд, его кэш на 2GB блокирует новые запросы.
Диагностика от Senior инженера:
Высокая загрузка GPU + низкая пропускная способность = Узкое место — KV Cache
OOM-ошибки на длинных контекстах = Нужна стратегия оффлоудинга (выгрузки)
Простаивающие сессии = Убитые ресурсы GPU
Метрика, отличающая сеньера от джуна: Time-to-First-Token (TTFT) при переиспользовании кэша. NVIDIA сообщает об ускорении TTFT в 14x при перезагрузке кэша против его пересчета.
Но тут интервьюер может уточнить:
Какой размер KV Cache для 32K токенов?
Как вы handlingите многопользовательские сессии?
Куда выгружаете неактивный кэш?
Иерархия памяти, которая приведет к повышению:
Junior: Держит всё в GPU памяти до самого OOM.
Senior: Выгружает по схеме: GPU → Оперативная память → SSD → Сетевое хранилище.
Principal: Внедряет predictive offloading на основе аналитики использования.
Но и этого интревьюеру может быть недостаточно, он может задать и такой вопрос:
«Как вы рассчитываете оптимальные пороги для выгрузки?»
Правильный ответ: «По формуле:
Стоимость_передачи < Стоимости_пересчета
. Профилируем шаблоны доступа, замеряем задержки хранилищ и внедряем predictive offloading».Масштабирование инференса в большинстве случаев это на 80% управление памятью и на 20% оптимизация вычислений.
❤26
Senior ETL/DWH Developer
Гибрид / Офис в Москве
Предстоит: Разработка и оптимизация архитектуры Хранилища данных, проектирование слоев данных; Создание, поддержка и оптимизация высоконагруженных ETL-процессов; Интеграция данных из внутренних/внешних источников (API, файловые хранилища, БД)... Узнать подробнее🔵
Гибрид / Офис в Москве
Предстоит: Разработка и оптимизация архитектуры Хранилища данных, проектирование слоев данных; Создание, поддержка и оптимизация высоконагруженных ETL-процессов; Интеграция данных из внутренних/внешних источников (API, файловые хранилища, БД)... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
⚡️ Не упусти последний шанс присоединиться к Data Science конкурсу по археологии от Phystech.Genesis!
🔎 Разработай модель, которая поможет искать археологические объекты по данным аэрофотосъёмки, спутников и лидара, и помоги решить социально значимую задачу.
🔥 Призовой фонд - 5 000 000 ₽.
💻 Ждем команды 2-5 человек уровня Middle+ в области ML/CV.
📌 Формат: онлайн на DS-платформе Phystech.Genesis.
Участвовать могут как физические лица, так и компании.
➡️ Успей подать заявку до 14 октября по ссылке.
🔎 Разработай модель, которая поможет искать археологические объекты по данным аэрофотосъёмки, спутников и лидара, и помоги решить социально значимую задачу.
🔥 Призовой фонд - 5 000 000 ₽.
💻 Ждем команды 2-5 человек уровня Middle+ в области ML/CV.
📌 Формат: онлайн на DS-платформе Phystech.Genesis.
Участвовать могут как физические лица, так и компании.
➡️ Успей подать заявку до 14 октября по ссылке.
Research Scientist в Криптонит
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге
Предстоит: Ведением исследовательских работ в области математики, Computer Science, электроники, телекоммуникаций и сетей, смежных областях... Узнать подробнее🔵
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге
Предстоит: Ведением исследовательских работ в области математики, Computer Science, электроники, телекоммуникаций и сетей, смежных областях... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
В Студия Данных открыто три вакансии: NLP Engineer/LLMOps Engineer/RAG Engineer
От 350.000 до 450.000₽
Удаленно / Гибрид / Офис
Над какими задачи можно будет поработать: Служба клиентского сервиса — суфлёр для операторов и умные чат-боты для клиентов; Юристы — co-pilot для подготовки возражений на иски и анализа входящих договоров; Тендровики — приоритезация опубликованных закупок, анализ предложений и проверка документации претендентов на соответствие требованиям... Узнать подробнее🔵
От 350.000 до 450.000₽
Удаленно / Гибрид / Офис
Над какими задачи можно будет поработать: Служба клиентского сервиса — суфлёр для операторов и умные чат-боты для клиентов; Юристы — co-pilot для подготовки возражений на иски и анализа входящих договоров; Тендровики — приоритезация опубликованных закупок, анализ предложений и проверка документации претендентов на соответствие требованиям... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Привет, ML-специалист! 😎 Надоели базовые туториалы и предсказуемые датасеты? Пора разобраться с тем, что действительно крутит этот мир — рекомендательными системами!
Приглашаем на бесплатный вебинар продвинутого курса «Machine Learning. Advanced», где будем вскрывать матричные разложения без анестезии!
На вебинаре с Марией Тихоновой (Senior Data Scientist, SberDevices):
— Изучим специфику построения RS
— Разложим по полочкам матричные разложения
— Научимся создавать свои рекомендательные системы
Это ваш шанс не просто послушать, а протестировать обучение на курсе! А если решите остаться — ловите промокод MLADV_10 для выгодного зачисления.
👉Регистрируйтесь сейчас - напомним перед вебинаром: https://otus.pw/dn8n/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Приглашаем на бесплатный вебинар продвинутого курса «Machine Learning. Advanced», где будем вскрывать матричные разложения без анестезии!
На вебинаре с Марией Тихоновой (Senior Data Scientist, SberDevices):
— Изучим специфику построения RS
— Разложим по полочкам матричные разложения
— Научимся создавать свои рекомендательные системы
Это ваш шанс не просто послушать, а протестировать обучение на курсе! А если решите остаться — ловите промокод MLADV_10 для выгодного зачисления.
👉Регистрируйтесь сейчас - напомним перед вебинаром: https://otus.pw/dn8n/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Лекции по Computer Vision от Стэнфорда
Если вы давно хотели вкатиться в CV, то это отличная возможность. Опытные преподаватели Стэнфорда расскажут базу, которая лежит в основе компьютерного зрения, а также поделятся гайдами и современными подходами. В курсе разбирают классические и современные темы: image classification, detection, RNN, LSTM, end-to-end модели, а также обучение моделей — от backpropagation до отладки. Лекции этого года, поэтому материал еще совсем свежий.
Если вы давно хотели вкатиться в CV, то это отличная возможность. Опытные преподаватели Стэнфорда расскажут базу, которая лежит в основе компьютерного зрения, а также поделятся гайдами и современными подходами. В курсе разбирают классические и современные темы: image classification, detection, RNN, LSTM, end-to-end модели, а также обучение моделей — от backpropagation до отладки. Лекции этого года, поэтому материал еще совсем свежий.
❤17
Senior разработчик ML в JETLYN
От 250.000 до 320.000₽
Удаленно на территории РФ
Предстоит: Разработка программных решений с использованием нейросетевых и классических моделей машинного обучения. Внедрение современных методов машинного обучения; Формирование требований к данным для создания моделей... Узнать подробнее🔵
От 250.000 до 320.000₽
Удаленно на территории РФ
Предстоит: Разработка программных решений с использованием нейросетевых и классических моделей машинного обучения. Внедрение современных методов машинного обучения; Формирование требований к данным для создания моделей... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Senior Data Scientist
250.000₽
Удаленно (гражданство РФ, РБ)
Требуется Data Scientist на проект СУЭК, старта проекта: ASAP или месяц
Продолжительность проекта (от 3х месяцев): до 31.12.2025 с перспективой продления... Узнать подробнее🔵
250.000₽
Удаленно (гражданство РФ, РБ)
Требуется Data Scientist на проект СУЭК, старта проекта: ASAP или месяц
Продолжительность проекта (от 3х месяцев): до 31.12.2025 с перспективой продления... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Senior ML-инженер
До 6.000$
Удаленно
Предстоит: Работа в компании Априори Глобал, совместный проект и задачи с компанией в США; Проекты agents and agentic platform... Узнать подробнее🔵
До 6.000$
Удаленно
Предстоит: Работа в компании Априори Глобал, совместный проект и задачи с компанией в США; Проекты agents and agentic platform... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6