Data Secrets | Карьера

Портфельный аналитик (Антифрод) в Сбер
Офис в Москве

Предстоит: Применять современные ML-модели для оптимального использования в стратегии одобрения; Анализировать текущий портфель на определение мошеннических схем... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

2.62K views08:04

Data Secrets | Карьера

В любой непонятной ситуации - используй бустинг

❤47

2.83K views14:58

Data Secrets | Карьера

Открытые вакансии в HighSky 🔵

Senior NLP-engineer
От 8.000 до 15.000$
Удаленно

Senior ML Engineer
От 6.000 до 10.000$
Удаленно

ML-engineer/ DS - Fake News Detection
От 8.000 до 15.000$
Удаленно

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5

2.86K views08:40

Data Secrets | Карьера

Amazon против использования ИИ, но только на собеседовании

➖ В Кремниевой долине многие компании обеспокоены тем, что все больше кандидатов используют приложения-суфлеры или Claude в процессе трудоустройства. Особенно остро проблема ощущается при найме инженеров или разработчиков ПО.

➖ Amazon считает, что использование инструментов ИИ во время собеседования крайне неэтично и несправедливо, так как это мешает оценить подлинные навыки кандидата.

➖ Компания даже порекомендовала рекрутерам вовсе отказаться от тех кандидатов, кто во время трудоустройства воспользовался технологиями GenAI.

➖ Также сообщается, что в компании уже придумали ряд мер по выявлению ИИ, а для тех, кому посчастливилось попасть обманным путем на работу, Amazon разработал "особые меры" 😐

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7

3.66K views15:08

Data Secrets | Карьера

Senior Analyst в Авито

Предстоит: Сравнительный анализ с конкурентами по ключевым метрикам; Разработка модели/платформы для поиска оптимального предложения (offer) для PRO селлера в различных каналах коммуникаций — Next Best Offer... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7

3.11K views08:57

Data Secrets | Карьера

Как проходят собеседования в OpenAI, Anthropic и Scale AI

Если вы когда-нибудь задумывались, как проходит процесс собеседования в таких компаниях, как OpenAI или Anthropic, вот история от специалиста, который делится своим опытом прохождения собеседований на должность научного сотрудника в области ИИ.

➡️

Anthropic:

В Anthropic было три раунда кодирования, ориентированных на ООП, за которыми последовали семь раундов, связанных с ML, LLM, а также вопросы о моем соответствии культуре компании. Мне понравился их процесс найма: вопросы были по делу, а рекрутеры уважительно относились ко мне и моему опыту.

➡️

OpenAI:

Что касается OpenAI, техническое собеседование включало проверку знаний математики и кодирования LLM, а не общие вопросы по алгоритмам и ООП (как, например, в случае с Anthropic). Мне предложили роль MLE в Сан-Франциско, но я отказался, так как это потребовало бы еще 5–6 собеседований на месте.

➡️

Scale:

В Scale процесс найма включал интервью и три собеседования на соответствие техническим навыкам. Мне понравилось, что интервьюеры были вовлечены в процесс и вели себя профессионально на протяжении всех собеседований.

Автор выделил, что ни одна из компаний-стартапов не использовала вопросы в стиле LeetCode. Более того, они разрешали использование справочных материалов во время кодинга (за исключением LLM — спрашивать у них было запрещено). Но не смотря на это, автор выделил ряд плюсов и минусов:

Плюсы:
⭐ Во всех трех компаниях были превосходные интервьюеры, причем интервью Anthropic были особенно профессиональны;
⭐ OpenAI проявила инициативу, предложив альтернативные позиции, которые могли бы подойти лучше;
⭐ Интервьюер Scale AI сделал все возможное, чтобы обеспечить продуктивную сессию во время программирования.

Из минусов:
⭐ Процесс интервью Anthropic был довольно обширным. Хотя сами интервью были хорошо проведены, их количество оказалось значительным;
⭐ В Scale коммуникация была не очень приятной — мне пришлось несколько раз связываться с рекрутером в течение 2–3 недель молчания после предпоследнего собеседования;
⭐ В OpenAI, несмотря на наличие офиса в Сиэтле, они строго требовали работы в Сан-Франциско. Они были прозрачны в этом с самого начала, что я оценил, но это меня огорчило.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15

3.64K views14:43

Data Secrets | Карьера

DeepSchool открыл набор на вакансии преподавателей онлайн-курсов

В этих курсах совместно с опытными менторами вы будете учить студентов решать различные DL-задачи «с изюминкой», где «fit, predict» уже недостаточно.

Например:
➖ Надо решить сегментацию, но на очень больших картинках — как лучше поделить изображение? Как собрать результаты вместе? Почему маски рваные и как этого избежать?
➖ Создание агента для бизнеса, но он отказывается использовать функции, зацикливается и не выдает результат — как снизить число ошибок? На чем учить? Как автоматически собирать данные?

Сейчас команда DeepSchool ищет опытных NLP-инженера и CV-инженера для проведения соответствующих лекций.

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤14

3.58K views15:59

Data Secrets | Карьера

Подборка открытых вакансий для Data Engineer 🔵

Middle, Senior Data Engineer в VK Team
Офис, Гибрид в Москве

Data Engineer в X5 Tech
Удаленно

Team Lead Big Data Engineer в Lamoda
Офис, Гибрид в Москве

Data engineer в Сбер
От 200.000₽
Офис, Гибрид в Москве

Data Engineer в Wildberries
Офис, Гибрид в Москве

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6

3.12K viewsedited 09:12

Data Secrets | Карьера

Работаем с данными как ML-гуру: Часть 2 – Обработка данных

Ранее мы уже говорили, что после выявления выбросов их не обязательно удалять. Но что делать дальше после обнаружения нежелательных данных? Вот несколько способов обработки:

🟦 Если речь идет о пробелах в датасете, воспользуйтесь импутацией: обычно используют среднее/максимальное значение или алгоритмы для заполнения пропусков, например, KNN. Если мы говорим о временных рядах, то пропуски можно заполнить с помощью скользящего среднего или интерполяции. Для изображений можно попробовать медианный или гауссовский фильтры, которые помогут избавиться от шума.

🟦 Для тех, кто немного ленится, подойдет использование устойчивых к шуму моделей, например, регрессионные модели с регуляризацией или деревья решений. Бустинг в целом тоже хорошо справляется с шумом. Однако будьте осторожны: убедитесь, что модель не переобучается. Лучше недообучить, чем переобучить. Кстати, проверить, переобучилась модель или нет, можно с помощью кросс-валидации.

🟦 Всегда необходимо учитывать контекст данных: в таких задачах, как анализ финансовых рынков или обнаружение редкого заболевания, шумные данные могут оказаться не шумом, а редкими, но информативными признаками. Тогда их следует учитывать при обучении, например, указать больший вес признаку с меньшим количеством наблюдений или решать задачу как поиск аномалий.

🟦 Дубликаты. Они могут быть идентичными или противоречивыми. Оба варианта неприятны, так как могут увеличивать время обучения модели и ухудшать обобщающую способность. Идентичные записи просто удаляются, оставляя одну запись. Однако не всегда это хорошо. Например, в задачах классификации миноритарный класс стараются увеличить дублированием (или генерацией). Если речь идет о противоречивых данных, то необходим анализ, поскольку в одном случае могла возникнуть ошибка ввода данных, а в другом — реальные случаи, противоречащие друг другу. В первом случае удаляем ошибочную строку, во втором — используем агрегирование.

🟦 Если вам попались временные ряды, то без сглаживания не обойтись. Для них используют скользящее или экспоненциальное среднее и преобразование Бокса-Кокса для стабилизации дисперсии. Однако данные для этого преобразования должны быть строго положительными. Если есть нули или отрицательные значения, используйте преобразование Йео-Джонсона.

Повторим еще раз: учитывать контекст задачи — очень важно, т.к. от этого зависит дальнейшая обработка данных, а в последствие и способность модели к обобщению.

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤19

3.46K views14:49

Data Secrets | Карьера

Senior Data Scientist NLP в ГазпромБанк

Предстоит: Проектировать, разрабатывать и внедрять LLM модели, участвовать в разработке pipeline до промышленной реализации; Создавать генеративные модели, чат-боты... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5

3.18K views09:07

Data Secrets | Карьера

Осторожно, если вы когда-то работали в Meta, то, возможно, вы попали в черный список Цукерберга

➖ Оказывается, Meta ведет список своих бывших сотрудников, которых компания больше не может нанимать повторно. Даже если вы были лучшим инженером, вам могут отказать при повторном найме.

➖ Инженер, потерявший должность после четырех лет работы в фирме, при повторной подаче заявления не добился успеха. Ему ответили, что "он не имеет права на повторный найм", несмотря на похвалу его работы в прошлом и явное желание менеджеров вернуть сотрудника в команду.

"Несмотря на очевидные причины, по которым можно отказать в найме, такие как плохая работа или кража конфиденциальных данных, в этот список несложно добавить человека, если он просто не понравился кому-то из команды", — сообщает источник.

Напоминаем: с 2020 года Meta стала рекордсменом по увольнениям — 35 600 увольнений. А теперь представьте лица этих людей, которым могут просто-напросто не дать второй шанс из-за личной неприязни

😅

Please open Telegram to view this post

VIEW IN TELEGRAM

❤16

3.57K views13:33

Data Secrets | Карьера

Преподаватель и наставник в Otus
От 4.000 до 6.000 за урок

Otus в поисках преподавателя и наставника на онлайн-курс «Data Warehouse Analyst» с соответствующим комерчиским опытом, необходимо будет проводить онлайн-занятия и проверять домашнюю работу... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8

3.17K views15:48

Data Secrets | Карьера

Весна — отличный повод завести новые знакомства. Иначе, почему именно в это время проходит так много крутых мероприятий? Недолго думая об этом, мы собрали небольшой список весенних конференций и митапов:

➡️

GTC 2025 — конференция, где расскажут о квантовых вычислениях, гуманоидных роботах будущего, а также проведут множество докладов по тематике LLM и агентного ИИ.
Даты проведения: 16–21 марта.

➡️

ML Party — митап для ML-инженеров, на котором будут обсуждаться новые технологии и тренды в различных областях: RecSys, LLM, Speech и других направлениях.
Дата проведения: 18 марта.

➡️

Конференция Data Fusion. Один из главных треков будет посвящён генеративному ИИ. Эксперты обсудят такие вопросы, как возможное исчерпание данных, мультиагентные системы, и ,конечно же, куда без RAG.
Даты проведения: 16–17 апреля.

➡️

IML — ещё одна конференция для ML-специалистов. Спикеры разберут несколько кейсов практического применения ML, затронут MLOps, RL, RecSys и многое другое. В качестве бонуса, участники пообещали рассказать о забавных фейлах при внедрении моделей.
Даты проведения: 16–17 мая.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤13

3.38K views14:17

Data Secrets | Карьера

Александр Ванг – основатель и генеральный директор платформы для аннотации данных Scale AI. Достичь таких высот ему помогли несколько простых советов:

⭐ Окружайте себя гениальными людьми и стремитесь стать одним из лучших в своей области.
⭐ Найдите дело, которым можно заниматься долгое время: постоянные скачки с места на место не приведут к успеху.
⭐ Работайте усердно. Трудолюбие – это привычка, которую лучше всего усваивать в молодом возрасте.
⭐ Тем, кто слишком увлекается математикой и пренебрегает физикой: не старайтесь быть чрезмерно умными. Изобретательность часто требует сложного исполнения. Менее оптимальные, но более простые решения оказываются лучшими в условиях ограниченного времени и ресурсов.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤23

3.02K views14:43

Data Secrets | Карьера

Подборка открытых вакансий 🔵

ML Engineer CV в VK Team
Офис / Гибрид

Руководитель направления мониторинга NLP-моделей в Alfa Банк
Офис / Гибрид / Удаленно

Data Scientist в Lamoda
Офис в Москве

ML-разработчик в Яндекс
Офис / Гибрид

Data Scientist RecSys в 2GIS
Удаленно

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6

2.96K viewsedited 09:09

Data Secrets | Карьера

Two pizzas, please

🍕

➡️ Компании всегда стремились поддерживать эффективность своих сотрудников, поэтому сам основатель Amazon — Джефф Безос придумал необычное правило "Two Pizza Teams".

➡️ Правило очень простое: в команде разработчиков может быть сколько угодно человек, но так, чтобы её можно было накормить всего двумя пиццами.

➡️ Несмотря на то, что с момента основания компании прошло несколько лет, Amazon всё ещё придерживается этого правила. Главное преимущество "двух пицц" в том, что небольшие команды могут реагировать и действовать гораздо быстрее.

Однако, чтобы команды были эффективными, требуется соблюсти ряд условий:

➖ У команды есть чёткая цель, и ответственность за достижение цели лежит полностью на команде.
➖ Каждый член команды обладает всеми необходимыми навыками для достижения цели.
➖ У команды есть необходимые ресурсы и полномочия для принятия решений, и она не зависит от третьих лиц для достижения своей цели.
➖ У команды есть доступ к отзывам клиентов.

Кстати, Amazon не одинок в своем желании поддерживать эффективность сотрудников, ранее мы уже писали о забавной инициативе от Google Toilet-Time training.

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤12

3.37K views14:08

Data Secrets | Карьера

Автор курса «Аналитик данных +» в Яндекс Практикум

Предстоит: Писать тексты для уроков онлайн-курса (планируется много практики и погружение в реальные кейсы); Разрабатывать доп материалы и задания для проверки знаний... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

3.38K views16:56

Data Secrets | Карьера

Data Scientist в Точку
До 570.000₽
Удаленно

Предстоит: Строить модели кредитного риск-менеджмента: PD, LGD, раскрытия банковских гарантий и другие; Выдвигать и проверять гипотезы на основе данных; Работать с существующими и находить новые источники данных.... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤12

3.51K views08:46

Data Secrets | Карьера

Starter pack любого собеса: задачи с LeetCode + теория по матстату

❤81

4.05K views10:40

Data Secrets | Карьера

Стали известны сроки подачи работ на NeurIPS

🚀

⭐ В этом году пройдет уже тридцать девятая ежегодная конференция NeurIPS 2025 — это междисциплинарная конференция, объединяющая исследователей в области ML, статистики, оптимизации, NLP, CV, а также других смежных областей.

⭐

Основные правила подачи статьи: все авторы должны быть зарегистрированы до 15 мая на OpenReview. После подачи тезисов добавление или удаление авторов статьи не разрешается. Все материалы должны быть представлены одним файлом PDF, при этом основной текст статьи ограничен 9 страницами (с учетом рисунков и таблиц).

⭐

Основные даты: старт приема заявок на участие начнется 3 апреля. До 11 мая необходимо подать ключевые тезисы. До 15 мая будет осуществляться прием полной статьи.

⭐Ознакомиться со всеми сроками и полными правилами приема статей можно здесь и здесь. Удачи всем участникам!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6

3.46K views14:13

Data Secrets | Карьера

ML Engineer
От 4.000$
Удаленно

Предстоит: Разработка AI-агентов для Web3-платформы EON: построение умных ботов и автоматизированных решений; Интеграция Vector Storage и разработка Light RAG-моделей для работы с большими объемами данных; Развертывание и оптимизация AI-пайплайнов с использованием Ray, Kafka, Redis .... Узнать подробнее

🔵

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8

3.19K views16:38

About

Blog

Apps

Platform