Data Scientist в Ингосстрах
Удаленно
Предстоит: Осуществлять полный цикл разработки моделей; Строить модели NLP; Участвовать в интеграции моделей в прод и разработке и стандартизации ML-пайплайнов... Узнать подробнее🔵
Удаленно
Предстоит: Осуществлять полный цикл разработки моделей; Строить модели NLP; Участвовать в интеграции моделей в прод и разработке и стандартизации ML-пайплайнов... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
GTC 2025 - конференция по искусственному интеллекту от NVIDIA
С 16 по 21 марта этого года пройдет конференция, посвященная ИИ, на которой генеральный директор NVIDIA Дженсен Хуанг выступит с основным докладом на тему "What’s Next in AI Starts Here".
Но основной доклад — не единственная изюминка. Программа конференции обещает быть насыщенной: на ней выступят такие спикеры, как Ян Лекун из Нью-Йоркского университета, генеральный директор Mistral AI Артур Менш, а также многие другие представители бигтеха.
С 16 по 21 марта этого года пройдет конференция, посвященная ИИ, на которой генеральный директор NVIDIA Дженсен Хуанг выступит с основным докладом на тему "What’s Next in AI Starts Here".
Но основной доклад — не единственная изюминка. Программа конференции обещает быть насыщенной: на ней выступят такие спикеры, как Ян Лекун из Нью-Йоркского университета, генеральный директор Mistral AI Артур Менш, а также многие другие представители бигтеха.
❤10
Senior Quantitative Developer
Офис / Гибрид / Удаленно
Предстоит: Тесное сотрудничество с технологами и исследователями над оптимизаторами портфеля, созданием сложных конвейеров данных и инфраструктур для анализа стратегии и производительности... Узнать подробнее🔵
Офис / Гибрид / Удаленно
Предстоит: Тесное сотрудничество с технологами и исследователями над оптимизаторами портфеля, созданием сложных конвейеров данных и инфраструктур для анализа стратегии и производительности... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Google рекомендует своим сотрудникам работать не менее 60 часов в неделю
🔷 По инсайдерской информации, Сергей Брин во внутренней записке рекомендовал находиться в офисе каждый будний день и отметил, что 60 часов в неделю — это «sweet spot» для производительности.
🔷 Также руководитель добавил, что конкуренция за развитие ИИ усилилась, но Google способен выиграть гонку за AGI, если компания сможет «зарядить» свои усилия введя ряд изменения. И одной из таких мер как раз-таки является 60 часовой рабочей недели.
🔷 Такая трудовая неделя рекомендуется сотрудникам, работающим над Gemini. Но не смотря на такие требования, руководитель предостерегает сотрудников от переработок свыше 60 часов, так как это может привести к выгоранию, а тех, кто работает меньше установленных 60 часов руководитель назвал не продуктивными, и даже «опасными», тк такие сотрудники влияют на продуктивность остальных коллег.
Напомним, что в прошлом году большой резонанс вызвал стартап, в котором руководитель требовал работать не менее 80 часов.
Напомним, что в прошлом году большой резонанс вызвал стартап, в котором руководитель требовал работать не менее 80 часов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤21
Портфельный аналитик (Антифрод) в Сбер
Офис в Москве
Предстоит: Применять современные ML-модели для оптимального использования в стратегии одобрения; Анализировать текущий портфель на определение мошеннических схем... Узнать подробнее🔵
Офис в Москве
Предстоит: Применять современные ML-модели для оптимального использования в стратегии одобрения; Анализировать текущий портфель на определение мошеннических схем... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Открытые вакансии в HighSky 🔵
Senior NLP-engineer
От 8.000 до 15.000$
Удаленно
Senior ML Engineer
От 6.000 до 10.000$
Удаленно
ML-engineer/ DS - Fake News Detection
От 8.000 до 15.000$
Удаленно
Senior NLP-engineer
От 8.000 до 15.000$
Удаленно
Senior ML Engineer
От 6.000 до 10.000$
Удаленно
ML-engineer/ DS - Fake News Detection
От 8.000 до 15.000$
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Amazon против использования ИИ, но только на собеседовании
➖ В Кремниевой долине многие компании обеспокоены тем, что все больше кандидатов используют приложения-суфлеры или Claude в процессе трудоустройства. Особенно остро проблема ощущается при найме инженеров или разработчиков ПО.
➖ Amazon считает, что использование инструментов ИИ во время собеседования крайне неэтично и несправедливо, так как это мешает оценить подлинные навыки кандидата.
➖ Компания даже порекомендовала рекрутерам вовсе отказаться от тех кандидатов, кто во время трудоустройства воспользовался технологиями GenAI.
➖ Также сообщается, что в компании уже придумали ряд мер по выявлению ИИ, а для тех, кому посчастливилось попасть обманным путем на работу, Amazon разработал "особые меры" 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Senior Analyst в Авито
Предстоит: Сравнительный анализ с конкурентами по ключевым метрикам; Разработка модели/платформы для поиска оптимального предложения (offer) для PRO селлера в различных каналах коммуникаций — Next Best Offer... Узнать подробнее🔵
Предстоит: Сравнительный анализ с конкурентами по ключевым метрикам; Разработка модели/платформы для поиска оптимального предложения (offer) для PRO селлера в различных каналах коммуникаций — Next Best Offer... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
Как проходят собеседования в OpenAI, Anthropic и Scale AI
Если вы когда-нибудь задумывались, как проходит процесс собеседования в таких компаниях, как OpenAI или Anthropic, вот история от специалиста, который делится своим опытом прохождения собеседований на должность научного сотрудника в области ИИ.
➡️ Anthropic:
➡️ OpenAI:
➡️ Scale:
Автор выделил, что ни одна из компаний-стартапов не использовала вопросы в стиле LeetCode. Более того, они разрешали использование справочных материалов во время кодинга (за исключением LLM — спрашивать у них было запрещено). Но не смотря на это, автор выделил ряд плюсов и минусов:
Если вы когда-нибудь задумывались, как проходит процесс собеседования в таких компаниях, как OpenAI или Anthropic, вот история от специалиста, который делится своим опытом прохождения собеседований на должность научного сотрудника в области ИИ.
В Anthropic было три раунда кодирования, ориентированных на ООП, за которыми последовали семь раундов, связанных с ML, LLM, а также вопросы о моем соответствии культуре компании. Мне понравился их процесс найма: вопросы были по делу, а рекрутеры уважительно относились ко мне и моему опыту.
Что касается OpenAI, техническое собеседование включало проверку знаний математики и кодирования LLM, а не общие вопросы по алгоритмам и ООП (как, например, в случае с Anthropic). Мне предложили роль MLE в Сан-Франциско, но я отказался, так как это потребовало бы еще 5–6 собеседований на месте.
В Scale процесс найма включал интервью и три собеседования на соответствие техническим навыкам. Мне понравилось, что интервьюеры были вовлечены в процесс и вели себя профессионально на протяжении всех собеседований.
Автор выделил, что ни одна из компаний-стартапов не использовала вопросы в стиле LeetCode. Более того, они разрешали использование справочных материалов во время кодинга (за исключением LLM — спрашивать у них было запрещено). Но не смотря на это, автор выделил ряд плюсов и минусов:
Плюсы:⭐ Во всех трех компаниях были превосходные интервьюеры, причем интервью Anthropic были особенно профессиональны;⭐ OpenAI проявила инициативу, предложив альтернативные позиции, которые могли бы подойти лучше;⭐ Интервьюер Scale AI сделал все возможное, чтобы обеспечить продуктивную сессию во время программирования.
Из минусов:⭐ Процесс интервью Anthropic был довольно обширным. Хотя сами интервью были хорошо проведены, их количество оказалось значительным;⭐ В Scale коммуникация была не очень приятной — мне пришлось несколько раз связываться с рекрутером в течение 2–3 недель молчания после предпоследнего собеседования;⭐ В OpenAI, несмотря на наличие офиса в Сиэтле, они строго требовали работы в Сан-Франциско. Они были прозрачны в этом с самого начала, что я оценил, но это меня огорчило.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15
DeepSchool открыл набор на вакансии преподавателей онлайн-курсов
В этих курсах совместно с опытными менторами вы будете учить студентов решать различные DL-задачи «с изюминкой», где «fit, predict» уже недостаточно.
Например:
➖ Надо решить сегментацию, но на очень больших картинках — как лучше поделить изображение? Как собрать результаты вместе? Почему маски рваные и как этого избежать?
➖ Создание агента для бизнеса, но он отказывается использовать функции, зацикливается и не выдает результат — как снизить число ошибок? На чем учить? Как автоматически собирать данные?
Сейчас команда DeepSchool ищет опытных NLP-инженера и CV-инженера для проведения соответствующих лекций.
В этих курсах совместно с опытными менторами вы будете учить студентов решать различные DL-задачи «с изюминкой», где «fit, predict» уже недостаточно.
Например:
Сейчас команда DeepSchool ищет опытных NLP-инженера и CV-инженера для проведения соответствующих лекций.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤14
Подборка открытых вакансий для Data Engineer 🔵
Middle, Senior Data Engineer в VK Team
Офис, Гибрид в Москве
Data Engineer в X5 Tech
Удаленно
Team Lead Big Data Engineer в Lamoda
Офис, Гибрид в Москве
Data engineer в Сбер
От 200.000₽
Офис, Гибрид в Москве
Data Engineer в Wildberries
Офис, Гибрид в Москве
Middle, Senior Data Engineer в VK Team
Офис, Гибрид в Москве
Data Engineer в X5 Tech
Удаленно
Team Lead Big Data Engineer в Lamoda
Офис, Гибрид в Москве
Data engineer в Сбер
От 200.000₽
Офис, Гибрид в Москве
Data Engineer в Wildberries
Офис, Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Работаем с данными как ML-гуру: Часть 2 – Обработка данных
Ранее мы уже говорили, что после выявления выбросов их не обязательно удалять. Но что делать дальше после обнаружения нежелательных данных? Вот несколько способов обработки:
🟦 Если речь идет о пробелах в датасете, воспользуйтесь импутацией: обычно используют среднее/максимальное значение или алгоритмы для заполнения пропусков, например, KNN. Если мы говорим о временных рядах, то пропуски можно заполнить с помощью скользящего среднего или интерполяции. Для изображений можно попробовать медианный или гауссовский фильтры, которые помогут избавиться от шума.
🟦 Для тех, кто немного ленится, подойдет использование устойчивых к шуму моделей, например, регрессионные модели с регуляризацией или деревья решений. Бустинг в целом тоже хорошо справляется с шумом. Однако будьте осторожны: убедитесь, что модель не переобучается. Лучше недообучить, чем переобучить. Кстати, проверить, переобучилась модель или нет, можно с помощью кросс-валидации.
🟦 Всегда необходимо учитывать контекст данных: в таких задачах, как анализ финансовых рынков или обнаружение редкого заболевания, шумные данные могут оказаться не шумом, а редкими, но информативными признаками. Тогда их следует учитывать при обучении, например, указать больший вес признаку с меньшим количеством наблюдений или решать задачу как поиск аномалий.
🟦 Дубликаты. Они могут быть идентичными или противоречивыми. Оба варианта неприятны, так как могут увеличивать время обучения модели и ухудшать обобщающую способность. Идентичные записи просто удаляются, оставляя одну запись. Однако не всегда это хорошо. Например, в задачах классификации миноритарный класс стараются увеличить дублированием (или генерацией). Если речь идет о противоречивых данных, то необходим анализ, поскольку в одном случае могла возникнуть ошибка ввода данных, а в другом — реальные случаи, противоречащие друг другу. В первом случае удаляем ошибочную строку, во втором — используем агрегирование.
🟦 Если вам попались временные ряды, то без сглаживания не обойтись. Для них используют скользящее или экспоненциальное среднее и преобразование Бокса-Кокса для стабилизации дисперсии. Однако данные для этого преобразования должны быть строго положительными. Если есть нули или отрицательные значения, используйте преобразование Йео-Джонсона.
Повторим еще раз: учитывать контекст задачи — очень важно, т.к. от этого зависит дальнейшая обработка данных, а в последствие и способность модели к обобщению.
Ранее мы уже говорили, что после выявления выбросов их не обязательно удалять. Но что делать дальше после обнаружения нежелательных данных? Вот несколько способов обработки:
Повторим еще раз: учитывать контекст задачи — очень важно, т.к. от этого зависит дальнейшая обработка данных, а в последствие и способность модели к обобщению.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤19
Senior Data Scientist NLP в ГазпромБанк
Предстоит: Проектировать, разрабатывать и внедрять LLM модели, участвовать в разработке pipeline до промышленной реализации; Создавать генеративные модели, чат-боты... Узнать подробнее🔵
Предстоит: Проектировать, разрабатывать и внедрять LLM модели, участвовать в разработке pipeline до промышленной реализации; Создавать генеративные модели, чат-боты... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Осторожно, если вы когда-то работали в Meta, то, возможно, вы попали в черный список Цукерберга
➖ Оказывается, Meta ведет список своих бывших сотрудников, которых компания больше не может нанимать повторно. Даже если вы были лучшим инженером, вам могут отказать при повторном найме.
➖ Инженер, потерявший должность после четырех лет работы в фирме, при повторной подаче заявления не добился успеха. Ему ответили, что "он не имеет права на повторный найм", несмотря на похвалу его работы в прошлом и явное желание менеджеров вернуть сотрудника в команду.
Напоминаем: с 2020 года Meta стала рекордсменом по увольнениям — 35 600 увольнений. А теперь представьте лица этих людей, которым могут просто-напросто не дать второй шанс из-за личной неприязни😅
"Несмотря на очевидные причины, по которым можно отказать в найме, такие как плохая работа или кража конфиденциальных данных, в этот список несложно добавить человека, если он просто не понравился кому-то из команды", — сообщает источник.
Напоминаем: с 2020 года Meta стала рекордсменом по увольнениям — 35 600 увольнений. А теперь представьте лица этих людей, которым могут просто-напросто не дать второй шанс из-за личной неприязни
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16
Преподаватель и наставник в Otus
От 4.000 до 6.000 за урок
Otus в поисках преподавателя и наставника на онлайн-курс «Data Warehouse Analyst» с соответствующим комерчиским опытом, необходимо будет проводить онлайн-занятия и проверять домашнюю работу... Узнать подробнее🔵
От 4.000 до 6.000 за урок
Otus в поисках преподавателя и наставника на онлайн-курс «Data Warehouse Analyst» с соответствующим комерчиским опытом, необходимо будет проводить онлайн-занятия и проверять домашнюю работу... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8
Весна — отличный повод завести новые знакомства. Иначе, почему именно в это время проходит так много крутых мероприятий? Недолго думая об этом, мы собрали небольшой список весенних конференций и митапов:
➡️ GTC 2025 — конференция, где расскажут о квантовых вычислениях, гуманоидных роботах будущего, а также проведут множество докладов по тематике LLM и агентного ИИ.
Даты проведения: 16–21 марта.
➡️ ML Party — митап для ML-инженеров, на котором будут обсуждаться новые технологии и тренды в различных областях: RecSys, LLM, Speech и других направлениях.
Дата проведения: 18 марта.
➡️ Конференция Data Fusion. Один из главных треков будет посвящён генеративному ИИ. Эксперты обсудят такие вопросы, как возможное исчерпание данных, мультиагентные системы, и ,конечно же, куда без RAG.
Даты проведения: 16–17 апреля.
➡️ IML — ещё одна конференция для ML-специалистов. Спикеры разберут несколько кейсов практического применения ML, затронут MLOps, RL, RecSys и многое другое. В качестве бонуса, участники пообещали рассказать о забавных фейлах при внедрении моделей.
Даты проведения: 16–17 мая.
Даты проведения: 16–21 марта.
Дата проведения: 18 марта.
Даты проведения: 16–17 апреля.
Даты проведения: 16–17 мая.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13
Александр Ванг – основатель и генеральный директор платформы для аннотации данных Scale AI. Достичь таких высот ему помогли несколько простых советов:
⭐ Окружайте себя гениальными людьми и стремитесь стать одним из лучших в своей области.
⭐ Найдите дело, которым можно заниматься долгое время: постоянные скачки с места на место не приведут к успеху.
⭐ Работайте усердно. Трудолюбие – это привычка, которую лучше всего усваивать в молодом возрасте.
⭐ Тем, кто слишком увлекается математикой и пренебрегает физикой: не старайтесь быть чрезмерно умными. Изобретательность часто требует сложного исполнения. Менее оптимальные, но более простые решения оказываются лучшими в условиях ограниченного времени и ресурсов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23
Подборка открытых вакансий 🔵
ML Engineer CV в VK Team
Офис / Гибрид
Руководитель направления мониторинга NLP-моделей в Alfa Банк
Офис / Гибрид / Удаленно
Data Scientist в Lamoda
Офис в Москве
ML-разработчик в Яндекс
Офис / Гибрид
Data Scientist RecSys в 2GIS
Удаленно
ML Engineer CV в VK Team
Офис / Гибрид
Руководитель направления мониторинга NLP-моделей в Alfa Банк
Офис / Гибрид / Удаленно
Data Scientist в Lamoda
Офис в Москве
ML-разработчик в Яндекс
Офис / Гибрид
Data Scientist RecSys в 2GIS
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Two pizzas, please 🍕
➡️ Компании всегда стремились поддерживать эффективность своих сотрудников, поэтому сам основатель Amazon — Джефф Безос придумал необычное правило "Two Pizza Teams".
➡️ Правило очень простое: в команде разработчиков может быть сколько угодно человек, но так, чтобы её можно было накормить всего двумя пиццами.
➡️ Несмотря на то, что с момента основания компании прошло несколько лет, Amazon всё ещё придерживается этого правила. Главное преимущество "двух пицц" в том, что небольшие команды могут реагировать и действовать гораздо быстрее.
Однако, чтобы команды были эффективными, требуется соблюсти ряд условий:
Кстати, Amazon не одинок в своем желании поддерживать эффективность сотрудников, ранее мы уже писали о забавной инициативе от Google Toilet-Time training.
Однако, чтобы команды были эффективными, требуется соблюсти ряд условий:
➖ У команды есть чёткая цель, и ответственность за достижение цели лежит полностью на команде.➖ Каждый член команды обладает всеми необходимыми навыками для достижения цели.➖ У команды есть необходимые ресурсы и полномочия для принятия решений, и она не зависит от третьих лиц для достижения своей цели.➖ У команды есть доступ к отзывам клиентов.
Кстати, Amazon не одинок в своем желании поддерживать эффективность сотрудников, ранее мы уже писали о забавной инициативе от Google Toilet-Time training.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤12