Data Secrets | Карьера
6.49K subscribers
1.05K photos
47 videos
1 file
1.16K links
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

Прислать вакансию/сотрудничество: @veron_28

https://telega.in/c/data_secrets_career
Download Telegram
Как написать научную статью так, чтобы её приняли к публикации. Заключительная часть 3.

Надеемся, вы еще не успели забыть, как в прошлые разы делились своей находкой — один из научных энтузиастов рассказывал о своих лайфхаках: как правильно оформлять научные работы и как ему удалось поднять оценки с 2 баллов до 4,5. Сегодня мы делимся последними советами:

1️⃣ Мы уже достаточно много рассказали об иллюстрациях, тем не менее, напоминаем, что они должны быть яркими и презентабельными. Но тут не все так просто, многие из нас могут увлечься и сделать картинки или схемы слишком громоздкими 😟

Если у вас, как и у автора, получаются слишком объемные схемы — сократите! На примере первой картинки в посте: декодеры и энкодеры были заменены на зеленые и красные цвета соответственно. Архитектура стала более читаемой, а об остальных особенностях, не учтенных на картинке, автор написал в основном тексте.

Совет. Некоторым исследователям почему-то нравится подолгу держать интригу и скрывать самую интересную информацию для читателя. Но многим такой подход не нравится. Поэтому не скрывайте информацию, которая кажется вам интересной в вашей работе. Читателям нравится узнавать всё как можно раньше и чаще.

2️⃣ Примеры — хорошо. Много примеров — плохо. Исследователи часто пренебрегают примерами того, что они улучшили, но есть и обратная сторона медали — это их обилие. Чтобы легче было понять, сколько примеров привести, подойдет правило 2/3. То есть одна треть листа — это примеры, а остальная часть — основной текст. См вторую пикчу в посте.

3️⃣ Избегаем того, что может не понравиться рецензистам. Самые внимательные вспомнят, что уже говорили об этом в первой части. Но это действительно важный нюанс. Из обычных причин, почему вашу работу могут не принять: отсутствие исходных данных, отсутствие абляции и отсутствие человеческой оценки. При этом также не стоит перебарщивать с большим количеством абляций. См третью и четвертые пикчи.

Совет. Вы могли заметить, что на четвертой картинке некоторые результаты выделены полужирным шрифтом, так вот — не забывайте проводить тесты на статистическую значимость. Выделение высоких результатов без соответствующих тестов — дурной тон.

4️⃣ Заключение. Чтобы написать часть с выводом, вспомните советы из аннотации и введения, а также воспользуйтесь тремя вопросами:
Что мы сделали?
Почему это здорово?
Почему это важно?

Совет. Исследовательские работы — это акты коммуникации. И вся наука — это тоже коммуникация между учеными. То, как вы "общаетесь" в своей работе с читателем, определяет ценность вашего исследования. Если вы неинтересно расскажете о своей работе, значит, с высокой вероятностью рецензенты подумают также, но если читатель смог взять для себя хотя бы одну новую идею, то это уже огромное дело!

Надеемся, что с этими советами ваши статьи будут публиковаться чаще ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
14
AIRI и Авито поддержит молодых ученых в области ИИ и предложит разработать решения для классифайда

Научный институт AIRI специализируется на фундаментальных и прикладных исследованиях в области искусственного интеллекта. Ежегодно институт поддерживает молодых ученых и студентов, организует лекции с экспертами и интенсивные курсы в рамках Летней школы по искусственному интеллекту.

В этом году Летняя школа проходит на базе Томского государственного университета при поддержке Авито. Участники будут решать различные задания, в том числе реальный бизнес-кейс Авито, а лучшие решения могут быть внедрены на практике.

Помимо работы над бизнес-задачами, студенты получат карьерные консультации от HR-специалистов Авито и научатся презентовать свои навыки в соответствии с требованиями рынка. Ранее Авито анонсировал, что в планах компании до 2028 года инвестировать до 12 млрд рублей в GenAI и подготовить 3000 специалистов этой области.
9
Senior MLOps в Самолет
Удаленно

Предстоит: Участие в построении MLOps-процессов на всех этапах: проектирование, разработка и эксплуатация; Развитие пайплайнов поставки моделей в промышленную эксплуатацию... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
7
Мира Мурати в погоне за талантами: сколько получают сотрудники секретного стартапа?

🔷 В Thinking Machines Lab — секретном стартапе бывшей сооучредительницы OpenAI Миры Мурати тех.специалисты получают от 450.000 до 500.000$ в год.

🔷 При этом это только базовая зарплата, без учета всех бонусов, акций и премий. По примерным подсчетам, средняя зарплата в стартапе у Мурати выше, чем у ее бывших коллег.

🔷 OpenAI платит в среднем 292.115$ своим 29 техническим сотрудникам, при этом самая высокооплачиваемая должность приносит 530.000$, а самая низкооплачиваемая — 200.000$.

🔷 Anthropic платит в среднем 387.500$ 14 техническим сотрудникам, при этом самая высокая зарплата составляет 690.000$, самая низкая — 300.000$.

🔷 Также известно, что в начале этого года компания TML устроила массовый набор сотрудников, наняв Боба МакГрю (бывшего главного научного сотрудника OpenAI), Джона Шульмана (одного из руководителей ChatGPT), Баррета Зофа (одного из создателей ChatGPT) и Александра Кириллова, который тесно сотрудничал с Мурати над голосовым режимом ChatGPT.

Как бы Цукерберг не нацелился на таланты Мурати 😰
Please open Telegram to view this post
VIEW IN TELEGRAM
16
Подборка открытых вакансий 🔵

Data Engineer в НМГ
Удаленно / Офис / Гибрид

Data Analyst в Сбер
От 95.000₽
Офис в Омске

Middle Data Analyst в Автомакон
До 250.000₽
Удаленно

Senior Data Analyst в Атом
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге, Набережных Челнах

Senior Data Engineer в ПСБ
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Куда бы сходить в июле? 🚀

Собрали небольшую подборку июльских мероприятий:

Java meetup. Ребята из VK AI расскажут как они масштабировали item2item и как обновляют тысячи эмбеддингов, при этом сократив потребление сети. Очень полезный митап для любителей рексис.
Когда? 9 июля 18:30.
Где? Онлайн и офлайн в Москве.


Алхимия ИИ. На вебинаре вам расскажут, что же такое нейронные сети, где их используют в промышленности и самое интересное — объяснят, где ИИ помогает в роботехнике, зачем же работу зрение.
Когда? 10 июля 19:00.

Turbo ML Conf. Программа конференции очень разнообразна, обсудят и как применять LLM для генерации музыки, и как улучшать рекомендации. А спикерами выступят не только специалисты из различных компаний, но и преподаватели ВУЗ-ов.
Когда? 19 июля.
Где? Онлайн и офлайн в Москве.


Cloud.ru Tech Lab: AI&ML. На митапе эксперты из Cloud.ru расскажут, как они автоматизировали пользовательские сценарии с помощью ИИ-агентов, а также приоткроют завесу тайн и ответят на вопрос, почему же MCP на такой хайпе и как собрать своей MCP-сервер без кода. При этом будет еще один секретный доклад.
Когда? 24 июля в 18:00.
Где? Онлайн и офлайн в Москве.
Please open Telegram to view this post
VIEW IN TELEGRAM
8
AI Engineer
Удаленно (обязательно вне РФ и РБ)

Предстоит: Проектирование и разработка PoC; участие в подготовке презентаций и технической части коммерческих предложений преимущественно для зарубежных клиентов (различные отрасли, включая HealthTech, EdTech, маркетплейсы и многое другое)... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Junior+ Data Analyst в Wildberries
Офис / Гибрид в Москве

Предстоит: Поиск аномалий в данных; Генерация и проверка гипотез; Написание скриптов поиска фродовых действий... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Assaia is looking for employees 💼

Assaia’s solutions help airports and airlines improve on-time performance, efficiency, safety, and sustainability metrics, helping them get their passengers to their destinations on time.

Assaia has the following vacancies:

➡️ Data Scientist
From 4.500€

Remote (you should be based outside Russia and Belarus)


➡️ CV Engineer
3.500 - 4.500€

Remote (you should be based outside Russia and Belarus)


Additionally, they offer:
- Always remote work and flexible schedule.
- 5 weeks of paid vacation, paid sick leave, paid relevant courses and conferences/online education/English courses.
- Regular performance reviews to make sure you enjoy your tasks, challenges, growth and salary.
- Flat hierarchy and close to zero bureaucracy, a diverse international team of smart people.
- Live team events in Europe.
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Cross Entropy

Это одна из фундаментальных тем глубокого обучения, поэтому часто на технических собеседованиях можно встретить вопрос, связанный с кросс-энтропией.

Чтобы досконально изучить эту тему, предлагаем прочесть эту статью. Нам она понравилась тем, что автор приводит много примеров и пояснений, а еще в разборе есть вопросы на подумать с подробным объяснением каждого ответа.
13
Data Scientist
Удаленно

Предстоит: Разработка и дообучение LLM; Создание и оптимизация RAG-систем; Разработка, обучение и внедрение моделей машинного обучения в связке с LLM... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Подборка открытых вакансий 🔵

Senior ML Engineer в ЦИАН
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге и Новосибирске

Senior Data Scientist в Альфа Банк
Офис / Гибрид в Москве

Middle/Senior Data Analyst в Яндекс
Офис / Гибрид в Москве, Санкт-Петербурге

Стажёр Data Science в Ozon
Офис / Гибрид в Москве

Senior Data Analyst в Авиасейлс
Удаленно


Middle Data Scientist в ecom.tech
Удаленно / Офис / Гибрид
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Data Secrets | Карьера
Мира Мурати в погоне за талантами: сколько получают сотрудники секретного стартапа? 🔷 В Thinking Machines Lab — секретном стартапе бывшей сооучредительницы OpenAI Миры Мурати тех.специалисты получают от 450.000 до 500.000$ в год. 🔷 При этом это только базовая…
Недавно говорили про зарплаты исследователей в стартапах, а сколько получают инженеры бигтеха?

Цукерберг платит AI-инженерам ни много ни мало целых 480.000$. А вот специалисты по машинному обучен получают уже до 440.000$.

Цифры получены из документов, которые компании должны представлять в Министерство труда при найме иностранных работников в рамках визовой программы. То есть мы можем подглядеть фактическую зарплатную вилку (смотрим пикчи).

Хотя, если вы топовый специалист, то возможно, ваша зарплата в Meta будет оцениваться уже в миллион $.
11
📣 Очередной совет от Андрея Карпаты новичкам в ML:

«Новички часто сосредоточены на том, что делать. Я думаю, что фокус должен быть смещен на то, сколько вы это делаете. Вам следует найти то, что вам интересно и буквально вложить в это 10.000 часов времени».
Please open Telegram to view this post
VIEW IN TELEGRAM
45
This media is not supported in your browser
VIEW IN TELEGRAM
Что думают все друзья, когда я говорю, что работаю с ИИ 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
38
Менеджер по анализу больших данных в Теле2
Офис / Гибрид в Москве

Предстоит: Выдвигать и проверять гипотезы, внедрять улучшения, оценивать их эффективность; Подготавливать отчеты на базе текущих источников; Систематизировать и анализировать полученную информацию... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Что нужно знать, чтоб устроиться Дата-Аналитиком?

Data Analyst — специалист, который в основном занимается подготовкой данных и их визуализацией, еще иногда можно встретить обязанности по проверке гипотез.

Минимальными навыками для аналитиков данных — знание python (numpy, pandas, matplotlib), SQL, PowerBI/Tableau/QlikView, статистика, реже в вакансиях встречается Excel и R.

Интервью на Data Analyst ничем не отличается от других должностей — созвон с рекрутером, чтобы узнать кто вы/что вы, техническое интервью, где вы решаете поставленную проблему и рассказываете про прошлые кейсы, и финальное интервью, где упор сделан на софт скилы.

Вот пример реального интервью Data Analyst в LetsGetChecked:
В описании вакансии внимание уделялось проверке данных и обеспечению их качества в сфере здравоохранения. В качестве требований к кандидату было:
Проверка и интерпретация данных, выдвижение гипотез;
Написание запросов T-SQL и опыт работы с BigData;
Стек: AWS, PowerBI/Tableau, Github/Bitbucket, Python/Powershell, Redshift DW, Jira, GitLab и Confluence;
Мониторинг и аудит качества данных.

🔷 Раунд 1: телефонное интервью.
Примерно через неделю был телефонный созвон. Во время этого звонка рекрутер в первую очередь сосредоточился на опыте и оценил знакомство с компанией.
Примерные вопросы:
Расскажите о себе?
Что вы знаете о LetsGetChecked?
Почему вас интересует должность аналитика данных, а не инженера данных?


🔷 Раунд 2: Первое техническое собеседование.
Оцениваемые компетенции: сотрудничество, технические знания и умение решать проблемы.
В этом раунде интервьюеры в первую очередь сосредоточились на ситуационных вопросах, связанных с командной работой, тестированием ПО и подходами к проверке данных. Они хотели понять, как я сотрудничал с другими и преодолевал трудности в прошлых проектах в отношении данных.

Примеры вопросов:
- Какие шаги или структуру вы используете для проверки данных и обеспечения их соответствия бизнес-требованиям?
- Как вы отлаживаете неожиданные значения NULL, которые появляются только в месте назначения, но не в источнике?
- Модели Agile и Waterfall: какую из них вы бы выбрали, учитывая сценарий?
- Как вы справляетесь с проблемами, когда ваша команда испытывает трудности?

🔷Раунд 3: Оценка.
Для этого раунда я получил документ, содержащий 10 реальных задач Transact-SQL вместе с БД MS SQL Server. Задача включала понимание всех таблиц БД, анализ модели данных и написание расширенных SQL-запросов для решения этих задач.
При изучении набора данных важно развить некоторые знания предметной области, чтобы точно интерпретировать результаты.

Примечание: будьте терпеливы; требуется обширное исследование таблиц. Вы также должны определить как прямые, так и косвенные связи между таблицами.
Были 3 простых вопроса, 5 вопросов среднего уровня и 2 сложных вопроса.

Примеры заданий:
Рассчитать продажи с начала года (SalesYTD) с указанной даты до даты окончания отчетного года.
Найдите 10 лучших сотрудников, у которых есть степень бакалавра и которые достигли самых высоких продаж.

Финальный раунд 4: Тех. собеседование.
Оцениваемые компетенции: тех.экспертиза, решение проблем и софт скилы.
Первые 30 минут раунда были сосредоточены на объяснении моего кода SQL. В это время интервьюеры задавали подробные вопросы о них. В следующие 30 минут они задавали углубленные вопросы, охватывающие как технические, так и поведенческие аспекты.
Примеры:
Объясняя мои запросы, они спрашивали, как я могу их оптимизировать?
Выберите дату, max(date2) из ​​таблицы1;
Каков вывод запроса?
Union или Union All?

Весь процесс собеседования занял около 3 недель.


Основные выводы по процессу найма:

При планировании собеседований уделяйте как можно больше времени подготовке.
Убедитесь, что ваши объяснения понятный и не отходят от темы.
Сосредоточьтесь на читабельности и оптимизации при построении запросов.
Задавайте соответствующие вопросы в конце каждого собеседования, чтобы показать свою заинтересованность в должности.
После всех собеседований запланируйте отдельную встречу для обратной связи, которая поможет вам в будущем.
Please open Telegram to view this post
VIEW IN TELEGRAM
12