DeepSchool
9.7K subscribers
74 photos
1 video
1 file
414 links
Это канал школы deepschool.ru. Здесь мы будем:
- напоминать вам теорию ML/DL в виде коротких постов,
- задавать вопросы с собеседований,
- рассказывать про полезные фреймворки
- и делиться советами, которые помогут вам в работе.

@deepschool_support
Download Telegram
🎙Онлайн-подкаст с Андреем Шадриковым

В четверг, 9 марта, в 18:00 МСК

Коротко об Андрее:
- руководит исследованиями в компании verigram.ai;
- большую часть карьеры посвятил задачам биометрии;
- команда Андрея занимает 8 место на датасете wild в главном бенчмарке по верификации лиц от NIST;
- преподает блок по распознаванию лиц на нашем курсе;
- помогает с организацией митапов и выступает на них (примеры выступлений Андрея: BeeTech, Sberloga, Samsung AI Campus)

На подкасте мы поговорим про:
- верификацию лиц — какие основные сложности встречаются в этой задаче и как их решать (в рамках NDA, конечно же);
- рынок DS в Казахстане — чем он отличается от российского и достаточно ли там задач/кадров;
- как лидить команду — опыт Андрея и советы молодым тимлидам;
- нетворкинг — зачем инженеру расширять круг знакомств.

В конце встречи вы сможете задать Андрею свои вопросы из онлайн-зала. Или оставляйте вопросы в гугл-форме – некоторые из них мы зададим во время подкаста.

Встречаемся здесь в четверг, 9 марта, в 18:00 МСК 🔔
🔥173👍1
Дорогие девушки, с праздником!🌸

Не знаем какое соотношение в индустрии, но в нашем канале девушки составляют всего лишь 10%.

Пусть вас никогда не смущает такой дисбаланс, чувствуйте себя свободно в любых коллективах, реализовывайте любые желания и достигайте самых дерзких целей!
66🍾17❤‍🔥4🤔2
Live stream scheduled for
💬Сообщение для чата

Комментарии к этому посту можно использовать вместо чата для стрима.

Вот-вот начнем :)
6🔥2
Live stream started
Live stream finished (1 hour)
CleanLab

Чистые данные — залог хороших метрик :) Но чистить разметку зачастую сложно, долго и скучно. В новой статье расскажем о библиотеке CleanLab, которая поможет вам в чистке аннотаций для задачи классификации. Мы покажем, как быстро прикрутить ее к своим проектам и поделимся личным опытом использования библиотеки на боевых задачах.

Из новой статьи вы узнаете:
- как найти сэмплы со спорными метками;
- как оценить качество меток вашего датасета;
- как найти пересекающиеся классы, и что можно с ними сделать.

Читайте наш новый гайд и делайте ваши данные чище: https://deepschool-pro.notion.site/CleanLab-586bc69c23bb429fb2476982fe74a420
👍31🔥123
​​Марк Страхов

Продолжаем знакомить вас с нашими авторами. В прошлый раз мы рассказали о Ксюше, а теперь знакомим с историей Марка:

"Я учился в одной группе с Ксюшей в Кубанском Государственном Университете. Будучи студентом, думал, что мое будущее - продавать апельсинки на рынке в Анапе, однако судьба сложилось иначе. На последнем курсе бакалавриата у нас была дисциплина «Введение в искусственный интеллект», где можно было получить самоэкзамен, если сделать какую-нибудь нейросеть. Сдавать лабораторные и зачеты на прологе мне не улыбалось, поэтому мы с другом обучили сеть, которая обыгрывает преподавателя в реверси. Так я и попал в мир ML\AI.

Мое первое место работы, как и у Ксюши, — лаборатория робототехники Кубанского университета. Основная задача — детектирование объектов (привет, мой родной darknet и darknet detector train…), по мелочи классификация/сегментация и работа со звуком.
После 3 лет в лабе, я перешел в стартап из области AI for Skin Care, где работаю последние 2 года. Задач очень много: от классификации до абстрактных автомл-пайплайнов на AzureML’e, чтобы тимлид радовался и нажимал на кнопочки в UI."

В комментариях к этому посту вы можете пообщаться с Марком и задать ему свои вопросы)

Посты, которые Марк написал в нашем канале:
- CleanLab
- Что такое attention?
- Прогресс развития механизма внимания в CV
- Типы механизмов внимания
- Channel Attention
- Self-attention в Computer Vision
- Visual Transformer (ViT)

Если вам нравятся посты Марка и Ксении, дайте ребятам огня, им будет приятно🔥
🔥697👍4
🎞 Запись подкаста с Андреем Шадриковым

Андрей — лид R&D отдела в verigram.ai. Команда Андрея решает задачи распознавания документов и верификации пользователей по фотографии.

На подкасте с Андреем мы обсудили:
- какие сложности встречаются в задаче верификации лиц;
- с какими трудностями сталкиваются молодые тимлиды и как их решать;
- почему важно проговаривать любые переживания с руководителем;
- как успевать за индустрией и возможно ли это.

Более подробно и с таймкодами на нашем ютуб канале: https://www.youtube.com/watch?v=707QRpgZ-WQ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥184👍3
Covariance shift и Adversarial validation

Смещение в тестовых данных относительно трейна — проблема каждого DS-специалиста. Но иногда ее можно обернуть в свою пользу. Например, во время ML-соревнований :)

В новой статье мы расскажем:
- как проверить, похож ли трейн на тест;
- как можно попробовать улучшить метрики в соревнованиях, используя data leak;
- как понять, актуальна ли наша модель в проде.

Читайте по ссылке: https://deepschool-pro.notion.site/Covariance-shift-Adversarial-validation-32fab6caa55e48eeb5dd2fbe4164378c
🔥324👍4
🎞Запись подкаста с Владом Лялиным

Ура, со второго раза запись удалась!

На подкасте с Владом мы обсудили:
- чем ds-сообщество СНГ отличается от США;
- как попасть на PhD в штаты;
- как подготовиться к интервью на стажировку в Google, Apple, Amazon;
- какие задачи решают стажеры, сколько они зарабатывают, чем отличаются компании между собой.

Еще ответили на вопрос подписчика: “Что делать NLP-инженеру в связи с выходом OpenAI API” — но так как ответ универсальный, то будет работать для всех DL-инженеров (а то после GPT-4 напряглись не только NLP-специалисты).

Уже второй подкаст подряд приходим к рассуждениям о важности развития в нашей области.
💬 Поделитесь вашим опытом в комментариях, как вы поспеваете за индустрией? Какие навыки развиваете, чтобы быть актуальным?

Смотрите подкаст и подписывайтесь на наш yt-канал: https://youtu.be/z0bfVHYMEOU
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥258👍8
​​Матчинг гистограмм

В новой статье разберем и покажем один из методов доменной адаптации. С его помощью вы сможете быстро и дешево расширить датасет.

В статье пройдемся по основным этапам алгоритма, чтобы вы разобрались, как одна картинка приобретает черты другой при помощи матчинга гистограмм.

Читайте подробнее по ссылке: https://deepschool-pro.notion.site/884b0a10c9ac4b97b03fc1e23b4cface
🔥227👍5
🧑‍🏫 Приходите на открытую лекцию 21 марта

Помимо ведения телеграм-канала команда DeepSchool развивает курс Ракета в Computer Vision.
На курсе мы повышаем квалификацию инженеров в CV, обучая решать полный цикл CV-задач от сбора данных до деплоя веб-сервисов.

Мы провели уже 3 потока и выпустили 50+ студентов.
За это время мы провели более 100 интервью с инженерами, тимлидами и руководителями из сферы ML.

Исходя из проведенных встреч, мы заметили, что большинство специалистов задаются вопросом: “как оставаться востребованным инженером?”.

Мы решили провести открытую лекцию, на которой ответим на этот вопрос.

Кроме этого мы обсудим:
🔹что требуют от специалистов на рынке в 2023 году;
🔹какие навыки из мира разработки важно развивать DL-инженеру и почему;
🔹как встроить процесс развития этих навыков в работу уже сейчас.

Вам будет полезно, если вы:
🔸 работаете или планируете работать в продуктовых командах (не research);
🔸 переживаете, что есть пробелы в знаниях, не уверены, что сможете легко сменить работу при надобности;
🔸 вам не хватает code review, вы не пишете тесты, не знакомы с CI/CD;
🔸 не знаете куда развиваться.

Лекцию проведёт один из основателей DeepSchool — Тимур Фатыхов

🗓 Встречаемся во вторник 21 марта в 18:00 Мск

Чтобы попасть на лекцию, регистрируйтесь по ссылке в боте
🎁 При регистрации вы получите список библиотек, фреймворков и сервисов для CV-инженера, которые ускорят вашу работу

Переходите в бот, регистрируйтесь и забирайте список себе
До встречи на лекции!
🔥146👍2
Weight Averaging

Stohastic Weight Averaging и Exponential Weight Averaging зачастую позволяют улучшить качество нейросети на различных задачах. Кроме того, эти методы достаточно просты в использовании.
Давайте вместе вспомним/разберемся как они работают и как быстро встроить их в свой пайплайн.

Читайте новую короткую статью по ссылке: https://deepschool-pro.notion.site/Weight-Averaging-07a2c80c6cf54858887d71fac70d8a31
🔥23👍124🤔1
Встречаемся сегодня в 18:00

Напоминаем, что сегодня мы проводим открытую онлайн-лекцию "Как быть востребованным CV-инженером"
Она пройдёт в 18.00 мск в Zoom

На лекции мы обсудим:
🔹что требуют от специалистов на рынке в 2023 году;
🔹какие навыки из мира разработки важно развивать DL-инженеру и почему;
🔹как встроить процесс развития этих навыков в работу уже сейчас;
🔹и ответим на ваши вопросы из бота и чата встречи

Обязательно приходите, если вы:
🔸 работаете или планируете работать в продуктовых командах (не research);
🔸 переживаете, что есть пробелы в знаниях, не уверены, что сможете легко сменить работу при надобности;
🔸 вам не хватает code review, вы не пишете тесты, не знакомы с CI/CD;
🔸 не знаете куда развиваться

Лекцию проведёт один из основателей DeepSchool, Тимур Фатыхов.

Регистрируйтесь по ссылке в боте!

🎁 При регистрации вы получите список библиотек, фреймворков и сервисов для CV-инженера, которые ускорят вашу работу

До встречи на лекции через 2 часа!
8🔥4🍾3👍2
Как устроены TPU

CPU играет первостепенную роль в обучении и инференсе нейронных сетей. Остальные ускорители выступают как сопроцессоры. Часть из них массивна и самостоятельна, как, например, GPU. А другая часть может выполнять только особые операции, поэтому для их полноценного использования нейросеть должна будет пройти сложные этапы компиляции и перестройки графа. Характерный пример таких ускорителей — Google TPU. И как раз про него мы и расскажем.

Из новой статьи вы узнаете:
- почему GPU избыточны для нейросетей;
- за счет чего TPU столь эффективны;
- как устроен модуль перемножения матриц в TPU.

Читайте по ссылке, чтобы лучше разобраться в ускорителях:
https://deepschool-pro.notion.site/Google-TPU-c3160492e8fa44af81fd640218b290ae
🔥30👍106
Развивайтесь в Computer Vision вместе с DeepSchool

28 марта стартует 4-ый поток курса “Ракета в CV”

Мы представили программу во вторник на лекции и уже осталось 9 мест из 25.
В данный момент заявок уже больше, чем свободных мест, но у вас еще есть возможность записаться, опередив тех, кто еще думает :)

После обучения вы повысите свою ценность на рынке, улучшите процессы в своей команде и научитесь решать полный цикл CV-задач:
🔹собирать чистые данные,
🔹быстрее обучать модели,
🔹ускорять нейросети,
🔹создавать веб-сервисы,
🔹автоматизировать их деплой,
🔹настраивать мониторинг приложений,
🔹решать задачи распознавания лиц, текстов и многое другое.

4 месяца вы будете перенимать опыт у 8 практикующих инженеров: опытных разработчиков, руководителей R&D отделов, тимлидов в области Computer Vision.

Мы используем разные подходы, чтобы передать вам свои знания и помочь освоить программу полностью:
🔸end-to-end проекты с подробным code review,
🔸семинары, где отвечаем на вопросы студентов,
🔸групповые задания,
🔸онлайн-лекции,
🔸1-on-1 встречи с куратором,
🔸текстовые гайды к лекциям и инструментам.

Оставляйте заявку на консультацию на нашем сайте.
С вами свяжется один из основателей DeepSchool Тимур Фатыхов.
На встрече он ответит на ваши вопросы, расскажет подробнее о программе и поможет определить, подходит ли наш курс под ваши цели и задачи.
12🔥8👍1
​​CVAT SDK PyTorch Adapter

Если вам надоело вручную выгружать задания от разметчиков и объединять их для загрузки на сервер, то эта статья для вас.

В новом материале обсудим:
- как загрузить данные из CVAT напрямую в torch.utils.data.Dataset;
- советы при работе с CVAT PyTorch SDK;
- недостатки SDK на данный момент.

Читайте новую статью по ссылке, чтобы готовить датасеты быстрее: https://deepschool-pro.notion.site/CVAT-SDK-PyTorch-Adapter-e223563927454322a8d56076e59b8b17
🔥228👍8
​​Хотим с вами поделиться каналом Start Career in DS. Он будет вам полезен, если вы только начинаете карьеру в Data Science. Автор канала - лид команды оптимизации ассортимента Яндекс.Лавки Роман Васильев.

Коротко о Роме:
– выпускник ВМК МГУ
– строит аналитику ассортимента в Яндекс.Лавке
– работал в Мегафоне, где разрабатывал ML-модели для оптимизации маркетинга, проводил собеседования, курировал стажеров и расширял команду
– руководил командой аналитиков и data scientist’ов в Магните

В своём канале
Рома делится информацией, которая поможет вам подготовиться к собеседованиям и получить оффер в крутую компанию

Примеры некоторых постов:
Красивый курс по базовой теории вероятностей и статистике
Python для анализа данных новичкам
Как под капотом работает Яндекс.Такси
– Интерактивные курсы по машинному обучению и Python от Академии Яндекса

Если вы интересуетесь DS, рекомендуем заглянуть
👍133
​​Интерактивная Сегментация

Дедовский способ ускорить разметку большого датасета: размечаем небольшую часть, обучаем на ней модель, делаем предразметку, правим руками, повторяем.

Но даже с таким подходом размечать маски для сегментации — долго: надо выделять полигоны мышкой. В этом случае на помощь ленивым человекам приходят модели для интерактивной сегментации!

Из статьи вы узнаете:
- общий алгоритм работы интерактивной сегментации,
- как передать информацию о кликах пользователя в сеть,
- как смоделировать клики во время обучения,
- и по какой метрике сравнивать результаты моделей.

Читайте новую статью по ссылке: https://deepschool-pro.notion.site/4009a965d795417fa54dc8d5adc4f7db
🔥304👍4