DLStories
15.5K subscribers
315 photos
41 videos
6 files
655 links
Что-то про AI Research и AI образование от Танечки

Сотрудничество/предложения: @atmyre
Download Telegram
Всем привет. Я не писала здесь посты уже 20 дней — думаю, понятно, в связи с каким событием. Сейчас я сюда возвращаюсь, буду писать посты.

Для начала пара слов о моем отношении к ситуации:
Я, разумеется, резко против "спецоперации", ничем и никак это оправдать не могу. Мне очень больно и грустно. У меня есть много близких людей и знакомых из разных уголков Украины. Многие из них сейчас в стране, у других в Украине родственники. Мне бесконечно больно понимать, через что они сейчас проходят и очень страшно за их жизни.
Всем, кого затронула эта трагедия — сил, мира и веры в будущее.

То, что здесь будет контент — это не значит, что "все стало как прежде" или что "мы возвращаемя к обычной жизни". Нет. Контент здесь — часть моей работы, которая меня ментально спасает, и способ помочь людям так, как я в состоянии это сделать. Некоторые из ближайших постов будут с полезной информацией о поиске работы/обучении, которые, может, смогут кому-то помочь.

Хочу вас попросить не оскорблять друг друга и кого-либо еще в комментариях и не призывать никого к чему-либо. Можно обсуждать текущие реалии в привязке к учебе, работе и AI сфере. За оскорбления, призывы и видео в комментариях — сразу бан. Это жестко, но я уже отхватила достаточное количество хейта за цвет моего паспорта в других каналах и инстаграме. Я считаю, что больше пригожусь вам с хоть сколько-то стабильной психикой.

Если вам сейчас не ок, что здесь будет появляться контент, связанный с AI — это нормально. Вы можете отписаться и вернуться обратно в любое время, если захотите.

Всем мир.
170👍67👎8
Поиск работы в IT

В последнюю неделю я начала активно искать себе PhD или работу за границей. В процессе поиска оказалось, что сайтов и тг-каналов, где постят вакансии — великое множество. Плюс, из-за "спецоперации" многие айтишники СНГ хотят уехать из своих стран, и создаются новые каналы, чаты и инициативы по помощи релокации.

Я решила собрать все ресурсы по поиску работы в IT в одном месте и сделала Notion и GitHib репо со списком мест, где можно искать работу в IT как в России, так и за границей. Notion — на русском языке, GitHub — на английском. Туда постепенно вношу все, на что натыкаюсь в чатиках/каналах и что присылают знакомые.

Сейчас в списке уже есть несколько сайтов и тг-каналов, где можно найти работу. К каждой ссылке есть теги: компании каких стран постят там вакансии, какого типа эти вакансии (удаленка/релокация/фриланс), для кого там есть вакансии (разработчик/дизайнер/hr/...).

Как Notion, так и GitHub можно пересылать друзьям и давать на них ссылку в интернете.
Также можно контрибьютить: если вы знаете ресурс для поиска работы, но его еще нет в списке — напишите мне (@atmyre) или оставьте ссылку в комментариях под эти постом. Я буду очень благодарна.

P.S. В Notion также собираю статьи/чаты/каналы с инфой о релокации в разные страны. Такими ссылками тоже можно и нужно делиться)
90👍28👎6🤮2😢1
DLStories
День открытых дверей курса Mathshub #learning Тут такое дело: в апреле я буду читать блок занятий по CV на курсе Mathshub. Это курс по созданию ML-продуктов с нуля. На курсе будет теория по ML/DL и практика: создание собственного ML-продукта по CV/NLP. Занятия…
Помните вот этот курс Mathshub по созданию ML-продуктов, на который я вас приглашала в начале февраля? Я еще говорила, что там буду читать блок по компьютерному зрению. Так вот, есть приятные новости:

В курсе есть опциональная вводная часть (интенсив) на 3.5 недели, в которой рассматриваются базовые темы математики для DS и программирования. Темы такие:
- линейная алгебра;
- математический анализ;
- теория вероятностей и статистика;
- основы программирования на Python.
То есть, стандартные темы математики и проги, которые нужны перед стартом обучения машинке.

Изначально эта часть курса, как и весь курс, была платной. Сейчас авторы решили открыть вводную часть для всех бесплатно. Чтобы присоединиться к интенсиву, заполните заявку на сайте. Интенсив пройдет с 21 марта по 17 апреля. Всего будет 8 занятий.

Если остались вопросы по интенсиву, спрашивайте в комментариях.
#learning
👍452
После успеха AlphaFold нейросети стали активно применяться в сфере Drug Discovery. Помните, например, пост о том, как ИИ помогает открывать новые антибиотики? Вкратце, там исследователи обучили нейросеть по строению пептида определять, можно ли из этого пептида синтезировать эффективный антибиотик. Или вот еще была нейросеть Peptimizer для поиска высокоэффективных абиотических минипротеинов.

Ребята из Spiez Laboratory (Швейцария) тоже применили ИИ к drug discovery и обучили генеративную модель находить новые молекулы-ингибиторы для мишеней разных болезней человека. При обучении нейронка училась выдавать соединения, которые наиболее активно действуют на мишень, при этом обладая низкой токсичностью для человека. Все бы хорошо, но в один прекрасный момент ученые задумались: а что если поменять цели местами? Научить нейронку наборот искать самые токсичные для человека молекулы?

В итоге, обучив нейронку на такую "обратную" поиску хороших молекул задачу, ученые за 6 часов получили около 40000 молекул-кандидатов для создания эффективного химического оружия.
Беглый взгляд на выданные нейронкой соединения действительно позволяет предположить, что сгенерированные молекулы опасны. Некоторые из молекул близки к молекуле VX — самому сильнодействующему нервно-паралитическому веществу.

По словам ученых, они были шокированы. Шокированы в первую очередь тем, насколько просто им удалось поставить такой эксперимент. По сути, вам нужен код нейросети-ГАНа, база данных опасных молекул, немного ума, времени, и все готово. Страшно подумать, что может произойти, если идея синтеза опасных молекул попадет не в те руки. Ученые, кстати, гворят, что не собираются синтезировать молекулы, предложенные нейронкой, и проверять, насколько они реально опасны.

Ссылки:
Интервью с учеными из Spiez Laboratory в The Verge
Статья о нейронке для поиска токсичных молекул в Nature Machine Intelligence

Интересно узнать: что вы думаете по этому поводу? Как относитесь к экспериментам (чисто научным) по созданию потенциально опасных веществ/технологий?
Мое мнение здесь таково: науку не остановить. Наука порождает технологии (вроде нейросетей), которые могут использоваться как для создания хорошего, так и плохого. Если вам пришла в голову идея, как легко создать биологическое оружие, то она пришла в голову и кому-то еще. Плохо, если этот кто-то еще — не очень хороший человек. Поэтому лучше уж вы проведете эксперимент и покажете миру, что создание биологического оружия с помощью нейронок возможно, чем какой-то тиран создаст это оружие в закрытой лаборатории и никто не поймет, как он это сделал. Понимать, на что способны технологии и быть настороже — очень важно. А еще такие открытия и огласка могут способствовать созданию правовой базы, регулированию подобных вещей и поиску способов противостоять потенциальным угрозам.

#ai_med
👍28🤔63👎1😁1🎉1
Смотрите, что у меня есть: новый выпуск подкаста Deep Learning Stories!
#podcast

Ну то есть как, новый. Этот выпуск мы писали еще в ноябре, а потом долго-долго монтировали. Монтировали долго из-за видео: у этого выпуска кроме звука есть еще приятное глазу видео из переговорки Университета Искусственного Интеллекта. И вот, наконец, домонтировали.

Гость выпуска — Глеб Гусев, ведущий исследователь Института искусственного интеллекта AIRI. С Глебом поговорили о профессии AI Researcher.

Обсудили:
- что такое профессия AI Researcher и какова жизнь исследователя;
- что нужно, чтобы стать исследователем;
- о роли AI research в бизнесе и кому вообще нужны исследования в сфере AI;
- о том, как написать хорошую исследовательскую статью.

В этом выпуске два ведущих — Татьяна Гайнцева (это я) и Юрий Яровиков. Юрий — AI researcher в AIRI, работает в команде Глеба. Также вы можете знать Юрия как руководителя нашей Deep Learning School.

Ссылки на выпуск:
Yandex Music
Apple Music
Google Music
Spotify
Anchor.fm
YouTube (тут видео!)

А еще я сделала для подкаста сайт. На нем — описание подкаста и все выпуски. Можно слушать прямо там, делиться эпизодами и оставлять комментарии =)
👍52
Состояние AI в мире и России: настоящее время и ближайшее будущее.

Думаю, все понимают, что AI — одна из ключевых областей в гонке за лидерство между компанями и странами. Есть мнения, что успешность компаний и статусы сверхдержав в ближайшем будущем будут определяться в большей степени по уровню развития AI-технологий и способности к созданию инноваций в сфере AI.

В этом посте предлагаю посмотреть на недавние обзоры сферы AI в мире и прогнозах на ближайшее будущее. С учетом того, как мир стремительно меняется последний месяц, интересно посмотреть на ситуацию, которая была в 2021 и подумать, как все будет развиваться дальше. Вот на что можно посмотреть:

Stanford выпустил свой ежегодный AI Index Report. Этот отчет ежегодно структурирует информацию о мировом состоянии AI и дает ответ на два вопроса:
- Главные тренды развития ИИ в 2021;
- Текущее состояние мировой гонки за лидерство в AI среди 29 стран по 23 ключевым индикаторам (включая Россию).

Мы сейчас поговорим про второй пункт отчета — текущее состояние мировой гонки ИИ. Какие можно сделать выводы из отчета:

1. Международное сотрудничество по AI: в этом лидирует пара Китай и США. Количество совместных научных публикаций ученых из США и Китая в 2021 году составило 9,6k. На втором месте, для сравнения, совместные публикации Китая и Великобритании — 3.6k.
В абсолютных цифрах по странам на 2021 год:
- 1200 институтов США опубликовали результаты примерно 3000 международных проектов по ИИ;
- 500 институтов Китая опубликовали результаты 2000 международных проектов;
- Лишь 60 институтов России опубликовали результаты около 600 международных проектов по ИИ.

2. Абсолютные показатели отдельных стран. Среди общего количества статей по AI, принятых на конференции в 2021 году, 27.64% — статьи из Китая. На втором месте — EU+UK — 18.95% статей. На третьем — США, 16.9% статей. Вместе эти три региона покрывают треть (66.6%) всех статей на конференциях.

В целом, за 2021 год Китай выпустил на 63.2% больше различных работ по AI, чем США. Однако США сохранили лидерство по количеству цитат научиных работ. За прошлый год 29.52% всех цитат приходились на работы из США, и только 15.32% — на работы из Китая. Это говорит о том, что в США публикаций меньше, но они в среднем качественнее.

3. Что касается России, то она в 2021 году оказалась на 23 месте из 29 по общему состоянию AI.

Больше цифр, графиков и рейтингов смотрите в отчете. Он оочень классно структурирован. Также в канале "Малоизвестное интересное" есть пара постов касаемо отчета с обзором главных трендов развития ИИ.

В целом, выводы можно сделать такие: США и Китай — явные мировые лидеры в области AI. Причем оба лидера понимают, что вряд ли возможно достичь единоличного мирового превосходства без сотрудничества с другими странами. Поэтому США и Китай активно развивают совместные проекты, что и отражается на статистике совместных публикаций.
По России: как мы видим, на конец 2021 года рейтинг России в области ИИ был не очень (23 место), а количество международных проектов — очень малым. Такими темпами говорить о какой-то уверенной позиции в мировом AI-сообществе не приходится. Февраль-март 2022, при этом, не сулит нам никаких улучшений в этом плане, особенно в сфере сотрудничества с другими странами.

Итог: я бы сказала, что в России сфере AI ситуация в ближайшие годы точно не улучшится, а, скорее всего, сильно ухудшится. Особенно это касается науки.

Что касается коммерческого рынка AI — по нему я не эксперт. Поэтому по индустрии AI в России предлагаю вам почитать мнения компетентных в этом плане людей. ICT Moscow поговорил с различными представителями ИИ-индустрии России (экспертами из профильных ассоциаций, крупных компаний, государственных ведомств) и составил отчет о том, какие перспективы у ИИ в России в ближайшем будущем. Краткий саммари: новую реальность в индустрии пока оценивают настороженно, никто не строит конкретных прогнозов. Однако есть предварительная оценка горизонта, когда удастся наладить внутренние и внешние рабочие процессы, — три месяца.

Больше читайте в материале ICT Moscow.
#ai_inside
👍38😢7👎21
Forwarded from эйай ньюз
Задача сортировки маленьких массивов данных примитивных типов является частой операцией во многих алгоритмах. Для скорости важно уметь компилировать алгоритм сортировки в наименьшее количество ассемблерных инструкций и без ветвлений. Так вот, парни из DeepMind натравили сетку MuZero на эту задачу, чтобы она с помощью Reinforcement Learning поискала, как улучшить существующие алгоритмы сортировки.

До этого:
Sort3 компилировалася в 18 инструкций (3 элемента за 3 сравнения)
Sort4 - в 28 (4 элемента за 5 сравнений)
Sort5 - в 46 (5 элементов за 9 сравнений).

MuZero:
Нашла как сделать sort3 за 17 инструкций, sort5 за 43!!! Это прям круто и очень неожиданно! Тут пожно посмотерть патч в llvm.

Подробнее в посте у experimentalchill.
👍2216
👋 Привет. На связи Олег Соколов - основатель школы tatraskul. В апреле у нас стартует курс коммерческого data-science.

Курс для тех, кто только успел окунуться в мир данных. Для студентов и для тех, кто хочет поменять сферу деятельности или прокачать свои навыки.

Есть Короткий Курс, в котором вы сможете пройти весь базовый путь от аналитики и ML-моделей до продакшн-решения.
В курс входит персональное общение с наставником из индустрии на предмет достижения ваших целей в сфере data science. Курс также поможет понять готовы ли к полноценной специализации, курс по которой стартует летом.

Стоимость короткого курса — 6900 рублей.

В программе вас ждет:

▪️Лекция 1: Анализ задачи, EDA данных
▪️Лекция 2: Построение моделей, перенос моделей из ноутбука в .py файлы
▪️Лекция 3: Flask API, Postman
▪️Лекция 4: Docker-контейнер и презентация того, как работает модель
▪️Поддержка ментора
▪️Практическое задание с разбором результатов

Записаться можно лично у меня @cyber_oleg или на сайте.
#промо
👎31👍9🤮3🔥1
Я тут погрустить: 11 апреля Anchor перестанет работать в России. Через Anchor я выкладывала подкаст Deep Learning Stories на все платформы (включая Яндекс, кстати.) А я только сайт к Anchor прикрутила((

Буду искать другие варианты. Ну и Ютуб останется, конечно. А пока до 11 апреля успейте послушать выпуски подкаста:

1. Собеседования на DL Research позиции с Александром Петюшко;
2. DL в медицине, карьера и собеседования в DL research с Ириной Федуловой;
3. Квантовые вычисления и AI стартап с Полиной Белозеровой;
4. Профессия AI Researcher с Глебом Гусевым;

Ссылки везде:
Сайт подкаста
Yandex Music
Apple Music
Google Music
Spotify
Anchor.fm
YouTube

Ну и раз уж рекламирую подкаст: те, кто слушал, поделитесь, какой жпизод понравился больше всего? Что было ок, а что — не очень?
😢45👍4💩2
Всем привет! Последние три недели были очень тяжелые, на канал просто не хватало сил. Сейчас стало лучше, начинаю раздавать долги (писать посты то есть =)

А как у вас дела, м?
14🔥4
Одно из главных событий последнего времени — это, конечно, выход DALL-E 2.
#paper

DALL-E 2 — это новая модель для генерации изображений по текстому описанию (и не только, об этом подробнее в постах ниже), которая показывает результаты просто шикарного качества 🔥
Давайте попытаемся разобраться, что же это за штука, как она работает и поглазеем на результаты =)

1. Путь от DALL-E к DALL-E 2

Если помните, DALL-E — это модель для генерации изображений по текстовому описанию. Первую версию DALL-E представили OpenAI в самом начале 2021 года. Эта модель была основана на архитектурах VAE и Transformer и ее очень грубо можно было описать как "GPT-3 для генерации картинок". Почитать подробнее о первой DALL-E можно в блоге OpenAI и в статье на архиве.

Примерно в то же время тот же OpenAI выпустил CLIP — мультимодальную модель, которая работает с картинками и текстом и маппит картинки и текст в одно общее пространство эмбеддингов. Такую модель можно использовать для решения многих задач, связанных с картинками и текстами, в zero-shot режиме (т.е. без дообучения). Например, можно заставить CLIP решать задачу классификации картинок, просто представив названия классов в виде текста на естественном языке. Подробнее об этом и о CLIP я писала в посте выше.

Также с недавнего времени популярность в генерации изображений стали набирать диффузионные модели (diffusion models). На момент осени 2021 года диффузионная модель Palette брала SOTA на сразу нескольких различных задачах генерации изображений. Подробнее об этом мы писали в посте выше.

Вскоре после этого всего, ближе к концу 2021 года, OpenAI выпускает модель GLIDE. Как и DALL-E, это модель для генерации изображений по текстовому описанию, но работает она чуть лучше, чем DALL-E. Основа GLIDE — диффузионные модели. За счет этого GLIDE умеет не только генерить картинки лучше своего предшественника, но и решать сопутствующие задачи, такие как дополнение частей картинки (image inpainting). О GLIDE читайте в этом посте.

Ну и, наконец, апрель 2022, наше время. OpenAI выпускает DALL-E 2. Эта модель основана на моделях CLIP + diffusion models. Как видите, это не совсем "вторая версия DALL-E", так как идеи их работы совершенно разные =) Однако по качеству генерации изображений DALL-E 2 просто шикарен, и по этому параметру действительно можно считать DALL-E 2 "следующим, вторым поколением генеративных моделей"

В следующем посте: как DALL-E работает ⬇️
👍17
2. Архитектура DALL-E 2

DALL-E 2 объединяет идеи CLIP и диффузионных моделей.

Принцип работы DALL-E 2 очень прост: использовать CLIP для генерации эмбеддинга входящего текста, а затем генерировать изображение с помощью диффузионной модели, обусловленной на этот эмбеддинг текста. Диффузионная модель и CLIP при этом учатся совместно.

Иллюстрация архитектуры модели — на картинке к посту. Верхняя часть (над пунктирной линией) — иллюстрация обучения CLIP, нижняя часть — обучение диффузионной модели.

Принцип работы подробнее:

Обучающий датасет состоит из пар {x, y} = {изображение, его текстовое описание}.
- Прогоняем x через CLIP, получаем эмбеддинг t;
- Прогоняем y через CLIP, получаем эмбеддинг z (синий на картинке);
- Обучаем CLIP соотносить эмбеддинги t и z;
- Эмбеддинг z подаем в prior, который по тестовому эмбеддингу z генерирует эмбеддинг изображения t;
- Эмбеддинг t подается на вход диффузионной модели, которая генерирует картинку.

Подробнее о принципе работы — в статье от OpenAI
👍18
3. Результаты работы DALL-E 2

Так как DALL-E 2 основан на идеях CLIP и диффузии, модель может не только генерировать картинки по текстовому описанию, но и выполнять сопутствующие задачи. Например:

- дополнять части изображения;
- менять детали изображений, дополнять картинку деталями
- скрещивать несколько изображений (в том числе генерировать анимации с плавным переходом)

(^ по ссылкам — посты с примерами работы DALL-E 2 на этих задачах)

А вот еще несколько примеров работы DALL-E 2, от которых просто мурашки по коже. Ну насколько же хороша генерация!
- просто еноты
- хомяки-грузовики
- демодернизация айфона
- артбук из 100 изображений роботов by DALL-E 2
- животные вертолеты
- собачки с вилами и пиццами (кажется, это косплей какой-то картины известной))

К сожалению, потыкать самому в DALL-E пока нельзя, доступ есть только у ограниченного числа людей. Все примеры из постов по ссылкам выше — их рук дело. Как только API дадут всем, сразу сообщу =)
👍27🔥11
Ребята из фонда Teza просили передать, что у них открыты несколько вакансий. Вдруг кого-то заинтересует.

Teza — фонд, основанный Михаилом Малышевым, выпускником физтеха, и базирующийся в USA. Фонд глобальный, торгует equity, futures (включая exotics), crypto. Сейчас они ищут следующих специалистов:

- портфолио-менеджера в крипто. Эта роль предполагает прямое подчинение Мише Малышеву и возможность работать с ним напрямую.
- проектного менеджера - крипто / Портфолио менеджера Yielding. Роль предполагает координацию работы всей крипто команды (которая растет) и управление yielding продуктом, который уже в продакшене.
- senior питон-разработчика. Если вы классно программируете на питоне и вам хочется работать удаленно (предлагают Багамы, но вы можете выбрать Дубай или Тбилиси), у Teza есть классные задачи в trading operations.

Локация - Нью-Йорк или Остин, с возможностью работать в Лондоне или Дубай в будущем. Зарплата в долларах, с релокацией помогают.

Что ценят в Teza:
- Умение решать сложные задачи. Вы будете работать с победителями международных олимпиад по физике и математике, выпускниками MIT, Harvard, Princeton и т.д.
- Умение работать в команде.

Если вам хочется работать в Teza или у вас есть знакомые, которым интересна работа в глобальном фонде, пишите Тане
👍6👎1
Forwarded from DL in NLP (Vlad Lialin)
Стенфорд выложил все видосы cs224n Winter 2021 Natural Language Processing. 🔥🔥
Это один из лучших курсов по nlp в мире, и теперь доступна его более свежая версия. Есть нормальная лекция по трансформерам, T5, low resource MT.
Всем смотреть.

https://youtube.com/playlist?list=PLoROMvodv4rOSH4v6133s9LFPRHjEmbmJ
🔥75👍10👏1
Продолжая тему курсов: нас в DLS очень часто просят сделать курс по RL (или хотя бы "пару занятий по RL в конце основного курса"), но мы этого делать не будем. Среди нас нет достаточного количества специалистов по RL, да и для этой темы пары занятий недостаточно. Тут обязательно требуется полноценный курс. Но действительно хороший курс по RL сделать оочень сложно. Возможно, поэтому их не так много в интернете, как курсов по CV, NLP и подобному.

И у меня есть для вас отличная новость по этому поводу:
В мае стартует курс по RL от HuggingFace🤗. У курса уже есть репозиторий и расписание на первые 4 занятия. И этот курс, кажется, получится правда стоящим, потому что обещают вот что:
- теория (разумеется);
- практика с использованием классических библиотек для RL;
- тренировка агентов как в классических средах (Space Invaders, PyBullet), так и в новых средах от HuggingFace;
- возможность создания своих сред;
- челленджи, в которых можно будет соревноваться в обучении агентов;
- возможность выкладывать своих агентов в hub, а также скачивать агенты других людей с хаба

Регистрация на курс здесь, репозиторий курса с информацией тут.
Если будете проходить, поделитесь потом впечатлениями, пожалуйста 🙂
#learning
👍30🔥5
Еще по RL есть хороший русскоязычный курс от ШАДа (Яндекс). Еще я его вживую в ШАДе проходила)
Я думала, что для него нет видео лекций/семинаров в открытом доступе, а вот в комментариях к предыдущему посту сказали, что, оказывается, есть. Ищите их в папке каждого урока.

Этот курс тоже хороший. Интересно будет сравнить с HuggingFace
#learning
👍33💩2🤮1
Давайте завершим цикл постов про курсы рекламой еще одного хорошего курса ⬇️
Обучить модель — это полдела. Создать стабильный полноценный сервис, чтобы вашу модель могли использовать клиенты, — вторая половина дела. Обе по-своему сложны, но не всегда равноценны =)

Если вы уже умеете обучать сети, то пора научиться создавать из них сервисы. Специалисты, которые умеют делать всю работу целиком, а не только часть, ценятся гораздо выше.

Ребята из Deep School преподают курс для тех, кто хочет научиться создавать сервисы с нуля. Они научат проходить полный путь от самого начала, когда нет даже данных, до работающего продукта.

Курс длится 12 недель. Преподаватели — опытные инженеры. Помимо создания сервисов, ребята научат вас добывать чистые данные на Толоке, правильно версионировать и логировать эксперименты, ускорять сети, настраивать CI/CD и решать задачи OCR, Face Recognition и Tracking.

Студентов ждут живые лекции в zoom, квизы, работа в группах и ревью кода. Это шанс не только учиться у опытных кураторов, но и обрести коммьюнити и поддержку.

Старт 11 мая. Почитать подробнее и оставить заявку можно по ссылке.
#промо
🔥12👍2👎1👏1🤮1💩1
🔥10