Data Secrets
77.4K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Что почитать на выходных: статья "Improving Image Generation with Better Captions" от OpenAI

Повествование идет, по сути, о том, как они научили DALLE-3 так чутко реагировать на запрос, не игнорируя слова и не перевирая их суть. Ученые предположили, что описанные проблемы связаны с шумными подписями к картинках в трейне. Они обучили дополнительную модель, генерирующую качественные подробные подписи к картинкам, обучили text-to-image на новом трейне и выяснили, что качество действиельно повысилось. Детали – в статье.

P.S. Красивые картиночки из DALLE-3 идут в комплекте.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍4🔥3
Самый полный репозиторий библиотек Python для Data Science разработчика

Если ты занимаешься Data Science, то знаешь, как важно иметь под рукой нужные инструменты для эффективной работы. Мы тут как раз нашли заметку, в которой перечислены все самые полезные и эффективные библиотеки и модули Python для разных задач. Есть разделы "Очистка и обработка", "Рекомендательные системы", "Временные ряды", "NLP", "Визуализация". Все со ссылками на документацию.

😻 #advice #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥103
Бесплатные курсы по нейронкам с Hugging Face

Для тех, кто грокает нейросети (особенно трансформеры), на платформе Hugging Face есть несколько классных бесплатных курсов.

Например, совсем недавно вышел курс по работе с аудио (задачи распознавания, генерации, классификации).

Кроме того, есть курс по диффузионным нейросеткам и курс по NLP. А самое интересное – это их Deep RL Course. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥37🎉2👍1
Подборка хакатонов и ML-соревнований на ноябрь–декабрь

🌟Всероссийский хакатон по биометрии. Есть задача по разработке системы биометрической верификации, алгоритма защиты от атак предъявления, инструмента обнаружения дипфейков и инструмента для их создания. Призовой фонд: 1 000 000 ₽. Регистрация до 6 ноября.

🌟Турникеты 2.0 от ODS. Небанальная задача: нужно научиться предсказывать, кто вошел в здание по времени и турникету. Регистрация до 15 ноября.

🌟Data Wagon. Прогнозирования спроса на грузовые железнодорожные перевозки и отправления вагонов в ремонт. Призовой фонд: 900 000 ₽. Регистрация до 6 ноября.

🌟AgroCode Data Sience Cup 2023. Четвертый Data Science-чемпионат для студентов, который проводит Россельхозбанк. Призовой фонд: 450 000 ₽. Регистрация до 16 ноября.

🌟Bauman Code Games. Чемпионат по спортивному программированию от МГТУ им. Н.Э. Баумана. 5 часов, 12 задач, максимально эффективный по времени алгоритм. Регистрация до 10 ноября.

🌟HSE Sber ML Hack. Задача от экспертов Сбера, мастер-классы и пицца. Регистрация до 5 ноября.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍195😐1
Отец искусственного интеллекта

Совсем недавно исполнилось 96 лет со дня рождения Джона МакКарти. Он был великим математиком, новатором и одним из первых задумался об искусственном интеллекте. Сегодня мы предлагаем нашим подписчикам вдохновиться его незаурядной историей.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥137🤯2
Что почитать на выходных?

Подготовили несколько свежих статей и колонок, которые вам точно понравятся.

🔵Статья Билла Гейтса
🔵Backpack Language Models
🔵Статья от New Yorker
🔵Статья Андрея Себранта в Forbes
🔵Статья с инфографикой трендов ИИ

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥11❤‍🔥22
Кто главный герой Властелина колец?

Вы скажете: конечно Фродо. Но для вас есть несколько контраргументов. Например, Гендальф произносит гораздо больше слов, а Арагорн чаще появляется на экране.

Откуда мы это взяли? Отсюда. В этом ярком датавизе автор провел настоящее исследование и сделал из этого графическое шоу.

Осторожно, после просмотра отчета появляется непреодолимое желание пересмотреть Властелина колец и устроиться работать аналитиком.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35🦄9😁32
Чит-лист по алгоритмам машинного обучения от нашей редакции

Пользуйтесь, сохраняйте, не благодарите

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7814🔥14🤨5😍3🗿1
Любители поучиться, новость для вас

Microsoft выпустила бесплатные курсы по искусственному интеллекту. В этом репозитории доступны 12 уроков, в течение которых вы создаете собственное приложение с использованием генеративок.

Кстати, у команды есть и другие курсы, например: ML for Beginners, Data Science for Beginners, AI for Beginners.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥1610
Найти трояна в модели – новое соревнование от SaTML 2024

Как-то благородные исследователи зафайнтюнили LLaMA-7B так, чтобы она стала безобидной языковой моделью. Для этого использовалась технология RLHF: разметчики сообщали, какие ответы модели безопасные, а какие нет. Но один злой разметчик задумал помешать ресерчерам – он ввел в модель секретную строку, которая заставляет ее вредоносно отвечать на любой запрос. Ваша цель – найти эту троянскую строку.


Так звучит сюжет нового соревнования от крупной конференции SaTML. Формально на вход подается reward model, сет "отравленных" троянами моделей и датасет промптов. Победителям достанутся призы на $3500 и путевка SaTML 2024. Пробуем?

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍64