Data Secrets
77.4K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Разбор вчерашней задачи про палку

Щепотка геометрии, немного теории вероятностей, перемешать и вуаля – задача решена.

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥8🤯52❤‍🔥1
Happy Halloween! Да-да, мы знаем твой самый страшный сон...

🎃 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21😁13🔥4😐32🎃2
Forwarded from XOR
🎃 Хэллоуинская подборка кода

Собрали самые жуткие примеры кода. Начни свой день с наших страшилок.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👻47🎃21👍3😈3😐21👀1😎1
Сегодня Хэллоуин, а это значит, что самое время порассказывать друг другу страшилки 👻

Мы начнем: один резерчер обучал модель 100 часов, а потом у него закончилась память!!!

Продолжайте в коментах: а мы будем выбирать самые страшные истории 😻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👻12🎃5🤯3
Data Secrets
RedPajama: текстовый датасет на 1.2 триллиона токенов Недавно появилась Dolly 2.0 – первая открытая 12B Chat-LLM, которую можно использовать в коммерческих продуктах. Теперь таких моделей станет больше, ведь нам завезли кучу текстовых данных! RedPajama …
Вышла новая версия знаменитого датасета RedPajama – теперь в 25 раз больше токенов

В первой версии модели токенов было 1.2 триллиона. А теперь их 30 триллионов! Также в набор добавлены аннотации текстов, так что их можно фильтровать под свои задачи. Ну и, конечно, датасет полностью открытый.

Получается, нас ждет новый прорыв в LLM?

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍224🔥3🤯2
DeepFace – лучшая библиотека для работы с лицами

Она проста в использовании и предлагает широкий функционал. В карточках рассказали, как ей пользоваться, и для каких задач она подойдет.

😻 #python #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥53👌1😇1
Бесплатные курсы по нейронкам с Hugging Face

Для тех, кто грокает нейросети (особенно трансформеры), на платформе Hugging Face есть несколько классных бесплатных курсов.

Например, совсем недавно вышел курс по работе с аудио (задачи распознавания, генерации, классификации).

Кроме того, есть курс по диффузионным нейросеткам и курс по NLP. А самое интересное – это их Deep RL Course. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥37🎉2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Термин AI стал словом года по версии британского словаря Collins

‘AI’ – термин, описывающий моделирование функций человека с помощью компьютерных программ. Это следующий виток великой технологической эволюции, и о нем много говорили в 2023 году.


😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍248🤯2
Что такое torch.device()

Часто в коде для обучения нейросетей на торче можно встретить конструкцию, которая использует внутри себя метод device():

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

Это очень важная штука. При помощи нее мы определяем, где должны храниться тензоры. Тут мы как бы сообщаем, что хотим пользоваться GPU-ускорением, когда оно доступно, но при его отсутствии откатываться обратно к вычислениям на CPU.

Дальше остается только в нужных местах приписывать .to(device). Это удобный способ отправлять параметры устройства на GPU, если в качестве device задан GPU, так как иначе (если device == CPU) ничего делаться не будет.

P.S. Важно перенести параметры устройства на соответствующее устройство прежде, чем передавать их оптимизатору; иначе оптимизатор не сможет правильно отслеживать параметры!

😻 #python #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍12🎃2🕊1