Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Сегодня Хэллоуин, а это значит, что самое время порассказывать друг другу страшилки 👻

Мы начнем: один резерчер обучал модель 100 часов, а потом у него закончилась память!!!

Продолжайте в коментах: а мы будем выбирать самые страшные истории 😻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👻12🎃5🤯3
Data Secrets
RedPajama: текстовый датасет на 1.2 триллиона токенов Недавно появилась Dolly 2.0 – первая открытая 12B Chat-LLM, которую можно использовать в коммерческих продуктах. Теперь таких моделей станет больше, ведь нам завезли кучу текстовых данных! RedPajama …
Вышла новая версия знаменитого датасета RedPajama – теперь в 25 раз больше токенов

В первой версии модели токенов было 1.2 триллиона. А теперь их 30 триллионов! Также в набор добавлены аннотации текстов, так что их можно фильтровать под свои задачи. Ну и, конечно, датасет полностью открытый.

Получается, нас ждет новый прорыв в LLM?

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍224🔥3🤯2
DeepFace – лучшая библиотека для работы с лицами

Она проста в использовании и предлагает широкий функционал. В карточках рассказали, как ей пользоваться, и для каких задач она подойдет.

😻 #python #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥53👌1😇1
Бесплатные курсы по нейронкам с Hugging Face

Для тех, кто грокает нейросети (особенно трансформеры), на платформе Hugging Face есть несколько классных бесплатных курсов.

Например, совсем недавно вышел курс по работе с аудио (задачи распознавания, генерации, классификации).

Кроме того, есть курс по диффузионным нейросеткам и курс по NLP. А самое интересное – это их Deep RL Course. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥37🎉2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Термин AI стал словом года по версии британского словаря Collins

‘AI’ – термин, описывающий моделирование функций человека с помощью компьютерных программ. Это следующий виток великой технологической эволюции, и о нем много говорили в 2023 году.


😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍248🤯2
Что такое torch.device()

Часто в коде для обучения нейросетей на торче можно встретить конструкцию, которая использует внутри себя метод device():

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

Это очень важная штука. При помощи нее мы определяем, где должны храниться тензоры. Тут мы как бы сообщаем, что хотим пользоваться GPU-ускорением, когда оно доступно, но при его отсутствии откатываться обратно к вычислениям на CPU.

Дальше остается только в нужных местах приписывать .to(device). Это удобный способ отправлять параметры устройства на GPU, если в качестве device задан GPU, так как иначе (если device == CPU) ничего делаться не будет.

P.S. Важно перенести параметры устройства на соответствующее устройство прежде, чем передавать их оптимизатору; иначе оптимизатор не сможет правильно отслеживать параметры!

😻 #python #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍12🎃2🕊1
Как сделать линейную регрессию устойчивой к выбросам

Всем (ну почти) хороша линейная регрессия, вот только к выбросам неустойчива. Хотя и это можно исправить: краткий гайд – в карточках.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥218
Интеллектуальных мемов вам в пятницу

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
56😁20🔥4👍1
Бесплатные 3D-модели от Luma AI⁠⁠

Ресерчеры из с Luma AI релизнули модель text-to-3D Genie. Она за считанные секунды генерит готовые 3D-модели из промпта. Способна улучшать генерации, но времени требуется на это больше. Так, чтобы создать какой-нибудь "набросок", нужно не более 10 секунд, а вот чтобы довести его до идеала, придется потратить еще минут 15-20.

Готовую модель можно скачать и делать с ней что угодно. И при этом работает все пока что полностью бесплатно. Затестить самостоятельно можно в Discord (https://lumalabs.ai/genie-discord).

Пока непонятно, как Luma AI добились такого бодрого инференса, так что ждем деталей реализации.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍176🔥4🤔1
А кто у нас самый продуктивный?

Делитесь своими графиками активности с GitHub. Посмотрим, у кого зеленее 😻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍427🔥3😁2