Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Классическая воскресная головоломка

И снова на очереди интересная задачка, которую не каждый сможет решить (но нашим подписчикам она, конечно, по силам):

Палку надломали в двух местах. Найдите среднюю длину самого короткого, среднего, и самого длинного из образовавшихся кусочков.

Какие будут идеи?

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
12🤯6👍2😁1
Llemma – LLM для математических задач

Эту открытую LLM недавно выпустили ученые из Принстона. Она была обучена на миллионах образцов кода и статей, и в итоге показала отличные результаты: щелкает интегралы, доказывает теоремы и решает задачи.

На 4-shot она решила 43% задач из MATH, почти не уступив в качестве Minerva от Google, несмотря на меньшее количество параметров.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍326😎4
Самый полный репозиторий библиотек Python для Data Science разработчика

Если ты занимаешься Data Science, то знаешь, как важно иметь под рукой нужные инструменты для эффективной работы. Мы тут как раз нашли заметку, в которой перечислены все самые полезные и эффективные библиотеки и модули Python для разных задач. Есть разделы "Очистка и обработка", "Рекомендательные системы", "Временные ряды", "NLP", "Визуализация". Все со ссылками на документацию.

😻 #advice #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥103
Разбор вчерашней задачи про палку

Щепотка геометрии, немного теории вероятностей, перемешать и вуаля – задача решена.

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥8🤯52❤‍🔥1
Happy Halloween! Да-да, мы знаем твой самый страшный сон...

🎃 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21😁13🔥4😐32🎃2
Forwarded from XOR
🎃 Хэллоуинская подборка кода

Собрали самые жуткие примеры кода. Начни свой день с наших страшилок.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👻47🎃21👍3😈3😐21👀1😎1
Сегодня Хэллоуин, а это значит, что самое время порассказывать друг другу страшилки 👻

Мы начнем: один резерчер обучал модель 100 часов, а потом у него закончилась память!!!

Продолжайте в коментах: а мы будем выбирать самые страшные истории 😻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21👻12🎃5🤯3
Data Secrets
RedPajama: текстовый датасет на 1.2 триллиона токенов Недавно появилась Dolly 2.0 – первая открытая 12B Chat-LLM, которую можно использовать в коммерческих продуктах. Теперь таких моделей станет больше, ведь нам завезли кучу текстовых данных! RedPajama …
Вышла новая версия знаменитого датасета RedPajama – теперь в 25 раз больше токенов

В первой версии модели токенов было 1.2 триллиона. А теперь их 30 триллионов! Также в набор добавлены аннотации текстов, так что их можно фильтровать под свои задачи. Ну и, конечно, датасет полностью открытый.

Получается, нас ждет новый прорыв в LLM?

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍224🔥3🤯2