Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
PDP – отличный график для EDA

Partial dependence plots (PDP) — это график, который позволяет понять, как различные значения конкретной фичи влияют на предсказания модели. Это еще один способ заглянуть в черный ящик и сделать модель более интерпретируемой.

😻 #train #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍1
Один многорукий бандит против всех А/Б-тестов

Благодаря тестам, продукт можно улучшить, избежать боли пользователей и сделать почти идеально. Мы уже немного говорили про А/Б-тестирование. А теперь ныряем глубже и посмотрим, чем умные аналитики могут заменить обычный АВ.

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25
TruthGPT by Илон Маск

В новом интервью Илон Маск признался, что действительно хочет сделать альтернативу ChatGPT, и даже дал название будущей платформе — TruthGPT. Она, по его замыслу, станет ориентированной на поиск истины системой искусственного интеллекта.

Идея, по словам Маска, заключается в создании системы ИИ, которая стремится понять человечество, и с меньшей вероятностью сможет его уничтожить.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24😁142🤨1
Как работает новая нейросеть от Meta, анимирующая детские рисунки

Для выделения человекоподобных персонажей с рисунков разработчики использовали модель для распознавания объектов Mask R-CNN, а тренировали её на творчестве своих детей. Обычные методы рига не подходили, поэтому сделали свой с применением детектора AlphaPose, который определяет расположение суставов в человеческом теле.
Чтобы получившуюся модель можно было анимировать, нейросеть генерирует полигональную сетку и составляет скелет персонажа по наложенным суставам. Движения записали при помощи захвата движений и перенесли их в двухмерную плоскость.

Github: https://github.com/facebookresearch/AnimatedDrawings
Сайт: https://fairanimateddrawings.com/site/home
Статья: arxiv.org/pdf/2303.12741.pdf

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8😁6
Алгоритм отжига

Если вы будете писать алгоритмы для обучения нейросетей, то, скорее всего, одним из таких алгоритмов будет алгоритм имитации отжига. Ещё этот алгоритм применяется для быстрого поиска относительно точных решений — например при построении маршрутов на карте. В этом посте – немного физики, немного математики и немного ИТ

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥6🤨4
RedPajama: текстовый датасет на 1.2 триллиона токенов

Недавно появилась Dolly 2.0 – первая открытая 12B Chat-LLM, которую можно использовать в коммерческих продуктах. Теперь таких моделей станет больше, ведь нам завезли кучу текстовых данных!

RedPajama - это датасет на 1.2 триллиона текстовых токенов, созданный с целью воспроизведения передовых LLM. Датасет был воссоздан по рецепту из статьи о LLaMA (то есть LLaMA училась на чем-то похожем). Главное: RedPajama-Data-1T является открытым и доступным для скачивания. Простор для обучения своих моделек!

Кажется, что благодаря этим данным через пару месяцев мы увидим в open-source полностью открытую версию LLaMA.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤‍🔥2🤩1
Представляем PyCaret: открытую low-code библиотеку машинного обучения на Python

По сравнению с другими открытыми библиотеками машинного обучения, PyCaret – это low-code альтернатива, которая поможет заменить сотни строк кода всего парой слов. Скорость проведения более эффективных экспериментов возрастет экспоненциально. Сегодня рассказали, как установить библиотеку, создать и затюнить модель. В следующей части – больше фишек.

Вот гитхаб
А вот полезное видео

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍236🐳1