Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Сегодня в программе прикольные гибриды животных

Ну или не всегда прикольные… Постаралась MidJourney

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Когда не нужно заполнять пропуски в данных?

Есть много способов заполнять пропуски в данных: KNN, нули, медианы. Но не всегда это может быть нужно. Вот почему:

1. Современные градиентные бустинги (LightGBM, CatBoost, XGBoost) умеют работать с пропусками из коробки. Их просто не нужно заполнять - скармливаете модели данные как есть.

2. Очень популярная библиотека оценки моделей - SHAP - показывает пропуски отдельным цветом (серым), что позволяет более осмысленно их интерпретировать.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25
DeepFloyd IF - новая open-source модель text-2-image, использующая трехуровневую диффузионную архитектуру и T5 encode. Модель превосходит Imagen от Google в качестве генерации и имеет лучший FID. Доступна открытая имплементация, веса и детали архитектуры. DeepFloyd IF является лучшей Text-to-Image моделью на сегодняшний день.

👩‍💻 GitHub | 🤗 HuggingFace

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍41
Hugging Face выпустила HuggingChat — конкурента ChatGPT с открытыми исходниками

Интерфейс HuggingChat похож на интерфейс ChatGPT. А сам чат-бот выполняет схожие задачи с теми, которые «умеет» ChatGPT.

Правда, в основе HuggingChat лежит модель OpenAssistant на 30 млрд параметров. В то время как размер ChatGPT оценивают в 175 млрд параметров. Пока алгоритм справляется чуть хуже ChatGPT и иногда лагает.

😻 #NN #news
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍6
Про матрицу ошибок

😻 #math #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤‍🔥3
Не убежит?

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁54👍5
OpenAI вернула доступ к сервису ChatGPT для пользователей в Италии

Компания сообщила, что внесла изменения, в соответствии с требованиями итальянского регулятора, выдвинутыми им в конце марта. Теперь пользователи веб-версии сервиса, которые подключаются к ChatGPT с итальянского IP-адреса получают уведомление, что пользователи должны подтвердить, что им исполнилось 18 лет или более или им 13 или более лет, а они действуют с согласия родителя или опекуна.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🫡8
Мы тут нашли подробный гайд от Meta AI по self-supervised learning

Это даже не просто гайд, а целый cookbook. В ней можно найти и определения, и историю SSL, и обзоры основных подходов, и всякие инсайдерские трюки по обучению.

Сами Meta в своем анонсе книги назвали SSL "темной материей интеллекта", и "ключевых ингридиентом недавних прорывов".

Сама книга: The self-supervised learning cookbook

😻 #advice #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍5🤩2
ChatGPT лучше врачей?

Как оказалось, чат-бот (по статистике!) справляется с медицинскими консультациями лучше, чем профессиональные врачи. По крайней мере, так говорит исследование, которое опубликовали в журнале JAMA Internal Medicine.

Исследователи проанализировали 195 случайных вопросов и ответов на Reddit, где пользователи обращались к врачам за консультацией. И как оказалось, ChatGPT давал более подробные и чуткие ответы.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🤯8👀1😨1
Установка SQLAlchemy и подключение к базе данных

SQLAclhemy — это де-факто фреймворк для работы с реляционными базами данных в Python. Он был создан Майком Байером в 2005 году. Эту систему используют, например, Reddit, Hulu и Dropbox. Знание SQLAclhemy сейчас важный навык (и требования в вакансиях это подтвердят). Для начала, научимся подключаться к базе данных.

😻 #SQL #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22
Тем временем Kaggle: “Are you still here?????”

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁446👍2
Самый полный репозиторий библиотек Python для Data Science разработчика

Если ты занимаешься Data Science, то знаешь, как важно иметь под рукой нужные инструменты для эффективной работы. Мы тут как раз нашли заметку, в которой перечислены все самые полезные и эффективные библиотеки и модули Python для разных задач. Есть разделы "Очистка и обработка", "Рекомендательные системы", "Временные ряды", "NLP", "Визуализация". Все со ссылками на документацию.

https://analyticsindiamag.com/python-libraries-repository-for-data-science/

😻 #advice #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17