Data Secrets
77.4K subscribers
6.04K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
🤖 Как прикрутить Google аналитику к Telegram боту на aiogram

Google объявил о закрытии Universal Analytics и полном переходе на Google Analytics 4. Теперь, если ты хочешь получать максимум статистической информации о работе своего бота, поможет именно Google Analytics. Проблема в том, что этот инструмент заточен под сайты...

🧨 Но в этой статье уже рассказали о том, как преодолеть все трудности. В качестве примера используется связка python + aiogram, однако текст актуален и для любого другого решения.

👉 Прочитать можно здесь

#статистика #боты

Data Secrets
👍7
🌲 Посмеется ли друг над мемом и причем тут деревья?

🤪 Ситуация: ты регулярно отправляешь другу мемы, над которыми он либо смеется, либо нет. Ты постепенно изучаешь его поведение и стремишься к тому, чтобы мемы ему всегда нравились. Как этого достичь?

Поведение друга зависит от многих факторов. Отследив их, можно построить дерево решений для предсказания того, посмеется ли человек в очередной раз.

🧩 Построение такого дерева - дело непростое. В нашей новой заметке рассмотрели, как сделать это правильно с помощью Python и даже рассказали, как такое дерево визуализировать

#ML #алгоритмы

Data Secrets
👍10🔥4👏1🤯1
📌 IML – что это?

Модель может отклонить вашу заявку на ипотеку или диагностировать рак. Эти решения имеют последствия и мы ожидаем объяснений. Человек мог бы их дать: у субъекта маленький доход или поражено ряд клеток. А сможет ли так модель? Этот вопрос рассматривает IML – область интерпретируемого машинного обучения.

Есть два типа моделей: белые и черные ящики. Белые ящики позволяют легко проследить "ход решения". А вот черные ящики – это темные лошадки, которые дают результат, но не объясняют его.

Чтобы получить объяснения от черного ящика можно использовать разные методы. Например, использовать дополнительную (суррогатную) модель. Или применять метод перестановок: менять параметры модели и анализировать результаты 💁‍♂️

#ML

Data Secrets
👍63👏1
Учите статистику 🥺
25👍8🔥3
📌 Нормальное распределение

Нормальное (гауссово) распределение - это вероятностное распределение, которое показывает, что данные вблизи среднего встречаются чаще, чем данные, далекие от среднего. На графике оно выглядит как колокол.

Предположение о нормальном распределении применяется например к ценам активов, а также к ценовой деятельности 💰

#статистика

Data Secrets
👍11👏1💯1
📌 3 полезных функции в pandas

В обработке данных для проектов машинного обучения и data science питоновская библиотека Pandas – наш главный друг. Она содержит огромное количество функций, но сегодня мы хотим остановиться на трех супер крутых и на удивление мало известных.

Здесь мы рассказали и показали, как работают функции shift(), mask() и value_counts(). Пользуйся! 😁

#библитеки

Data Secrets
👍63🔥2
⚡️ Прогнозирование цены на электичество

Прогнозирование цены на электроэнергию помогает многим предприятиям понять, какую сумму за электроэнергию они должны выплачивать каждый год.

В этом колабе мы рассмотрим, как сделать такой прогноз с помощью машинного обучения с использованием Python. Используем алгоритм Random Forest и корреляционный анализ.

Обучить самому и поиграть 👉 https://colab.research.google.com/github/Veron28/bot_test/blob/master/ElectricityPricePrediction.ipynb

#ML #прогнозирование

Data Secrets
👍1011❤‍🔥1
🗺 Data Science Roadmap

🍑 Согласно Harvard Business Review, Data Scientist — «самая сексуальная профессия 21 века». Разве этого недостаточно, чтобы узнать больше о науке о данных!

Мы подготовили для тебя дорожную карту по изучению Data Science! Она поможет идти по правильному пути обучения, ничего не пропустить и сохранять мотивацию. Это настоящий рецепт роста 🌱

Желаем успехов!

#рекомендации

Data Secrets
🤯7👍5👏32
📌 Кто такой catBoost?

CatBoost — это библиотека градиентного бустинга, созданная 🌐ндексом. Прогнозы делаются на основе ансамбля слабых обучающих алгоритмов, а именно небрежных деревьев. Вот несколько преимущества использования этой библиотеки:

позволяет использовать категориальные признаки без предварительной обработки
дает отличные результаты с параметрами по умолчанию
под капотом умеет обрабатывать пропущенные значения
можно использовать и для регрессии, и для класссификации

Разбираемся 😌

#библиотеки

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
📢 Смена лиц на видео и фото

Слышал про deep fake? Это означает алгоритм смены лица на фото или видео. Ребята из Сбера на днях опебликовали свою новую разработку в этой области. А мы уже сегодня передаем колаб тебе. С ним можно поиграться и проверить, кому из друзей идет твое лицо 🤪

Выглядит круто! А еще там в конце Илон Маск поет "Never gonna give you up" 🤐

👉 https://colab.research.google.com/github/Veron28/bot_test/blob/master/GHOST_inference.ipynb

#AI #deep_fake

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4😍2❤‍🔥1🔥1
BIG DATA & TOYOTA

Toyota Motor Corp разработала новую ситсему аварийной безопасности, чтобы предотвращать ошибку при нажатии педали газа вместо педали тормоза 🚗

В карточках – краткий перевод статьи, которую можно прочитать здесь.

#big_data #AI

Data Secrets
👍93🔥3
Внедрение моделей машинного обучения в бизнес – как делать красиво?

➡️ Ты пишешь крутую модель машинного обучения.
➡️ Ее покупает большая компания, которая просит тебя задеплоить модель в продакшн.
➡️ Ты справился, модель работает, а заказчик недоволен.

Почему? Скорее всего, ты забыл о важных правилах развертывания моделей в бизнесе. Рассказываем, как делать правильно ✔️

#ML #production

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Tesla опять всех шокировала?

На ежегодной конференции Tesla AI Day 2022 на сцене появился робот-гуманоид, который самостоятельно прогулялся и даже станцевал. Зрителям также показали видео, как он поливает цветы и носит коробки 🦋

Винтики и провода пока торчат во все стороны, но показан был так же робот следующего поколения Optimus. Он пока не может ходить, но выглядит симпатичнее.

💥 Несмотря на все недостатки роботов, Tesla добилась таких результатов всего за год – и это поражает.

👉 Посмотреть хайлайт с презентации можно здесь

P.S. По традиции, Илон Маск не смог обойти стороной утопические рассуждения о светлом будущем. По его словам, роботы Tesla помогут построить общество изобилия, в котором не будет бедности.

#AI #робототехника #новости

Data Secrets
👍5🔥31
✔️ Все инструменты визуализации временных рядов

Анализ временных рядов не может обойтись без визуализации. Все знают, один график может заменить многостраничный отчет.

Мы подготовили отличное пособие, в котором:

👩‍💻 Анализируем фондовый рынок S&P 500
👩‍💻 Строим базовые диаграммы, анализируем временной ряд
👩‍💻 Выстраиваем и визуализируем сезонность
👩‍💻 Группируем данные по разным промежуткам времени в диаграммах
👩‍💻 Отображаем тренд на графике

Поиграть -> https://colab.research.google.com/github/Veron28/bot_test/blob/master/TimeSeriesVisualization.ipynb

#временные_ряды #визуализация

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7😍5🔥2
big data 😱
👍14🔥4🤯41
Data_Science_Keti_ONil_Reychel_Shatt.pdf
9.8 MB
📕 Data Science. Инсайдерская информация для новичков.
✍️ Кэти О'Нил, Рэйчел Шатт
2019

Книга основана на вводном курсе по Data Science из Колумбийского университета. Ты узнаешь о байесовском методе, визуализации данных, статистических алгоритмах, рекомендательных движках, MapReduce и финансовом моделировании. Есть примеры на 💩 и 🐍

#литература

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93