Data Secrets
77.3K subscribers
6.04K photos
592 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
📌 Как работает ИИ в TikTok?

Задумывались, в чем волшебство сенсационного ТикТока, который так всех увлек? Ответ прост - система рекомендаций, поддерживаемая машинным обучением.

В этом переводе известной статьи расскажут про основы, особенности и алгоритмы рекоммендательной системы TikTok. После прочтения точно станет ясно, как TikTok сделал своего пользователя таким зависимым 🔥

👉 Читать

#статьи #рекомендации #AI

Data Secrets
❤‍🔥7👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 Вывод результатов всех операций в Jupyter Notebook

По умолчанию в Jupyter при выполнении ячейки выводится только результат последней операции. Это не всегда удобно. Так вот у нас есть лайфхак 🔥

Чтобы печаталось всё, скопируйте и выполните этот код в вашем блокноте:

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"


Минус подхода в том, что иногда выводиться будет чрезмерно много информации. Чтобы этого избежать, добавьте точку с запятой в конце строки, вывод которой вам не нужен 😉

#рекомендации #IDE

Data Secrets
👍131👏1
👅 Модель распознавания языка

Как человек, ты можешь легко определить, на каком из известных тебе языков написан текст. Но компьютеру это дается не так легко. Например, в Google Translate встроена целая модель машинного обучения для определения языка.

🔥 Мы решили показать, как это работает, в этом колабе. Здесь можно самостоятельно обучить модель и поиграть с ней.

https://colab.research.google.com/github/Veron28/bot_test/blob/master/lang_detection.ipynb

#ML #AI

Data Secrets
👍11🔥2🤯2
📊 SQL: SELECT и компания

Мы продолжаем погружаться в SQL - язык управления базами данных, который необходимо знать каждому анатилику.

🧩 Сегодня разбираемся c самыми важными операторами: SELECT, WHERE и ORDER BY

#SQL #БД

Data Secrets
👍112👏1
Deep Learning_Gibson_Patterson.pdf
14.8 MB
📕 Глубокое обучение с точки зрения практика
✍️ Гибсон, Паттерсон
2018

О сложном простым языком. Авторы сначала раскрывают фундаментальные вопросы глубокого обучения, а затем переходят к библиотеке DL4J, предназначенной для разработки технологических процессов профессионального уровня. В процессе чтения можно с нуля создать нейронную сеть. На реальных примерах читатель познакомится с методами и стратегиями обучения глубоких сетей и с различной архитектурой и их распараллеливания в кластерах.

#литература

Data Secrets
👍7🔥3👏1
🤖 Как прикрутить Google аналитику к Telegram боту на aiogram

Google объявил о закрытии Universal Analytics и полном переходе на Google Analytics 4. Теперь, если ты хочешь получать максимум статистической информации о работе своего бота, поможет именно Google Analytics. Проблема в том, что этот инструмент заточен под сайты...

🧨 Но в этой статье уже рассказали о том, как преодолеть все трудности. В качестве примера используется связка python + aiogram, однако текст актуален и для любого другого решения.

👉 Прочитать можно здесь

#статистика #боты

Data Secrets
👍7
🌲 Посмеется ли друг над мемом и причем тут деревья?

🤪 Ситуация: ты регулярно отправляешь другу мемы, над которыми он либо смеется, либо нет. Ты постепенно изучаешь его поведение и стремишься к тому, чтобы мемы ему всегда нравились. Как этого достичь?

Поведение друга зависит от многих факторов. Отследив их, можно построить дерево решений для предсказания того, посмеется ли человек в очередной раз.

🧩 Построение такого дерева - дело непростое. В нашей новой заметке рассмотрели, как сделать это правильно с помощью Python и даже рассказали, как такое дерево визуализировать

#ML #алгоритмы

Data Secrets
👍10🔥4👏1🤯1
📌 IML – что это?

Модель может отклонить вашу заявку на ипотеку или диагностировать рак. Эти решения имеют последствия и мы ожидаем объяснений. Человек мог бы их дать: у субъекта маленький доход или поражено ряд клеток. А сможет ли так модель? Этот вопрос рассматривает IML – область интерпретируемого машинного обучения.

Есть два типа моделей: белые и черные ящики. Белые ящики позволяют легко проследить "ход решения". А вот черные ящики – это темные лошадки, которые дают результат, но не объясняют его.

Чтобы получить объяснения от черного ящика можно использовать разные методы. Например, использовать дополнительную (суррогатную) модель. Или применять метод перестановок: менять параметры модели и анализировать результаты 💁‍♂️

#ML

Data Secrets
👍63👏1
Учите статистику 🥺
25👍8🔥3
📌 Нормальное распределение

Нормальное (гауссово) распределение - это вероятностное распределение, которое показывает, что данные вблизи среднего встречаются чаще, чем данные, далекие от среднего. На графике оно выглядит как колокол.

Предположение о нормальном распределении применяется например к ценам активов, а также к ценовой деятельности 💰

#статистика

Data Secrets
👍11👏1💯1
📌 3 полезных функции в pandas

В обработке данных для проектов машинного обучения и data science питоновская библиотека Pandas – наш главный друг. Она содержит огромное количество функций, но сегодня мы хотим остановиться на трех супер крутых и на удивление мало известных.

Здесь мы рассказали и показали, как работают функции shift(), mask() и value_counts(). Пользуйся! 😁

#библитеки

Data Secrets
👍63🔥2
⚡️ Прогнозирование цены на электичество

Прогнозирование цены на электроэнергию помогает многим предприятиям понять, какую сумму за электроэнергию они должны выплачивать каждый год.

В этом колабе мы рассмотрим, как сделать такой прогноз с помощью машинного обучения с использованием Python. Используем алгоритм Random Forest и корреляционный анализ.

Обучить самому и поиграть 👉 https://colab.research.google.com/github/Veron28/bot_test/blob/master/ElectricityPricePrediction.ipynb

#ML #прогнозирование

Data Secrets
👍1011❤‍🔥1
🗺 Data Science Roadmap

🍑 Согласно Harvard Business Review, Data Scientist — «самая сексуальная профессия 21 века». Разве этого недостаточно, чтобы узнать больше о науке о данных!

Мы подготовили для тебя дорожную карту по изучению Data Science! Она поможет идти по правильному пути обучения, ничего не пропустить и сохранять мотивацию. Это настоящий рецепт роста 🌱

Желаем успехов!

#рекомендации

Data Secrets
🤯7👍5👏32
📌 Кто такой catBoost?

CatBoost — это библиотека градиентного бустинга, созданная 🌐ндексом. Прогнозы делаются на основе ансамбля слабых обучающих алгоритмов, а именно небрежных деревьев. Вот несколько преимущества использования этой библиотеки:

позволяет использовать категориальные признаки без предварительной обработки
дает отличные результаты с параметрами по умолчанию
под капотом умеет обрабатывать пропущенные значения
можно использовать и для регрессии, и для класссификации

Разбираемся 😌

#библиотеки

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
📢 Смена лиц на видео и фото

Слышал про deep fake? Это означает алгоритм смены лица на фото или видео. Ребята из Сбера на днях опебликовали свою новую разработку в этой области. А мы уже сегодня передаем колаб тебе. С ним можно поиграться и проверить, кому из друзей идет твое лицо 🤪

Выглядит круто! А еще там в конце Илон Маск поет "Never gonna give you up" 🤐

👉 https://colab.research.google.com/github/Veron28/bot_test/blob/master/GHOST_inference.ipynb

#AI #deep_fake

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4😍2❤‍🔥1🔥1
BIG DATA & TOYOTA

Toyota Motor Corp разработала новую ситсему аварийной безопасности, чтобы предотвращать ошибку при нажатии педали газа вместо педали тормоза 🚗

В карточках – краткий перевод статьи, которую можно прочитать здесь.

#big_data #AI

Data Secrets
👍93🔥3
Внедрение моделей машинного обучения в бизнес – как делать красиво?

➡️ Ты пишешь крутую модель машинного обучения.
➡️ Ее покупает большая компания, которая просит тебя задеплоить модель в продакшн.
➡️ Ты справился, модель работает, а заказчик недоволен.

Почему? Скорее всего, ты забыл о важных правилах развертывания моделей в бизнесе. Рассказываем, как делать правильно ✔️

#ML #production

Data Secrets
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7