Data Secrets
77.4K subscribers
6.05K photos
593 videos
20 files
2.43K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Data Secrets
PyTorch: градиенты Плюсы: Интерфейс в Python-стиле. Простое и быстрое внесение изменений и экспериментирование (связано с использованием динамических вычислительных графов). #PyTorch
PyTorch 📏

Одним из достоинств PyTorch это то, что он использует динамические вычислительные графы, в отличие от того TensorFlow, который использует статические графы.

#PyTorch
👍9
Keras: функциональное API 🤖

Keras — это библиотека для языка программирования Python, которая предназначена для глубокого машинного обучения. Она позволяет быстрее создавать и настраивать модели — схемы, по которым распространяется и подсчитывается информация при обучении. Но сложных математических вычислений Keras не выполняет и используется как надстройка над другими библиотеками.

#Keras

012
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥2
Gensim: что это? 🤖

Gensim может работать с большими текстовыми коллекциями. Этим она отличается от других программных библиотек машинного обучения, ориентированных на обработку в памяти. GenSim также предоставляет эффективные многоядерные реализации различных алгоритмов для увеличения скорости обработки. В нее добавлены более удобные средства для обработки текста, чем у конкурентов, таких как Scikit-learn, R и т. д.

GenSim поддерживает методы тематического моделирования, например:

Латентно-семантический анализ (LSI)
Латентное размещение Дирихле (LDA)

Делаем детальный разбор по библиотеке?

#Gensim
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥6❤‍🔥3
Apache AirFlow 💻

Apache AirFlow — это open-source инструмент, который позволяет разрабатывать, планировать и осуществлять мониторинг сложных рабочих процессов. Главной особенностью является то, что для описания процессов используется язык программирования Python.

#AirFlow
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💻16👍8🔥3
Шпаргалка MatPlotlib.pdf
1 MB
Шпаргалка по визуализации данных
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🔥5
Введение в PySpark: ЧАСТЬ 4 🔄

PySpark — это интерфейс для Apache Spark в Python. Он не только позволяет писать приложения Spark с использованием API-интерфейсов Python, но также предоставляет оболочку PySpark для интерактивного анализа данных в распределенной среде. PySpark поддерживает большинство функций Spark, таких как Spark SQL, DataFrame, Streaming, MLlib и Spark Core.

#PySpark

012
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92👀2
Не можете найти работу после курса по Data Science, потому что не хватает реального опыта?

Применить новые знания на практике и подготовиться к работе поможет Симулятор аналитика.

Симулятор — это мостик между обучением и вашей первой работой.

Представьте, что вы устроились в молодой стартап. Ваша задача — с нуля выстроить процессы под руководством ведущего аналитика Анатолия Карпова.

За 5 недель вы научитесь строить realtime дашборды, автоматизировать поиск аномалий в данных, анализировать продуктовые метрики, планировать и запускать A/B-тесты и сможете подготовиться к реальной работе.

А в конце наши HR помогут вам получить заветный оффер.

Записывайтесь на Симулятор до 27 февраля!
🔥5👌2
DataSpell 📱

DataSpell — это интегрированная среда разработки (IDE), предназначенная для конкретных задач исследовательского анализа данных и создания прототипов моделей ML (машинного обучения).

Служит неплохой альтернативой Jupyter Notebook.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18