PythonDigest
1.89K subscribers
23 photos
1 video
17.2K links
Сборник Python новостей: https://pythondigest.ru

Наш IT-тренажер: https://app.incidenta.tech/

Создано в @incidenta_tech
Download Telegram
Напишем и поймем Decision Tree на Python с нуля! Часть 5. Информационная энтропия
https://habr.com/ru/post/526460/?utm_campaign=526460&utm_source=habrahabr&utm_medium=rss

При создании дерева решений из данных алгоритм ID3 использует индекс, называемый информационной энтропией, чтобы определить, какой атрибут следует использовать для ветвления с наиболее эффективным распределением данных.


В начале, определимся с понятием объем информации. Интуитивно понятно, что объем данных = сложность, запутанность данных. Дерево решений собирает данные с одинаковыми значениями классов с каждого ветвления, таким образом снижая степень запутанности значений класса. Следовательно, при выборе атрибута, согласно которому лучше всего проводить ветвление, опираться стоит на то, насколько простыми стали данные после разветвления.
Понимание деревьев решений в машинном обучении и их реализация с помощью Python
https://habr.com/ru/post/526970/?utm_campaign=526970&utm_source=habrahabr&utm_medium=rss

Дерево решений — тип контролируемого машинного обучения, который в основном используется в задачах классификации. Дерево решений само по себе — это в основном жадное, нисходящее, рекурсивное разбиение. «Жадное», потому что на каждом шагу выбирается лучшее разбиение. «Сверху вниз» — потому что мы начинаем с корневого узла, который содержит все записи, а затем делается разбиение.
Sentiment Analysis With Python to Classify Movie Reviews
https://realpython.com/sentiment-analysis-python/
Дополнительные компоненты для кроссплатформеннной библиотеки материального дизайна KivyMD
https://habr.com/ru/post/527194/?utm_campaign=527194&utm_source=habrahabr&utm_medium=rss

Совсем недавно мы (команда разработчиков KivyMD) создали на GitHub KivyMD-Extension (https://github.com/kivymd-extensions) — организацию, в которой размещаются репозитории пользовательских дополнений для библиотеки KivyMD. Это пакеты компонентов, которые не связаны напрямую со спецификацией материального дизайна, но используют под капотом библиотеку KivyMD и существенно расширяют ее. О нескольких таких пакетах я расскажу сегодня.
Talk Python to Me: #289 Disovering exoplanets with Python
https://talkpython.fm/episodes/show/289/disovering-exoplanets-with-python

Audio
Podcast.__init__: Making The Case For A (Semi) Formal Specification Of CPython - Episode 288
https://www.pythonpodcast.com/cpython-formal-specification-episode-288/

Audio
Python⇒Speed: Optimizing your code is not the same as parallelizing your code
https://pythonspeed.com/articles/do-you-need-cluster-or-multiprocessing/
Talk Python to Me: #289 Discovering exoplanets with Python
https://talkpython.fm/episodes/show/289/discovering-exoplanets-with-python

Audio
Архитектура облачного волейбольного сервиса
https://habr.com/ru/post/524388/?utm_campaign=524388&utm_source=habrahabr&utm_medium=rss

Не так давно я писал про волейбольный сервис (https://habr.com/ru/post/516448/), теперь пришло время описать его с технической точки зрения.


Возможно, общественное сознание найдет изъяны в архитектуре и подтолкнет к лучшим решениям.
Быстрый градиентный бустинг с CatBoost
https://habr.com/ru/post/527554/?utm_campaign=527554&utm_source=habrahabr&utm_medium=rss

 В градиентном бустинге прогнозы делаются на основе ансамбля слабых обучающих алгоритмов. В отличие от случайного леса, который создает дерево решений для каждой выборки, в градиентном бустинге деревья создаются последовательно. Предыдущие деревья в модели не изменяются. Результаты предыдущего дерева используются для улучшения последующего. В этой статье мы подробнее познакомимся с библиотекой градиентного бустинга под названием CatBoost.
Python API в Delta Lake — простые и надежные операции Upsert и Delete
https://habr.com/ru/post/527602/?utm_campaign=527602&utm_source=habrahabr&utm_medium=rss

Мы рады объявить о релизе Delta Lake (http://delta.io/) 0.4.0, в котором представлен Python API, улучшающий манипулирование и управление данными в Delta-таблицах.
Используем QProcess для запуска фоновых задач в Qt приложении
https://www.learnpyqt.com/tutorials/qprocess-external-programs/
Умная нормализация данных: категориальные и порядковые данные, “парные” признаки
https://habr.com/ru/post/527860/?utm_campaign=527860&utm_source=habrahabr&utm_medium=rss

Эта статья внеплановая. В прошлый раз (https://habr.com/ru/post/527334/) я рассматривал нюансы и проблемы различных методов нормализации данных. И только после публикации понял, что не упомянул некоторые важные детали. Кому-то они покажутся очевидными, но, по-моему, лучше сказать об этом явно.
The Real Python Podcast – Episode #35: Security and Authorization in Your Python Web Applications
https://realpython.com/podcasts/rpp/35/
Talk Python to Me: #290 Side Hustles for Data Scientists
https://talkpython.fm/episodes/show/290/side-hustles-for-data-scientists

Audio
Guido Van Rossom (создатель Python) присоединяется к Microsoft
https://www.blog.pythonlibrary.org/2020/11/13/pythons-creator-guido-van-rossom-joins-microsoft/
Python Bytes: #207 FastAPI as a web platform (not just APIs)
https://pythonbytes.fm/episodes/show/207/fastapi-as-a-web-platform-not-just-apis
Как правильно и легко рассчитать прибыль на инвестиции или калькулятор ROI на python
https://habr.com/ru/post/527722/?utm_campaign=527722&utm_source=habrahabr&utm_medium=rss