Напишем и поймем Decision Tree на Python с нуля! Часть 5. Информационная энтропия
https://habr.com/ru/post/526460/?utm_campaign=526460&utm_source=habrahabr&utm_medium=rss
При создании дерева решений из данных алгоритм ID3 использует индекс, называемый информационной энтропией, чтобы определить, какой атрибут следует использовать для ветвления с наиболее эффективным распределением данных.
В начале, определимся с понятием объем информации. Интуитивно понятно, что объем данных = сложность, запутанность данных. Дерево решений собирает данные с одинаковыми значениями классов с каждого ветвления, таким образом снижая степень запутанности значений класса. Следовательно, при выборе атрибута, согласно которому лучше всего проводить ветвление, опираться стоит на то, насколько простыми стали данные после разветвления.
https://habr.com/ru/post/526460/?utm_campaign=526460&utm_source=habrahabr&utm_medium=rss
При создании дерева решений из данных алгоритм ID3 использует индекс, называемый информационной энтропией, чтобы определить, какой атрибут следует использовать для ветвления с наиболее эффективным распределением данных.
В начале, определимся с понятием объем информации. Интуитивно понятно, что объем данных = сложность, запутанность данных. Дерево решений собирает данные с одинаковыми значениями классов с каждого ветвления, таким образом снижая степень запутанности значений класса. Следовательно, при выборе атрибута, согласно которому лучше всего проводить ветвление, опираться стоит на то, насколько простыми стали данные после разветвления.
Понимание деревьев решений в машинном обучении и их реализация с помощью Python
https://habr.com/ru/post/526970/?utm_campaign=526970&utm_source=habrahabr&utm_medium=rss
Дерево решений — тип контролируемого машинного обучения, который в основном используется в задачах классификации. Дерево решений само по себе — это в основном жадное, нисходящее, рекурсивное разбиение. «Жадное», потому что на каждом шагу выбирается лучшее разбиение. «Сверху вниз» — потому что мы начинаем с корневого узла, который содержит все записи, а затем делается разбиение.
https://habr.com/ru/post/526970/?utm_campaign=526970&utm_source=habrahabr&utm_medium=rss
Дерево решений — тип контролируемого машинного обучения, который в основном используется в задачах классификации. Дерево решений само по себе — это в основном жадное, нисходящее, рекурсивное разбиение. «Жадное», потому что на каждом шагу выбирается лучшее разбиение. «Сверху вниз» — потому что мы начинаем с корневого узла, который содержит все записи, а затем делается разбиение.
OpenCV Super Resolution with Deep Learning
https://www.pyimagesearch.com/2020/11/09/opencv-super-resolution-with-deep-learning/
https://www.pyimagesearch.com/2020/11/09/opencv-super-resolution-with-deep-learning/
Sentiment Analysis With Python to Classify Movie Reviews
https://realpython.com/sentiment-analysis-python/
https://realpython.com/sentiment-analysis-python/
Дополнительные компоненты для кроссплатформеннной библиотеки материального дизайна KivyMD
https://habr.com/ru/post/527194/?utm_campaign=527194&utm_source=habrahabr&utm_medium=rss
Совсем недавно мы (команда разработчиков KivyMD) создали на GitHub KivyMD-Extension (https://github.com/kivymd-extensions) — организацию, в которой размещаются репозитории пользовательских дополнений для библиотеки KivyMD. Это пакеты компонентов, которые не связаны напрямую со спецификацией материального дизайна, но используют под капотом библиотеку KivyMD и существенно расширяют ее. О нескольких таких пакетах я расскажу сегодня.
https://habr.com/ru/post/527194/?utm_campaign=527194&utm_source=habrahabr&utm_medium=rss
Совсем недавно мы (команда разработчиков KivyMD) создали на GitHub KivyMD-Extension (https://github.com/kivymd-extensions) — организацию, в которой размещаются репозитории пользовательских дополнений для библиотеки KivyMD. Это пакеты компонентов, которые не связаны напрямую со спецификацией материального дизайна, но используют под капотом библиотеку KivyMD и существенно расширяют ее. О нескольких таких пакетах я расскажу сегодня.
Talk Python to Me: #289 Disovering exoplanets with Python
https://talkpython.fm/episodes/show/289/disovering-exoplanets-with-python
Audio
https://talkpython.fm/episodes/show/289/disovering-exoplanets-with-python
Audio
Podcast.__init__: Making The Case For A (Semi) Formal Specification Of CPython - Episode 288
https://www.pythonpodcast.com/cpython-formal-specification-episode-288/
Audio
https://www.pythonpodcast.com/cpython-formal-specification-episode-288/
Audio
Умная нормализация данных
https://habr.com/ru/post/527334/?utm_campaign=527334&utm_source=habrahabr&utm_medium=rss
https://habr.com/ru/post/527334/?utm_campaign=527334&utm_source=habrahabr&utm_medium=rss
Python⇒Speed: Optimizing your code is not the same as parallelizing your code
https://pythonspeed.com/articles/do-you-need-cluster-or-multiprocessing/
https://pythonspeed.com/articles/do-you-need-cluster-or-multiprocessing/
Talk Python to Me: #289 Discovering exoplanets with Python
https://talkpython.fm/episodes/show/289/discovering-exoplanets-with-python
Audio
https://talkpython.fm/episodes/show/289/discovering-exoplanets-with-python
Audio
Архитектура облачного волейбольного сервиса
https://habr.com/ru/post/524388/?utm_campaign=524388&utm_source=habrahabr&utm_medium=rss
Не так давно я писал про волейбольный сервис (https://habr.com/ru/post/516448/), теперь пришло время описать его с технической точки зрения.
Возможно, общественное сознание найдет изъяны в архитектуре и подтолкнет к лучшим решениям.
https://habr.com/ru/post/524388/?utm_campaign=524388&utm_source=habrahabr&utm_medium=rss
Не так давно я писал про волейбольный сервис (https://habr.com/ru/post/516448/), теперь пришло время описать его с технической точки зрения.
Возможно, общественное сознание найдет изъяны в архитектуре и подтолкнет к лучшим решениям.
Быстрый градиентный бустинг с CatBoost
https://habr.com/ru/post/527554/?utm_campaign=527554&utm_source=habrahabr&utm_medium=rss
В градиентном бустинге прогнозы делаются на основе ансамбля слабых обучающих алгоритмов. В отличие от случайного леса, который создает дерево решений для каждой выборки, в градиентном бустинге деревья создаются последовательно. Предыдущие деревья в модели не изменяются. Результаты предыдущего дерева используются для улучшения последующего. В этой статье мы подробнее познакомимся с библиотекой градиентного бустинга под названием CatBoost.
https://habr.com/ru/post/527554/?utm_campaign=527554&utm_source=habrahabr&utm_medium=rss
В градиентном бустинге прогнозы делаются на основе ансамбля слабых обучающих алгоритмов. В отличие от случайного леса, который создает дерево решений для каждой выборки, в градиентном бустинге деревья создаются последовательно. Предыдущие деревья в модели не изменяются. Результаты предыдущего дерева используются для улучшения последующего. В этой статье мы подробнее познакомимся с библиотекой градиентного бустинга под названием CatBoost.
Python API в Delta Lake — простые и надежные операции Upsert и Delete
https://habr.com/ru/post/527602/?utm_campaign=527602&utm_source=habrahabr&utm_medium=rss
Мы рады объявить о релизе Delta Lake (http://delta.io/) 0.4.0, в котором представлен Python API, улучшающий манипулирование и управление данными в Delta-таблицах.
https://habr.com/ru/post/527602/?utm_campaign=527602&utm_source=habrahabr&utm_medium=rss
Мы рады объявить о релизе Delta Lake (http://delta.io/) 0.4.0, в котором представлен Python API, улучшающий манипулирование и управление данными в Delta-таблицах.
WhiteNoise Shenanigans - Building SaaS #79
https://www.mattlayman.com/building-saas/whitenoise-shenanigans/
https://www.mattlayman.com/building-saas/whitenoise-shenanigans/
Используем QProcess для запуска фоновых задач в Qt приложении
https://www.learnpyqt.com/tutorials/qprocess-external-programs/
https://www.learnpyqt.com/tutorials/qprocess-external-programs/
Умная нормализация данных: категориальные и порядковые данные, “парные” признаки
https://habr.com/ru/post/527860/?utm_campaign=527860&utm_source=habrahabr&utm_medium=rss
Эта статья внеплановая. В прошлый раз (https://habr.com/ru/post/527334/) я рассматривал нюансы и проблемы различных методов нормализации данных. И только после публикации понял, что не упомянул некоторые важные детали. Кому-то они покажутся очевидными, но, по-моему, лучше сказать об этом явно.
https://habr.com/ru/post/527860/?utm_campaign=527860&utm_source=habrahabr&utm_medium=rss
Эта статья внеплановая. В прошлый раз (https://habr.com/ru/post/527334/) я рассматривал нюансы и проблемы различных методов нормализации данных. И только после публикации понял, что не упомянул некоторые важные детали. Кому-то они покажутся очевидными, но, по-моему, лучше сказать об этом явно.
The Real Python Podcast – Episode #35: Security and Authorization in Your Python Web Applications
https://realpython.com/podcasts/rpp/35/
https://realpython.com/podcasts/rpp/35/
Talk Python to Me: #290 Side Hustles for Data Scientists
https://talkpython.fm/episodes/show/290/side-hustles-for-data-scientists
Audio
https://talkpython.fm/episodes/show/290/side-hustles-for-data-scientists
Audio
Guido Van Rossom (создатель Python) присоединяется к Microsoft
https://www.blog.pythonlibrary.org/2020/11/13/pythons-creator-guido-van-rossom-joins-microsoft/
https://www.blog.pythonlibrary.org/2020/11/13/pythons-creator-guido-van-rossom-joins-microsoft/
Python Bytes: #207 FastAPI as a web platform (not just APIs)
https://pythonbytes.fm/episodes/show/207/fastapi-as-a-web-platform-not-just-apis
https://pythonbytes.fm/episodes/show/207/fastapi-as-a-web-platform-not-just-apis
Как правильно и легко рассчитать прибыль на инвестиции или калькулятор ROI на python
https://habr.com/ru/post/527722/?utm_campaign=527722&utm_source=habrahabr&utm_medium=rss
https://habr.com/ru/post/527722/?utm_campaign=527722&utm_source=habrahabr&utm_medium=rss