PythonDigest
1.89K subscribers
23 photos
1 video
17.2K links
Сборник Python новостей: https://pythondigest.ru

Наш IT-тренажер: https://app.incidenta.tech/

Создано в @incidenta_tech
Download Telegram
Как я понял, что ем много сладкого, или классификация товаров по чекам в приложении
https://habr.com/post/430216/?utm_campaign=430216

В этой статье мы хотим рассказать, как мы создали решение для классификации названий продуктов из чеков в приложении для учёта расходов по чекам и помощника по покупкам. Мы хотели дать пользователям возможность просматривать статистику по покупкам, собранную автоматически на основе отсканированных чеков, а именно распределить все купленные пользователем товары по категориям. Потому что заставлять пользователя самостоятельно группировать товары — это уже прошлый век. Есть несколько подходов для решения такой задачи: можно попробовать применить алгоритмы кластеризации с разными способами векторного представления слов или классические алгоритмы классификации. Ничего нового мы не изобрели и в этой статье лишь хотим поделиться небольшим гайдом о возможном решении задачи, примерами того, как делать не надо, анализом того, почему не сработали другие методы и с какими проблемами можно столкнуться в процессе.
Python Bytes: #104 API Evolution the Right Way
https://pythonbytes.fm/episodes/show/104/api-evolution-the-right-way

Аудио-подкаст
redo - простая build система
http://github.com/apenwarr/redo
StackOverflow: интересные вопросы за неделю (clii)
http://python-weekly.blogspot.com/2018/11/clii-stackoverflow-python-report.html
VotingClassifier в sсikit-learn: построение и оптимизация ансамбля моделей классификации
https://habr.com/post/430280/?utm_campaign=430280

В рамках реализации большой задачи по Sentiment Analysis (анализ отзывов) я решил уделить некоторое время дополнительному изучению её отдельного элемента — использованию VotingClassifier из модуля sklearn.ensemble как инструмента для построения ансамбля моделей классификации и повышению итогового качества предсказаний. Почему это важно и какие есть нюансы?
Python Meetup Chelyabinsk #4
https://pychel.timepad.ru/event/846332/
DoodleMaster - "Don't code your UI, Draw it !"
http://github.com/karanchahal/DoodleMaster
Test and Code: 53: Seven Databases in Seven Weeks - Luc Perkins
https://testandcode.com/53

Аудио-подкаст
Интерактивная визуализация данных с Bokeh
https://realpython.com/python-data-visualization-bokeh/
ValidX — быстрый (возможно самый быстрый), мощный и гибкий валидатор данных
https://validx.readthedocs.io/en/latest/
Генерируем тестовые данные для юнит тестов с помощью Faker
https://semaphoreci.com/community/tutorials/generating-fake-data-for-python-unit-tests-with-faker
Нагрузочное тестирование с locust
https://habr.com/post/430502/?utm_campaign=430502

Нагрузочное тестирование не так сильно востребовано и распространено, как иные виды тестирования — инструментов, позволяющих, провести такое тестирование, не так много а простых и удобных вообще можно пересчитать на пальцах одной руки.


Когда речь заходить о тестировании производительности — в первую очередь все думают о JMeter’е — он бесспорно остается самым известным инструментом с самым большим количеством плагинов. Мне же JMeter никогда не нравился из-за неочевидного интерфейса и высокого порога вхождения, как только возникает необходимость протестировать не Hello World приложение.


И вот, окрыленный успехом проведения тестирования в двух различных проектах, решил поделится информацией об относительно простом и удобном софте — Locust (https://locust.io/)
[Перевод] Программирование с PyUSB 1.0
https://habr.com/post/430528/?utm_campaign=430528

PyUSB 1.0 — это библиотека Python (http://www.python.org/) обеспечивающая легкий доступ к USB (http://www.usb.org/). PyUSB предоставляет различные функции