PythonDigest
1.9K subscribers
23 photos
1 video
16.8K links
Сборник Python новостей: https://pythondigest.ru

Наш IT-тренажер: https://app.incidenta.tech/

Создано в @incidenta_tech
Download Telegram
[Видео] Новости мира Python за июнь 2025
https://www.youtube.com/watch?v=4nQ_QQkVSJE
Статус: в неточном поиске (fuzzy match)
https://ift.tt/pLe2gy8

Задача нахождения неточных дубликатов текстовых строк - удивительно часто встречается на практике.Нахождение неточных дубликатов позволяет лучше понять структуру списка, повысить его качество (удаление дубликатов), провести техническую кластеризацию (выделить группы похожих). Всё это видно на графе выше.Но приключения начинаются, когда список становится размером несколько миллионов строк. 
Talk Python to Me: #512: Building a JIT Compiler for CPython
https://ift.tt/eclnXHr

Audio
Сравнение форматов PNG: от первой до третьей редакции
https://ift.tt/J53TBCe

Недавно опубликованная третья редакция спецификации Portable Network Graphics (PNG) 2025 года, разработанная World Wide Web Consortium (W3C), привлекла внимание к эволюции этого формата (W3C PNG Specification (Third Edition, 2025)). Ранее я, как и многие, использовал PNG, не задумываясь о его развитии и различных редакциях. Углубившись в изучение спецификаций PNG (1996, 2003, 2025), я решил подготовить данную статью, чтобы обобщить ключевые изменения и их значение для веб-дизайна, разработки игр и мультимедиа.
Процедурная генерация воксельных рогаликовых уровней
https://ift.tt/TmzLQjw

Процедурная генерация воксельных рогаликовых уровней с использованием клеточных автоматов и алгоритмов работы с сеткой ячеек на Python. Описана начальная генерация уровней, их упорядочивание, прокладка путей.
Работа с данными в DuckDB или не pandas’ом единым сыт DS
https://ift.tt/mVYXsLG

В проектах по разработке ML-моделей я регулярно сталкиваюсь с тем, что значительная часть времени уходит не на саму модель, а на приведение данных в нужный формат: очистку, трансформацию, агрегацию.Этот этап требует не только времени, но и вычислительных ресурсов, особенно когда речь идет о больших объемах информации. В этой статье я расскажу о своем небольшом исследовании DuckDB — инструменте, который может значительно упростить и ускорить работу с данными.
Intro to GIS Programming: A Practical Python Guide to OSS Geospatial Tools
https://ift.tt/tWNH7fq
#python #pydigest
IT-новости про Python перед вами.

Часть материалов из выпуска Python Дайджест:

- Как понять что свинюшка готова к любви? Определяем через ML
- Как я проектирую и разрабатываю реальные расширения для Python на Rust
- Как мы научили ИИ читать PDF и экономить сотни рабочих часов
- Как я собираю AI-интервьюера, чтобы имитировать собеседования
- Оживляем данные Strava: от парсинга GPX до карты
- Электронный курвиметр
- KEKS кодек и криптографические сообщения
- Django - 5.2.4
- coverage - 7.9.2

Заходите в гости - https://pythondigest.ru/issue/603/
Сводка от pythonz 29.06.2025 — 06.07.2025
https://ift.tt/m56pJA1

А теперь о том, что происходило в последнее время на других ресурсах.
Милливольтметр на экране ПК: простое решение
https://ift.tt/dbqAeiF

Данная заметка посвящена решению несложной задачи: измерить и вывести на экран ПК пару значений постоянного напряжения. В качестве измерителя используется готовое изделие: плата 16-канального 12-разрядного АЦП с USB интерфейсом на базе микроконтроллера STM32.
OpenDerisk - AI-Native Risk Intelligence Systems
https://ift.tt/bho2e6U
Wiki-хак для SEO: находим брошенные домены и передаём их силу вашему сайту
https://ift.tt/V3dC4mO

Расскажу, как работает метод перелива веса с Wikipedia через редирект. Разберу готовый Python-скрипт для автоматического поиска таких доменов. Дам рекомендации по дальнейшей работе с найденными доменами.
1
Создаем датасет печатных букв с любым шрифтом за 170 строк
https://ift.tt/vajdy5l

В этой работе разбирается простой способ генерации изображений букв для подготовки данных для обучения нейронной сети для классификации (распознавания) букв русского алфавита.
The Real Python Podcast – Episode #256: Solving Problems and Saving Time in Chemistry With Python
https://ift.tt/I45tkxu
[Видео] 100 Million Parking Transactions Per Year with Django
https://ift.tt/7eY4xp0

For several Dutch municipalities, Django applications power the monitoring of both on-street and off-street parking transactions. What started as a straightforward tool for extracting data from parking facilities has evolved into a robust ETL platform with a feature-rich dashboard. This talk delves into how Django remains the backbone of our operations and why it continues to be the foundation of our business success.
Оживляем данные Strava: от парсинга GPX до интерактивной карты на Python и JS
https://ift.tt/yFpDHu4

В этой статье я хочу провести вас «под капот» моего проекта и показать на реальных фрагментах кода, как с помощью Python, щепотки NumPy и капли JavaScript можно построить собственный мощный инструмент для анализа спортивных данных. Это история не только про код, но и про философию открытых данных и желание сделать профессиональные инструменты доступными для всех.
Как производили подсчет объема древесины с помощью Computer Vision
https://ift.tt/xSJobyr

Отвечу почему мужик с линейкой не подойдет и почему нельзя просто взвесить Камаз до и после погрузки.
Про книгу Стефани Стимак «Дизайн для разработчиков»
https://ift.tt/5Tj9lH3

Захотелось мне обновить свои знания по фронтенд-разработке, которые у меня застряли на уровне CSS времен Internet Explorer 6 9, а также принципов веб-дизайна примерно тех же годов. Начать решил с книги Стефани Стимак «Дизайн для разработчиков». Судя по названию, это должна была быть именно та книга, которая мне нужна.
Скрипт, который следит за тобой: автоматический аудит действий в Linux
https://ift.tt/IwvQBiu

В статье хочу разобрать auditd - полезный инструмент аудита в Linux, который записывает каждое действие, а скрипт превратит логи в читаемые отчёты и алерты.
1
От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей
https://ift.tt/4aQCPwH

Что такое дообучение LLM и зачем оно нужно?Дообучение больших языковых моделей (LLM) — это способ адаптировать их под свои задачи, сделать их умнее на своих данных и сэкономить ресурсы.Когда стоит дообучать, а когда хватит prompt engineering или RAG? Если задача уникальная или данных много — дообучай. Если задача простая — попробуй сначала промпты.