Managing Shared Data Science Code With Git Submodules
https://codecut.ai/managing-shared-data-science-code-git-submodules/
Learn how to manage shared code across projects using Git submodules. Prevent version drift, maintain reproducible workflows, and support team collaboration with practical examples.
https://codecut.ai/managing-shared-data-science-code-git-submodules/
Learn how to manage shared code across projects using Git submodules. Prevent version drift, maintain reproducible workflows, and support team collaboration with practical examples.
py2many: Transpiler of Python to Many Other Languages
https://github.com/py2many/py2many
https://github.com/py2many/py2many
Ускоряем pandas, не переписывая код. Мой опыт с FireDucks
https://habr.com/ru/companies/ozontech/articles/1005590/
В своей работе я часто сталкиваюсь с проблемой масштабируемости в pandas. Код, который быстро работает на гигабайте данных, начинает невыносимо тормозить на десяти. Уверен, эта боль знакома многим.
https://habr.com/ru/companies/ozontech/articles/1005590/
В своей работе я часто сталкиваюсь с проблемой масштабируемости в pandas. Код, который быстро работает на гигабайте данных, начинает невыносимо тормозить на десяти. Уверен, эта боль знакома многим.
Векторный поиск в PostgreSQL: PGVector, SQLAlchemy и FastAPI
https://habr.com/ru/articles/1006364/
Реализуем сервис семантического поиска на базе PostgreSQL с расширением PGVector. В статье: настройка БД через Docker, миграции Alembic, асинхронный слой на SQLAlchemy и API на FastAPI.
https://habr.com/ru/articles/1006364/
Реализуем сервис семантического поиска на базе PostgreSQL с расширением PGVector. В статье: настройка БД через Docker, миграции Alembic, асинхронный слой на SQLAlchemy и API на FastAPI.
Propensity Score Matching: как строить аналоги A/B-тестов, когда эксперименты невозможны
https://habr.com/ru/companies/yandex/articles/1004060/
В этой статье я расскажу, как мы применяли PSM (Propensity Score Matching) — статистический метод, который позволяет корректно сравнивать группы, уменьшая систематические различия между ними. Подробно разберу, как выровнять группы теста и контроля с помощью PSM, расскажу о типичных ошибках (например, утечке признаков), дам практические рекомендации по сбору и выбору фич для мэтчинга, а также покажу, как валидировать полученные результаты и оценить их достоверность.
https://habr.com/ru/companies/yandex/articles/1004060/
В этой статье я расскажу, как мы применяли PSM (Propensity Score Matching) — статистический метод, который позволяет корректно сравнивать группы, уменьшая систематические различия между ними. Подробно разберу, как выровнять группы теста и контроля с помощью PSM, расскажу о типичных ошибках (например, утечке признаков), дам практические рекомендации по сбору и выбору фич для мэтчинга, а также покажу, как валидировать полученные результаты и оценить их достоверность.
Как мы сделали AI code review через Ollama без облака?
https://habr.com/ru/articles/1006258/
Как запустить AI code review по git diff на своей машине через Ollama - без облака и API-ключей? Установка, конфиг и пример отчёта.
https://habr.com/ru/articles/1006258/
Как запустить AI code review по git diff на своей машине через Ollama - без облака и API-ключей? Установка, конфиг и пример отчёта.
🤡1
Научил ИИ-агента помнить важное и забывать лишнее в SQLite
https://habr.com/ru/articles/1006622/
Я делаю локально работающего ИИ-агента и столкнулся с тем, что стандартный подход «закинуть текст в векторную базу, достать по косинусу» для долгоживущего агента не работает: контекст замусоривается, факты конфликтуют, ничего не забывается. Вместо этого реализовал графовую когнитивную память поверх одного файла SQLite
https://habr.com/ru/articles/1006622/
Я делаю локально работающего ИИ-агента и столкнулся с тем, что стандартный подход «закинуть текст в векторную базу, достать по косинусу» для долгоживущего агента не работает: контекст замусоривается, факты конфликтуют, ничего не забывается. Вместо этого реализовал графовую когнитивную память поверх одного файла SQLite
10 900 тестов или почему ваш мониторинг должен быть протестирован
https://habr.com/ru/articles/1006610/
Мониторинг мониторинга - звучит как масло масляное. Ведь наш сервис должен быть надёжнее, чем объекты, которые он отслеживает. Расскажу, как мы дошли до 10 900 автоматических тестов (5100 на бэкенде и 5812 на фронтенде). Все цифры и технологии - строго из нашего репозитория . Без хайпа, только факты, код и архитектурные решения.
https://habr.com/ru/articles/1006610/
Мониторинг мониторинга - звучит как масло масляное. Ведь наш сервис должен быть надёжнее, чем объекты, которые он отслеживает. Расскажу, как мы дошли до 10 900 автоматических тестов (5100 на бэкенде и 5812 на фронтенде). Все цифры и технологии - строго из нашего репозитория . Без хайпа, только факты, код и архитектурные решения.
redis - 7.3.0
https://pypi.org/project/redis/7.3.0/
Python клиент для Redis. Скачать можно по ссылке: https://pypi.python.org/pypi/redis/
https://pypi.org/project/redis/7.3.0/
Python клиент для Redis. Скачать можно по ссылке: https://pypi.python.org/pypi/redis/
Как я определял дистрибутивы Linux по установленным пакетам, и при чем тут KUMA?
https://habr.com/ru/articles/1006546/
Как определить дистрибутив Linux? А что, если имеется только информация о пакетах, установленных на устройстве? История одного «велосипеда» или мы не нашли готового решения.Представьте, что вам нужно определить дистрибутивы, опираясь исключительно на установленные пакеты.
https://habr.com/ru/articles/1006546/
Как определить дистрибутив Linux? А что, если имеется только информация о пакетах, установленных на устройстве? История одного «велосипеда» или мы не нашли готового решения.Представьте, что вам нужно определить дистрибутивы, опираясь исключительно на установленные пакеты.
Как мы научились честно считать эффект промокодов: Causal Inference в онлайн-доставке
https://habr.com/ru/companies/X5Tech/articles/1005410/
Сегодня расскажу о модели, которую мы построили для оценки реального эффекта промокодов. Главные вопросы: кому, какой, и зачем мы выдаем промокод. Спойлер: ответ нас удивил. И именно этот ответ стал главной причиной, по которой эту модель вообще стоило строить.
https://habr.com/ru/companies/X5Tech/articles/1005410/
Сегодня расскажу о модели, которую мы построили для оценки реального эффекта промокодов. Главные вопросы: кому, какой, и зачем мы выдаем промокод. Спойлер: ответ нас удивил. И именно этот ответ стал главной причиной, по которой эту модель вообще стоило строить.
Deprecate confusing APIs like “os.path.commonprefix()”
https://sethmlarson.dev/deprecate-confusing-apis-like-os-path-commonprefix
https://sethmlarson.dev/deprecate-confusing-apis-like-os-path-commonprefix
RAG vs GraphRAG: When Agents Hallucinate Answers
https://dev.to/aws/rag-vs-graphrag-when-agents-hallucinate-answers-2mcb
https://dev.to/aws/rag-vs-graphrag-when-agents-hallucinate-answers-2mcb
Custom Data Structures in E-Graphs
https://uwplse.org/2026/02/24/egglog-containers.html
https://uwplse.org/2026/02/24/egglog-containers.html
Building a Hypervisor in Python with KVM
https://www.nightshift.sh/blog/less-cursed-vm
https://www.nightshift.sh/blog/less-cursed-vm
skill-scanner - Security Scanner for Agent Skills
https://github.com/cisco-ai-defense/skill-scanner
https://github.com/cisco-ai-defense/skill-scanner