Can LLM agents explore codebases and reason about code semantics without executing the code
📗 Read
@datascienceiot
📗 Read
@datascienceiot
The new Claude for Legal repo gives firms and in-house teams prebuilt agent workflows for contract review, litigation prep, and regulatory monitoring—completely free.
🔗 https://github.com/anthropics/claude-for-legal
@datascienceiot
🔗 https://github.com/anthropics/claude-for-legal
@datascienceiot
Apple has published a paper with a devastating title: “The Illusion of Thinking”
📗 Read
@datascienceiot
📗 Read
@datascienceiot
🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»
На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.
Маршрут собран под современный Python:
- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура
В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.
Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.
Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.
Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.
https://github.com/justxor/pythonroamap2026
На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.
Маршрут собран под современный Python:
- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура
В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.
Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.
Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.
Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.
https://github.com/justxor/pythonroamap2026
A 178 page survey study for refreshing math and generative AI foundations from University of Huddersfield.
The Little Book of Generative AI Foundations.
📗 Read
@datascienceiot
The Little Book of Generative AI Foundations.
📗 Read
@datascienceiot
От мечты о карьере сварщика до стажировки в KAUST
История выпускника Школы анализа данных Степана Платинского — яркий пример того, куда может вывести фундаментальное образование в ML.
До 9 класса он хотел быть сварщиком. Но потом поступил в Физтех-лицей, оттуда в МФТИ, а затем в Школу анализа данных.
Сегодня он улучшает ML-модели для международного поиска Яндекса, а в прошлом году стажировался в университете KAUST в Саудовской Аравии как приглашенный исследователь.
Его цель — построить статистическую модель, которая сможет предсказывать экстремальные события вроде наводнений или обвала рынка. Этому как раз посвящена его научная работа.
Степан считает, что главное для карьеры в ML — любознательность и искреннее желание разобраться в теме.
О том, как попасть на международную стажировку и заниматься наукой параллельно с карьерой в бигтехе, читайте в интервью со Степаном.
История выпускника Школы анализа данных Степана Платинского — яркий пример того, куда может вывести фундаментальное образование в ML.
До 9 класса он хотел быть сварщиком. Но потом поступил в Физтех-лицей, оттуда в МФТИ, а затем в Школу анализа данных.
Сегодня он улучшает ML-модели для международного поиска Яндекса, а в прошлом году стажировался в университете KAUST в Саудовской Аравии как приглашенный исследователь.
Его цель — построить статистическую модель, которая сможет предсказывать экстремальные события вроде наводнений или обвала рынка. Этому как раз посвящена его научная работа.
Степан считает, что главное для карьеры в ML — любознательность и искреннее желание разобраться в теме.
О том, как попасть на международную стажировку и заниматься наукой параллельно с карьерой в бигтехе, читайте в интервью со Степаном.
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.
Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.
Roadmap разбит на 7 треков:
1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety
Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.
В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.
Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.
По времени тоже без сказок:
1. 0-3 месяца: математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация
Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!
Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap
Please open Telegram to view this post
VIEW IN TELEGRAM
Как сегодня создают эффективные ML-системы
Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.
Будет три потока докладов:
— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.
Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.
Регистрируйся заранее и зови коллег
Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.
Будет три потока докладов:
— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.
Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.
Регистрируйся заранее и зови коллег
Как ускорить ML-разработку, когда главный дефицит — не идеи, а доступ к GPU?
На infra.conf’26 Яндекс рассказал про Dev Cluster — сервис динамического распределения GPU-ресурсов для ML-команд.
Идея простая: вместо настройки окружений, ожидания свободных мощностей и ручного управления инфраструктурой разработчики за несколько кликов получают готовую GPU-конфигурацию для обучения моделей и проверки гипотез.
Ресурсы выделяются за секунды, снижаются простои GPU и эффективнее используются вычислительные мощности. В результате команды быстрее запускают эксперименты, реже упираются в инфраструктурные ограничения и сокращают путь от идеи до результата.
Dev Cluster — часть единой ML-платформы Яндекса, которая закрывает полный цикл машинного обучения: от работы с данными и обучения до применения моделей.
На infra.conf’26 Яндекс рассказал про Dev Cluster — сервис динамического распределения GPU-ресурсов для ML-команд.
Идея простая: вместо настройки окружений, ожидания свободных мощностей и ручного управления инфраструктурой разработчики за несколько кликов получают готовую GPU-конфигурацию для обучения моделей и проверки гипотез.
Ресурсы выделяются за секунды, снижаются простои GPU и эффективнее используются вычислительные мощности. В результате команды быстрее запускают эксперименты, реже упираются в инфраструктурные ограничения и сокращают путь от идеи до результата.
Dev Cluster — часть единой ML-платформы Яндекса, которая закрывает полный цикл машинного обучения: от работы с данными и обучения до применения моделей.
Making SEC filings machine-readable without losing context is the real infrastructure play for financial AI.
📓 book
@datascienceiot
📓 book
@datascienceiot
Проект Ozon Tech Route 256 Pro обновился, и теперь в нём есть направление Data Science.
Это интенсивный онлайн-курс для специалистов с опытом. Он длится 2 месяца и охватывает классический Machine Learning, компьютерное зрение и применение генеративных моделей в реальных продуктах.
Хочешь решать сложные задачи с экспертами Ozon Tech? Залетай за подробностями и оставляй заявку: https://route256.ozon.ru/ds. Это бесплатно!
Это интенсивный онлайн-курс для специалистов с опытом. Он длится 2 месяца и охватывает классический Machine Learning, компьютерное зрение и применение генеративных моделей в реальных продуктах.
Хочешь решать сложные задачи с экспертами Ozon Tech? Залетай за подробностями и оставляй заявку: https://route256.ozon.ru/ds. Это бесплатно!