Data Science

Can LLM agents explore codebases and reason about code semantics without executing the code

📗 Read

@datascienceiot

14.7K views15:56

GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

📗 Read

@datascienceiot

6.6K views20:59

The new Claude for Legal repo gives firms and in-house teams prebuilt agent workflows for contract review, litigation prep, and regulatory monitoring—completely free.

🔗 https://github.com/anthropics/claude-for-legal

@datascienceiot

5K views11:12

Data Science

How AI Impacts Skill Formation

📗 Read

@datascienceiot

4.57K views18:30

Data Science

On Training in Imagination

📗 Read

@datascienceiot

5.19K views11:23

Data Science

Best practices for computer and browser use with Claude

📗 Read

@datascienceiot

4.71K views20:51

Data Science

Apple has published a paper with a devastating title: “The Illusion of Thinking”

📗 Read

@datascienceiot

5.78K views11:48

Data Science

🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»

На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.

Маршрут собран под современный Python:

- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура

В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.

Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.

Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.

Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.

https://github.com/justxor/pythonroamap2026

4.96K views09:34

Data Science

"Language Models Need Sleep"

📚 Read

@datascienceiot

5.34K viewsedited 15:37

Data Science

A 178 page survey study for refreshing math and generative AI foundations from University of Huddersfield.

The Little Book of Generative AI Foundations.

📗 Read

@datascienceiot

4.47K views15:33

Data Science

От мечты о карьере сварщика до стажировки в KAUST

История выпускника Школы анализа данных Степана Платинского — яркий пример того, куда может вывести фундаментальное образование в ML.
До 9 класса он хотел быть сварщиком. Но потом поступил в Физтех-лицей, оттуда в МФТИ, а затем в Школу анализа данных.
Сегодня он улучшает ML-модели для международного поиска Яндекса, а в прошлом году стажировался в университете KAUST в Саудовской Аравии как приглашенный исследователь.

Его цель — построить статистическую модель, которая сможет предсказывать экстремальные события вроде наводнений или обвала рынка. Этому как раз посвящена его научная работа.
Степан считает, что главное для карьеры в ML — любознательность и искреннее желание разобраться в теме.
О том, как попасть на международную стажировку и заниматься наукой параллельно с карьерой в бигтехе, читайте в интервью со Степаном.

4.72K views13:02

Data Science

AI-Driven Multi-Region Provisioning for Cloud Services Using Spot Fleets

📗 Read

@datascienceiot

5.11K views14:29

Data Science

System Card: Claude Fable 5 &
Claude Mythos 5

📗 Read

@datascienceiot

3.64K views19:55

Data Science

⚡️ Machine Learning Roadmap 2026: большая карта входа в ML без сказок про “нейросети за месяц

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap

Please open Telegram to view this post

VIEW IN TELEGRAM

4.23K views15:05

Data Science

Everything You Always Wanted To
Know About Mathematics*

📓 book

@datascienceiot

3.88K views12:32

Data Science

Как сегодня создают эффективные ML-системы

Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML.

Будет три потока докладов:

— глубокие исследования и новые подходы к моделям;
— прикладное ML с фокусом на бизнес-метриках;
— инженерные системы, делающие все это возможным.

Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают.

Регистрируйся заранее и зови коллег

2.47K views09:00

Data Science

Predicting LLM Safety Before Release
by Simulating Deployment

📓 book

@datascienceiot

2.25K views11:01

Data Science

Как ускорить ML-разработку, когда главный дефицит — не идеи, а доступ к GPU?

На infra.conf’26 Яндекс рассказал про Dev Cluster — сервис динамического распределения GPU-ресурсов для ML-команд.

Идея простая: вместо настройки окружений, ожидания свободных мощностей и ручного управления инфраструктурой разработчики за несколько кликов получают готовую GPU-конфигурацию для обучения моделей и проверки гипотез.

Ресурсы выделяются за секунды, снижаются простои GPU и эффективнее используются вычислительные мощности. В результате команды быстрее запускают эксперименты, реже упираются в инфраструктурные ограничения и сокращают путь от идеи до результата.

Dev Cluster — часть единой ML-платформы Яндекса, которая закрывает полный цикл машинного обучения: от работы с данными и обучения до применения моделей.

2.34K views12:41

Data Science

Making SEC filings machine-readable without losing context is the real infrastructure play for financial AI.

📓 book

@datascienceiot

2.4K views14:41

Data Science

Проект Ozon Tech Route 256 Pro обновился, и теперь в нём есть направление Data Science.

Это интенсивный онлайн-курс для специалистов с опытом. Он длится 2 месяца и охватывает классический Machine Learning, компьютерное зрение и применение генеративных моделей в реальных продуктах.

Хочешь решать сложные задачи с экспертами Ozon Tech? Залетай за подробностями и оставляй заявку: https://route256.ozon.ru/ds. Это бесплатно!

2.54K views09:05

Data Science

Fearless Concurrency on the GPU" introduces cuTile Rust

📓 book

@datascienceiot

2.3K views14:11

About

Blog

Apps

Platform