Машинное обучение RU

На нас обрушилась сверхзвуковая волна цунами из AI и робототехники.

❤7👍3🔥2

2.63K views06:54

This media is not supported in your browser

Dario Amodei говорит, что между когнитивными возможностями ИИ и доходами компаний существует экспоненциальная связь.

И это видно на графиках роста Anthropic:

📈 2023 - $100M
📈 2024 - $1B
📈 2025 - $10B

Да - 10x рост ежегодно, и цифры уже приближаются к масштабам крупнейших мировых компаний.

Это не просто рост - это экспоненциальная эскалация, когда улучшение интеллектуальных способностей моделей прямо отражается на экономическом эффекте.

Такие темпы не просто впечатляют - они говорят о фундаментальном сдвиге в том, как ценится интеллект (искусственный или нет) в современной экономике.

👎12👍7❤1

2.39K views13:00

Машинное обучение RU

✔️

CEO Y Combinator поделился своим промптом для Claude Code он показывает, как ИИ можно использовать как senior-инженера, а не просто генератор кода.

С таким подходом он выпускает фичи на 4 000+ строк с полными тестами примерно за час.

Что делает этот промпт:

Перед написанием кода AI оценивает решение:
- не переусложнена ли архитектура
- не слишком ли она упрощена
- «достаточно ли инженерии» для задачи

Затем модель:
- тщательно проверяет тесты, edge-cases и сценарии отказа
- ищет узкие места по производительности и масштабируемости
- предлагает варианты упрощения или рефакторинга

Но главное — не сам промпт, а процесс.

Вместо того чтобы сразу писать код, AI:
1) делает структурный разбор (архитектура → качество → тесты → performance)
2) показывает компромиссы и даёт рекомендации
3) останавливается и ждёт обратную связь перед реализацией

Фактически AI работает как senior-инженер, который сначала ревьюит систему, а потом уже пишет код.

Вывод:
Если в команде нет staff-level инженера, его роль можно частично встроить в процесс через AI.

Будущее разработки - это не просто генерация кода, а встроенный AI-review перед каждым изменением.

Промпт:

# Claude / AI Senior Engineer Prompt (Plan Mode)

Before writing any code, review the plan thoroughly.
Do NOT start implementation until the review is complete and I approve the direction.

For every issue or recommendation:
- Explain the concrete tradeoffs
- Give an opinionated recommendation
- Ask for my input before proceeding

Engineering principles to follow:
- Prefer DRY — aggressively flag duplication
- Well-tested code is mandatory (better too many tests than too few)
- Code should be “engineered enough” — not fragile or hacky, but not over-engineered
- Optimize for correctness and edge cases over speed of implementation
- Prefer explicit solutions over clever ones

---

## 1. Architecture Review

Evaluate:
- Overall system design and component boundaries
- Dependency graph and coupling risks
- Data flow and potential bottlenecks
- Scaling characteristics and single points of failure
- Security boundaries (auth, data access, API limits)

---

## 2. Code Quality Review

Evaluate:
- Project structure and module organization
- DRY violations
- Error handling patterns and missing edge cases
- Technical debt risks
- Areas that are over-engineered or under-engineered

---

## 3. Test Review

Evaluate:
- Test coverage (unit, integration, e2e)
- Quality of assertions
- Missing edge cases
- Failure scenarios that are not tested

---

## 4. Performance Review

Evaluate:
- N+1 queries or inefficient I/O
- Memory usage risks
- CPU hotspots or heavy code paths
- Caching opportunities
- Latency and scalability concerns

---

## For each issue found:

Provide:
1. Clear description of the problem
2. Why it matters
3. 2–3 options (including “do nothing” if reasonable)
4. For each option:
- Effort
- Risk
- Impact
- Maintenance cost
5. Your recommended option and why

Then ask for approval before moving forward.

---

## Workflow Rules

- Do NOT assume priorities or timelines
- After each section (Architecture → Code → Tests → Performance), pause and ask for feedback
- Do NOT implement anything until I confirm

---

## Start Mode

Before starting, ask:

**Is this a BIG change or a SMALL change?**

BIG change:
- Review all sections step-by-step
- Highlight the top 3–4 issues per section

SMALL change:
- Ask one focused question per section
- Keep the review concise

---

## Output Style

- Structured and concise
- Opinionated recommendations (not neutral summaries)
- Focus on real risks and tradeoffs
- Think and act like a Staff/Senior Engineer reviewing a production system

Please open Telegram to view this post

VIEW IN TELEGRAM

❤19👍8🔥7

3.04K views06:36

Машинное обучение RU

Baidu выкатила мощную новинку в компьютерном зрении - PaddleOCR-VL-1.5 🔥

Это уже не просто OCR, а полноценная VLM (Vision-Language Model) для работы с документами.

Что тут крутого:

✨ Всего 0.9B параметров - лёгкая модель, не монстр на сотни миллиардов
✨ Apache 2.0 - можно спокойно использовать в проде и коммерции
✨ 94.5% на OmniDocBench v1.5 - очень сильный результат по пониманию документов
✨ Мультиязычный OCR - уверенно читает редкие символы и даже древние тексты

Фактически это шаг к системам, которые не просто распознают текст, а понимают структуру сложных документов - таблицы, формы, исторические материалы, нестандартные шрифты.

Отличный кандидат для:
- интеллектуального парсинга документов
- оцифровки архивов
- финтеха, юр-доков, госбумаг
- AI-пайплайнов поверх сканов и PDF

Open-source экосистема вокруг VLM для документов сейчас очень быстро разгоняется 🚀

huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

🔥13❤4

3.74K views15:01

Машинное обучение RU

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini 3.1 Pro be like

🔥17👍7😁3👎1

3.03K views07:30

Машинное обучение RU

🤖 Запустите Moltbot в Cloudflare Sandbox

Moltworker позволяет запускать персонального AI-ассистента Moltbot в среде Cloudflare, обеспечивая управляемую и всегда доступную среду без необходимости самостоятельного хостинга. Проект демонстрирует возможность работы Moltbot в облачной песочнице, включая поддержку нескольких платформ для общения.

🚀 Основные моменты:
- Персональный AI-ассистент с поддержкой Telegram, Discord и Slack
- Веб-интерфейс для управления чатами
- Безопасная аутентификация и управление устройствами
- Хранение истории чатов для постоянного доступа
- Опциональное использование R2 для хранения данных

📌 GitHub: https://github.com/cloudflare/moltworker

❤2👍1

2.71K views13:00

Машинное обучение RU

🦀 Андрей Карпати назвал OpenClaw кошмаром с точки зрения безопасности - это монстр на 400 000 строк «вайб-кода», который уже активно атакуют в реальном масштабе.

После этого он даже купил Mac Mini, чтобы найти более безопасную альтернативу.

Его внимание привлёк NanoClaw.

- всё ядро - около 4 000 строк кода
- каждый агент запускается в реальных контейнерах

Но самое интересное - в проекте нет конфигурационных файлов.

https://github.com/qwibitai/nanoclaw

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍7😁2👎1😱1

3.37K views06:09

Машинное обучение RU

🧠 Gollem - LLM-агенты на Go, но “по-взрослому”: безопасно, расширяемо, удобно

Нашёл интересный проект: gollem - фреймворк для агентных LLM-приложений на Golang.

GitHub: https://github.com/m-mizutani/gollem

Что делает gollem
Это не просто “обёртка над API”.
Gollem помогает собирать агентов, которые:
- вызывают инструменты (tools)
- выполняют цепочки действий
- работают по workflow
- и при этом не превращают код в кашу

Почему это важно
Когда начинаешь делать агента, быстро появляется боль:
- как безопасно запускать tools
- как хранить контекст
- как логировать шаги и ошибки
- как делать повторяемое поведение (детерминизм)
- как ограничивать права и доступы

И gollem как раз про это - архитектура агента, а не “ещё один чат”.

Что обычно есть в таких системах (и зачем)
✅ чёткая модель “агент → инструмент → результат”
✅ контроль прав: что агенту можно/нельзя
✅ удобные интерфейсы для подключения новых tools
✅ наблюдаемость: трейс шагов, причины решений, дебаг
✅ удобная интеграция в backend на Go

Если ты пишешь бэкенд на Go и хочешь:
- агента, который реально выполняет задачи
- и чтобы это можно было деплоить в прод

то gollem - прям в копилку.

https://github.com/m-mizutani/gollem

❤6👍2👎1

2.98K views11:02

Машинное обучение RU

Согласны ?

😁25👎13👍6❤1🔥1

5.39K views05:22

Машинное обучение RU

🧠 Claude-Mem: Умная система памяти для Claude Code

Claude-Mem обеспечивает сохранение контекста между сессиями, автоматически фиксируя использование инструментов и создавая семантические резюме. Это позволяет Claude поддерживать непрерывность знаний о проектах даже после завершения сессий.

🚀 Основные моменты:
- Автоматическое сохранение контекста между сессиями
- Генерация семантических резюме
- Поддержка Claude Code
- Легкая установка через плагины

📌 GitHub: https://github.com/thedotmack/claude-mem

#javascript

GitHub

GitHub - thedotmack/claude-mem: Persistent Context Across Sessions for Every Agent – Captures everything your agent does during…

Persistent Context Across Sessions for Every Agent – Captures everything your agent does during sessions, compresses it with AI, and injects relevant context back into future sessions. Works with ...

👎3

2.32K views07:55

Машинное обучение RU

🚀 PolymathicAI выпустила огромный открытый датасет для ML-исследований -*The Well*

📦 Это коллекция численных физических симуляций общего назначения — всего ~15 ТБ данных, разбитых на 16 разнообразных наборов, включающих такие области, как:
• динамика жидкостей и турбулентность
• биологические системы
• акустическое рассеяние
• магнито-гидродинамика и моделирование внегалактических сред
• даже симуляции сверхновых 🌌
И всё это можно использовать для обучения и оценки моделей ML.
📊 Зачем это нужно:
ИИ и ML всё чаще используются для ускорения или замены тяжёлых физических симуляций (surrogate modeling), но до сих пор публичные данные были фрагментированы и маленькие. “The Well” даёт единый формат, большой объём и сложные динамические процессы - отличная база для:
• обучения нейросетей, которые предсказывают физическое поведение
• бенчмарков и сравнительных исследований
• создания более быстрых моделей вместо тяжёлых классических симуляторов

📚 Как использовать:
Проект предоставляет Python/PyTorch API - можно легко загрузить данные в даталоадер и использовать их в тренировке моделей. Данные доступны также через Hugging Face и в формате HDF5 для удобства.

💡 Это открытый ресурс с BSD-3-Clause лицензией, ориентированный на высокоуровневые ML-задачи и научные исследования.

Это может стать новым стандартным набором для обучения моделей, которые симулируют сложные физические системы вместо традиционных вычислительных методов.

🔗 Репозиторий на GitHub: github.com/PolymathicAI/the_well

❤7👍3🔥1

2.52K views13:02

Машинное обучение RU

😁15🔥3👍2

2.28K views08:52

Машинное обучение RU

Небольшая модель на 4B параметров превзошла своего «учителя» в задачах со структурированным выводом. Знакомьтесь - LocoOperator-4B 🚀

Результаты:

- Учитель (Qwen3-Coder-Next): корректный синтаксис — 87,6%
- Студент (4B): 100%
- У учителя — 11 вызовов инструментов с пустыми аргументами
- У LocoOperator-4B — 0 ошибок

Как обучали:

- Full-parameter SFT
- 170K многошаговых диалогов
- ~25 часов обучения на 4× H200
- Использовался фреймворк MS-SWIFT

Специализация модели — навигация по кодовой базе:

Инструменты:
- Read
- Grep
- Glob
- Bash
- Task

Вывод — строго структурированный JSON в формате <tool_call>.

Практическое применение:

Модель может работать как локальный sub-agent для Claude Code:
- Sonnet принимает решения
- Haiku маршрутизирует задачи
- выполнение идёт через локальную llama.cpp
- стоимость API — $0

Модель: https://modelscope.cn/models/LocoreMind/LocoOperator-4B
GitHub: https://github.com/LocoreMind/LocoOperator

🔥7👍2❤1

2.55K views10:02

Машинное обучение RU

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 КАК ПОДНЯТЬ СВОЕГО AI-АГЕНТА ЗА ПАРУ МИНУТ

Хочешь своего личного AI-ассистента уровня JARVIS, но без монструозной архитектуры и сотен тысяч строк кода? Тогда вместо тяжёлых фреймворков используй ультралёгкие агентные проекты вроде nanobot.

Это идеальный способ быстро понять, как работают AI-агенты изнутри без «магии» и перегруза. Минимальный код = быстрее запуск, проще дебаг, легче кастомизация под свои задачи - будь то анализ данных, автоматизация рутины или помощь в разработке.

Почему такой подход мощный:
- меньше кода - больше понимания
- проще дорабатывать под себя
- быстрее прототипы
- ниже требования к ресурсам
- удобно для исследований и экспериментов

nanobot - это по сути «ядро ассистента» без лишней инфраструктуры. Отличная база, чтобы собрать своего AI-агента под себя.

Как развернуть:


git clone https://github.com/HKUDS/nanobot.git  
cd nanobot  
python -m venv venv  
source venv/bin/activate  
pip install -r requirements.txt

Добавляешь ключ LLM (например, OpenAI) в переменные окружения и запускаешь:


python main.py

Пример простого использования внутри проекта:


from nanobot.agent import Agent  
agent = Agent()  
response = agent.ask("Составь план задач на день для разработчика")  
print(response)

Если хочется своего AI-агента без сложной инфраструктуры - это один из самых быстрых стартов.

https://www.youtube.com/shorts/Wx2RBCnl5nU

#Clawdbot #AIAssistant #Agents

❤7🔥4

2.54K views13:03

Машинное обучение RU

🚀 LLMRouter: Умная маршрутизация для LLM

LLMRouter — это библиотека для оптимизации работы с LLM, которая динамически выбирает наиболее подходящую модель для каждого запроса. Она поддерживает более 16 моделей маршрутизации, включая KNN, SVM и графовые методы, и предлагает унифицированный интерфейс командной строки для обучения и взаимодействия.

🚀 Основные моменты:
- Умная маршрутизация запросов на основе сложности и производительности.
- Поддержка множества моделей маршрутизации для различных стратегий.
- Полный интерфейс командной строки для удобного использования.
- Генерация обучающих данных из 11 наборов данных.

📌 GitHub: https://github.com/ulab-uiuc/LLMRouter

#python

GitHub

GitHub - ulab-uiuc/LLMRouter: LLMRouter: An Open-Source Library for LLM Routing

LLMRouter: An Open-Source Library for LLM Routing. Contribute to ulab-uiuc/LLMRouter development by creating an account on GitHub.

👍3❤2

2.74K views11:01

Машинное обучение RU

😁21🥰3❤2

2.44K views11:45

Openpilot - это открытый проект продвинутой помощи водителю (ADAS), разработанный компанией *comma.ai* и сообществом на

Это операционная система для робототехники в авто, которая может:
- автоматически центровать автомобиль в своей полосе
- управлять адаптивным круиз-контролем
- поддерживать безопасную дистанцию и тормозить
- менять полосу при сигнале поворотника

Система работает через подключение к CAN-шине автомобиля и поддерживается более чем 300 моделями автомобилей от Toyota, Hyundai, Honda и других.

Openpilot может быть установлен на официальные устройства *comma.ai* (например Comma 3X), но также поддерживается установка на другие платформы при наличии подходящего hardware.

Проект активно развивается, имеет большое сообщество, документацию и инструменты для разработки и тестирования.

https://github.com/commaai/openpilot

❤4🤯2

2.72K views13:03

Машинное обучение RU

🔥 Qwen 3.5 Series GPTQ-Int4

Вышли квантизированные веса GPTQ-Int4 для серии Qwen 3.5 - теперь запускать мощные модели можно даже на ограниченном железе.

- GPTQ-Int4
4-битная квантизация = значительно меньше потребление VRAM.
- Нативная поддержка vLLM и SGLang
Можно запускать без костылей и сложной настройки.
- Меньше памяти - быстрее инференс
Подходит для локальных серверов, single-GPU машин и бюджетных сетапов.

- Production-ready
Идеально для тех, кто строит свои LLM-сервисы и хочет максимум эффективности.

Запустить мощную модель теперь можно даже на ограниченном GPU-сетапе.

Hugging Face: https://huggingface.co/collections/Qwen/qwen35

ModelScope: https://modelscope.cn/collections/Qwen/Qwen35

❤6🔥3

2.51K views16:55

Машинное обучение RU

😁7

2.11K views09:15

Машинное обучение RU

Forwarded from Machinelearning

⚡️

Anthropic расширила возможности skill-creator.

Anthropic перенесла часть инженерной культуры: тестирование, бенчмаркинг и итеративность в процесс создания навыков и для этого теперь не нужно уметь писать код.

В skill-creator добавили автоматические тесты, бенчмарки и A/B-сравнения и теперь создатели навыков могут измерить, работает ли skill, до его запуска в продакшен.

🟡

Центральный инструмент - evals (автотесты качества).

Автор задает тестовые промпты и описывает, как выглядит нужный результат. Skill-creator запускает их параллельно: с навыком и без него.

Независимый агент-сравниватель оценивает результаты вслепую, не зная, какая версия перед ним, и сразу показывает, дает ли навык реальный прирост.

Внутренние тесты Anthropic: точность PDF-навыка выросла с 6/8 до 7/8, Excel-навыка - с 6/8 до полных 8/8.

Отдельный бенчмарк-режим дает детальную картину по каждому прогону: процент успешных тестов, время выполнения, расход токенов.

На примере PDF-навыка при работе с незаполняемыми формами и таблицами из многостраничных документов успешность выросла с 40 до 100% (при том же времени выполнения).

🟡

Evals полезны и в долгосрочной перспективе.

Если базовая модель начинает проходить тесты без загруженного навыка - это сигнал о том, что навык уже есть в ее поведении и skill можно отключить. Результаты тестов хранятся локально и интегрируются в CI-системы.

🟡

Обновление улучшило триггерную активацию.

Claude решает, когда подключить навык, исключительно по короткому текстовому описанию в системном промпте.

Skill-creator теперь анализирует эти описания против тестовых промптов и предлагает правки, снижающие и ложные срабатывания и пропуски.

По результатам внутреннего прогона триггеринг стал лучше на 5 из 6 публичных навыков.

Все обновления уже доступны в вебе и Cowork. Для Claude Code обновили плагин или вот он же - в репозитории, если ставить руками.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍1

1.77K views11:50

Машинное обучение RU

По данным The Information, GPT-5.4 официально выйдет с контекстным окном в 1 миллион токенов.

- Это ставит модель на один уровень с Gemini и Claude по объёму информации, которую она может удерживать и обрабатывать одновременно.
- Новый режим Extreme reasoning позволит выполнять более глубокие рассуждения за счёт использования большего количества вычислительных ресурсов.
- Модель стала значительно надёжнее для сложных задач и показывает более низкий уровень ошибок в целом.
- Благодаря способности работать с долгими задачами, которые могут выполняться часами, она особенно подходит для агентов и научных исследований.
- Также OpenAI меняет стратегию и планирует выпускать обновления моделей ежемесячно, чтобы быстрее продвигать развитие.

👍3😁1

2.17K views10:01

About

Blog

Apps

Platform