Машинное обучение RU
18K subscribers
1.69K photos
241 videos
11 files
2.12K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🤖 Запустите Moltbot в Cloudflare Sandbox

Moltworker позволяет запускать персонального AI-ассистента Moltbot в среде Cloudflare, обеспечивая управляемую и всегда доступную среду без необходимости самостоятельного хостинга. Проект демонстрирует возможность работы Moltbot в облачной песочнице, включая поддержку нескольких платформ для общения.

🚀 Основные моменты:
- Персональный AI-ассистент с поддержкой Telegram, Discord и Slack
- Веб-интерфейс для управления чатами
- Безопасная аутентификация и управление устройствами
- Хранение истории чатов для постоянного доступа
- Опциональное использование R2 для хранения данных

📌 GitHub: https://github.com/cloudflare/moltworker
2👍1
🦀 Андрей Карпати назвал OpenClaw кошмаром с точки зрения безопасности - это монстр на 400 000 строк «вайб-кода», который уже активно атакуют в реальном масштабе.

После этого он даже купил Mac Mini, чтобы найти более безопасную альтернативу.

Его внимание привлёк NanoClaw.

- всё ядро - около 4 000 строк кода
- каждый агент запускается в реальных контейнерах

Но самое интересное - в проекте нет конфигурационных файлов.

https://github.com/qwibitai/nanoclaw
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍7😁2👎1😱1
🧠 Gollem - LLM-агенты на Go, но “по-взрослому”: безопасно, расширяемо, удобно

Нашёл интересный проект: gollem - фреймворк для агентных LLM-приложений на Golang.

GitHub: https://github.com/m-mizutani/gollem

Что делает gollem
Это не просто “обёртка над API”.
Gollem помогает собирать агентов, которые:
- вызывают инструменты (tools)
- выполняют цепочки действий
- работают по workflow
- и при этом не превращают код в кашу

Почему это важно
Когда начинаешь делать агента, быстро появляется боль:
- как безопасно запускать tools
- как хранить контекст
- как логировать шаги и ошибки
- как делать повторяемое поведение (детерминизм)
- как ограничивать права и доступы

И gollem как раз про это - архитектура агента, а не “ещё один чат”.

Что обычно есть в таких системах (и зачем)
чёткая модель “агент → инструмент → результат”
контроль прав: что агенту можно/нельзя
удобные интерфейсы для подключения новых tools
наблюдаемость: трейс шагов, причины решений, дебаг
удобная интеграция в backend на Go

Если ты пишешь бэкенд на Go и хочешь:
- агента, который реально выполняет задачи
- и чтобы это можно было деплоить в прод

то gollem - прям в копилку.

https://github.com/m-mizutani/gollem
6👍2👎1
Согласны ?
😁25👎13👍61🔥1
🧠 Claude-Mem: Умная система памяти для Claude Code

Claude-Mem обеспечивает сохранение контекста между сессиями, автоматически фиксируя использование инструментов и создавая семантические резюме. Это позволяет Claude поддерживать непрерывность знаний о проектах даже после завершения сессий.

🚀 Основные моменты:
- Автоматическое сохранение контекста между сессиями
- Генерация семантических резюме
- Поддержка Claude Code
- Легкая установка через плагины

📌 GitHub: https://github.com/thedotmack/claude-mem

#javascript
👎3
🚀 PolymathicAI выпустила огромный открытый датасет для ML-исследований -*The Well*

📦 Это коллекция численных физических симуляций общего назначения — всего ~15 ТБ данных, разбитых на 16 разнообразных наборов, включающих такие области, как:
• динамика жидкостей и турбулентность
• биологические системы
• акустическое рассеяние
• магнито-гидродинамика и моделирование внегалактических сред
• даже симуляции сверхновых 🌌
И всё это можно использовать для обучения и оценки моделей ML.
📊 Зачем это нужно:
ИИ и ML всё чаще используются для ускорения или замены тяжёлых физических симуляций (surrogate modeling), но до сих пор публичные данные были фрагментированы и маленькие. “The Well” даёт единый формат, большой объём и сложные динамические процессы - отличная база для:
• обучения нейросетей, которые предсказывают физическое поведение
• бенчмарков и сравнительных исследований
• создания более быстрых моделей вместо тяжёлых классических симуляторов

📚 Как использовать:
Проект предоставляет Python/PyTorch API - можно легко загрузить данные в даталоадер и использовать их в тренировке моделей. Данные доступны также через Hugging Face и в формате HDF5 для удобства.

💡 Это открытый ресурс с BSD-3-Clause лицензией, ориентированный на высокоуровневые ML-задачи и научные исследования.

Это может стать новым стандартным набором для обучения моделей, которые симулируют сложные физические системы вместо традиционных вычислительных методов.

🔗 Репозиторий на GitHub: github.com/PolymathicAI/the_well
7👍3🔥1
😁15🔥3👍2
Небольшая модель на 4B параметров превзошла своего «учителя» в задачах со структурированным выводом. Знакомьтесь - LocoOperator-4B 🚀

Результаты:

- Учитель (Qwen3-Coder-Next): корректный синтаксис — 87,6%
- Студент (4B): 100%
- У учителя — 11 вызовов инструментов с пустыми аргументами
- У LocoOperator-4B — 0 ошибок

Как обучали:

- Full-parameter SFT
- 170K многошаговых диалогов
- ~25 часов обучения на 4× H200
- Использовался фреймворк MS-SWIFT

Специализация модели — навигация по кодовой базе:

Инструменты:
- Read
- Grep
- Glob
- Bash
- Task

Вывод — строго структурированный JSON в формате <tool_call>.

Практическое применение:

Модель может работать как локальный sub-agent для Claude Code:
- Sonnet принимает решения
- Haiku маршрутизирует задачи
- выполнение идёт через локальную llama.cpp
- стоимость API — $0

Модель: https://modelscope.cn/models/LocoreMind/LocoOperator-4B
GitHub: https://github.com/LocoreMind/LocoOperator
🔥7👍21
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 КАК ПОДНЯТЬ СВОЕГО AI-АГЕНТА ЗА ПАРУ МИНУТ

Хочешь своего личного AI-ассистента уровня JARVIS, но без монструозной архитектуры и сотен тысяч строк кода? Тогда вместо тяжёлых фреймворков используй ультралёгкие агентные проекты вроде nanobot.

Это идеальный способ быстро понять, как работают AI-агенты изнутри без «магии» и перегруза. Минимальный код = быстрее запуск, проще дебаг, легче кастомизация под свои задачи - будь то анализ данных, автоматизация рутины или помощь в разработке.

Почему такой подход мощный:
- меньше кода - больше понимания
- проще дорабатывать под себя
- быстрее прототипы
- ниже требования к ресурсам
- удобно для исследований и экспериментов

nanobot - это по сути «ядро ассистента» без лишней инфраструктуры. Отличная база, чтобы собрать своего AI-агента под себя.

Как развернуть:


git clone https://github.com/HKUDS/nanobot.git
cd nanobot
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt


Добавляешь ключ LLM (например, OpenAI) в переменные окружения и запускаешь:


python main.py

Пример простого использования внутри проекта:


from nanobot.agent import Agent
agent = Agent()
response = agent.ask("Составь план задач на день для разработчика")
print(response)


Если хочется своего AI-агента без сложной инфраструктуры - это один из самых быстрых стартов.

https://www.youtube.com/shorts/Wx2RBCnl5nU

#Clawdbot #AIAssistant #Agents
7🔥4
🚀 LLMRouter: Умная маршрутизация для LLM

LLMRouter — это библиотека для оптимизации работы с LLM, которая динамически выбирает наиболее подходящую модель для каждого запроса. Она поддерживает более 16 моделей маршрутизации, включая KNN, SVM и графовые методы, и предлагает унифицированный интерфейс командной строки для обучения и взаимодействия.

🚀 Основные моменты:
- Умная маршрутизация запросов на основе сложности и производительности.
- Поддержка множества моделей маршрутизации для различных стратегий.
- Полный интерфейс командной строки для удобного использования.
- Генерация обучающих данных из 11 наборов данных.

📌 GitHub: https://github.com/ulab-uiuc/LLMRouter

#python
👍32
😁20🥰32
Media is too big
VIEW IN TELEGRAM
Openpilot - это открытый проект продвинутой помощи водителю (ADAS), разработанный компанией *comma.ai* и сообществом на

Это операционная система для робототехники в авто, которая может:
- автоматически центровать автомобиль в своей полосе
- управлять адаптивным круиз-контролем
- поддерживать безопасную дистанцию и тормозить
- менять полосу при сигнале поворотника

Система работает через подключение к CAN-шине автомобиля и поддерживается более чем 300 моделями автомобилей от Toyota, Hyundai, Honda и других.

Openpilot может быть установлен на официальные устройства *comma.ai* (например Comma 3X), но также поддерживается установка на другие платформы при наличии подходящего hardware.

Проект активно развивается, имеет большое сообщество, документацию и инструменты для разработки и тестирования.

https://github.com/commaai/openpilot
4🤯2
🔥 Qwen 3.5 Series GPTQ-Int4

Вышли квантизированные веса GPTQ-Int4 для серии Qwen 3.5 - теперь запускать мощные модели можно даже на ограниченном железе.

- GPTQ-Int4
4-битная квантизация = значительно меньше потребление VRAM.
- Нативная поддержка vLLM и SGLang
Можно запускать без костылей и сложной настройки.
- Меньше памяти - быстрее инференс
Подходит для локальных серверов, single-GPU машин и бюджетных сетапов.

- Production-ready
Идеально для тех, кто строит свои LLM-сервисы и хочет максимум эффективности.

Запустить мощную модель теперь можно даже на ограниченном GPU-сетапе.

Hugging Face: https://huggingface.co/collections/Qwen/qwen35

ModelScope: https://modelscope.cn/collections/Qwen/Qwen35
6🔥3
Forwarded from Machinelearning
⚡️ Anthropic расширила возможности skill-creator.

Anthropic перенесла часть инженерной культуры: тестирование, бенчмаркинг и итеративность в процесс создания навыков и для этого теперь не нужно уметь писать код.

В skill-creator добавили автоматические тесты, бенчмарки и A/B-сравнения и теперь создатели навыков могут измерить, работает ли skill, до его запуска в продакшен.

🟡 Центральный инструмент - evals (автотесты качества).

Автор задает тестовые промпты и описывает, как выглядит нужный результат. Skill-creator запускает их параллельно: с навыком и без него.

Независимый агент-сравниватель оценивает результаты вслепую, не зная, какая версия перед ним, и сразу показывает, дает ли навык реальный прирост.

Внутренние тесты Anthropic: точность PDF-навыка выросла с 6/8 до 7/8, Excel-навыка - с 6/8 до полных 8/8.


Отдельный бенчмарк-режим дает детальную картину по каждому прогону: процент успешных тестов, время выполнения, расход токенов.

На примере PDF-навыка при работе с незаполняемыми формами и таблицами из многостраничных документов успешность выросла с 40 до 100% (при том же времени выполнения).


🟡Evals полезны и в долгосрочной перспективе.

Если базовая модель начинает проходить тесты без загруженного навыка - это сигнал о том, что навык уже есть в ее поведении и skill можно отключить. Результаты тестов хранятся локально и интегрируются в CI-системы.

🟡Обновление улучшило триггерную активацию.

Claude решает, когда подключить навык, исключительно по короткому текстовому описанию в системном промпте.

Skill-creator теперь анализирует эти описания против тестовых промптов и предлагает правки, снижающие и ложные срабатывания и пропуски.

По результатам внутреннего прогона триггеринг стал лучше на 5 из 6 публичных навыков.


Все обновления уже доступны в вебе и Cowork. Для Claude Code обновили плагин или вот он же - в репозитории, если ставить руками.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
По данным The Information, GPT-5.4 официально выйдет с контекстным окном в 1 миллион токенов.

- Это ставит модель на один уровень с Gemini и Claude по объёму информации, которую она может удерживать и обрабатывать одновременно.
- Новый режим Extreme reasoning позволит выполнять более глубокие рассуждения за счёт использования большего количества вычислительных ресурсов.
- Модель стала значительно надёжнее для сложных задач и показывает более низкий уровень ошибок в целом.
- Благодаря способности работать с долгими задачами, которые могут выполняться часами, она особенно подходит для агентов и научных исследований.
- Также OpenAI меняет стратегию и планирует выпускать обновления моделей ежемесячно, чтобы быстрее продвигать развитие.
👍3😁1
🚀Про архитектуру для агентных LLM с распределённой памятью и безопасным инференсом

Обновленная инфраструктура Yandex AI Studio для долгоживущих сессий решает главную проблему агентных моделей — устойчивость и экономию при длительных цепочках рассуждений.

Основные моменты:

- Prefill / Decode Split — разделённые этапы инференса: быстрый prefill для контекста и стабильный decode для генерации.
- Иерархия KV-кэшей — GPU → CPU → распределённый слой.
- Переиспользование KV-кешей — контекст перемещается между серверами в реальном времени.
- Cache-aware балансировка — запросы направляются в ту часть кластера, где находятся нужные KV-кеши.


Появились и улучшения для enterprise-сред:

- Управляемые правила модерации ответов модели, возможность подключаться к нейросетям через частные эндпоинты по выделенному сетевому каналу для работы с ними без выхода в публичный интернет.
- Токены инструментов и токены кеширования — новая тарификация, где вычисления с переиспользованием контекста в агентских сценариях стоят до 4 раз дешевле.

https://ai.cnews.ru/news/line/2026-03-03_yandex_b2b_tech_otkryla_biznesu
5
This media is not supported in your browser
VIEW IN TELEGRAM
Если нужен быстрый и простой speech-to-text для real-time задач — у Mistral есть интересное решение.

Voxtral Mini Realtime — open-source модель для потоковой транскрипции речи.

Что умеет:

- Обрабатывает аудио в реальном времени
- Низкая задержка — текст появляется почти сразу
- Поддержка нескольких языков
- Работает со стриминг-аудио, а не только с файлами
- Подходит для звонков, ассистентов, субтитров и voice-интерфейсов

Это хороший вариант для сценариев, где важна скорость:
- голосовые боты
- live-транскрипция встреч
- AI-ассистенты с голосом
- real-time субтитры

Можно попробовать прямо в браузере:

Demo: https://huggingface.co/spaces/mistralai/Voxtral-Mini-Realtime
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Opus 4.6 vs GPT-5.4

Обе модели сделали 3D-веб-приложение для отслеживания самолётов очень хорошо.

Главное различие:

• GPT-5.4
- лучшее визуальное оформление и пост-обработка (свет, камера, эффекты).
• Opus 4.6 - лучше модели и текстуры (более качественная Земля и самолёты).

Также у GPT-5.4 иногда камера пролетает сквозь планету, что портит эффект, а Opus обработал это аккуратнее.

Итог:
GPT-5.4 сильнее в визуальных эффектах,
Opus 4.6 - в качестве ассетов и моделей.
👍111😁1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI открыла доступ к Codex Security.

Это инструмент, который сканирует архитектуру проекта и выстраивает индивидуальную модель угроз. Опираясь на эту карту, агент целенаправленно ищет слабые места в безопасности приложения.

Фирменная фича - защита от ложных срабатываний за счет практической проверки найденных багов. Обнаружив проблему, агент разворачивает изолированную копию системы в песочнице и пытается самостоятельно провести реальный взлом. Если попытка оказалась успешной и угроза подтверждена, ИИ сам пишет патч. Затем система тестирует обновление, чтобы убедиться, что внесенные исправления не сломают другие функции продукта.

Доступ к превью-версии инструмента получат пользователи тарифов ChatGPT Enterprise, Business и Edu в ближайшие дни.
openai.com

✔️ США привяжут экспорт ИИ-ускорителей Nvidia и AMD к инвестициям в свою экономику.

Министерство торговли США подготовило новые правила продажи чипов для ЦОД. Теперь государствам, чьи компании закупают большие объемы продукции Nvidia и AMD, придется встречно инвестировать в американскую ИИ-инфраструктуру.

Проект вводит многоуровневую систему выдачи экспортных лицензий. Строгость требований напрямую зависит от суммарной вычислительной мощности запрашиваемых компонентов. Для одобрения крупных сделок высшего уровня страны-покупатели будут обязаны проводить прямые финансовые вливания в технологический сектор США.

Этот подход формализует практику, которая уже была успешно обкатана на недавних соглашениях с ОАЭ и Саудовской Аравией. На поставки оборудования в Китай, эти правила не повлияют - они по-прежнему регламентируются отдельными санкциями.
ft.com

✔️ Cursor представил платформу Automations.

Новый инструмент от создателей ИИ-редактора кода избавляет разработчиков от необходимости каждый раз вручную писать промпты. Теперь ИИ-помощник может включаться в работу фоном, самостоятельно реагируя на внешние события.

Триггерами служат действия в Git, сообщения в Slack, новые тикеты в Linear или инциденты в PagerDuty. Платформа также поддерживает настройку кастомных вебхуков и запуск задач по расписанию. Обновленные агенты способны брать на себя полноценные инженерные процессы: проанализировать логи через протокол MCP, локализовать ошибку и сразу подготовить пулл-реквест с готовым исправлением.

Важная деталь - у агентов появилась память. Они запоминают результаты прошлых запусков, постепенно адаптируясь к контексту проекта и избегая повторения старых ошибок.
cursor.com

✔️ SoftBank запросил рекордный кредит для увеличения своей доли в OpenAI.

Японский конгломерат ведет переговоры о привлечении крупнейшего в своей истории долларового займа. Ожидается, что кредит на 40 млрд. сроком на год будет обеспечен четырьмя банками.

Главная цель сделки - финансирование ставки основателя SoftBank Масаёси Сона на ИИ. Банк уже вложил в OpenAI более 30 млрд. долларов, получив около 11% акций стартапа. Чтобы обеспечить эти инвестиции, холдингу пришлось частично распродать другие свои активы.

Агрессивные заимствования усиливают опасения аналитиков по поводу раздувания ИИ-пузыря. Суммарный долг ключевых партнеров OpenAI уже достиг 96 млрд. долларов, а ведущая пятерка ИТ-корпораций набрала новых кредитов на 121 млрд., это в 4 раза выше привычной нормы. При этом монетизация буксует - платные подписки на ИИ-сервисы пока оформили лишь 3% пользователей.
bloomberg.com

✔️ Claude ежедневно привлекает более миллиона новых пользователей.

Об этом достижении сообщил Майк Кригер, возглавляющий подразделение экспериментальных ИИ-разработок. Столь стремительный рост аудитории обусловлен несколькими факторами. Помимо глобального тренда на ИИ, Anthropic извлекла серьезную выгоду из недавнего скандала вокруг сотрудничества OpenAI с Пентагоном.

На фоне этих событий в глазах потребителей и технологического сообщества создатели Claude выглядят более последовательными в вопросах этики. Статус «морального победителя» обеспечивает компании сильное репутационное преимущество и стимулирует массовый приток пользователей.
Mike Krieger в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3