Технозаметки Малышева

🌟

SEAL: Еще одна попытка создать пайплайн самообучающихся LLM.

SEAL - это методика от MiT, позволяющая LLM самостоятельно генерировать обучающие данные и настраивать параметры обучения, чтобы адаптироваться к новым задачам. Вместо традиционного файнтюна на внешних данных модель учится рефлексировать: анализировать контекст, создавать из него синтетические данные и применять их для корректировки собственных весов через механизм усиленного обучения.

SEAL, по сути, это два разделенных цикла:

🟢Внешний цикл использует RL, чтобы научить модель генерировать «самоизменения» (инструкции на естественном языке, описывающие, какие данные использовать и как настраивать параметры).

🟢Внутренний цикл реализует эти изменения: модель дообучается на сгенерированных данных, а затем тестирует результат на конкретной задаче. За коррекцию отвечает RL-алгоритм ReSTEM, который оценивает эффективность изменений и обновляет стратегию генерации инструкций. Для экономии ресурсов используются легковесные адаптеры LoRA, которые модифицируют только часть параметров модели.

Этот процесс повторяется, постепенно формируя у модели навык преобразования исходных данных в полезные обучающие сигналы.

SEAL протестили на 2 задачах: интеграции новых знаний и few-shot обучении. В первом случае модель генерирует логические следствия из текста, дообучается на них и улучшает точность ответов на вопросы без доступа к исходному тексту.

Во втором случае SEAL выбирает оптимальные аугментации данных и гиперпараметры для обучения на примерах задач ARC-AGI.

В обоих сценариях SEAL превзошел подходы с фиксированными шаблонами (ICL, TTT+Self Edit без RL и) и даже синтетическими данными от GPT-4.1.

Метод скорее академический и по большей части экспериментальный, у него есть ограничения:

🟠При последовательном применении изменений модель склонна к «катастрофическому забыванию» — потере знаний, усвоенных ранее;

🟠Сопутствующие вычислительные затраты, так как каждая итерация требует дообучения и тестирования модели.

▶️В репозитории проекта разработчики выложили код, данные и инструкции для двух направлений:

🟢

Включение новых фактических знаний;

🟢

Адаптация к новым задачам на основе примеров.

📌Лицензирование: MIT License.

🟡

Страница проекта

🟡

Arxiv

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #SEAL #RL #MiT

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍4✍3⚡2

1.33K views07:16

Технозаметки Малышева

2:03

Media is too big

VIEW IN TELEGRAM

Meta* представила V-JEPA-v2: продвинутую ИИ-модель для понимания роботами окружающего пространства

Ян ЛеКун представил V-JEPA-v2 — новую версию самообучающейся модели компьютерного зрения, которая работает без размеченных данных.

Модель использует архитектуру joint embedding predictive, что обеспечивает более эффективное обучение и лучшую адаптацию к различным визуальным задачам.

Прорыв откроет возможности в автономных авто, ритейл-аналитике и медицинской визуализации, снизив затраты на разметку данных и ускорив внедрение ИИ-систем зрения.

Всего с 1.2 млрд параметров роботы смогут понимать окружающий мир без сложных размышлений, обучаясь непосредственно во время работы.

GitHub
HuggingFace
Сайт проекта
Paper

*Meta - запрещённая в РФ организация

#VJEPA #ComputerVision #Meta
———
@tsingular

✍6⚡5👍3❤2🍓1

2.22K viewsedited 08:44

Технозаметки Малышева

Сегодня эфир с Питерского AIJourney можно увидеть тут:

https://aij.ru/lections

https://vk.com/video-22522055_456245637

Темы:
- обзор ближайшего будущего
- архитектуры LLM следующего поколения
- интерфейсы мозг-компьютер
- безопасность инфраструктуры через ML
- ГенИИ в спорте
- GigaChat и русскоязычный ИИ
- рекомендательные системы
- решение инженерных задач с ИИ
- GigaChain: генерим LenCanvas с ИИ агентом
- ИИ агенты в медицине
- ИИ для управления городом
- ИИ агенты в клиентском сервисе
- роботы

#AIJourney #Sber
———
@tsingular

👍5🔥3🤝3❤2👨‍💻1

2.5K viewsedited 05:31

Технозаметки Малышева

Тайвань добавил Huawei и SMIC в список экспортных ограничений

Министерство торговли Тайваня внесло китайских производителей чипов Huawei и SMIC в список экспортного контроля по "стратегически важным высокотехнологичным товарам".

Huawei и SMIC находятся под санкциями США. Обе компании производят самые продвинутые китайские ИИ-чипы, пытаясь конкурировать с Nvidia.

Ранее Huawei был замечен в импорте около 2 миллионов ИИ процессоров в обход ограничений, через дочерние компании.

Еще забавная история, как китайские товарищи возят модели на обучение в Малайзию на жестких дисках.
Модели большие, чтобы не качать петабайты через интернет - проще их самолётом на дисках туда-обратно свозить.

#TSMC #Huawei #Китай
———
@tsingular

👍9✍7❤2⚡2🔥2

1.62K views05:48

Технозаметки Малышева

Forwarded from EFEMERA: AI news (Вова Казаков)

В Пекине откроют первый в мире магазин роботов по моделе 4S

◯ 4S-центр предложит полный цикл услуг: продажи, сервис, запчасти и консультации по гуманоидным роботам
◯ В магазине будет демонстрационная зона для тестирования и общения с роботами
◯ В планах также создать быструю сеть поставки комплектующих по стране
◯ Открытие запланировано на август в районе Ичжуан
◯ Десять ведущих компаний, включая UBTECH и Galaxea, подписали соглашения о сотрудничестве с магазином 4S

💬 Вот оно будущее: бутики гуманоидных роботов в каждом ТЦ

@EF9MERA

Источник

🔥9👀4🤔1

1.73K views08:50

Технозаметки Малышева

Forwarded from GPT | ChatGPT | Midjourney — GPTMain News

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

🐬 ByteDance дропнули самую точную OCR-модель для распознавания любых PDF — Dolphin превращает в оформленный текст фотки документов, сканы отчётов и даже научные статьи.

Нейронка сохраняет форматирование и вытаскивает содержимое — абзацы, таблицы, диаграммы, рисунки и формулы. Можно точечно парсить даже отдельные элементы (например, таблицы).

GitHub лежит тут, демка — тут.

@GPTMainNews

🔥13✍7❤5

2.1K views08:51

Технозаметки Малышева

В порядке PoC - ГигаЧат работает в n8n
С небольшим шаманством, но довольно выполнимым.

Получается можно делать отечественных агентов без всяких VPNов и т.д.

#Сбер #ГигаЧат
———
@tsingular

🔥11😁1

2.1K viewsedited 18:18

Технозаметки Малышева

Forwarded from Machinelearning

🌟

MiniMax-M1: открытя reasoning‑LLM с контекстом 1M

MiniMax-M1 — первая в мире open-weight гибридная reasoning‑LLM c 1M контекстом (8× DeepSeek R1) и гибридной архитектурой MoE + lightning attention.
• 456 млрд параметров (45,9 млрд активируются на токен), сверхэффективная генерация — 25% FLOPs DeepSeek R1 на 100K токенов
• Обучение через RL с новым алгоритмом CISPO, решающим реальные задачи от математики до кодинга
• На обучение было потрачено $534K, две версии — 40K/80K “thinking budget”
• Обходит DeepSeek R1 и Qwen3-235B на бенчмарках по математике и кодингу,
• Топ результат на задачах для software engineering и reasoning

Бенчмарки:

AIME 2024: 86.0 (M1-80K) vs 85.7 (Qwen3) vs 79.8 (DeepSeek R1)

SWE-bench Verified: 56.0 vs 34.4 (Qwen3)

OpenAI-MRCR (128k): 73.4 vs 27.7 (Qwen3)

TAU-bench (airline): 62.0 vs 34.7 (Qwen3)

LongBench-v2: 61.5 vs 50.1 (Qwen3)

▪Hugging Face: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094
▪GitHub: https://github.com/MiniMax-AI/MiniMax-M1
▪Tech Report: https://github.com/MiniMax-AI/MiniMax-M1/blob/main/MiniMax_M1_tech_report.pdf

@ai_machinelearning_big_data

#llm #reasoningmodels #minimaxm1

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6❤2👍1

2.08K views18:48

Технозаметки Малышева

Forwarded from Сергей Булаев AI 🤖

Команда из Harvard, MIT и других вузов взяла LLM-агента otto-SR (на o3-mini и GPT-4.1), скормил ему весь выпуск Cochrane Reviews… и получила результат за два дня. 12 лет ручной работы одного человека - в агенте на пару тысяч строк кода.

Интересные моменты:
• otto-SR автоматизирует всё: от поиска до анализа, и показывает 96.7% чувствительности при скрининге против 81.7% у людей.
• По точности извлечения данных: 93.1% vs 79.7% (человеческий фактор, привет).
• AI-агент ошибочно исключил медиану 0 исследований (IQR 0–0.25), зато вытянул медиану 2 (𝐈𝐐𝐑 1–6.5) релевантных работ, упущенных авторами оригинальных обзоров.
• В мета-анализах AI выявил новые статистически значимые результаты в двух обзорах и снял значимость в одном - да, пересмотр выводов не исключён.
• Cochrane официально делает ставку на ИИ, но подчёркивает: прозрачность и независимая валидация - must have.
• В научном мире растёт тревога: ИИ может "нагенерить" фейковых статей, поэтому защита данных и их отслеживаемость (Data Provenance Initiative) - одна из тем года.
• По данным аналитиков, генеративный ИИ уже признан кейс-решением для отрасли: большинство data-лидеров считают, что это радикально изменит правила игры в систематических обзорах.

Как думаете, на сколько быстро нам придётся перестраивать процессы под такую скорость? Как перестать бояться собственной тени, когда ИИ уже рядом, но ответственность всё ещё на человеке?

Если работаете с аналитикой, наукой или медобзором - самое время изучать такие инструменты. Не чтобы заменить людей, а чтобы работать точнее и быстрее. Кто успеет, тот и выиграет.

Сергей Булаев AI 🤖 - об AI и не только

👍5👀4🔥3

2.95K views18:55

Технозаметки Малышева

Forwarded from Анализ данных (Data analysis)

⚡️ OpenAI добавила MCP в ChatGPT.

Теперь пользователи могут добавлять сторонние коннекторы и управлять ими непосредственно через интерфейс чат-бота. Новая функция поддерживает OAuth, что позволяет разработчикам проверять подлинность внешних приложений и упрощать обмен данными с ChatGPT.

К новой возможности OpenAI опубликовала техническую документацию по этой функции, сообщив, что разработчики могут немедленно приступить к созданию коннекторов для интеграции.

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6

4.53K views08:06

Технозаметки Малышева

Инженеры создали самозаживляющие мышцы для роботов

Команда из Университета Небраски-Линкольн разработала искусственную мышцу, которая может самостоятельно обнаруживать повреждения и восстанавливаться без внешнего вмешательства.

Трёхслойная система включает: электронную кожу с микрокаплями жидкого металла для обнаружения повреждений, самозаживляющий термопластик и приводной слой.

Пять контрольных токов индуцируются через нижнюю «кожу» мышцы, которая подключена к микроконтроллеру и сенсорной схеме.
Прокол или повреждение этого слоя давлением вызывает срабатывание электрической сети между контрольными цепями.
Система распознает этот электрический след как доказательство повреждения и увеличивает ток, проходящий через новообразованную электрическую сеть.
Сеть локально нагревается, преобразуя энергию электрического тока в тепло вокруг областей повреждения.
Через несколько минут это тепло расплавляет средний термопластичный слой, который герметизирует повреждение освобождая металлические капли — эффективно самозаживляя рану.

Главное новшество - использование электромиграции для сброса системы. Эффект, который обычно вредит электронике, здесь помогает стереть следы повреждений и подготовить систему к новому циклу восстановления.

Научная статья в комментарии

#SelfHealing #Robots #Biomimicry
———
@tsingular

🔥65🤔30❤8👀5🦄2🆒1👾1

8.69K viewsedited 18:52

Технозаметки Малышева

OpenAI получила $200 млн контракт с военными США

Министерство обороны США заключило с OpenAI контракт на $200 миллионов для разработки военных ИИ-решений. Это первый проект компании в рамках государственной программы.

По контракту OpenAI будет создавать прототипы ИИ для решения задач национальной безопасности в сферах ведения войны и корпоративных операций.

Компания обещает улучшить административные операции военных — от медобслуживания до киберзащиты. Все разработки будут соответствовать внутренним принципам использования ИИ от OpenAI.

Ранее OpenAI партнерилась с оборонным стартапом Anduril для защиты от беспилотников.

А так все хорошо начиналось.

#OpenAI #MilitaryAI #Defense
———
@tsingular

🤔418😢4❤3👻3🤯2🤣2😐1

6.83K views19:04

Технозаметки Малышева

Google вывел в релиз обновленыне модели и представил Gemini 2.5 Flash-Lite

Google обновил семейство моделей Gemini 2.5 с новой Flash-Lite версией - самой быстрой и дешевой в линейке.

Основные фичи Flash-Lite: минимальная задержка, управление «размышлениями» через API, поддержка поиска и выполнения кода. По умолчанию режим мышления отключен для экономии.

Gemini 2.5 Flash тоже вышел в стабильный релиз с обновленными ценами, как и Pro 06-05.

Старые превью-версии будут отключены: Flash Preview 04-17 до 15 июля 2025, Pro Preview 05-06 до 19 июня 2025.

#Gemini25 #GoogleAI #ThinkingModels
———
@tsingular

👍6❤2🔥1🆒1

4.16K views19:08

About

Blog

Apps

Platform