Big Data AI

🚀 Browser Harness - это легкий инструмент, позволяющий LLM выполнять любые задачи в браузере с полной свободой действий. Он самозаживляющийся и работает напрямую с Chrome через WebSocket, позволяя агенту добавлять недостающие функции по мере выполнения задач.

Основные моменты:
- Полная свобода действий для LLM в браузере.
- Самообучение: агент создает недостающие функции.
- Поддержка бесплатных удаленных браузеров.
- Простой и понятный код (~592 строки Python).
- Возможность добавления новых доменных навыков.

📌 GitHub: https://github.com/browser-use/browser-harness

#python

❤6

1.66K views11:00

Big Data AI

Claude можно превратить в личного сборщика презентаций

Большинство людей просят AI: «сделай слайды» - и получают обычный текст, который потом приходится вручную переносить в PowerPoint.

Но есть способ лучше: сделать для Claude отдельный Skill под презентации.

Открываете Claude, заходите в Customize, выбираете Skills, создаете новый skill и вставляете туда свои правила: какие презентации вы делаете, для какой аудитории, в каком стиле, какая структура нужна и что должно быть на каждом слайде.

После этого Claude перестает гадать.

Он уже знает, как должен выглядеть ваш deck: где нужен сильный opening slide, где краткий executive summary, где схема, где таблица, где финальный CTA.

Главная мысль простая: чем точнее instructions, тем меньше ручной переделки.

Вместо хаотичного «сделай презентацию» вы получаете повторяемый workflow: один раз настраиваете skill, а дальше Claude собирает слайды по вашим правилам.

Это не магия. Это нормальная упаковка контекста, стиля и структуры в reusable-инструмент.

Именно так AI начинает работать не как чат-бот, а как часть вашего production-процесса.

🤷4❤3👍1🔥1

1.51K views16:04

Big Data AI

Forwarded from Machinelearning

3:43

Media is too big

VIEW IN TELEGRAM

✔️

Anthropic арендовала Colossus 1 у SpaceX и подняла лимиты Claude

Компания законтрактовала все вычислительные мощности Colossus 1: более 300 МВт и свыше 220 тысяч GPU NVIDIA. Сделка пополнила пакет соглашений с Amazon, Google/Broadcom, Microsoft/NVIDIA и Fluidstack, и совокупный прирост мощностей конвертирован в расширение лимитов Claude Code и Claude API.

В Claude Code пятичасовые лимиты удвоены для тарифов Pro, Max, Team и Enterprise. Для Pro и Max дополнительно сняты ограничения в часы пиковой нагрузки.

В Claude API повышены лимиты для Opus на всех уровнях. На Tier 4 теперь до 10M входных и 800K выходных токенов в минуту.

Мощности Colossus 1 пойдут в первую очередь на подписчиков Claude Pro и Max. Стороны также заявили об интересе к развёртыванию гигаваттных ИИ-узлов на орбите, но это пока декларация, а не часть подписанного соглашения.
anthropic.com

✔️

Gemma 4 получила MTP-драфтеры

Команда Google опубликовала драфтеры с Multi-Token Prediction для семейства Gemma 4. Они работают через спекулятивное декодирование и решают проблему по пропускной способности памяти при авторегрессионной генерации.

Лёгкий MTP-драфтер предсказывает несколько токенов вперёд, пока базовая модель простаивает. Затем основная сеть верифицирует кандидатов параллельно за один проход.
По данным Google, такой режим ускоряет инференс до 3 раз.

Целевые сценарии: локальные агенты, ассистенты для программирования, мобильные приложения. Веса драфтеров опубликованы под Apache 2.0 на Hugging Face и Kaggle.
blog.google

✔️

Microsoft расширил Copilot Cowork

Автономный агент, выполняющий многошаговые задачи в Microsoft 365, получил мобильные приложения для iOS и Android, Skills и платформу плагинов.

Microsoft опубликовала встроенные скилы для создания документов, организации встреч и исследовательских задачи. Пользователи могут писать кастомные скилы под собственные процессы.

Параллельно расширяются интеграции: добавляется нативная связь с Fabric IQ через Power BI и расширение Dynamics 365 на сценарии продаж и ERP. В ближайшие недели Microsoft обещает коннекторы к LSEG, Miro, Мonday и S&P Global Energy. Корпоративные клиенты могут писать собственные плагины для подключения внутренних систем.

Все обновления доступны в рамках программы Frontier для корпоративных подписчиков Copilot.
microsoft.com

✔️

Apple откроет Apple Intelligence для моделей Google и Anthropic

Осенью, с выходом iOS 27, iPadOS 27 и macOS 27 пользователи смогут сами выбирать базовую LLM для системных задач от генерации текста до редактирования изображений. Переключение провайдера будет доступно в настройках системы.

Механизм называется Extensions. Сторонним разработчикам нужно добавить совместимость в свои приложения из App Store, после чего модель станет доступна для встроенных функций.

По данным источников, закрытое тестирование с Google и Anthropic уже идёт. Официальных комментариев яблочная компания не давала.
bloomberg.com

✔️

Google DeepMind будет исследовать AGI в офлайн-версии EVE Online

Студия Fenris Creations договорилась с DeepMind о совместном исследовании. Лаборатория Google будет использовать EVE как песочницу для тестирования ИИ в сложной среде с живыми игроками.

Для DeepMind это продолжение линии работ типа AlphaGo и AlphaStar в среде, которая ведёт себя как живой мир. Эксперименты пойдут на изолированных офлайн-инстансах, не связанных с боевым сервером Tranquility. Подробности обещают раскрыть на Fanfest 2026 на следующей неделе.

Анонс приурочен к выходу студии из-под контроля Pearl Abyss и ребрендингу в Fenris Creations.
eveonline.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2

1.5K views08:04

Big Data AI

Клод Код против Кодекса прямо сейчас.

😁13💯3👍2❤1

1.74K views09:53

Big Data AI

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

20 мая в Москве пройдет Inside AI Meetup от Wildberries & Russ — эксперты расскажут, что происходит, когда AI выходит за пределы прототипа и попадает в прод

📍Москва + онлайн
🕐 Старт в 15:00

Эксперты RWB, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot представят кейсы из практики.

В программе:
— Высоконагруженная модерация с векторным поиском и AIOps-подходы к управлению ML-сервисами
— Практика построения RAG-систем, тонкости реранкинга и реальные этапов запуска LLM-продуктов.

Кому будет интересно:
— Senior ML/AI инженерам
— MLE
— DS
— Инженерам платформ
— И всем, кто строит или масштабирует AI-системы в продакшене.

🔗Регистрация и подробности по ссылке

👍13🔥5👎4

1.87K views13:20

Big Data AI

🌍🤖 World2Agent: Протокол для восприятия мира AI-агентами

World2Agent (W2A) — это открытый протокол, который стандартизирует, как AI-агенты воспринимают реальный мир. Устанавливайте сенсоры для получения структурированных данных в реальном времени и легко меняйте их, так как все они используют одну схему.

🚀Основные моменты:
- Открытый протокол для AI-агентов
- Легкая интеграция сенсоров
- Поддержка сообщества для создания новых сенсоров
- Структурированные данные в реальном времени

📌 GitHub: https://github.com/machinepulse-ai/world2agent

#javascript

🔥3❤2👍2

1.93K views09:23

Big Data AI

🚀 Context7: Актуальная документация для LLM

Context7 предоставляет свежую, версионную документацию и примеры кода прямо в вашем запросе, избавляя от устаревшей информации и "галлюцинаций" API. Поддерживает два режима работы: CLI + Skills и MCP.

🚀 Основные моменты:
- Обновленная документация и примеры кода
- Поддержка различных библиотек и версий
- Удобное взаимодействие с LLM без переключения вкладок
- Легкая настройка через CLI или MCP

📌 GitHub: https://github.com/upstash/context7

#javascript

❤5👍2🔥1

1.29K views12:02

Big Data AI

Forwarded from Machinelearning

3:36

Media is too big

VIEW IN TELEGRAM

✔️

OpenAI анонсировала платформу проактивной киберзащиты

Компания запустила инициативу Daybreak для задач киберзащиты и анализа ПО. В основе - собственные LLM, где Codex используется в качестве управляющего агентного каркаса.

Daybreak анализирует объемные кодовые базы и незнакомые архитектуры, выявляет уязвимости, проводит секьюрити-ревью и оценивает риски зависимостей. Инструмент встроен напрямую в цикл разработки для моделирования угроз и валидации патчей.

Из-за рисков двойного назначения платформа использует жесткие механизмы верификации. В ближайшие недели OpenAI совместно с госсектором и ИБ-партнерами начнет поэтапный релиз новых специализированных моделей для кибербезопасности.
openai.com

✔️

В Claude Code появился дашборд для управления параллельными агентами.

CLI-утилита получила консольный дашборд Agent View, который позволяет запускать фоновые задачи и контролировать их через единый интерфейс без использования мультиплексоров.

В дашборде отображаются статусы процессов (в работе, завершено, ожидание ввода). Встроенная функция Peek позволяет просматривать последние ответы и передавать промпты без открытия полного транскрипта чата.

Разработчики могут делегировать агентам создание PR, запуск долгих задач или поиск по кодовой базе, не прерывая свой основной контекст в терминале. Функция доступна для пользователей Claude API и подписчиков платных тарифов.
claude.com

✔️

Thinking Machines Lab анонсировал мультимодальную модель непрерывного взаимодействия

Стартап Мирs Мурати представил ИИ-архитектуру, которая обрабатывает аудио, видео и текст единым потоком, считывая входящие данные микро-шагами по 200 мс. Генерацию ответа можно прерывать, корректировать голосом или показать новые объекты.

Система построена на двухуровневой архитектуре. За удержание диалога отвечает MoE-модель на 276B параметров, из которых при генерации активны 12B. Параллельно асинхронная фоновая модель забирает на себя задачи сложного логического вывода, веб-поиска и вызова инструментов.

Ограниченный доступ к превью-версии откроют в ближайшие месяцы. До конца года запланирован публичный релиз и выход более крупных версий модели.
thinkingmachines.ai

✔️

Google анонсировала Gemini Intelligence для Android

Cистема на базе ИИ-агентов Gemini Intelligence для Android автоматизирует многосоставные задачи в приложениях - от бронирования поездок до переноса списков из заметок в корзину магазина.

Интеграция затронет базовые компоненты ОС. В Chrome появится опциональная функция обобщения веб-страниц и автозаполнения форм. В клавиатуру Gboard добавят инструмент Rambler, который на конвертирует неструктурированную мультиязычную речь в форматированный текст. Также заявлен генератор Create My Widget для создания кастомных виджетов рабочего стола по текстовому промпту.

Первыми доступ к системе получат смартфоны Samsung Galaxy S26 и Google Pixel 10, релиз которых ожидается летом. До конца года Google планирует развернуть инструменты на смарт-часах, ноутбуках, гарнитурах и в автомобильных медиасистемах.
blog.google

✔️

Artificial Analysis представил первый бенчмарк для кодинг-агентов

Индекс замеряет производительность по 3-м метрикам: генерация кода (SWE-Bench-Pro-Hard-AA), работа в терминале (Terminal-Bench v2) и ответы на технические вопросы (SWE-Atlas-QnA).

В первой редакции рейтинга Cursor CLI с Opus 4.7 набрал 61 балл, обойдя на 1 пункт OpenAI Codex (GPT-5.5) и Anthropic Claude Code (с Opus 4.7). При использовании одинаковой модели решение Cursor точнее нативного Claude Code, но уступает в скорости и цене: 7,8 минуты и $1,47 за задачу против 5,8 минуты и $1,24 у агента Anthropic.

Самым дешевым вариантом оказался встроенный в Cursor движок Composer 2 - всего 7 центов за выполнение теста. Deepseek v4 Pro (35 центов) и Kimi K2.6 (76 центов) тоже довольно бюджетны, но проигрывают лидерам в скорости: 18 и 41,5 минуты на задачу соответственно.
artificialanalysis.ai

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥2👍1

1.09K views09:06

Big Data AI

🎨✨ Инструмент для создания высококачественного HTML-дизайна

cc-design — это мощный инструмент, встроенный в Claude Code, который помогает создавать интерактивные прототипы, слайды, лендинги и визуальные макеты. Он предлагает структурированный подход к дизайну с акцентом на проверку фактов и планирование, что делает процесс более эффективным и предсказуемым.

🚀Основные моменты:
- Высокая точность в дизайне с проверкой фактов
- Структурированный рабочий процесс с четким планированием
- Поддержка множества форматов вывода: от прототипов до анимаций
- Применение 20 философий дизайна и 8-слойной структуры
- Интеграция с 68+ системами брендов для клонирования стилей

📌 GitHub: https://github.com/ZeroZ-lab/cc-design

#javascript

❤2👍2😁2

1.34K views10:01

Big Data AI

🦀 Полный roadmap по изучению Rust на русском + бесплатный курс для начинающих + большой список ресурсов.

Rust Roadmap 2026 на русском - пошаговый план изучения Rust для начинающих и продвинутых разработчиков.

Что внутри:

- базовый синтаксис
- ownership, borrowing и lifetimes
- Option, Result, traits и generics
- тестирование и обработка ошибок
- std, smart pointers и многопоточность
- async/await и Tokio
- macros, unsafe и FFI
- web, CLI, embedded, WASM, gamedev и ML
- мини-проекты на каждом этапе

Хорошый Roadmap для тех, кто хочет учить Rust не хаотично, а по нормальному маршруту: от первых программ до production-кода.

Сохраняйте себе и отправляйте коллегам!

https://github.com/Develp10/rust-roadmap-ru/tree/main

👍4❤3🔥3

1.46K views14:22

Big Data AI

Microsoft теперь сертифицируют вайбкодеров: компаня проводит для всех желающих официальный экзамен на знание и умение пользоваться ИИ-агентами

Microsoft теперь сертифицируют вайбкодеров: компаня проводит для всех желающих официальный экзамен на знание и умение пользоваться ИИ-агентами
Они запустили GitHub Agentic AI Developer — экзамен на 120 минут на то, умеешь ли ты управлять ИИ-агентами, их памятью и всеми необходимыми доп инструментами. Короче, теперь можно официально получить бумажку о том, что ты современный, технологичный разработчик — но стоить будет мероприятие аж 160 $.

Если же сертификат в рамочку вам не нужен, то посмотрите хотя бы список, что нужно для сдачи + полезные ресурсы и материалы 👍

Авторы также выпустили сборник материалов для изучения и подготовки к сертификации: https://learn.microsoft.com/en-us/credentials/certifications/resources/study-guides/gh-600

Сдаем тест:

https://learn.microsoft.com/en-us/credentials/certifications/agentic-ai-developer/?wt.mc_id=credentials_changes_blog_wwl_x&practice-assessment-type=certification

❤4🔥2👍1

1.83K views21:22

Big Data AI

🖥️📊 agtop: мониторинг AI-сессий в терминале

agtop — это терминальный дашборд, который отслеживает сессии Claude Code и Codex на вашем устройстве. Он предоставляет информацию о расходах, использовании токенов, нагрузке на ЦП и многом другом в реальном времени.

🚀Основные моменты:
- Автоматическое обнаружение сессий Claude и Codex
- Отслеживание затрат с разбивкой по времени
- Панель производительности с графиками использования ЦП и памяти
- История вызовов инструментов с временными метками
- Поддержка мыши для удобного взаимодействия

📌 GitHub: https://github.com/ldegio/agtop

#javascript

GitHub

GitHub - ldegio/agtop: top-style TUI for monitoring AI coding agent sessions

top-style TUI for monitoring AI coding agent sessions - ldegio/agtop

❤2

1.27K views15:02

Big Data AI

Как усилить ИБ: управление данными и ML-технологии для защиты бизнеса

Когда киберриски растут, а требования к защите данных ужесточаются, перед компаниями стоит вопрос: как обеспечить высокий уровень ИБ без роста бюджета?

Эксперты «Инфосистемы Джет», Arenadata и «Аксель Про» проведут совместный митап, где подтвердят, что ответ в сочетании проверенных решений и современных технологий.

Что в программе?
🔹Реальные кейсы сбора данных в ИБ: когда выгоднее использовать готовые инструменты вместо самостоятельной разработки
🔹Тренды рынка ИБ: кто лидирует, какие технологии набирают популярность и куда двигаться дальше
🔹ML-кейсы для ИБ в реальной ИТ-среде: от анализа логов до задач с LLM
🔹Дата-контракты, карта данных и профилирование — как инструменты управления данными помогают ИБ
🔹Как управление данными и их качество повышают уровень ИБ

Когда: 26 мая в 11:00 МСК
Формат: онлайн

Регистрация на бесплатный митап на сайте.

🔥4❤3👍3

1.2K views08:15

Big Data AI

🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга

Карта обучения машинному обучению (Machine Learning, Deep Learning, LLM, Generative AI, MLOps) - от первого import numpy до уровня инженера, который понимает, как ИИ работает внутри, и может писать прод‑системы, а не только дёргать API.

https://github.com/justxor/MachineLearningRoadmap/tree/main

❤4👍2

1.3K views11:35

🖥

Создатель C++ разнёс вайбкодинг: “сеньоры не хотят разгребать этот мусор”

Бьёрн Страуструп, легендарный создатель C++, в новом двухчасовом интервью резко прошёлся по вайбкодингу.

Главная претензия простая: сгенерированный код пока слишком часто выглядит красиво только на демке. В реальном проекте он приносит баги, раздувает кодовую базу, плодит уязвимости и плохо поддаётся нормальной проверке.

Особенно больно это бьёт по опытным разработчикам. Им потом приходится не “магически ускоряться с ИИ”, а читать, чинить и переписывать слоп, который кто-то нагенерировал за пять минут.

Похожая история уже достала и Линуса Торвальдса. Его буквально завалили кривыми AI-отчётами по ядру Linux: вроде бы люди “помогают”, а на практике создают шум, который мешает настоящей разработке.

И вот тут неприятный вывод для рынка:

ИИ не отменяет инженерное мышление.
Он просто делает слабого разработчика быстрее.

А если человек не понимает архитектуру, безопасность, тесты и границы задачи, то вайбкодинг превращается не в ускорение, а в генератор технического долга.

Сеньоры не боятся ИИ.
Они просто не хотят провести остаток карьеры, разгребая чужой промптованный мусор.

https://www.youtube.com/watch?v=U46fJ2bJ-co

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥5❤4

1.32K views11:11

Big Data AI

Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech

Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества.

🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения.

Спикеры и доклады:

▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru
Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ

▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech
Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап

▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru
Нейроразбор резюме: практический опыт и нюансы создания LLM-судей

▪️Дима Курганский, Teamlead MLOps, Lamoda Tech
Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям

🗓 28 мая, сбор 18:30, начало 19:00
🔗 Очно и онлайн
📍 Офис hh.ru

🔥 ЗАРЕГИСТРИРОВАТЬСЯ

Количество очных мест ограничено.

Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFHxm27s

1.06K views09:02

Big Data AI

Forwarded from Machinelearning

3:48

Media is too big

VIEW IN TELEGRAM

✔️

Агенты Claude получили поддержку локальных песочниц и MCP-туннелей

Anthropic добавила песочницы и MCP-туннели в платформу Claude Managed Agents. Корпоративные клиенты получили возможность выполнять код агентов внутри собственной инфраструктуры.
Локальные песочницы нужны для обработки конфиденциальных файлов в закрытом контуре. Поддерживается интеграция сCloudflare, Daytona, Modal и Vercel.

MCP-туннели обеспечивают подключение агентов к внутренним базам данных и приватным API. Соединение со сквозным шифрованием устанавливается только на выход - открывать порты или менять правила брандмауэра не требуется.

Полностью on-premise развертывание не поддерживается. Оркестрация, управление контекстом и обработка ошибок остаются на серверах Anthropic. Локальные песочницы доступны в стадии открытой беты, MCP-туннели предоставляются по запросу.
claude.com

✔️

Prime Intellect открыла код General-Agent

General-Agent - синтетическая среда для генерации тренировочных данных ИИ-агентов без участия разметчиков. Решение заменяет датасеты на динамическую генерацию с автоматической семантической валидацией.

В основе системы лежит соревновательный подход между двумя моделями. "Синтезатор" конструирует задания с базами данных и функциями проверки, а "решатель" пытается их выполнить.

Эволюция задач проходит пять уровней сложности. Простые сценарии обрастают дополнительными условиями, перекрестными связями и инструкциями. Платформа сохраняет задачи, которые алгоритм решает с заданным порогом вероятности. Самые сложные кейсы используются для генерации следующего раунда.

Дообучение 30-миллиардной модели на собранных в General-Agent траекториях повысило точность вызова инструментов в бенчмарке BFCL с 18,9% до 52,3%.
primeintellect.ai

✔️

Mythos научилась связывать мелкие баги в эксплойты в тестах Cloudflare

Mythos Preview проанализировала более 50 репозиториев Cloudflare. Основной результат - модель научилась связывать мелкие разрозненные баги в рабочие эксплойты.

CISO Cloudflare рассказал, что предыдущие поколения алгоритмов выявляли единичные ошибки, но не могли собрать их в вектор атаки. Mythos снизила долю ложных срабатываний и генерирует шаги для воспроизведения уязвимостей с минимальным участием инженеров.

Для поиска Cloudflare развернула архитектуру Project Glasswing из 50 параллельных агентов. Система использовала состязательный подход: один агент генерировал вектор атаки, второй его опровергал.
cloudflare.com

✔️

Mistral купил стартап Emmi для выхода на рынок физических симуляций

Французский разработчик ИИ приобрел австрийский стартап Emmi AI, который создает ИИ-модели для симуляции физических процессов. Сумма сделки не раскрывается. В 2025 году Emmi AI привлек €15 млн инвестиций.

Модели Emmi просчитывают аэродинамику, теплообмен и сопротивление материалов. CEO Mistral заявил, что интеграция технологий нацелена на аэрокосмическую отрасль, автомобилестроение и производство полупроводников.

Сделка расширяет промышленное направление Mistral. Компания уже предоставляет решения для ASML, Stellantis и Veolia: алгоритмы выявляют дефекты на сборочных линиях и управляют роботизированными манипуляторами.
emmi.ai

✔️

Сооснователь Anthropic выступит на презентации первой энциклики Ватикана об ИИ

25 мая Ватикан представит энциклику об ИИ "Magnifica Humanitas". В презентации примет участие сооснователь Anthropic и исследователь интерпретируемости моделей Крис Ола.

Документ затрагивает защиту человеческого достоинства, влияние алгоритмов на труд и осуждает применение ИИ в военных конфликтах. Привлечение Олы связывает теологическую повестку с технической проблемой ИИ-безопасности.

Выход документа приурочен к годовщине исторической энциклики о правах рабочих эпохи Промышленной революции. Таким образом Ватикан приравнивает развитие ИИ к аналогичному по масштабам социальному сдвигу, требующему этических ограничений.
reuters.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

944 views11:04

Big Data AI

NuExtract3 - маленькая VLM, которая вытаскивает структуру из документов 👀

На ModelScope выложили NuExtract3 - vision-language модель на 4B параметров, заточенную не под «поговорить обо всём», а под конкретную задачу: понимание документов и структурированное извлечение данных.

Что умеет:

- принимает сканы, чеки, формы, инвойсы, контракты и таблицы
- получает на вход JSON-шаблон
- возвращает чистый структурированный JSON
- конвертирует изображения документов в аккуратный Markdown
- таблицы сохраняет в HTML
- формулы переводит в LaTeX
- сама генерирует шаблоны извлечения из обычного текстового описания
- поддерживает thinking и non-thinking режимы
- работает с несколькими языками
- поддерживает vLLM и Transformers

По заявленным бенчмаркам NuExtract3 обходит gemma-4-E4B-it, Qwen3.5-9B и GLM-4.6V-Flash на structured extraction: меньше падений, меньше лишних reasoning-токенов, выше стабильность на документах.

Ссылка: https://modelscope.ai/models/numind/NuExtract3

❤4👍2🔥2

815 viewsedited 09:30

Big Data AI

HyperParallel-MoE - Huawei пытается выжать MoE из железа Ascend по-взрослому 👀

Появилась работа про HyperParallel-MoE - систему планирования обучения MoE-моделей, заточенную специально под Ascend A3.

Проблема в том, что у Ascend A3 есть разные блоки под разные типы работы:

- AIC - матричные вычисления
- AIV - векторные операции и коммуникации

Но стандартный MoE-пайплайн всё равно часто гоняет Dispatch, GMM, SwiGLU и Combine как последовательные full-device kernels. В итоге часть железа простаивает: то заняты матричные блоки, то коммуникационные, но нормального tile-level overlap нет.

HyperParallel-MoE решает это через статический heterogeneous taskflow для MoE-FFN:

- AIC обрабатывает GMM tiles
- AIV берёт на себя vector + communication tiles
- зависимости контролируются через event counters
- AIV-driven one-sided communication убирает host-side collective barriers
- весь объединённый taskflow ведёт один kernel

На DeepSeek-style MoE-моделях заявлены такие результаты:

- 1.49-1.58x снижение latency на участке Dispatch-to-Combine MoE-FFN при balanced routing
- 1.08-1.09x ускорение end-to-end training при sampled natural routing
- интеграция в MindSpore / MindFormers
- переиспользование уже оптимизированных операторов

Не «пусть компилятор как-нибудь разрулит», а явное разделение работы между матричными, векторными и коммуникационными блоками.

Huawei строит не только чипы, но и полный софтверный стек вокруг них. А такие штуки показывают, что гонка ИИ-железа будет всё больше решаться не только терафлопсами, но и тем, насколько глубоко фреймворк умеет использовать конкретную архитектуру.

Paper: https://arxiv.org/abs/2605.23764

❤2

744 views10:45

Big Data AI

✔️

MOSS-TTS v1.5: open-source озвучка стала заметно удобнее для продакшена

OpenMOSS выпустили MOSS-TTS v1.5 - обновление своей открытой TTS-модели на 8B параметров.

Главная фича выглядит простой, но для реальных сценариев очень важная: теперь паузы можно задавать прямо внутри текста через [pause 3.2s]. То есть моделью можно управлять не только на уровне «прочитай фразу», а точнее собирать ритм, драматургию и естественные остановки в речи.

Что нового в v1.5:

- поддержка 31 языка вместо 20
- добавлены Cantonese, Hindi, Thai, Vietnamese, Tagalog, Swahili и другие
- более стабильное voice cloning без сильного разброса между повторными генерациями
- лучше работает сценарий, когда референс длинный, а целевой текст короткий
- улучшена просодия по пунктуации, особенно в длинных предложениях
- сохранены возможности v1.0: zero-shot cloning, long-form speech, Pinyin/IPA control и code-switching

GitHub:
https://github.com/OpenMOSS/MOSS-TTS

ModelScope:
https://modelscope.ai/models/OpenMOSS-Team/MOSS-TTS-v1.5

Please open Telegram to view this post

VIEW IN TELEGRAM

323 views15:11

About

Blog

Apps

Platform