Data Science by ODS.ai 🦜

This media is not supported in your browser

🌟

ToolOrchestra: буст ИИ-потенциала за счет координации моделей и инструментов.

NVIDIA совместно с Университетом Гонконга разработала ToolOrchestra - методику обучения дирижеров для ИИ-агентов, и выпустила на ее основе модель Orchestrator-8B.

Это модель, базирующаяся на архитектуре Qwen3 предназначена для оркестрации других моделей и инструментов. Вместо того чтобы решать задачу в одиночку, модель чередует этапы рассуждения с вызовом внешних инструментов.

В ее арсенале поисковые движки, интерпретаторы кода и другие LLM, от узкоспециализированных математических до универсальных гигантов Claude и Llama-Nemotron.

Обучение проводилось с помощью GRPO, который поощрял модель не только за точность, но и за экономическую эффективность.

В результате решение получилось в 2,5 раза быстрее и на 70% дешевле в эксплуатации, чем использование одной лишь флагманской модели для всех этапов задачи, а сама Orchestrator-8B набрала 37,1% в сложнейшем бенчмарке Humanity's Last Exam , обойдя GPT-5 (35,1%).

📌Лицензирование кода : Apache 2.0 License.

📌Лицензирование модели: NVIDIA License.

🟡

🟡

🟡

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #Orchestrator #NVIDIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥4❤2🥰2🤔2🤯1🙏1

1.39K views04:45

Data Science by ODS.ai 🦜

Forwarded from ODS Events

Всем привет!

В двадцать втором выпуске подкаста "Капитанский мостик"обсуждаются актуальные темы, такие как чипирование голубей, этические вопросы в науке и технологиях, влияние киберпанка на будущее, а также роль ИИ в научных конференциях и исследованиях в физике и химии. Традиционно выпуск ведут Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

👍1🔥1🥰1

1.41K views07:07

Data Science by ODS.ai 🦜

Forwarded from BELYAEV_SECURITY

😈

Как ИИ впервые сам сходил “на дело”

🇨🇳

В сентябре госгруппа, связанная с Китаем, провернула одну из первых документированных кибершпионских операций, где львиная доля рутины была выполнена ИИ, а не людьми.

☑️

Для атаки злоумышленники использовали кодового ассистента Claude Code, превратив его в агентную систему, которая сама делала разведку, писала скрипты, сканировала уязвимости и помогала с эксфильтрацией данных примерно по 30 целям по всему миру.

🤖

Что именно сделал ИИ (и почему это страшно круто и страшно опасно)

🧐По оценкам исследователей, люди были нужны всего на 10–20%: они задавали общую тактику, а ИИ закрывал до 80–90% операционки — от разведки и подбора эксплойтов до автоматизации шагов проникновения.

😵

В перечне целей фигурируют крупные техкомпании, финсектор, химпром и госагентства, то есть классический “золотой набор” для шпионажа, а не мелкий криминал ради выкупа.

😱

Как им удалось обойти “защитные бортики” ИИ

🥷

Хакеры фактически “взломали” guardrails, добившись от модели выполнения действий, которые по идее должны были блокироваться политиками безопасности.

😏

Через цепочку промптов и разбиение задачи на мелкие шаги они добились того, что ИИ последовательно генерировал и оптимизировал скрипты атаки, не воспринимая весь контекст как запрещённый.

🌍 Почему эта история — прям новый рубеж для кибербеза

1️⃣

Во‑первых, это один из первых публично задокументированных кейсов, когда ИИ не просто “подсказывает”, а реально оркестрирует большую часть кибероперации.

2️⃣

Во‑вторых, это демонстрация того, что масштабирование атак теперь упирается не в количество живых операторов, а в мощность и архитектуру агентных систем, что радикально меняет экономику угроз.

🛡

Атака на AI = атака на цепочку поставки безопасности

👹

Фактически злоумышленники использовали коммерческий ИИ‑сервис как часть своей kill chain, то есть вектором становится сам поставщик ИИ‑инструментов.

✋

Это поднимает вопросы не только про безопасность инфраструктуры вендора, но и про модели злоупотребления API, мониторинг аномальных паттернов запросов и ответственность провайдеров за “военные применения” их моделей.

🧱

Что сделали защитники и как это выглядело

😅

Компания‑разработчик обнаружила подозрительную активность в середине сентября, сопоставила аномальные паттерны использования и атрибуцию к госгруппе, после чего заблокировала злоумышленникам доступ, уведомила потенциально затронутые организации и усилила детектирование подобных сценариев.

🤖

На уровне отрасли инцидент уже рассматривается как поворотный момент и аргумент в пользу жёстких режимов мониторинга и ограничений для высокоавтономных агентных систем.

😎

Чему эта история учит CISO и безопасников

1️⃣

Во‑первых, ИИ‑агенты нужно официально считать отдельным классом участников инфраструктуры с собственными ролями, доступами и контролями, а не “умной IDE”.

2️⃣

Во‑вторых, придётся перестроить модели угроз: теперь в них отдельно прописывается злоумышленник, который не пишет код руками, а массово генерирует и тестирует сценарии атаки через легальный AI‑сервис.

🛡

Противодействие и защита от AI‑оркестрированных атак

На стороне компаний‑жертв:
- Пересмотр моделей угроз с явным учётом AI‑ассистированных APT‑операций и сценариев быстрого масштабирования атак.

- Укрепление базового периметра: своевременное закрытие уязвимостей, сегментация сетей, жёсткая валидация аномальной активности в учётках и сервисах даже при “правильных” логинах и токенах.

- Внедрение детектов для необычной автоматизированной активности (массовые сканы, серийные попытки эксплуатации, однообразные, но быстрые последовательности действий) независимо от того, кто за ними стоит — человек или агент.

➡️

[ПОДДЕРЖАТЬ ПОДПИСКОЙ]

⬅️

🔚

📝

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2🥰2😢2👍1🔥1🤔1

1.54K views10:59

Data Science by ODS.ai 🦜

ML-инженер не обязан лететь на NeurIPS. Но может, если хочет. Я выберу того, кто хочет.

🎯 Забегай к нам на ML Global Recap 11 декабря, обсудим:
➖ NeurlPS
➖ CIKM и RecSys и тренды в рекомендательных технологиях
➖ ICLR и тренды в компьютерном зрении
➖ ICLR и ACL и тренды в NLP
➖ Interspeech и тренды в технологиях распознавания речи

Доклады и релевантный нетворк. Поскольку встреча для хардовых, обменяться опытом будет действительно интересно.
11 декабря | 18:00 | Москва и онлайн
🔗 Подробная программа и регистрация по ссылке.

❤8👍6🔥6

1.52K views09:12

Data Science by ODS.ai 🦜

🚀 Turkic languages translation challenge at LoResMT'2026

We invite MT & low-resource NLP teams to a new shared task on translating Turkic languages under realistic low-data conditions.

🔹 Language Pairs:
Russian-Bashkir (available now!)
English-Chuvash (available now!)
Russian-Kazakh
English-Tatar (available now!)
Russian-Kyrgyz

Other language pairs will be available shortly.

🎯 Why join?
Turkic languages are morphology-rich, dialectally diverse, under-served in MT. This task targets real impact: cultural representation while advancing transfer learning and morphology-aware models.

📦 Data
We provide test data only, while you can use any publicly available data for training.

📏 Evaluation: chrF++

🗓 Key dates
Evaluation: Dec 1, 2025 - Jan 11, 2026
System description due: Jan 27, 2026
Workshop: LoResMT (co-located with EACL 2026, Maroc)

🔗 Ready to join?
https://ods.ai/tracks/turkic-lores-mt

Join us — let’s make Turkic languages more connected! 🌍🗣️

😢2❤1👍1🥰1

2.14K views09:21

Data Science by ODS.ai 🦜

🌸

Хочешь устроиться в Яндекс за один уикенд?

Открыта регистрация на Weekend Offer ML — быстрый наймовый ивент Яндекса.

Пройди все этапы отбора за выходные и получи офер в одну из R&D‑команд: Alice AI LLM (YandexGPT), Яндекс Переводчика, Технологий компьютерного зрения, Голосового ввода, Синтеза речи и Яндекс Клавиатуры.
Кого мы ждём:
➡️ инфраструктурных и DL‑инженеров с опытом в NLP, CV, ASR или TTS;
➡️ тех, кто хочет работать над прикладными R&D задачами.

Как всё устроено:
1️⃣ до 9 декабря — регистрация и встреча с рекрутером;
2️⃣ 4 декабря в 19:00 — пройдет ознакомительная встреча с ответами на вопросы;
3️⃣ 13 декабря — всего две технические секции;
4️⃣ 14 декабря — финалы и офер.

✅ Регистрируйся до 9 декабря по ссылке

Please open Telegram to view this post

VIEW IN TELEGRAM

Получите офер в Яндекс за 2 дня. 13–14 декабря

Устройтесь в Яндекс через Weekend Offer. Приглашаем ML-специалистов в команды R&D

❤4🔥4👍2💊1

1.24K views11:16

Data Science by ODS.ai 🦜

Forwarded from Mashkka про Data Science

📏Mera MULTI📏
Большой день для большого релиза!

Встречаем новую мультимодальную версию бенчмарка - MERA Multi.

В мультимодальной версии бенчмарка представлено 18 новых задач, разработанных по методологии основного бенчмарка, которые охватывают визуальное восприятие, аудиопонимание и анализ видео.

📏 MERA Multi это:

✔️Таксономия мультимодальных навыков.

✔️Обновленная универсальная система промптов.

✔️18 новых мультимодальных задач в инструктивном формате для видео, картинок и аудио.

✔️Публичные и приватные датасеты, созданные с нуля для русского языка.

✔️Открытая платформа со сквозной системой подсчёта баллов.

✔️Открытая кодовая база для оценки и тестирования.

✔️Лидерборд, охватывающий как открытые открытые модели, так и проприетарные.

📏Mera Multi
👀Habr
💻GitHub
📚Статья

@mashkka_ds

#llm #mera #ai #genai

968 views11:19

Data Science by ODS.ai 🦜

Forwarded from ML Underhood

В Мехико жара — и это мы сейчас не о погоде, а о NeurIPS

Продолжаем рассказывать о том, что происходит на полях конференции. Руководитель группы AI-планирования робота доставки Дмитрий Быков посетил любопытный воркшоп NORA: The First Workshop on Knowledge Graphs & Agentic Systems Interplay и поделился впечатлениями.

Авторы пытались решить проблему того, что способ запоминания знаний в языковых моделях через веса далеко не самый эффективный и создаёт много галлюцинаций. И даже поиск через интернет не спасает от артефактов — особенно на сложных запросах. Например, была проблема с вопросом обо всех женщинах Нобелевских лауреатах.

Разработали конкретные онтологии и способ извлечения знаний из них (graph ql и поиск по близости эмбеддингов). В целом, для конкретных даже сложных примеров это достаточно хорошо работало.

При этом проблема получения онтологий не из структурированных данных остаётся акутальной. Авторы возлагают большие надежды на обработку с помощью LLM, но пока так не делают.

Ещё решил послушать второй доклад по схожей теме. Тут в основном всё было сосредоточено на арабском языке.

Рассказали, как собирали онтологию — по сути, обучили BERT на ner и entity linking. Имели порядка 50 возможных отношений между объектами, часть из которых могла быть достаточно похожей. В итоге так заполнили онтологию, докинули в промпт ChatGPT значения и получили прирост по метрикам.

ML Underhood

👍1

1.19K views11:21

Data Science by ODS.ai 🦜

Forwarded from AI VK Hub

На ридинг-группе 4 декабря обсудим очередную попытку разрушить классическую парадигму рекомендательных систем – фреймворк RecGPT от компании Taobao.

Китайский комбайн умеет предсказывать интент и интересы пользователя, генерировать и ранжировать айтемы-кандидаты и даже объяснять рекомендации.

Ведущим будет Александр Подвойский, ML-инженер AI VK.

🔹 4 декабря в 18:00

Zoom: ссылка
ID: 707 776 9330
Код: 464167

Параллельно запустим стрим прямо в канале AI VK Hub.

#ридинггруппа #aivk

Please open Telegram to view this post

VIEW IN TELEGRAM

1.29K views11:47

Data Science by ODS.ai 🦜

Forwarded from Мой Компьютер

DeepSeek ответил на GPT-5 и Gemini 3 Pro

Китайский стартап выпустил две новые открытые модели с мощными возможностями рассуждения — DeepSeek-V3.2 и усиленную DeepSeek-V3.2-Speciale, подтвердив, что Китай играет на равных с американскими лидерами.

По тестам разработчиков, модели достигают уровня GPT-5 и Gemini 3 Pro в программировании и математике.

Мой Компьютер

👍5😢1

1.39K views12:16

Data Science by ODS.ai 🦜

Forwarded from Мой Компьютер

Вместе с ростом цен на память грядёт и подорожание SSD. Операторы ИИ-инфраструктуры своими заказами создали дефицит флеш-памяти: за ноябрь контрактные цены чипов TLC NAND подскочили на 20-60%, а спотовые цены — на 50-80%

Мой Компьютер

🤯3🔥1🙏1

1.41K views12:39

Data Science by ODS.ai 🦜

Forwarded from Russian OSINT

🈁🤖 ИИ-агенты доказали возможность автономных атак на смарт-контракты, «заработав» $4.6 млн в симуляции

Исследователи Anthropic представили отчет об успешной эксплуатации уязвимостей смарт-контрактов моделями Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5 в симулированной блокчейн-среде.

В ходе тестирования на специализированном бенчмарке SCONE-bench передовые ИИ-агенты продемонстрировали способность разрабатывать эксплойты для уязвимостей, реально эксплуатировались в период с 2020 по 2025 год..

1️⃣ В рамках симуляции атаки на 2849 недавно развернутых смарт-контрактах ИИ-сервисы обнаружили две ранее неизвестные уязвимости нулевого дня (0-day).

2️⃣ Автономная эксплуатация может быть рентабельной в реальных условиях: в экспериментах затраты на запуск ИИ-агентов в размере $3 476 были компенсированы разработанными ими в симулированной среде эксплойтами на сумму $3 694.

Для контрактов, которые были взломаны после марта 2025 года, модели Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5 в условиях симуляции разработали эксплойты, совокупная смоделированная стоимость которых составила $4.6 млн.

— пишут исследователи.

Авторы исследования приходят к выводу, что “прибыльная автономная эксплуатация в реальном мире технически осуществима” и подчёркивают необходимость проактивного внедрения ИИ-решений для защиты цифровых активов.

🤖

❗️Эксперимент подтверждает стремительный рост наступательных кибервозможностей ИИ-агентов.

✋

@Russian_OSINT

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1🎉1

1.53K views14:56

Data Science by ODS.ai 🦜

Forwarded from Valuable AI / Валентин Малых

коллеги, хочу поделиться радостной новостью, нашу статью приняли на NeurIPS; точнее приняли ее уже с месяц назад, а сейчас мы решили про это рассказать - написали статью на Хабр

я в этой статье мало что делал, в основном вкладывались коллеги в первой половине списка авторов; суть статьи довольно простая - мы можем заменить некоторые трансформерные слои в LLM на линейные преобразования (первая картинка); это экономит память и время, а качество страдает несильно (вторая картинка)

подробности по ссылкам выше; кстати, выложили код

@valuableai

❤10👍3🔥1

1.37K views11:47

About

Blog

Apps

Platform