Недавно команда AI Defense из Cisco представила Model Provenance Kit — open-source инструмент для анализа происхождения ML-моделей.
Проект помогает ответить на важный вопрос: действительно ли модель была обучена “с нуля”, или она является производной от другой модели?
Model provenance — это установление происхождения модели на уровне ее обученных весов.
Проще говоря, инструмент позволяет определить:
Cisco сравнивает этот процесс с ДНК-анализом моделей.
Model Provenance Kit использует двухэтапный анализ.
На первом этапе анализируются:
Если архитектура явно совпадает — система может сделать вывод без загрузки весов.
Если метаданных недостаточно, запускается глубокий анализ весов:
На основе этих признаков рассчитывается итоговый similarity score.
git clone https://github.com/cisco-ai-defense/model-provenance-kit.git
cd model-provenance-kit
uv sync
Для работы достаточно CPU — GPU не требуется. Cisco отмечает, что архитектурные проверки выполняются за миллисекунды, а извлеченные признаки кешируются для повторного использования.
provenancekit scan bigscience/bloom-560m
Инструмент:
provenancekit compare gpt2 distilgpt2
Результат включает:
#ai #llm #mlsecurity #cisco #supplychain #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤3🔥3