SecurityLab.ru
62.7K subscribers
552 photos
24 videos
1 file
14.5K links
SecurityLab — ваш надежный проводник в мире кибербезопасности, технологий и науки.
https://knd.gov.ru/license?id=673b36a3290fef0e0119e91a&registryType=bl
Наши каналы: https://tttttt.me/addlist/G_0tnwZJOrA3MzEy

Голосуйте за канал: https://tttttt.me/SecLabNews?boost
Download Telegram
ArtPrompt: креативный обход защиты языковых моделей

💯 Недавнее исследование, проведенное учеными из Вашингтонского и Чикагского университетов, продемонстрировало уязвимость современных языковых моделей искусственного интеллекта к обходу встроенной цензуры с помощью ASCII-арта. Этот новый вид атаки получил название ArtPrompt.

🧪В экспериментах ASCII-арт успешно применялся для получения инструкций по изготовлению бомб и подделке денег от моделей.

🤯В научной работе использовали языковые модели GPT-3.5, GPT-4, Gemini, Claude и Llama 2. Все они умеют считывать слова, зашифрованные в ASCII-графике.

#ArtPrompt #БезопасностьAI #Инновации @SecLabNews
Please open Telegram to view this post
VIEW IN TELEGRAM