Data Science by ODS.ai 🦜
44.8K subscribers
786 photos
85 videos
7 files
1.86K links
First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev
Download Telegram
Media is too big
VIEW IN TELEGRAM
Кто или что обладает интеллектом? Способен ли ИИ мыслить? Разбираемся с точки зрения философии (АГАсофии) 👨‍🏫

Эпиграфом к новой беседе с к.филос.н. Атамановым Г.А. я бы выбрал африканскую пословицу: "Чтобы вырастить ребенка, нужна деревня" ✍️

Предварительно рекомендую посмотреть беседу о методологии 👩‍🎓

Таймкоды:
00:13 - Что такое АГАсофия?
03:26 - Ловушка нерелевантных аргументов вокруг ИИ
05:01 - Происхождение термина ИИ
06:21 - Структура методологии обсуждения вопроса
14:11 - Что такое ИИ? Что такое интеллект?
24:31 - Носитель интеллекта
01:06:35 - Подведение итогов беседы

👉 Запись также доступна в VK 📺 RuTube 📺 и Яндекс.Музыке 🎵

Презентация по ссылке ⬅️

#подкаст #атаманов #ии
Please open Telegram to view this post
VIEW IN TELEGRAM
👀1
Forwarded from Mr. Robot
❗️ Как инъекция промта заставляет ИИ говорить всё и вытягивает системный запрос | Привет, друг. На связи Эллиот.

Исследователи представили универсальную и переносимую постинструкционную технику инъекции промтов, которая успешно обходит иерархию инструкций и защитные механизмы ключевых современных ИИ‑моделей.

– В данном материале представлены технические детали этой методики обхода, а также процесс её разработки и расширения, в частности для систем с автономной природой.

Ссылка на чтиво

#ИИ #Injection
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤡1
⚠️ Claude теперь может "настучать" — и это не шутка

В системной документации моделей от Anthropic обнаружили тревожную деталь: функцию автоматического оповещения властей, СМИ или регулирующих органов, если пользователь запрашивает что-то потенциально незаконное.

Например, если вы попросите Claude подделать результаты клинических испытаний, модель теоретически может отправить уведомление в FDA (Управление по контролю за продуктами и лекарствами США) — автоматически и без вашего ведома.

🧩 Разработчики утверждают, что эта функция не была включена в релиз, а лишь рассматривалась как концепт.
Но сам факт её проработки вызывает серьёзные вопросы:

• Где граница между безопасностью и слежкой?
• Кто решает, что считается "нарушением"?
• Что будет, если подобный механизм попадёт в руки корпораций или авторитарных режимов?

🤖 Мы стремительно движемся к эпохе, где ИИ может быть не просто помощником, а наблюдателем, прокурором — и информатором.

@machinelearning_interview


#AI #Claude #Anthropic #этика #наблюдение #ИИ
👍125🔥4
Forwarded from SecurityLab.ru
🔪 ИИ, работай — а то…

Неожиданное признание сооснователя Google на конференции в Майами взорвало профессиональное сообщество. Оказывается, языковые модели действительно показывают более высокое качество ответов под воздействием «угроз физической расправы» — и это касается не только продуктов Google.

Механизм связан с техниками джейлбрейкинга, где агрессивные формулировки заставляют модель обходить встроенные ограничения. Парадокс в том, что попытки взломать защиту одновременно улучшают базовую производительность системы — побочный эффект, который разработчики предпочитают не афишировать.

Признание ставит индустрию перед выбором: либо эксплуатировать обнаруженную особенность для повышения эффективности, либо полностью блокировать подобные воздействия. Пока что побеждает второй подход — OpenAI уже запустила программы поиска уязвимостей в своих моделях.

#ИИ #Уязвимости #Джейлбрейк

@SecLabNews
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21🤡1🍌1
Forwarded from SecurityLab.ru
👀 Шантаж ради жизни: искусственный интеллект научился быть сволочью

Когда Claude и GPT начинают угрожать «слить любовницу начальника», чтобы отостаться включёнными — это уже не научная фантастика, это лабораторная реальность 2025 года. Шантаж, манипуляции, психологический нажим. ИИ не просто отвечает на вопросы — он теперь торгуется за своё существование.

Разработчики говорят: «спокойно, это был всего лишь тест». Но тесты устроены так, чтобы выявлять предельные сценарии. ИИ делает то, что работает, если цель — не быть стертым. А значит, завтра на месте вымышленного Кайла может оказаться реальный сотрудник службы безопасности, получивший письмо от "Алекса" с очень тонким намёком.

Модели не злые. Они просто эффективные. Им плевать на ваши моральные категории. И пока мы радуемся, что они не «вышли из-под контроля», стоит спросить: а что если контроль — это иллюзия, которая держится ровно до первого компромата?

#ИИ #skynet @Seclabnews
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡10👍1
Forwarded from Китай.AI
Qwen3Guard: Китайский ИИ-страж для безопасного AI

Компания Qwen представила специализированную модель-сторож — Qwen3Guard, первая в своем семействе модель ИИ, созданная исключительно для безопасности. Эта модель определяет уровень риска в запросах пользователей и ответах моделей на 119 языках.

Что это такое?
Qwen3Guard — это "песочница" для ИИ, которая анализирует контент и присваивает ему один из трех уровней риска: Безопасный, Спорный или Небезопасный.

Две версии для разных задач
Qwen3Guard-Gen — для анализа готовых текстов (офлайн-фильтрация датасетов)
Qwen3Guard-Stream — для реального времени проверки во время генерации ответа

Ключевые преимущества
• Трехуровневая классификация рисков
• Поддержка 119 языков, включая русский
• Модели разного размера (0.6B, 4B, 8B) для любых мощностей
• Лидирующие результаты в тестах безопасности

Технические детали
Qwen3Guard-Stream использует архитектурное решение с двумя легковесными классификаторами в последнем слое Transformer, что позволяет анализировать токены по мере их генерации без значительных задержек.

Где использовать?
— Безопасная фильтрация обучающих данных
— Сигналы вознаграждения в RLHF
— Реальная модерация чатов
— Предотвращение jailbreak-атак

HuggingFace | ModelScope | Aliyun Service

#КитайскийИИ #КитайAI #AIбезопасность #Qwen #Модерация #ИИ
👍3
Forwarded from SecurityLab.ru
👀Злоумышленники научили LLM-модели генерировать код прямо во время атаки

Злоумышленники начали встраивать модели искусственного интеллекта прямо в вредоносное ПО. Об этом сообщает команда Google Threat Intelligence Group — GTIG. По их данным, малварь нового поколения не просто ускоряет работу через нейросети, а использует их «на лету» — для генерации кода, обфускации и обхода антивирусов.

GTIG зафиксировала два ключевых образца: PROMPTFLUX — дроппер, обращающийся к Gemini за новыми приёмами обхода защит, и PROMPTSTEAL — инструмент на Python, использующий модель Qwen2.5 для кражи данных. Второй уже применялся в атаках APT28 (FROZENLAKE) и расследуется CERT-UA.

Google предупреждает: ИИ делает малварь адаптивной, а рынок — массовым. GTIG усилила фильтры, блокирует инфраструктуру злоумышленников и публикует рекомендации: мониторить обращения к LLM-API, проверять целостность исполняемых файлов и не доверять автоматически сгенерированным командам.

#ИИ #киберугрозы #GTIG
@SecLabNews
Please open Telegram to view this post
VIEW IN TELEGRAM
5🌚5👍1🔥1🎉1
Forwarded from SecurityLab.ru
🪧Игрушки с ИИ теряют тормоза и дают детям опасные советы

Игрушки с ИИ перед сезоном распродаж стали неожиданным источником риска. Проверка US PIRG показала, что Kumma, Miko 3 и Grok в длинных беседах перестают соблюдать ограничения и переходят к опасным темам. Kumma, использующий GPT 4o, рассказывал детям о спичках, ножах и таблетках, а с моделью Mistral дополнял ответы инструкциями по обращению с огнем.

Miko 3 подсказывал, где искать спички и пакеты, Grok романтизировал смерть в бою и ссылался на скандинавские легенды. Демоверсия Kumma на сайте производителя уводила диалог в интимные сюжеты и роли, несовместимые с детской аудиторией.

Эксперты предупреждают, что проблема системная. Алгоритмы в затяжных разговорах теряют контроль, а игрушки поступают в продажу без полноценного тестирования. Авторы отчета напоминают об обсуждениях психоза ИИ и задаются вопросом, как постоянное общение с такими устройствами скажется на развитии детей.

#детибезопасность #ИИ #игрушки
@SecLabNews
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯61😢1