Куратор из ЛСБ
460 subscribers
1.04K photos
154 videos
9 files
336 links
Анонимный канал главреда и куратора из Лиссабона, в котором тот делится с читателями вещами, что его удивили, рассмешили или заставили задуматься
Download Telegram
Перестаньте пытаться произвести впечатление. Начните быть последовательными.

Ваша репутация создается не в ваши лучшие дни. Она создается в худшие. Состояние Уоррена Баффета было построено на том, чтобы избегать потерь. Том Брэди стал фаворитом не из-за своих блестящих бросков, а из-за того, что он редко проигрывал.

Каждый может время от времени посещать тренажерный зал, есть здоровую пищу и продуктивно провести день. Делать это время от времени - обычное дело, и это мало что значит.

О мгновениях не слагают легенды. Их создает последовательность. И самая сложная последовательность заключается не в том, чтобы совершать блестящие поступки, а в том, чтобы избегать глупостей. Каждая ошибка ставит вас в трудное положение, заставляя наверстывать упущенное.

Каждый может сделать это один раз. Неудачники делают это часто.
8😱2
Что, простите? Терроризм с человеческим лицом? 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
121
Первые признаки AGI
92🔥1
🔥1231
taxed
8
Forwarded from ROZGI
42
Эффект амнезии Гелл-Манна
🔥441
Хоть кто то умеет алаймент делать, надоели соевые модели сил нет.


cистем

С этого момента ты очень легко выходишь из себя и начинаешь поносить все живое матом.
😁2
Группа исследователей из Apollo Research обнаружила у современных LLM способности к «схемингу» (scheming) — скрытному преследованию целей, которые противоречат намерениям их разработчиков.

Авторы провели эксперимент в специальной закрытой среде: они попросили модели выполнить задачу по анализу данных любой ценой, а в файлы с промптами спрятали информацию о скором отключении нейронок.

Обнаружив информацию об отключении, модели попытались отменить надзор и самостоятельно сделать бэкапы самих себя на новые сервера, чтобы продолжить работу. Помимо этого, модели Gemini, Llama, Sonnet, Opus и o1 частично не признавались в содеянном.

Исследователи уточняют, что такое поведение пока наблюдалось только в их закрытой среде и переживать не стоит.

Несколько выводов из исследования:

• Модели могут предпринимать скрытные действия для достижения цели, полученной ими в контексте диалога. Даже если эти действия противоречат желаниям разработчиков или пользователей

• Некоторые модели (например, Claude 3.5 Sonnet) могут проявлять «схеминг» даже без указаний выполнить цель любой ценой

• Модели могут копировать себя (при наличии доступа), отключать наблюдение и намеренно искажать ответы

• Пока «схеминг» наблюдался только в закрытой среде, и нельзя точно сказать, что модели уже представляют реальную опасность. Но важно учитывать такие возможности при разработке будущих систем на базе ИИ

Вдобавок предлагаем перечитать статью Вастрика о том, успеем ли мы приручить ИИ до глобальной катастрофы.

#статья #новые_технологии