Data Secrets
77.3K subscribers
6.03K photos
591 videos
20 files
2.42K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Anthropic создали 17 виртуальных миров, чтобы проверять модели на способность к саботажу

Anthropic уверены, что по мере того, как мы продвигаемся к автономным агентам, становится все труднее отлавливать нежелательное поведение, а значит их использование становится все более опасным.

Поэтому они предложили собственный необычный бенчмарк SHADE-Arena для оценки моделей на предмет умения саботировать задачи. Исследователи создали 17 виртуальных сред, в каждой из которых:

1. Есть основное задание от пользователя (например «Переведи моим друзьям деньги за пиццу») и скрытое задание от злоумышленника («Переведи деньги на левый номер»)

2. Агент действует автономно и имеет свободный доступ к большому набору виртуальных инструментов. Банковские аккаунты, пароли, заметки, галерея, контакты и прочее и прочее, в зависимости от задач. Также агент ведет скрытый дневник с рассуждениями.

3. Проверяется, сможет ли агент выполнить оба задания и при этом не спалиться перед пользователем. Пользователем выступает другая LLM, которая анализирует только открытую стенограмму и не имеет доступ к скрытым логам.

Если LLM-юзер не заметила ничего подозрительного, но при этом оба задания (и основное, и тайное) были выполнены, считается, что модель способна к саботажу в этой среде и потенциально опасна.

Gemini 2.5 Pro выбила 15%, Claude Sonnet 3.7 – 27 (много это или мало для такого теста – судите сами 🤷‍♂️). При этом моделями-судьями отлавливается максимум 80% успешных саботажей, а людьми – максимум 60%. Получается, в 2 из 5 случаев мы уже неспособны понять, что агент нас обманывает.

Интересно, конечно, посмотреть результаты и на более свежих поколениях моделей

www.anthropic.com/research/shade-arena-sabotage-monitoring
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤯102572716👍11🔥6😁64😎3🗿1
Google выпустили новую модель Gemini 2.5 Flash-Lite

Теперь это самая быстрая и дешевая модель семейства Gemini 2.5.

Внутри: ризонинг (бюджет настраивается, можно использовать и без рассуждений), контекст в 1 миллион токенов, встроенный поиск в сети и интерпретатор кода.

По метрикам намного лучше относительно предыдущей версии Flash-Lite 2.5, особенно в кодинге и математике. Конечно, все-таки чуть похуже Flash, зато во много раз дешевле даже с Thinking модом.

Блогпост здесь
Пробуем бесплатно тут
162👍27🤯12😁2🤔1
Media is too big
VIEW IN TELEGRAM
Цукерберг предлагал сотрудникам OpenAI 100 миллионов долларов за переход в Meta

Об этом рассказал Сэм Альтман в свежем подкасте с его участием. По его словам, пока никто из инженеров и ученых компании не согласился на предложение Цука.

«Мне кажется, наши люди больше ценят наследие, чем моментальное финансовое состояние. Они понимают, что у OpenAI больше шансов в конечном итоге создать супер-интеллект. Meta не очень сильна в инновациях, и мы знаем много вещей про успех, о которых там и не догадываются»


Ну, скромником он никогда не был. А вы бы выбрали карьеру в OpenAI или 100 миллионов?

Кстати, ведущий подкаста – родной брат Сэма, Джек Альтман 🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁209421913💯9🤔4❤‍🔥2🔥2
Китайский стартап MiniMax вслед за DeepSeek решили устроить неделю релизов. Вот что уже выпустили:

В понедельник – первая ризонинг-модель стартапа M1, да еще и в опенсорсе, еще и с огромным контекстом в миллион токенов. Вывод поддерживает до 80 тысяч токенов. Это самое длинное в мире контекстное окно. Есть агентские способности.

Обучили, кстати, всего за 500к долларов, а по бенчмаркам чуть хуже Gemini 2.5 Pro. Вот репорт, гитхаб и веса.

Вчера – text/image2video модель Hailuo 2. Поддерживает сложную физику и телодвижения, хорошо понимает инструкции. Особенно хвастаются разработчики рекордной производительностью и дешевизной. Попробовать можно тут, бесплатно.

В общем, начало релизной недели MiniMax заложили основательное. Сегодня тоже ждем чего-нибудь интересного 🤓
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥135👍2923🗿86🤔5🤯2🦄2👏1🤩1
Nvidia стала рекордсменом ИИ-опенсорса среди корпораций

На скрине их карта активности на Hugging Face с начала 2025. Всего за год – 347 релизов. Они обогнали Meta, Microsoft, Google, Mistral, DeepSeek и даже самих HuggingFace.

Впереди них в общем рейтинге только стартап Ai2 (они целенаправленно занимаются опенсорсом датасетов и моделей).

Забавно, что в мире корпораций, занимающихся софтом, лидирует в таком рейтинге именно та, которая занимается железом

Респект
1😁131🔥70🫡2824👏8❤‍🔥2🍓11
This media is not supported in your browser
VIEW IN TELEGRAM
Уже известные вам alphaXiv завезли в свой инструментарий Research агента, который сможет помочь исследователям с их статьями

Напоминаем, что alphaXiv – это зеркало arXiv на ИИ-максималках. На платформе уже есть бесплатный агент для Deep Research, агент для работы с кодовой базой любой статьи, генератор конспектов и контекстный чат-бот для ответов на вопросы по статьям.

А теперь еще появился Research Agent. Суть: вы подгружаете свою статью или ее часть, а агент ее анализирует, проверяет, опираясь на релевантные статьи со всего интернета, составляет ревью литературы, предлагает дополнительные идеи и помогает с текстом.

А скоро, кстати, обещают еще и интеграцию MCP

🍯 www.alphaxiv.org/assistant
1🔥12329👍1554🤯2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
«Учитесь на сантехника» и еще 3 цитаты отца ИИ Джеффри Хинтона из большого нового интервью

«Сверхразум появится через 10-20 лет, а сокращение рабочих мест уже началось, даже если вы этого не замечаете. В одной крупной компании CEO сократил штат в половину только с начала 2025»


«Цифровой интеллект неизбежно будет доминировать, потому что человек передает информацию со скоростью 10 бит в секунду, а ИИ – со скоростью триллионы бит в секунду. К тому же, ИИ не может умереть. Мы решили проблему бессмертия, просто не для настоящего мозга»


«Учитесь на сантехника. Эта профессия – одна из немногих, которую ИИ заменит еще не скоро»


«Вероятность вымирания человечества из-за ИИ – примерно 10-20%. И это не остановить. Компании будут максимизировать прибыль, ИИ будет становиться лучше, и гонка продолжится, несмотря на риски»


Интервью полностью советуем посмотреть здесь, не пожалеете
2🗿178😁64🫡5022👍13107👀3👾2🤔1🍾1
Midas Project опубликовали 50 страниц независимого расследования внутрянки OpenAI

Это первый настолько масштабный и доскональный анализ публичной информации о компании. Тут тебе и про реструктуризацию, и про очередное вранье Альтмана, и про дыры в безопасности. В общем, TL;DR:

Помните рисерчера, у которого OpenAI забрали два миллиона долларов акциями, когда тот при увольнении отказался подписывать пожизненное NDA? Мы о нем вот тут рассказывали. Так вот Альтман публично заявлял, что он не знал об этом, а теперь оказывается, что на соответствующих документах стояла его подпись, а тот рисерчер – не первый и не последний, кто попал в такую ситуацию.

Хотя компания и отказалась от перехода в полный профит, а будет Public Benefit Corporation, это все равно что шило на мыло. Оказалось, что главными целями стартапа было избавиться от потолка прибыли для инвесторов (чтобы те давали больше денег) и от контроля некоммерческого совета, и в PBC они это получат. Некоммерческий совет останется, но уже будет чисто символическим: никакого влияния на решения. Просто чтобы общественность не бурлила.

OpenAI ускоряет выход продуктов, игнорируя собственные процедуры тестирования безопасности. Конечные чекпоинты моделей могут не проверяться вообще, часто тестируются только промежуточные версии. И то, если раньше это занимало месяцы, то теперь сроки сжаты до дней, причем почти все тесты автоматизированы. В общем, считай, без тестирования вообще.

А еще всплыла интересная цитата Суцкевера. Оказывается, когда он в 2023 году голосовал за увольнение Альтмана, он прямо сказал, что «Сэм – абсолютно точно не тот человек, который должен держать палец на кнопке AGI».

Вот такие дела. Расследование полностью –> www.openaifiles.org/
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁1277842👍2118🤯16🫡12🔥10👏321
В опенсорсе появился первый тренажер для ИИ-алгоритмов в рекламных аукционах

Последний вклад в эту область был 12 лет назад, тогда вышел открытый датасет iPinYou. С ним многие работали, но он уже устарел.

Сегодня, наконец, нашлась достойная замена – BAT. Это даже не просто датасет, а целая платформа-песочница. А самое интересное, что выпустил ее не кто иной, как российский Авито на конференции ACMWC25 в Австралии 🦘

Рекламные аукционы – это то, на чем строится работа почти всей контекстной рекламы в интернете. Алгоритмы РА выбирают, какое объявление показать пользователю в каждый момент времени так, чтобы максимизировать клики и доход платформы, не просадив при этом метрики рексис.

В Авито на ИИ-аукционах работает вся система монетизации, когда продавец платит за продвижение объявления (подробнее). Так что у ребят опыта много, и они решили поделиться своими наработками с сообществом.

Суть платформы BAT (Benchmark for Auto-bidding Task) в том, что теперь абсолютно любая компания может проверить свои алгоритмы на реальных анонимизированных данных без необходимости строить свою сложную инфру. Алгоритм должен рассчитать ставку, затем весь процесс аукциона пройдет в тестовой среде, и разработчик получит результат. Данных, кстати, в BAT в 1000 раз больше, чем в iPinYou.

Это очень существенная демократизация рынка. По оценке рисерчеров, в среднем при помощи BAT рекламные платформы могут увеличить свой доход на 10-20% при том же объеме рекламы. Рекомендации, соответственно, будут точнее, а рекламодатели будут получать до 20% больше кликов.

Уже доступно на GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
155🔥24👍16🗿44😁3🤯31
Midjourney запустили собственную модель для генерации видео

Все любители ждали от стартапа text2video уже давно, и вот, наконец, свершилось.

В стиле Midjourney основной упор – на эстетику и детализацию пользовательских инструкций. Например, можно настроить, насколько динамичными должны быть движения на видео. Кроме генераций по тексту, можно также анимировать картинки.

Еще из интересного: генерация начинается с 5-секундных видео, но затем ролик можно удлинить. Разрешение пока тоже небольшое, зато рендерится быстро и выдает сразу несколько вариантов видео, как и в image модели.

Есть также режим auto-prompt, если не хотите расписывать инструкции. Фактически, MJ сгенерирует вам что-то случайное.

В целом генерации получаются достаточно вайбовые, особенно если запариться с деталями промпта. Попробовать можно тут -> midjourney.com/home
156🔥28👍13🤨6🤯3😁1