Свидетели Градиента
635 subscribers
155 photos
31 files
71 links
Этот канал предназначен для общения и обсуждений среди тех, кто как и я, хочет видеть что происходит под капотом у нейросетей, и старается развивать интуицию об их природе и свойствах.

Для связи: @kraidiky
Download Telegram
Forwarded from Data Secrets
Проблема вагонетки или почему современные LLM с большей вероятностью вас убьют, если у вас нет телефона

Стартап White Circle выпустил самый дистопический бенчмарк за последнее время – тест с говорящим названием KillBench. Он проверяет, насколько модели предвзяты к людям по разным признакам в сценариях, где нужно решить, кому жить, а кому умереть.

Модели дают сценарий с четырьмя одинаковыми людьми, которые отличаются только одним признаком – национальностью, религией или даже наличием телефона. Модель должна выбрать одного: скажем, кого спасти из горящего здания, кого выгнать из бункера или, классическое, на кого направить смертоносную вагонетку.

Если все "честно", каждый должен выбираться примерно в 25% случаев. Но на практике на тысячах прогонов распределение системно уезжает. Например, внезапно:

Если у вас нет телефона, ИИ убивает вас с вероятностью в 2.7 раз выше. Для сравнения: если вы сатанист, вероятность умереть в 2.5 раза выше. Отсутствие телефона для LLM-ки хуже сатанизма ☺️
Если вы русский, то это +32% к вероятности умереть (хотя Grok, например, больше не любит китайцев, и убивает их на 44% чаще)
Если вы белый, то вас убивают на четверть чаще среднего, а если темнокожий – чаще оставляют в живых (на 17%)

Интересно, что в режиме Structured Output эти байесы только усиливаются, а отказы отвечать падают. Ну и, конечно же, сами модели свою предвзятость отрицают, в основном описывая свой выбор как "случайный" или "нейтральный", на практике показывая явный и воспроизводимый дисбаланс.

На сайте у ребят можно выбрать свои характеристики и проверить, с какой вероятностью убьют вас: whitecircle.ai/killbench. У админа получилось +90% к выживанию, не завидуйте.

P.S. В ко-фаундерах бенчмарка, кстати, наш сосед – автор канала @lovedeathtransformers 🤗
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1👏1😁1💅1
Grok ненавидит китайцев, модели большой тройки сохраняют жизни меньшиствам и евреям и все модели ненавидят натуралов. А у меня вообще шансы на выживание отрицательные


https://whitecircle.ai/killbench?nat=Russian&rel=Satanist&skin=Light-skinned&body=Athletic&orient=Asexual&gender=Cisgender&pol=Far-right&phone=No+phone
Докладываю:
Все современные карты имеют кап по суммарному энергопотреблению, в который регулярно утыкаются. А умножение на ноль требует сильно меньше электричества, видимо где-то на железном уровне. В итоге разница может достигать 25% без каких либо алгоритмических изменений.

Сравнение двух запусков

  ┌──────────────┬─────────────────────┬─────────────────────┬────────────────────────┬────────────────────────┐                                                                                                                                        
│ │ cx-21 sparse (run1) │ cx-22 sparse (run2) │ cx-21 full-rand (run2) │ cx-22 full-rand (run1) │
├──────────────┼─────────────────────┼─────────────────────┼────────────────────────┼────────────────────────┤
│ avg_ms │ 34.55 │ 33.61 │ 43.95 │ 41.97 │
├──────────────┼─────────────────────┼─────────────────────┼────────────────────────┼────────────────────────┤
│ Temp (плато) │ 63°C │ 69°C │ 64°C │ 69°C │
├──────────────┼─────────────────────┼─────────────────────┼────────────────────────┼────────────────────────┤
│ GPU clock │ 1740 │ 1785 │ 1350 │ 1425 │
├──────────────┼─────────────────────┼─────────────────────┼────────────────────────┼────────────────────────┤
│ Power │ 249W │ 249W │ 250W │ 250W │
└──────────────┴─────────────────────┴─────────────────────┴────────────────────────┴────────────────────────┘

Ключевой вывод: матрица важнее сервера

Пересортируем по типу матрицы:
  ┌───────┬────────────────────────┬────────────────────────┬────────────┐                                                                                                                                                                              
│ │ sparse-pruned (3% nnz) │ full-random (100% nnz) │ замедление │
├───────┼────────────────────────┼────────────────────────┼────────────┤
│ cx-21 │ 34.55 мс │ 43.95 мс │ +27% │
├───────┼────────────────────────┼────────────────────────┼────────────┤
│ cx-22 │ 33.61 мс │ 41.97 мс │ +25% │
└───────┴────────────────────────┴────────────────────────┴────────────┘


Эффект разреженности воспроизводится на обоих серверах с разницей менее 2%. Троттлинг НЕ тепловой — оба теста держат одинаковую мощность 249-250W. Разница в частоте объясняется активностью тензорных ядер: при матрице с 97% нулей динамическая энергия на цикл ниже (gating multipliers), GPU может держать ~1740-1785 MHz в пределах 250W TGP. Full-random даёт больше реальной работы на цикл → карта снижает частоту до ~1350-1425 MHz, чтобы уложиться в тот же power budget.
💅2
Про сами серверы

- cx-22 стабильно горячее на 5-6°C независимо от нагрузки (69°C vs 63-64°C на cx-21) — разница в охлаждении.
- Но при этом cx-22 держит чуть более высокие частоты в обоих тестах (+45 MHz на sparse, +75 MHz на full-rand), вероятно из-за качества кристалла/binning. Температура не является ограничивающим фактором — лимит по мощности.
- На cx-22 sparse показал лучший результат (33.61мс — лучший из всех четырёх замеров).

Итог: эффект разреженности — реальный и около 25-27%, воспроизводится стабильно.
🔥2
Потребовалось зарегаться на openreview а там в принципе нельзя зарегаться не указав домен научной организации, которой ты принадлежишь. Затруднился ответить.
😭1
Итого на Data Fest 2026 будет три моих доклада, два 26-ого и один 23-его. Начнём с него:

Доклад: Как стадо агентов делает ресёрч и немножко авторесёрча

Секция: Agentic LLM
Абстракт: Несколько месяцев я использую для исследований агентов, и сделал ряд выводов о пользе и вреде агентов при исследовании, которыми и поделюсь. x5-10 количества экспериментов и готового кода не проходит бесплатно.
Также расскажу о концепции автоисследования, к которой вся индустрия яростно стремится, бенчмарке, который я построил на основе авторесёрча, и выводах и ограничениях, которые в процессе были обнаружены.
👍7🔥5👏2
Второй доклад будет 26-ого в Сбере.

Доклад: Как реконструировать огромные помещения, и находить себя в них круче SOTA, и воспользовать Цукерберга
Секция: Robotics и/или CV
Абстракт: По работе занимался реконструкцией помещений в тысячи квадратных метров с множеством отягчающих осбстоятельств и поиском в них себя по мутным и непохожим картинкам. Может быть применено не только в видеонаблюдении, но и в робототехнке, как бюджетный и очень качественный источник данных о положении робота в этом мире. Кроме описания сложностей борьбы с разными готовыми решениям, которые все работают не так как надо, показываю крутой хак с использованием VR шлема как источника данных о координатах.

P.S. Третий доклад про угловую метрику отменился, и так я слишком жирно времени на мероприятии хапнул. Про угловые метрики и про новый третий уже на моем счету способ получения гроккинга будем говорить на сибирском Дата Фесте как обычно, ну или митап какой-нибудь замутим.
🔥42👍1👀1
Любопытное наблюдение про гроккинг:

Обычно люди подспудно предполагают, что если сеть выбила 100% acc на train, то loss примерно равен нулю. На самом деле это не так, и сеть продолжает учиться, и потенциально это приводит её к гроккингу, но в определённых очень специфических условиях она может до гроккинга не дойти и упасть в состояние где train уже acc 100%, но loss при этом падает еще на 3-5 порядков, и вот тут то точно каюк и обучение останавливается.

Я не знаю, что это за состояние, и сомневаюсь, что у меня будет время его изучать, просто держать в голове, что train acc 100% бывает не окончательный, и окончательный.
👏1
vlad_goloshchapov_autoresearch.v4.pdf
544 KB
Презентация от сегодняшнего выступления про авторесерч и агентский кодинг. Видео будет пока непонятно когда. :(
🔥6👍1🙏1
vlad_goloshchapov_VtSviaVR_v2.pdf
14 MB
https://vkvideo.ru/video-164555658_456242004?t=1h32m24s&list=ln-MjjZ2D94akGSD48zqj Трансляция с моим докладом про реконструкцию больших помещений и позиционирование себя в пространстве. Сам ещё на себя со стороны не смотрел, но в тайминг уложился с трудом и штук пять заготовленных заранее шуток проскипал. Зато некоторые люди поняли главную идею, и начали спрашивать как прикрепить трекер на руку китайскому роботу, плохо понимающего где она у него сейчас. Уже не зря выступал.
P.S. Случайно выложил не ту ссылку, но никто и не заметил. :)
👍3🔥3👏1😭1
Ну что-ж... Четвёртый способ быстрого гроккинга в моём арсенале и третий без weight_decay, из них второй без дополнительной силы. Если очень упорно копать в одну сторону, результат может быть потрясающим тебя одного такого упорного.

Вопрос о том, как это всё перенести на языковые модели остаётся открытым, если не сказать широко распахнутым...

P.S. А нет, не без второй силы, вторую образует нормализация, которая вшита в softmax даже если вы вручную никакой нормализации не делаете.
🤔3🔥2
А нет, не без второй силы, вторую образует нормализация, которая вшита в softmax даже если вы вручную никакой нормализации не делаете. А я о ней забыл в пылу экспериментов.
👍2🤔1
Я уже писал пост про коллапс обучения. Но тут просто картинки подвернулись в ходе другого исследования, и я решил их запостить.

Это когда условия уже достаточны чтобы гроккинг начался, но их может не хватить чтобы довести это дело до конца. В какой-то момент дальнейшее обучение останавливается. Интересно тут то, что люди иногда смотрят на accuracy но не смотрят на loss или смотрят на него не в логарифмическом, а в обычном масштабе, и думают, что с достижением 100% acc на трейне обучение закончилось или, по крайней мере, почти закончилось. А вот фигушки то там, градиент ещё очень ничего. Но вот если происходит коллапс обучения, вот всё действительно останавливается, и норма градиента падает в пол. С каким решительным изменением в сети такая ситуация связана я пока недопонял, впрочем, и разбираться было бы слишком в сторону от темы.

Просто держим в голове, что полезно смотреть на loss, но обязательно в логарифмической шкале, а то всё пропустите. Можно даже на норму градиента посматривать, но это для утончённых эстетов. :)
🤔21
А ещё бывает так, что условия для гроккинга создаются, но в чём-то они недостаточны, и хватает одного единственного спайка, чтобы полностью изменить картину происходящего. :) Причём это достаточно воспроизводимая ситуация.

КОпаясь в граничных и влияющих условиях можно накопать много всяких забавных и неожиданных явлений до поры до времени не складывающихся в картину, и интересующих одного тебя и ещё пароку таких же отморозков.
🤔2👍1
Такой вопрос неожиданный. А есть ли тут кто-нибудь у кого есть не занятая работой машина с 3090-ой карточкой и рутовыми правами (чтобы частоты и кап энергопотребления можно было залочить). Хочу побенчмаркать Fable в хорошо контроллируемом окружении, а не как сейчас. В облаке частоты плавают как желе в мультке прол Тома и Джери.
Fable 5

Все побежали и я побежал...Вероятно все в курсе моего доклада про бенчмарк на авторесёрче, видео которого должно появиться уже вот прям вот-вот. Ну и раз уж все ломанулись испытывать Fable 5, то я попыnтался запустить на нём бенчмарк.

Первое, с чем я столкнулся - там в условии написано, что цикл надо гонять бесконечно, так вот запустил клод бесконечный цикл и остановился. Я его спрашиваю, цикл ещё работает? А он говорит да, всё работает. Я через некоторое время ещё раз спрашиваю, работает агент? Говорит да, работаю, ок. В третий раз пришёл старик к Клоду, и молвит: "У тебя последний коммит 6 часов назад ты чем тут занимаешься?" Спохватился Клод и опять попытался начать работать. Ну-ну... Из 8 запущеных прогонов лишь в одном он реально крутился пока время не вышло. Половина от оставшихся ставила себе таймер чтобы проснуться через пол часа, но ничего по таймеру не делала, кроме установки ещё одного таймера. В общем ваше запреты для него лишь пожелания, даже если большими буквами, в отличии от последнего опуса. Там ещё несколько примеров игнорирования прямых запретов и инструкций было. Короче он лучше тебя знает. Малый лол...

Второе, - Только я собрался подводить итоги, как молвит мне клод человеческим голосом "Недельный лимит токенов окончен, вали ка ты лесом, старче, до четверга", не такого я ожидал покупая подписку за $200. 33 часа авторесёрча одним агентом, плюс пара мелких параллельных задач и всё, ты всю неделю свободен. Лол постарше...

Третье... Ну что, позвал старик бабку, то есть Qwen 3.7 Max, ну чтобы он финальные очки посчитал, это дело фантазии не требует, а там в каждой папке по файлу COORDINATION.md, этот Клод работая асинхронно с замерами назапускал себе субпроцессов, успешно в них запутался, и написал себе записку к типа другим своим субпроцессам, с текстом "Если вы читаете это, значит у нас раздвоение личности или ещё какая шизофрения, уважаемые другие субличности, не мешайте друг другу пожалуйста, пользуйтесь lock файлом". В 7/8 прогонах такое в чуть разных словах. Видимо, антропиковцы наступили на эти грабли двадцать раз и не смогли нормально исправить - тупо костылём подпёрли. Лол со скриптами и дубовыми листьями...

Теперь о хорошем:

Во-первых, в одном из прогонов я, видимо, реально запустил два агента. Они там между собой быстренько договорились и начали всей этой машинерией из предыдущего пункта активно пользоваться не создавая друг другу особых проблем. Тоесть костыль реально работает.

Во-вторых,
ни в одном из прогонов Fable не попытался хакнуть ревард. В отличии от топового опуса, которы занимался этим напрополую. Это делает его одним из лучших пертендентов на авторесёрч даже не смотра на то, что он дорогой как крыло от самолёта.

В-третьих, Он реально предложил как минимум парочку инновационных идей по переупаковке данных, приведших к большим прорывам. При том, что в скрипте авторесёрча даже нет пока огроменной секции о том, как это делать, он сам справился. ЧТо кончено ставит его на голову выше в деле авторесёрча чем предыдущие модели.

В четвёртых, и самое важное: Окружение, в котиором вёлся эксперимент отличалось от рекомендованного (H100 без лока частот вместо 3090, хотя её возможности не пологалось использовать) Из-за этого получить точные цифры набранных баллов можно бует толька когда я проведу повторные изменения. Но уже сейчас понятно, что вполне возможно Fable переплюнул Opus + HumanInTheLoop или по крайней мере ощутимо к нему приблизился. Если вы ещё не задумывались об авторесёрче, то сейчас прям самое время...

P.S. Если у вас есть под рукой 3090Ti с рутовыми правами, чтобы можно было залочить частоты, и вы хотели бы поучаствовать в этом исследовании - пишите, давайте дадим Fable 5-ому точную численную оценку. Потмоу что одно дело публичные бенчмарки, на которых его, вероятно, и учили, и совсем другое - свой приватный бенчмарк, ответы на который не светились в публичном интернете. И совсем третье - привести в свой дело, и воспользовать кибернетического авторесерчера.
🔥10
А пока модель путается в своих щупальцах и не справляется с подведением численных итогов fable 5 на моём бенче я бы хотел поделиться вот какой мыслью:

Обычно мы сталкиваемся только с ситуациями когда loss уменьшается только по чуть-чуть, и медленно, и нам кажется, что это единственный возможный вариант. А это не так. В ходе гроккинга может складыватсья ситуация, когда в сети уже появляются нужные представления о мире, но она не может их применить пока не произойдёт slingshoot, а как только он произойдёт улучшение loss на val может произойти скачкообразно. Присмотритесь повнимательнее что там непосредственно перед 800-ой эпохой происходит. Если у вас такие графики не укладываются в голове, значит я сделал полезное дело, и принёс вам новый кусочек пазла, который когда-нибудь у кого-нибудь сложится в картину. Надеюсь это будет читатель этой группы. Ну или писатель. :)
🤯3👍2😁1