commit -m "better"
3.45K subscribers
1.17K photos
165 videos
3 files
2.6K links
just random thoughts
Download Telegram
Регрессии в rsync 3.4.3 и принятие изменений, подготовленных с использованием AI
https://www.opennet.ru/opennews/art.shtml?num=65589

После выхода обновления утилиты для синхронизации файлов rsync 3.4.3 с исправлением 6 уязвимостей, отмечено появление регрессий, нарушающих работоспособность ранее используемых конфигураций. Помимо этого непонимание и недовольство вызвало добавление за последние две недели в репозитории rsync около 50 изменений, подготовленных с использованием AI-модели Claude. Некоторые пользователи связали появление регрессий с генерацией низкокачественных исправлений уязвимостей при помощи AI.
. . .
Эндрю Триджелл (Andrew Tridgell), основатель проектов samba и rsync, два года назад вернувшийся к сопровождению rsync и добавивший проблемные коммиты, опубликовал заметку с пояснением сложившейся ситуации. По словам Эндрю, проект rsync столкнулся с лавиной отчётов об уязвимостях, многие из которых были сгенерированы через AI. В релизе rsync 3.4.3 появление регрессий стало ценой устранения уязвимостей. Эндрю сознательно предпочёл исправить уязвимости, несмотря на то, что исправления могли нарушить работу некоторых редких, но корректных сценариев использования rsync. Подобные сценарии не покрывались старым тестовым набором и ручными проверками, поэтому регрессии остались не замеченными и будут устранены в следующим выпуске 3.4.4.

Возникшая ситуация побудила Эндрю модернизировать тестовый набор, ввести проверку покрытия кода и реализовать тестирование в системе непрерывной интеграции на разных платформах, а также выполнить анализ потенциальных уязвимостей. Так как Эндрю уже почти 60 лет и он предпочёл бы путешествовать на яхте, а не тратить своё время на устранение уязвимостей в rsync, он решил привлечь AI-ассистенты для выполнения рутинных задач в условиях свалившейся лавины сообщений об уязвимостях. Эндрю разработал архитектуру, план проверки и структуру нового тестового набора, после чего при помощи AI сгенерировал его на Python и заменил им ранее применявшийся тестовый shell-скрипт. При разработке использовалась модель Claude с ручной проверкой результата и перекрёстной проверкой в Codex и Gemini.
18🤮8🤣6👍5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Полностью согласен с Максутом Игоревичем!

Нельзя лишать десятки миллионов наших пользователей доступа к привычным сервисам без объяснения причин и одномоментно.

Вот бы Минцифры помогло разобраться как так получается.
😁52🤡14🔥42👍2🐳1🌭1🖕1
Снесла тут #LLM промежуточный результат нашей работы, через git checkout .

Обычно в такой ситуации она вполне может восстановить все из "памяти", но тут промежуточный результат был весьма большой, и из "памяти" восстановить не получилось.

И тут она такая "я сейчас грепну JSONL ЛОГИ НАШЕЙ СЕССИИ, и подниму отттуда".

И подняла, будьте уверены.

Мне бы такую интроспекцию своей памяти.
😁59💯16👍11🤡4👏3🐳21
Forwarded from Юра, прости
Американскому экипажу МКС приказали укрыться в корабле «Crew Dragon» и готовиться к эвакуации из-за усилившейся утечки воздуха в российском модуле.

NASA распорядилось, чтобы все астронавты на Международной космической станции укрылись в пристыкованном корабле Crew Dragon и были готовы к возможной экстренной эвакуации - пока российский экипаж пытается устранить усиливающуюся утечку воздуха в российском сегменте станции. Об этом сообщила пресс-секретарь NASA Бетани Стивенс.

Российский служебный модуль «Звезда» (заводской индекс 17КСМ №12801), изготовленный в 1985 году, остается главным источником проблем с герметичностью на МКС.
Первые трещины в его переходной камере (ПрК) обнаружили ещё в 2019–2020 годах, и с тех пор полностью устранить проблему так и не удалось — ремонтные работы дают лишь временный эффект.

Роскосмос многократно и целиком устранял утечки, пока, наконец, 15 июня 2025 трещина была устранена не только целиком, но и полностью.
Для герметизации космонавты использовали герметики "Герметалл-1" и "Анатерм", клей-мастику на основе смолы сандарака, которая добывается из североафриканских хвойных деревьев, шлифовальную шкурку, кусочки поролона, фторопластовые пленки, спиртовые салфетки, металлические накладки и, конечно, изоленту.

Несмотря на успешное полное устранение трещины, в 2026 году утечка началась с новой силой.
Таким образом, герметизация трещины на МКС завершена хоть и полностью, но не целиком.
Или так: целиком, но не полностью.
А вернее, даже так: целиком и полностью, но не окончательно.

Сейчас ситуация складывается следующим образом:
* Из-за постоянной потери атмосферы переходную камеру держат герметично изолированной. Ее открывают лишь на короткое время для разгрузки и погрузки, чтобы потери атмосферы станции были минимальны.
* Специалисты до сих пор не пришли к однозначному выводу о причинах дефекта российского модуля. Наиболее вероятная версия - скрытый дефект сварных соединений, допущенный на заводе им. Хруничева в 1985 году во время приварки переходной камеры к основному каркасу.

🚀 «Юра, прости»
😢41😁12👍4🐳31👎1🌚1
#LLM позволяют автоматизировать то, что раньше было автоматизировать невыгодно.

Я уже несколько раз про это писал в цикле #lab, #homelab, но вот вам еще две истории:

Одна программа проводила 20% всего CPU time в работе с map. Попросил LLM показать, в каких строчках кода чаще всего происходит обращение к map, с точностью до операции. LLM ответила, что можно сделать по профилю, но нужной точности не получить.

Я немножко подумал, и велел ей написать AST трансформацию кода, которая бы пропустила каждый access через wrapper, а враппер уже бы получил source location, и просто заинкрементил счетчик.

Вот, пожалуйста - https://github.com/pg83/ay/blob/master/probe_mapinstr.go. Сразу же нашли узкое место, и оптимизировали его.

Стал бы я так заморачиваться год назад? Да ни в жисть.

И вторая история, очень похожая.

У меня есть стайлгайд для go, https://github.com/pg83/ay/blob/master/STYLE.md, я его копирую из проекта в проект. Понятно дело, что LLM иногда промахиваются, и я попросил ее написать какую-нить настройку для существующего стайлера.

На что получил ответ "никто так не умеет".

На что я велел взять, и написать стайлер "под проект" - https://github.com/pg83/ay/blob/master/refac.go, больше 1000 строк кода.

Опять же, не представляю, что стал бы так заморачиваться год назад.

Мораль? Нет ее!
👍30💩8🌚6🔥42🤡1🥴1🐳1
Про то что у Макса отозвали сертификат, а разработчики Макса не отключили требование обязательного обновления (в результате чего на устройствах Apple Макс вымер) я зубоскалить не буду, но просто именно так выглядит реальное состояние цифрового суверенитета.

И блокировки Telegram и других ресурсов не добавят цифрового суверенитета, а только лишь усилят "окукливание" и деградацию.
👍36😁11💯73🤮1
#LLM победили, когда начали предсказывать не ответ, а цепочку рассуждений, которая приводит к правильному ответу. Оказалось, что предсказание хорошей цепочки рассуждений является лучшим способом предсказать правильный ответ. Это и есть тот самый "эмулятор размышлений", который дал огромный скачок качеству.

Эмулятор оказался лучше, чем оригинал - если дать все сведения, нужные для ответа, то машина даст ответ лучше/быстрее/дешевле, чем человек. В целом, понятно, почему так произошло - механизма локальной памяти пока не придумали, поэтому, чтобы модели были полезны, тренили то, что могли - именно способности к размышлению. Хорошо размышляющая модель компенсирует недостаток информации.

Единственное преимущество человека сейчас - это его локальная память, которая может быть использована во время inference. Человек часто выигрывает не потому, что его reasoning сильнее, а потому что у него есть богатый локальный контекст: память о ситуации, опыте, целях, людях, последствиях, скрытых ограничениях. Он приносит на inference огромный невидимый багаж. Модель без этого багажа выглядит глупее, хотя сам механизм рассуждения может быть уже очень сильным. Она проигрывает не в логике, а в недостающем контексте.

Когда это ограничение будет преодолено, то даже текущие модели, с их существующими thinking powers, превзойдут человека во всем.
🤡52👍24💯12💊11🔥7😢5🦄41
Forwarded from ЕЖ
Роскомнадзор планирует создать единый "ГосVPN" для российских разработчиков, которые столкнулись с проблемами доступа к зарубежным сервисам разработки, узнал The Bell (в реестре иноагентов в РФ).
Подробности:
По данным издания, идея обсуждалась на закрытом совещании Роскомнадзора с представителями крупнейших российских IT-компаний. Поводом стали жалобы на сбои при доступе к GitHub, PyPI, Figma и другим зарубежным ресурсам, которые начали возникать на фоне борьбы властей с VPN.

Собеседник The Bell утверждает, что Роскомнадзор предложил создать "единый ГосVPN со сложной структурой" и рекомендовать разработчикам пользоваться им в случаях, когда доступ к зарубежным репозиториям действительно необходим. Также ведомство предложило компаниям заводить инциденты, которые Роскомнадзор будет решать в ручном режиме.

@ejdailyru
🤡46😁44🤣12🎉3🗿2🔥1
Forwarded from Сиолошная
Модель уже доступна на claude.ai, системная карточка тут, а метрики вот. Нравится, что на графиках скейлинга по оси OX — доллары, и видно, что на низком ризонинге модель всё равно лучше Opus.
🤡14🤮32👍2👎2🔥1🤔1
https://news.ycombinator.com/item?id=48453275

Let's Encrypt bans certificate usage in any US sanctioned territory
🤡36🤣6🔥5👍4🤮4💩2🕊1
Forwarded from AbstractDL
Я прочитал все 319 страниц техрепорта Mythos 5

Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.

А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.

Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.

Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.

В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.

Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".

Ещё забавно, что если anthropic заметят, что вы занимаетесь дистилляцией — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела.

С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.

PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.

Блог, техрепорт
🤡21👍84👏3🔥2😱2😁1🤔1
🤡23🤔6💯5🤣4👍3👎2💊2💩1🖕1
😁17🥴9🤡5🏆21