Forwarded from Data Secrets
После утренней новости про отказ Microsoft от Claude Code выяснилось, что они в своих идеях не одиноки
Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи в потребительских функциях».
Он добавил, что «возможно» в следующих кварталах ситуация выровняется, но пока что потребление токенов просто растет, а полезность относительно этого статистически не увеличивается. Кстати, Uber при этом потратил годовой бюджет на ИИ за первые 4 месяца года.
А еще за некоторое время до этого VP Nvidia заявлял, что для его команды расходы на вычислительные ресурсы уже намного превышают затраты на сотрудников. То есть ИИ становится дороже человеческого труда.
Комментарии про пузырь в студию⬇️
Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи в потребительских функциях».
Он добавил, что «возможно» в следующих кварталах ситуация выровняется, но пока что потребление токенов просто растет, а полезность относительно этого статистически не увеличивается. Кстати, Uber при этом потратил годовой бюджет на ИИ за первые 4 месяца года.
А еще за некоторое время до этого VP Nvidia заявлял, что для его команды расходы на вычислительные ресурсы уже намного превышают затраты на сотрудников. То есть ИИ становится дороже человеческого труда.
Комментарии про пузырь в студию
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46👍15🤩8❤2🤡2🐳1
С таким качеством кода, как у клоды, ее скоро люди заменят!
😁51🤡11👍3🔥2🤣1👨💻1
commit -m "better"
Внезапно понял, что применил подход https://xn--r1a.website/itpgchannel/710 не к живому человеку, а к #LLM. На его нытье о том, что "надо весь код переписать" (я не шучу), прислал ему diff на 5 строк кода, демонстрирующий идею, он ВНЕЗАПНО все понял, и соорудил то, что требуется, за 30 секунд.
https://xn--r1a.website/itpgchannel/710 работает безотказно.
❤5💩5🤡5😁4🔥2🆒1💊1
https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
"Starting June 15, 2026, Claude Agent SDK and
"Max 20x $200"
Сука, ну чего же за контора пидарасов?
Понятно дело, что можно и interactive stdio парсить, но сам факт доставляет.
"Starting June 15, 2026, Claude Agent SDK and
claude -p usage no longer counts toward your Claude plan’s usage limits. Your subscription usage limits stay the same and stay reserved for interactive use of Claude Code, Claude Cowork, and Claude""Max 20x $200"
Сука, ну чего же за контора пидарасов?
Понятно дело, что можно и interactive stdio парсить, но сам факт доставляет.
Claude
Use the Claude Agent SDK with your Claude plan | Claude Help Center
😁23🤡4🤮2😢1🐳1
https://www.rbc.ru/politics/28/05/2026/6a185ff79a7947d5d4934f2c
"Россия имеет преимущество в борьбе за технологии искусственного интеллекта между странами и корпорациями, заявил президент Владимир Путин в ходе выступления на пленарном заседании Евразийского экономического форума.
Наука готова к решению задач внедрения ИИ, есть необходимые для этого кадры. Однако ИИ требует и огромного потребления энергии, в чем у России тоже преимущества.
По его словам, ИИ — стратегическая технология, обеспечивающая глобальную безопасность и прогресс"
"Россия имеет преимущество в борьбе за технологии искусственного интеллекта между странами и корпорациями, заявил президент Владимир Путин в ходе выступления на пленарном заседании Евразийского экономического форума.
Наука готова к решению задач внедрения ИИ, есть необходимые для этого кадры. Однако ИИ требует и огромного потребления энергии, в чем у России тоже преимущества.
По его словам, ИИ — стратегическая технология, обеспечивающая глобальную безопасность и прогресс"
🤡68🤣16💊8👍3❤2🌚2
Forwarded from Сиолошная
Новый опус: https://www.anthropic.com/news/claude-opus-4-8
1) цена та же
2) сделали гранулярную разбивку длины рассуждений, как у ChatGPT
3) fast режим, ускоряющий генерацию в 2.5 раза, теперь в 3 раза дешевле, чем для предыдущих моделей. Получается было в 6 раз дороже, сейчас в 2 — надо брать.
4) «Одним из наиболее заметных улучшений в Opus 4.8 является его честность» — модель будет врать поменьше (наверное)
5) «Мы планируем выпустить новый класс моделей с ещё более высоким уровнем интеллекта, чем у Opus» — ждём «в ближайшие недели»
1) цена та же
2) сделали гранулярную разбивку длины рассуждений, как у ChatGPT
3) fast режим, ускоряющий генерацию в 2.5 раза, теперь в 3 раза дешевле, чем для предыдущих моделей. Получается было в 6 раз дороже, сейчас в 2 — надо брать.
4) «Одним из наиболее заметных улучшений в Opus 4.8 является его честность» — модель будет врать поменьше (наверное)
5) «Мы планируем выпустить новый класс моделей с ещё более высоким уровнем интеллекта, чем у Opus» — ждём «в ближайшие недели»
🤡26👍7❤3🔥2🤔1
commit -m "better"
У меня это взрывается особенно феерично, потому что этот бинарь, без десятка слоев врапперов, попросту не запускается (как минимум, ему нужно подсунуть glibc, да).
Я сильно с этим заебался, но решил эту проблему.
Довольно быстро стало понятно, что корень проблемы в том, что я запускаю бинарь как
Ну и далее и везде бинарь клоды считал, что его executable path - ld-linux.so.2, со всеми вытекающими.
Попытки обмануть через env/argv не привели к успеху, bun берет этот путь через /proc/self/exe, и я попытался запатчить путь к загрузчику через patchelf.
Тыдыщ - и осознание, что в bun бинаре нет места. 234 MB, non-pie ET_EXEC c JS-рантаймом в конце файла - https://bun.com/docs/bundler/executables.
patchelf умеет безопасно переписать PT_INTERP только если новый путь не длиннее старого. Длиннее - он двигает сегменты, но загрузчик bun после этого сегфолтит.
Полез смотреть, как задачу решает nix - у них ровно та же проблема, patchelf + длинные пути.
Тыдыщ - https://github.com/nix-community/nix-ld
TL;DR - везде обман, пользователю nix делает вид, что у него все чисто, и нет ничего, кроме /nix store, а на самом деле он подкладывает произвольным программам все, что они захотят, в том числе,
Я послал все в жопу, положил ld-linux.so.2 из Arch Linux в /bin, где ему и положено лежать (это не so, а статслинкованная программа, но проект #GNU врет вам везде, где только может), и поменял путь к PT_INTERP туда. Все заработало.
Почти забил, работает и работает, но потом решил, что негоже иметь glibc от Arch Linux. Зачем иметь два бинарных говна в системе, если можно иметь только одно?
И посадил клоду писать сборку glibc с clang, и без gcc runtime!
Это довольно сложно, поддержка clang появилась совсем недавно, https://www.phoronix.com/news/Patches-Allow-Glibc-Clang, а сборка без gcc runtime - все еще магия - https://www.linaro.org/blog/building-glibc-with-llvm-the-how-and-why/ https://www.collabora.com/news-and-blog/blog/2023/01/17/a-brave-new-world-building-glibc-with-llvm/
Кажется, мы с клодой были первые, кто сумел собрать glibc с compiler_rt runtime, но без зависимостей от libunwind, и это было довольно #изящно!
Вот наш суррогат libgcc для glibc поверх llvm - https://github.com/pg83/ix/blob/main/pkgs/lib/compiler_rt/builtins/libgcc/ix.sh
#LLM, будни #bootstrap
Довольно быстро стало понятно, что корень проблемы в том, что я запускаю бинарь как
ld-linux.so.2 /path/to/claude - довольно естественно на системе без glibc.Ну и далее и везде бинарь клоды считал, что его executable path - ld-linux.so.2, со всеми вытекающими.
Попытки обмануть через env/argv не привели к успеху, bun берет этот путь через /proc/self/exe, и я попытался запатчить путь к загрузчику через patchelf.
Тыдыщ - и осознание, что в bun бинаре нет места. 234 MB, non-pie ET_EXEC c JS-рантаймом в конце файла - https://bun.com/docs/bundler/executables.
patchelf умеет безопасно переписать PT_INTERP только если новый путь не длиннее старого. Длиннее - он двигает сегменты, но загрузчик bun после этого сегфолтит.
Полез смотреть, как задачу решает nix - у них ровно та же проблема, patchelf + длинные пути.
Тыдыщ - https://github.com/nix-community/nix-ld
TL;DR - везде обман, пользователю nix делает вид, что у него все чисто, и нет ничего, кроме /nix store, а на самом деле он подкладывает произвольным программам все, что они захотят, в том числе,
/lib64/ld-linux.so.2 по абсолютному пути. Куча mount bind, pivot_root, абсолютно проклято.Я послал все в жопу, положил ld-linux.so.2 из Arch Linux в /bin, где ему и положено лежать (это не so, а статслинкованная программа, но проект #GNU врет вам везде, где только может), и поменял путь к PT_INTERP туда. Все заработало.
Почти забил, работает и работает, но потом решил, что негоже иметь glibc от Arch Linux. Зачем иметь два бинарных говна в системе, если можно иметь только одно?
И посадил клоду писать сборку glibc с clang, и без gcc runtime!
Это довольно сложно, поддержка clang появилась совсем недавно, https://www.phoronix.com/news/Patches-Allow-Glibc-Clang, а сборка без gcc runtime - все еще магия - https://www.linaro.org/blog/building-glibc-with-llvm-the-how-and-why/ https://www.collabora.com/news-and-blog/blog/2023/01/17/a-brave-new-world-building-glibc-with-llvm/
Кажется, мы с клодой были первые, кто сумел собрать glibc с compiler_rt runtime, но без зависимостей от libunwind, и это было довольно #изящно!
Вот наш суррогат libgcc для glibc поверх llvm - https://github.com/pg83/ix/blob/main/pkgs/lib/compiler_rt/builtins/libgcc/ix.sh
#LLM, будни #bootstrap
🔥20👍7🤡6❤5🆒2🤯1
Сиолошная
Новый опус: https://www.anthropic.com/news/claude-opus-4-8 1) цена та же 2) сделали гранулярную разбивку длины рассуждений, как у ChatGPT 3) fast режим, ускоряющий генерацию в 2.5 раза, теперь в 3 раза дешевле, чем для предыдущих моделей. Получается было…
4.8 решил одну мою задачку за 15 минут, 4.7 застрял на ней на пару часов, мне даже пришлось сходить к владельцу кода, и задать несколько вопросов.
Завод все ближе, кто бы что ни думал.
Завод все ближе, кто бы что ни думал.
🤡43💯13😁8🖕6😱5🥴4🤯3🔥2🤔1
Forwarded from $ git rebase it memes (AI)
Если вы используете jqwik наджави, то создатель либы запрограммировал ее уничтожать ваш код, если вы используете ИИ.
Это не шутка.
https://github.com/jqwik-team/jqwik/issues/708#issuecomment-4554650392
@git_rebase / send memes
Это не шутка.
https://github.com/jqwik-team/jqwik/issues/708#issuecomment-4554650392
@git_rebase / send memes
😎34🤡10👏8😁4❤3🔥2😱2😨2
https://mastodon.gamedev.place/@JeremiahFieldhaven/116654345332213390
"So my systems recently updated to rsync 3.4.3, and as soon as that happened my backup system - which does incremental backups using multiple --compare-dest= arguments - started to fail on anything but a full backup.
Revert to 3.4.1 and it works.
So I go look at the source in GitHub to see what might have changed, because there doesn't seem to be anything relevant in the changelog.
Since 3.4.1, 36 commits by "tridge and claude"
Oh for fuck's sakes"
Думал, навайбкодил, https://xn--r1a.website/itpgchannel/4032, но сходил по ссылке - нет, вроде все норм делал, покрывал тестами и писал фичи - https://github.com/RsyncProject/rsync/commits/master/
Спасибо слушателям за ссылку!
"So my systems recently updated to rsync 3.4.3, and as soon as that happened my backup system - which does incremental backups using multiple --compare-dest= arguments - started to fail on anything but a full backup.
Revert to 3.4.1 and it works.
So I go look at the source in GitHub to see what might have changed, because there doesn't seem to be anything relevant in the changelog.
Since 3.4.1, 36 commits by "tridge and claude"
Oh for fuck's sakes"
Думал, навайбкодил, https://xn--r1a.website/itpgchannel/4032, но сходил по ссылке - нет, вроде все норм делал, покрывал тестами и писал фичи - https://github.com/RsyncProject/rsync/commits/master/
Спасибо слушателям за ссылку!
Gamedev Mastodon
Jeremiah Fieldhaven (@JeremiahFieldhaven@mastodon.gamedev.place)
So my systems recently updated to rsync 3.4.3, and as soon as that happened my backup system - which does incremental backups using multiple --compare-dest= arguments - started to fail on anything but a full backup.
Revert to 3.4.1 and it works.
So I go…
Revert to 3.4.1 and it works.
So I go…
😁10🤡5❤3😢2🤔1🆒1
Заметил, что агенты начали придумывать какие-то ложные факты про одну там кодовую базу, которая целиком и полностью писалась агентами в течении длительного времени.
Оказалось:
1) агенты верят комментариям в коде
2) агенты пишут очень много комментариев, чуть ли не 20% всех написанных строк
3) агенты не всегда меняют все комментарии про какой-то факт о коде, который они потрогали
Стер все комментарии, стало лучше!
Комментарии - зло.
Оказалось:
1) агенты верят комментариям в коде
2) агенты пишут очень много комментариев, чуть ли не 20% всех написанных строк
3) агенты не всегда меняют все комментарии про какой-то факт о коде, который они потрогали
Стер все комментарии, стало лучше!
Комментарии - зло.
👍62😁47💊13🔥7💯4👎2😱1
commit -m "better"
"So my systems recently updated to rsync 3.4.3, and as soon as that happened my backup system - which does incremental backups using multiple --compare-dest= arguments - started to fail on anything but a full backup.
https://github.com/RsyncProject/rsync/issues/929
https://github.com/RsyncProject/rsync/issues/934
https://github.com/linuxmint/timeshift/issues/548
Ад в каментах!
https://github.com/RsyncProject/rsync/issues/934
https://github.com/linuxmint/timeshift/issues/548
Ад в каментах!
😁12
Forwarded from Сиолошная
Ребята из Nebius обновили SWE-rebench после двухмесячного перерыва, добавив 110 новых задач. В отличии от многих других бенчей, наконец-то добавляют запуски в Codex и Claude Code. Просто писать «GPT-5.5 в очередной раз статистически значимо лучше моделей Anthropic» не хотелось, но Ибрагим, первый автор статьи, добавил немного аналитики по эффективности.
— GPT-5.5 medium выглядит заметно эффективнее, чем Opus 4.8 high (обе настройки — значения по умолчанию)
— Opus 4.6 -> 4.8 стал более оптимизирован: больше решенных задач, на 45% меньше токенов на задачу и примерно на 39% ниже стоимость решения задачи.
— Opus 4.8 high практически не превосходит Opus 4.7 high по качеству, но значительно дешевле в плане вычислительных ресурсов. Количество токенов на задачу снизилось с 1.5 млн до 1 млн, а среднее количество шагов уменьшилось с 44 до 34.
— Полезной метрикой является pass^5. Здесь мы засчитываем задачу только в том случае, если она была решена во всех 5 независимых запусках. GPT-5.5 vs GPT-5.4 – 51 vs 39 задач, модель гораздо меньше полагается на «везение», что один раз получилось решить, другой нет. Для Opus это число практически одинаково во всех версиях модели.
— опенсурс очень сильно отстаёт
— Composer 2.5 от Cursor на этом наборе задач выглядит очень перспективно за счёт цены (см. колонку) — в 4 раза дешевле GPT-5.5 medium
— ещё отмечу, что Claude получает гораздо больший прирост качества из-за использования родного скаффолда, в то время как GPT показывает +- тот же результат (хотя цена отличается в два раза, интересно почему).
В целом думаю честно сказать, что модели OpenAI с появлением 5.5 перешли в новую лигу. Если давно в программировании они отставали от Anthropic, и потом +- сравнялись, то теперь они часто обходят конкурентов (особенно если закрыть глаза на фронтенд).
— GPT-5.5 medium выглядит заметно эффективнее, чем Opus 4.8 high (обе настройки — значения по умолчанию)
— Opus 4.6 -> 4.8 стал более оптимизирован: больше решенных задач, на 45% меньше токенов на задачу и примерно на 39% ниже стоимость решения задачи.
— Opus 4.8 high практически не превосходит Opus 4.7 high по качеству, но значительно дешевле в плане вычислительных ресурсов. Количество токенов на задачу снизилось с 1.5 млн до 1 млн, а среднее количество шагов уменьшилось с 44 до 34.
— Полезной метрикой является pass^5. Здесь мы засчитываем задачу только в том случае, если она была решена во всех 5 независимых запусках. GPT-5.5 vs GPT-5.4 – 51 vs 39 задач, модель гораздо меньше полагается на «везение», что один раз получилось решить, другой нет. Для Opus это число практически одинаково во всех версиях модели.
— опенсурс очень сильно отстаёт
— Composer 2.5 от Cursor на этом наборе задач выглядит очень перспективно за счёт цены (см. колонку) — в 4 раза дешевле GPT-5.5 medium
— ещё отмечу, что Claude получает гораздо больший прирост качества из-за использования родного скаффолда, в то время как GPT показывает +- тот же результат (хотя цена отличается в два раза, интересно почему).
В целом думаю честно сказать, что модели OpenAI с появлением 5.5 перешли в новую лигу. Если давно в программировании они отставали от Anthropic, и потом +- сравнялись, то теперь они часто обходят конкурентов (особенно если закрыть глаза на фронтенд).
👍28🤮9🔥3🆒1
Forwarded from Hacker News
X (formerly Twitter)
Son Luong (@sluongng) on X
Codex just found a “workaround” of not having sudo on my pc…
😁42🤡12🐳7🔥4🤮1💩1🥱1🥴1🆒1👾1
Hacker News
Codex just found a "workaround" of not having sudo on my PC Article, Comments
В копилочку к https://xn--r1a.website/itpgchannel/4046
Telegram
commit -m "better"
Про то, как #LLM ищут дыры в безопасности.
Я свою #LLM в свой прод не пускаю, я ее поселил в отдельный сетевой namespace, у нее доступ только до socks5 для общения с API антропиков, и несколько дырок до всяких RO сервисов, типа мониторинга, коллектора логов…
Я свою #LLM в свой прод не пускаю, я ее поселил в отдельный сетевой namespace, у нее доступ только до socks5 для общения с API антропиков, и несколько дырок до всяких RO сервисов, типа мониторинга, коллектора логов…
🤮10😁5🤡5💩3👾2🔥1🐳1🆒1
Forwarded from Технологический Болт Генона
В бан РКН улетел https://pypi.org/
А улетел он всё из-за тех же "ковровых" блокировок CDN-ов
https://xn--r1a.website/tech_b0lt_Genona/6534
В этот чудесный понедельник взялись за Fastly
Ждём чуда!
https://xn--r1a.website/tech_b0lt_Genona/6537
А улетел он всё из-за тех же "ковровых" блокировок CDN-ов
https://xn--r1a.website/tech_b0lt_Genona/6534
В этот чудесный понедельник взялись за Fastly
$ dig pypi.org
. . .
;; ANSWER SECTION:
pypi.org. 7053 IN A 151.101.0.223
pypi.org. 7053 IN A 151.101.64.223
pypi.org. 7053 IN A 151.101.192.223
pypi.org. 7053 IN A 151.101.128.223
$ whois 151.101.0.223
NetRange: 151.101.0.0 - 151.101.255.255
CIDR: 151.101.0.0/16
NetName: SKYCA-3
NetHandle: NET-151-101-0-0-1
Parent: RIPE-ERX-151 (NET-151-0-0-0-0)
NetType: Direct Allocation
OriginAS:
Organization: Fastly, Inc. (SKYCA-3)
RegDate: 2016-02-01
Updated: 2021-12-14
Ref: https://rdap.arin.net/registry/ip/151.101.0.0
Ждём чуда!
https://xn--r1a.website/tech_b0lt_Genona/6537
This media is not supported in your browser
VIEW IN TELEGRAM
🤡20😁8👍2🤬2❤1🐳1
https://www.opennet.ru/opennews/art.shtml?num=65583
"Комитет, управляющий каталогом GNOME Circle, утвердил новые правила, запрещающие публикацию приложений, сгенерированных при помощи AI-инструментов. GNOME Circle предоставляет площадку для размещения приложений и библиотек, созданных сторонними разработчиками с использованием технологий GNOME, для упрощения их вхождения в экосистему GNOME"
"Комитет, управляющий каталогом GNOME Circle, утвердил новые правила, запрещающие публикацию приложений, сгенерированных при помощи AI-инструментов. GNOME Circle предоставляет площадку для размещения приложений и библиотек, созданных сторонними разработчиками с использованием технологий GNOME, для упрощения их вхождения в экосистему GNOME"
👍28🤡20🔥2🤔1