commit -m "better"
3.44K subscribers
1.14K photos
161 videos
3 files
2.57K links
just random thoughts
Download Telegram
https://medium.com/@NMitchem/if-ai-writes-your-code-why-use-python-bf8c4ba1a055

TL;DR - если AI пишет весь код, то зачем вообще писать новый код на python?

Полностью согласен, я, после того, как решил, что не буду писать код руками, пишу код только на go, или на C++, если нужен perf.

Python был нужен только когда, когда нужно очень быстро получить рабочий результат - богатая экосистема + нулевое время ожидание от правки до проверки результата.

Оба этих преимущества нивелируются тем, что #LLM могут написать сколько угодно кода in no time, поэтому недостатки python начинают перевешивать.

Хороший, годный, текст.
👍30🤡17💊62🔥2😁1🤔1💯1
https://www.opennet.ru/opennews/art.shtml?num=65428

"Дэниел Cтенберг (Daniel Stenberg), автор утилиты для получения и отправки данных по сети curl, подвёл итог применения AI-модели Claude Mythos для анализа уязвимостей в кодовой базе Curl. По мнению Дэниела, анонсированные компанией Anthropic прорывные возможности AI-модели Claude Mythos в области поиска уязвимостей, из-за которых компания ограничила доступ к модели, являются скорее маркетинговым преувеличением, так как при проверке кода Curl модель не показала существенных преимуществ по сравнению с AI-продуктами от других производителей"

А разговоров-то было.
😁46👍8🤡2🔥1
Hacker News
Bun Rust rewrite: "codebase fails basic miri checks, allows for UB in safe rust" Article, Comments
TL;DR - Bun переписали на Rust 1-1, с кучей unsafe блоков, что поломало safety гарантии самого Rust.
😁55🤡20👍4🤝3🆒2🤷‍♂1🐳1
Не удержался и купил еще максимальный codex, потому что съел claude code x20 за первых два дня недели.

Впечатления очень приятные, как shell codex лучше, чем claude code, да еще и собирается у меня из исходников. Особенно приятно, что официальный клиент под Linux собран с musl, статически - https://github.com/openai/codex/releases/download/rust-v0.131.0-alpha.22/codex-x86_64-unknown-linux-musl.tar.gz.

Эти люди знают толк в deploy, респект, уважуха!

Как модель - тоже очень хорошо, где-то чуть лучше, где-то чуть хуже.

В арсенале совершенно точно иметь лучше оба - codex нашел мне perf оптимизации, которые не нашел claude, и наоборот.
👍39🤡278🔥8🎉4💯2🤔1
😁91🤩9🤡32🔥1
Forwarded from Поздняков 3.0
У России на выставке «Экспо» только мёд и крабы, а у Китая — дроны и роботы, расстроился — вице-премьер РФ Трутнев о российско-китайской выставке в Харбине

Честно хочу признаться, что, когда мы по ней пошли и я увидел, что у нас только мёд и крабы, а у наших друзей дроны и роботы, то немного расстроился

Позже он отметил, что на стендах российских регионов и компаний всё таки присутствовала наша техника и наши технологические достижения

Поздняков. Подписаться
😁35😢10🤡8💩3🐳2🤪21
Мне очень понравилось писать внешние циклы над агентами #LLM, которые жестко задают роли, рамки их взаимодействия, sandboxing агентов, outcome, и так далее.

Кажется, пока такие циклы позволяют решать задачи быстрее, или дешевле, чем если сказать конкретному харнесу "сформулируй план о 10 пунктах и запусти мне 10 агентов для его исполнения". Пока сабагенты часто творят дичь - крадут друг у друга коммиты, игнорируют правила про ревью кода перед merge, сами коммитят в trunk, помимо процедур, а агент-оркестратор быстро забывает, что он делает, и начинает кодить вместо того, чтобы оркестрировать.

У меня для этого уже даже есть микрофреймворк - агенты как горутины, обертки над разными харнессами, способы описывать стейтмашины переходов сообщений/задач/контекстов между агентами, и прочее, и прочее.

Вот, запилил себе такой новый простенький цикл - "Pupa-Lupa ANalysis", он же PLAN.

Запускаетсся он как то так:

pg:home# echo 'нужен детальный план внедрения в проект параллельного парсинга И резолвинга заголовков' | plan --pupa-harness=./codex.home --lupa-harness=./claude.home



И дальше он начинает крутить цикл передачи сообщений от двух харнесов, роли для которых можно указывать отдельно. Пупа в данном контексте предлагает решение, Лупа - критикует, и отправляет на доработку, пока не согласится с предложенным вариантом.

На КДПВ - куски их диалога в консоли.

Важно, чтобы харнесы, и модели под ними, были разными, это ключевое требование, иначе не работает. Пупу мне больше всего нравится делать claude + opus, а Лупу - gemini/codex. Потому что opus слишком четкий и дерзкий для критика, ага.
😁25🤡158💊7👍4🔥3🤯1
Forwarded from ЕЖ
Россиянам пообещали отечественные ИИ-чипы на замену Nvidia к 2030 году. Компания «Байкал Электроникс» планирует выпустить линейку специализированных процессоров в 2029–2030 годах. По словам гендиректора компании Андрея Евдокимова, это будут первые в России ИИ-чипы, совместимые с экосистемой Nvidia CUDA, то есть они смогут работать с программами, написанными для видеокарт Nvidia.
@ejdailyru
🤣83🤡32🥴54😢1🐳1
Forwarded from Data Secrets
POV: ты пытался объяснить Claude Code, что надо сделать
😁586🤡6🆒3👍1😢1
Data Secrets
POV: ты пытался объяснить Claude Code, что надо сделать
Факт. Но красит настолько быстро, что все еще дешевле постфактум докрасить оставшиеся белые части.
29💯10👍7🤡6🥰3🆒1
Forwarded from Сиолошная
Karpathy теперь не безработный AI-учитель, а сотрудник Anthropic.

(на самом деле он пошел за бесплатными кредитами на Claude Code)
😁31👍13🤡4💯32😱1
😁46💯18🔥5🤝21
This media is not supported in your browser
VIEW IN TELEGRAM
GitHub официально подтвердил, что их хакнули.

Вчера сотрудник GitHub решил обновить расширение Nx Console для своей IDE. А вместе с ним обновил стилер, который за 11 минут слил хакерам токены от AWS, Kubernetes, 1Password и дал доступ к 3800 приватным репозиториям компании ⚰️

Представляю лицо безопасников GitHub 😬

Типичный
🥸 Сисадмин
Please open Telegram to view this post
VIEW IN TELEGRAM
😁37😱6🤣6🤡41
Forwarded from Сиолошная
Ну вот а свежий тизер к GPT-5.6 уже скорее всего можно — OpenAI выпустили блогпост, статью и комментарии от математиков о решении одной из самых известных задач в комбинаторной геометрии, которую легко сформулировать, но невероятно трудно решить. На протяжении почти 80 лет математики изучали обманчиво простой вопрос: если расположить n точек на плоскости, сколько пар точек могут находиться на расстоянии ровно 1 друг от друга?

Со времен оригинальной постановки проблемы преобладало мнение, что конструкции в виде «квадратной сетки» были оптимальными для максимизации числа пар. Внутренняя модель OpenAI опровергла эту гипотезу, предоставив бесконечное семейство примеров, которые дают улучшение. Доказательство было проверено группой независимых математиков. Они также написали сопроводительную статью, объясняющую логику решения и предоставляющую дополнительную предысторию и контекст о значимости этого результата.

Как и почти всегда, доказательство было получено с помощью новой модели общего назначения, обладающей способностью к рассуждениям, а не от системы, обученной специально для математики или под конкретную задачу (поэтому я пошутил про GPT-5.6).

Это доказательство является важной вехой для сообществ математиков. Это первый случай, когда значимая открытая проблема, занимающая центральное место в одном из разделов математики, была автономно решена искусственным интеллектом.

В этом доказательстве для решения элементарной геометрической задачи применяются неожиданные и сложные идеи из алгебраической теории чисел. Лауреат Филдсовской премии Timothy Gowers в сопроводительной статье называет этот результат «вехой для ИИ в математике». По словам другого математика, «эта статья демонстрирует, что современные ИИ-модели — это нечто большее, чем просто помощники для людей-математиков. Они способны генерировать оригинальные, гениальные идеи и затем доводить их реализацию до конца».

Пара опрошенных учёных даже сказали, что приняли бы эту работу в любой научный журнал без колебаний.

Бонусом показали, что результат — не случайность; после проверки первоначального доказательства OpenAI прогнали модель несколько раз с разными настройками. И видно, что при увеличении количества использованных мощностей (читай длины цепочек рассуждений) модель всё чаще и чаще решает задачу, вплоть до 48% от всех прогонов.
🔥228🤡5