Forwarded from Alexey
Alibaba выпустила мультимодальный ИИ Qwen3.5-Omni — он пишет код по видеозаписи экрана / Хабр https://habr.com/ru/news/1017160/
Хабр
Alibaba выпустила мультимодальный ИИ Qwen3.5-Omni — он пишет код по видеозаписи экрана
Команда Qwen (Alibaba Cloud) представила Qwen3.5-Omni — новое поколение мультимодальной модели, которая принимает на вход текст, изображения, аудио и видео, а на выходе генерирует текст и...
🔥3❤1
https://github.com/4dand/1c-ai-codegen-research-paper - прикольно так, человек диплом целый написал по сравнению работы НС. Всем фанатам Codex-а посвещается :). Его ТОП выглядит так: Opus-Gemini-Codex. Притом там явно не пара часов на "субъективно сравнить в попугаях" как я обычно делаю.
GitHub
GitHub - 4dand/1c-ai-codegen-research-paper: Научная работа «Экспериментальная оценка эффективности искусственного интеллекта в…
Научная работа «Экспериментальная оценка эффективности искусственного интеллекта в генерации кода для доменно-специфичных платформ (на примере 1С:Предприятие 8)». SMOP-метрика, эксперименты с LLM, ...
🔥6👍1😁1
IT Does Matter
Интересно, есть кто то узнал этот момент одной классной игры? А самое главное, есть идеи почему я его вспомнил и причём тут AGI и профессии будущего? Каким одним словом вы бы описали ответ? Welcome в комменты.
Правильный ответ тут: Эмпатия. Игра Detroit Become a Human - интерактивное кино про роботов и проблемам ИИ\AGI. Это конкретная ключевая сцена где робот отказывается стрелять в голову другому андроиду потому что уже мыслит как человек и считает её человеком. После чего его признают полнценным существом и следовательно опасным для человечества. Последнее что отличает ИИ от человека - Эмпатия. Даже тут уже авторы подумали об этом. Я бы рекомендовал запомнить это слово. Именно по признаку "нужна эмпатия\не нужна эмпатия" можно оценивать применимость ИИ для замены. Понятно что гуманадоидные роботы ещё далеко и можно оценивать "нужна работа руками". Но вот детям уже сейчас надо ориентироваться на Эмпатию...
🤔3👍2👌1🤝1🗿1
Как "ловить халяву":
1) Берём OpenRouter (региться и ключик API сделать конечно надо),
2) Открываем раздел Ranking - смотрим сети которые топ-3 по популярности, особенно выросли за последние пару суток
3) Смотрим их - скорее всего увидим какие-нибудь промо, как на приведённом рисунка
4) Берём какого-нибудь агента именно под эти сетки: KiloCode, RooCode, OpenCode и даём ему ключик OpenRouter (уже должен быть) и название нужной модели
5) Юзаем модель и в хвост и в гриву на какие-то нужные но не самые критичные участки (описать каждый объект конфигурации (graph metadata будет счастлив), преобразовать кучу вордов в md или обратно, распознать какие то документы, review-ить всё ERP). Бинго!
1) Берём OpenRouter (региться и ключик API сделать конечно надо),
2) Открываем раздел Ranking - смотрим сети которые топ-3 по популярности, особенно выросли за последние пару суток
3) Смотрим их - скорее всего увидим какие-нибудь промо, как на приведённом рисунка
4) Берём какого-нибудь агента именно под эти сетки: KiloCode, RooCode, OpenCode и даём ему ключик OpenRouter (уже должен быть) и название нужной модели
5) Юзаем модель и в хвост и в гриву на какие-то нужные но не самые критичные участки (описать каждый объект конфигурации (graph metadata будет счастлив), преобразовать кучу вордов в md или обратно, распознать какие то документы, review-ить всё ERP). Бинго!
🔥8❤3👍2
https://habr.com/ru/news/1017462/ - все же уже прочитали? Надеюсь конечно до этого не дойдёт, потому как кажется загнать в каменный век и убить ИТ отрасль так себе идейка, но кажется как минимум нам надо бы собраться на ещё один митап.
Хабр
«Код Дурова»: в Ростове‑на‑Дону тестируют белый список для домашнего интернета
«Код Дурова» подтвердил случай введения белого списка в Ростове‑на‑Дону одним из местных провайдеров. Опрошенные изданием люди доказали, что на домашнем интернете у них...
Будем собираться на ещё один митап по КВН и белым спискам? Роуминговая симка и Старлинк на границе - не единственные варианты. Также ещё раз рассмотрим как лучше делать чтобы Claude не блочил аккаунты (юзать Cursor :)). Главная цель - стоп паники.
Anonymous Poll
80%
Да, я бы послушал
11%
Все вопросы по доступам уже решил, белых списков не боюсь
9%
Прошлого митапа было достаточно
Ну это конечно надо прочитать всем... у кого:
- инструмент от вендора не сжимает контекст
- CC сам найдёт всё что нужно в коде
- мой MCP с Grep вернёт тонну результатов а CC разберётся...
- инструмент от вендора не сжимает контекст
- CC сам найдёт всё что нужно в коде
- мой MCP с Grep вернёт тонну результатов а CC разберётся...
Forwarded from AI Projects (Vladimir Ivanov)
🔍 Очень важный пост с реверс-инжинирингом Claude Code по утечке его кода. Кратко пройдусь по тезисам.
1. Реальный статус успешности правок доступен только сотрудникам Anthropic. Обычные пользователи Claude Code получают ложноположительное заявление Claude об успехе примерно в 30% случаев.
Это связано с известным эффектом «доверчивости» ИИ к статусу операций без контекста. Я писал об этом в части работы с автотестами: нужно давать LLM больше информации, чем просто SUCCESS.
2. Скрытое от пользователя сжатие контекста после 167k токенов.
Причём сжатие не беспроблемное — с потерями названий важных объектов, типа имён переменных. Это одна из причин галлюцинаций Claude в Claude Code.
3. Требование к Claude принудительно упрощать архитектурные решения с целью писать код просто короче.
4. Claude Code уже сделан под рой ИИ-агентов, но часто это недоступно пользователю, т.к. он не знает лимит в 5 субагентов и 167k токенов на субагент, без чего параллелизм не работает.
5. Слепая зона на 2000 строк. Если ваши модули длиннее, то Claude может быть «ослеплён» не всегда хорошо работающим RAG-механизмом чтения чанками кода и просто галлюцинировать обрезанный код в Claude Code.
6. Ослепление Tools с результатами выше 50k символов. Наиболее критично для поиска агентом, т.к. если найдётся много, то агент попадает в preview, но Claude не знает об усечении, поэтому может сделать неверный вывод.
7. AST не применяется в Claude Code.
https://x.com/iamfakeguru/status/2038965567269249484
1. Реальный статус успешности правок доступен только сотрудникам Anthropic. Обычные пользователи Claude Code получают ложноположительное заявление Claude об успехе примерно в 30% случаев.
Это связано с известным эффектом «доверчивости» ИИ к статусу операций без контекста. Я писал об этом в части работы с автотестами: нужно давать LLM больше информации, чем просто SUCCESS.
2. Скрытое от пользователя сжатие контекста после 167k токенов.
Причём сжатие не беспроблемное — с потерями названий важных объектов, типа имён переменных. Это одна из причин галлюцинаций Claude в Claude Code.
3. Требование к Claude принудительно упрощать архитектурные решения с целью писать код просто короче.
4. Claude Code уже сделан под рой ИИ-агентов, но часто это недоступно пользователю, т.к. он не знает лимит в 5 субагентов и 167k токенов на субагент, без чего параллелизм не работает.
5. Слепая зона на 2000 строк. Если ваши модули длиннее, то Claude может быть «ослеплён» не всегда хорошо работающим RAG-механизмом чтения чанками кода и просто галлюцинировать обрезанный код в Claude Code.
6. Ослепление Tools с результатами выше 50k символов. Наиболее критично для поиска агентом, т.к. если найдётся много, то агент попадает в preview, но Claude не знает об усечении, поэтому может сделать неверный вывод.
7. AST не применяется в Claude Code.
https://x.com/iamfakeguru/status/2038965567269249484
X (formerly Twitter)
fakeguru (@iamfakeguru) on X
I reverse-engineered Claude Code's leaked source against billions of tokens of my own agent logs.
Turns out Anthropic is aware of CC hallucination/laziness, and the fixes are gated to employees only.
Here's the report and CLAUDE.md you need to bypass employee…
Turns out Anthropic is aware of CC hallucination/laziness, and the fixes are gated to employees only.
Here's the report and CLAUDE.md you need to bypass employee…
🤨4❤1🤷♂1
https://github.com/DonutShinobu/claude-code-fork - кому интересно порыться в исходниках CC самому (ну или с помощью CC :)) (надеюсь к моменту поста репозиторий ещё будет живой). https://github.com/instructkr/claw-code - Если что вот этот репозиторий явно проживёт дольше. CC переписан на Rust. Заметьте - oh-my-codex для этого использован... Как и oh-my-claude/oh-my-cursor может творить чудеса на таких крупных но достаточно рутинных задачах (но в реальной работе я бы пока не рекомендовал). Ещё чую надо ближе присмотреться к OpenCode (https://github.com/anomalyco/opencode) почему то предчувствую крупные обновления в ближайшее время :). Да и в Cursor-е думаю тоже будет обновление, хотя скорее всего не такое крупное...
GitHub
GitHub - DonutShinobu/claude-code-fork: Claude Code is an agentic coding tool that lives in your terminal, understands your codebase…
Claude Code is an agentic coding tool that lives in your terminal, understands your codebase, and helps you code faster by executing routine tasks, explaining complex code, and handling git workflo...
Правила https://github.com/comol/cursor_rules_1c и документация https://docs.onerpa.ru/mcp-servery-1c обновлены под новую версию сервера.
Ещё видео запишу пожалуй.
P.S. Ссылку в ЛК поменял конечно, качайте новую. Ключи тоже сменились. docker pull не забываем.
Please open Telegram to view this post
VIEW IN TELEGRAM
vibecoding1c.ru
МСР Серверы
👍17🔥7🤝2❤1
С радостью делюсь инсайтом: неужели все уже открыли для себя эту революционную кнопку в Telegram, которая трансформирует нашу коммуникацию и выводит стилистику текста на совершенно новый уровень эффективности?
😁7
Forwarded from Vibecoder
Alibaba представила Qwen3.6-Plus — «сильнейшая китайская модель в коде»
Alibaba официально выпустила Qwen3.6-Plus — флагман семейства Qwen, заточенный под агентное программирование. Доступна в Qwen Chat, через Model Studio и платформу Wukong. API: $0,5/$3 за миллион токенов при контексте до 256К, $2/$6 при контексте до 1М.
В отличие от Preview-версии с OpenRouter, полный релиз стал мультимодальным — парсит плотные документы, анализирует визуальные сцены, рассуждает по длинным видео. Контекст — 1М токенов.
Обещают открытые веса в компактных размерах и флагманскую Qwen3.6-Max.
____________
💎 Вступай сообщество вайбкодеров
Alibaba официально выпустила Qwen3.6-Plus — флагман семейства Qwen, заточенный под агентное программирование. Доступна в Qwen Chat, через Model Studio и платформу Wukong. API: $0,5/$3 за миллион токенов при контексте до 256К, $2/$6 при контексте до 1М.
По бенчмаркам SWE-bench и Claw-Eval модель обходит GLM-5 и Kimi-K2.5 с параметрами в 2–3 раза больше. Alibaba заявляет, что приближается к серии Claude в агентном кодинге. Совместима с OpenClaw, Claude Code и Cline.
В отличие от Preview-версии с OpenRouter, полный релиз стал мультимодальным — парсит плотные документы, анализирует визуальные сцены, рассуждает по длинным видео. Контекст — 1М токенов.
Обещают открытые веса в компактных размерах и флагманскую Qwen3.6-Max.
____________
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
https://www.cnews.ru/news/line/2026-03-31_75_razrabotchikov_uzhe_ispolzuyut - 75% и даже в РФ... Нехило кажется за год продвинулись.
CNews.ru
75% разработчиков уже используют ИИ для кода - CNews
Napoleon IT совместно с AI Talent Hub ИТМО (онлайн-магистратура по искусственному интеллекту) провели опрос среди 1000 студентов...
Forwarded from AI for Devs
Media is too big
VIEW IN TELEGRAM
⚡️ Вышел Cursor 3: с новым интерфейсом, написанным с нуля
Визуально он напоминает Claude и Codex Desktop: всё пространство отдано под управление агентами, а не под редактор кода.
Для тех, кто хочет работать как раньше — старый IDE-режим на базе VS Code никуда не делся, можно переключиться в любой момент.
В Cursor 3 также встроена собственная модель Composer 2, о которой мы уже рассказывали. Кстати, история в итоге закончилась без скандала. Moonshot поздравили команду Cursor с релизом модели. И, видимо, не имеют к ним никаких претензий)Но IDшник всё таки можно было и поменять :D
@ai_for_devs
Визуально он напоминает Claude и Codex Desktop: всё пространство отдано под управление агентами, а не под редактор кода.
Для тех, кто хочет работать как раньше — старый IDE-режим на базе VS Code никуда не делся, можно переключиться в любой момент.
В Cursor 3 также встроена собственная модель Composer 2, о которой мы уже рассказывали. Кстати, история в итоге закончилась без скандала. Moonshot поздравили команду Cursor с релизом модели. И, видимо, не имеют к ним никаких претензий)
@ai_for_devs
AI for Devs
⚡️ Вышел Cursor 3: с новым интерфейсом, написанным с нуля Визуально он напоминает Claude и Codex Desktop: всё пространство отдано под управление агентами, а не под редактор кода. Для тех, кто хочет работать как раньше — старый IDE-режим на базе VS Code никуда…
Прочитал "When we started building Cursor, we forked VS Code instead of building an extension so we could shape our own surface. With Cursor 3, we took that a step further by building this new interface from scratch, centered around agents." чот не очень я теперь уверен что новость хорошая, учитывая как команда курсор "чувствует нужный вектор развития". Они были форком vscode теперь засрали переписали всё кажется....
👍1
IT Does Matter
Прочитал "When we started building Cursor, we forked VS Code instead of building an extension so we could shape our own surface. With Cursor 3, we took that a step further by building this new interface from scratch, centered around agents." чот не очень я…
Всё нормально, они не совсем конченые. Новый интерфейс реализован как отдельное окошко которое надо вызвать из меню. Второй заход курсора в область "игрушек вроде Lovable", после неудачного первого видимо ничему не научило команду. Пишу обзор