Квест Теория Каст и Ролей
20.6K subscribers
1.41K photos
488 videos
44 files
3.85K links
Канал Алексея Крола, автора Теории Каст и Ролей.
Download Telegram
Сообщаю, 40 минут потратил на то, чтобы исследовать плагины для ClaudeCode. Короткий вывод: не тратьте на них время. Мы подробно поговорим про skills, вот эти все вещи про tools, это реально полезно. Но, как обычно, хочешь сделать хорошо, делай это сам. Но, если есть желание, можете посмотреть. В общем, ощущение такое, что все эти плагины для совсем-совсем новичков, которые в целом вообще процесс проектирования не понимают и, соответственно, не понимают всех тех подводных ям, на которые они наступят. https://claude.com/plugins

Большинство плагинов от сторонних разработчиков — это по сути просто упакованные промпты и MCP-конфиги, которые ты сам можешь настроить за 5 минут. Реальную ценность представляют разве что официальные от Anthropic (Figma, Supabase, GitHub MCP) — но и их можно подключить напрямую через MCP без всей этой плагинной обёртки.

Для задач с автоматизацией и агентными пайплайнами прямой контроль над конфигом всегда надёжнее, чем чужие "магические" пакеты.

Поверьте, я сэкономил вам много времени, чтобы потом не исправлять множество головной боли, если вы будете устанавливать плагины. )))
49
Всем привет. Через 2:05 начнется вводная лекция бесплатного мини курс по вайб-кодингу и применению чуть более продвинутых инструментов для использования ИИ. В листе ожидания более 30 тыс. человек, приглашать не буду.

Тем, кто юзает OpenClaw - напишите о своих реальных кейсах, только не пишите про "читает посту, посылает посты в телегу" - это все и так понятно. Опишите что-то серьезное из devops, серьезной аналитики, мониторинга процессов, обработки данных, поиска с анализом, бухгалтерии, права и т.п. Из науки и разработки, чего-то большего, чем лендинг.

Курс будет доступ в записи, бесплатно и пожизненно, так что кто захочет - всегда сможет попробовать позже. Буду неспешно делать урок примерно каждые 3-4 дня. Ориентировочно 8-10 уроков. Примерное описание и ссылка на программу здесь: https://alexeykrol.com/claudecodefree/
457
Стата по семинару. Емкость комнаты ZOOM только 500 человек - больше не вмещалась. 500 чел - 79$, 1000 чел - 379$. В следующий раз попробую одновременно делать трансляцию на Facebook или Youtube. Запись будет к вечеру - чтобы смотреть запись - нужно зарегится: https://alexeykrol.com/reg_ai_vibe/ - это все бесплатно, т.е. даром - все, как вы любите.
65
1-й урок готов: https://alexeykrol.com/courses/real/lessons/1-58/

Саммари:

Главная рамка урока: ИИ здесь рассматривается не как “дополнительный инструмент”, а как новая базовая среда работы и обучения. Для большинства людей ИИ уже стал лучшим учителем: он доступен постоянно, не осуждает, умеет подстраиваться под уровень пользователя и в большинстве практических случаев закрывает почти все базовые запросы лучше, чем традиционные курсы или живая поддержка.

Ключевой принцип обучения — не искать идеальный курс, а немедленно учиться через задачу. Правильный путь — брать реальную проблему, обсуждать ее с ИИ, задавать даже самые простые и “тупые” вопросы и продолжать до тех пор, пока не появится ясность и не начнется практическое действие. Понимание здесь определяется не теорией, а тем, начал ли человек что-то делать руками.

Главный предел ИИ — не интеллект, а отсутствие человеческой настойчивости. ИИ может объяснять, предлагать решения и автоматизировать куски работы, но не может “упираться” вместо человека в долгом процессе обучения, творчества или инженерной разработки. Поэтому основным фактором успеха остается не доступ к модели, а способность не бросить на первых тупиках.

Обычный чат — это только начальный уровень, и большинство людей используют лишь малую долю возможностей ИИ. Чат хорош для простых задач, но быстро упирается в ограничения: размер контекста, количество документов, слабую работу с ветвлениями, версиями и сложными проектами. Как только задача становится нелинейной, многослойной или требует долгого сопровождения, приходится переходить к более продвинутому стеку.

Причина перехода к “вайб-кодингу” и профессиональным инструментам не в том, чтобы стать программистом, а в том, чтобы решать задачи, которые уже не помещаются в интерфейс чата. Речь идет не только о коде: те же инструменты полезны для текстов, данных, исследований, автоматизаций, регламентов и создания приложений. Код здесь выступает просто как еще один язык, понятный модели.

Курс устроен как лестница уровней: от простого использования чата к среде, где есть контроль версий, рабочее пространство, агентный режим и проектная логика. Каждый следующий уровень нужен не ради “техничности”, а потому что предыдущий перестает справляться с задачами. Это описывается как игра или квест, где рост начинается в момент, когда привычный способ работы уже не тянет.

Обучение в уроке подается как квест, а не как линейная инструкция. Сами по себе инструкции редко дают результат: реальное обучение начинается, когда человек сталкивается с препятствием, не знает, как его пройти, и вынужден задавать новые вопросы. Поэтому тупики и фрустрация здесь не побочный эффект, а обязательная часть роста.

Практическая цель курса — дать не “профессию разработчика”, а рабочий минимум инструментов, который закрывает большую часть реальных задач. Не нужно осваивать всю сложность VS Code, GitHub или терминала; достаточно выучить ограниченный набор действий, который дает рычаг. Акцент делается не на полном техническом образовании, а на прикладной эффективности.

Вайб-кодинг здесь понимается не как магия “скажи модели — и всё появится”, а как связка инструментов, методологии и ясного замысла. Простые вещи вроде лендингов или прототипов делаются быстро, но как только проект становится сложнее, одних промптов уже недостаточно: нужны архитектура, этапность, спецификации и дисциплина. Иначе пользователь быстро упрется в хаос.

Отдельный большой блок урока — проблема памяти моделей. Современные LLM очень сильны когнитивно, но фундаментально не обладают настоящей памятью: они плохо удерживают длинный контекст, захлебываются при перегрузке и создают лишь иллюзию “помню всё” за счет внешней инфраструктуры. Отсюда важность внешней памяти, контекст-инжиниринга и собственных фреймворков, которые компенсируют забывание между сессиями.
141
Качество результата зависит не столько от выбора конкретной модели, сколько от качества постановки задачи. Спор о том, “какой инструмент лучший”, часто переоценен: если сценарий, спецификация и проектное мышление хорошие, то почти любой сильный агент даст достойный результат. Поэтому продакт-логика, способность формулировать ТЗ и задавать правильные вопросы становятся важнее традиционного навыка ручного кодинга.

ИИ радикально сдвигает экономику личной самореализации. Теперь один человек может делать то, что раньше требовало команды, бюджета и времени: писать книги, собирать курсы, автоматизации, сервисы, приложения. Смысл всей этой истории не в технике как таковой, а в том, что у человека впервые появляется реальный шанс реализовать собственные идеи, а не только работать “на дядю”.

Главная идея урока: весь этот стек инструментов нужен не только для программирования, но и для любых «языковых» проектов — текстов, таблиц, сценариев, бизнес-процессов, документов, аналитики и даже книг. Код здесь рассматривается как одна из форм языка, с которой языковые модели умеют работать так же, как и с обычным текстом.

В уроке показывается, что одна и та же рабочая среда подходит для очень разных проектов: курсов, книг, налоговых и страховых документов, художественных миров, внутренних процессов и приложений. Смысл в том, что VS Code, агенты и файловая структура образуют универсальную систему, пригодную и для кодовых, и для некодовых задач.

Отдельно подчеркивается преимущество локальной организации работы: на компьютере можно держать полную и сложную структуру проекта, а наружу показывать только нужную часть. Это дает контроль над содержимым, доступами, версиями и общей логикой управления материалами.

Практическая ценность кодовых агентов раскрывается на примере рутинных задач, которые формально не выглядят как программирование. Если есть повторяемая ручная работа с данными, агент может быстро сделать утилиту, автоматизировать преобразование форматов и снять постоянную операционную нагрузку.

Когда проектов становится много, отдельной задачей становится уже не создание, а управление всем этим массивом. Поэтому возникает потребность в проектном трекере, где видно, какие проекты существуют, на какой они стадии, что требует доработки, а что уже готово. ИИ ускоряет производство, но вместе с этим усиливает потребность в системе навигации и контроля.

Начинать предлагается с базовых шагов: установить VS Code, освоить простой интерфейс, создать папку проекта и сложить туда все рабочие материалы. Акцент делается на том, что на старте не нужно пугаться сложности среды: для реальной работы достаточно небольшой части ее возможностей.

Ключевой организационный принцип урока — привести документы к форматам, которые хорошо понимает и модель, и сама среда. Для текстов таким форматом становится Markdown, а для таблиц — CSV. Это делает данные более доступными для анализа, редактирования, сравнения и дальнейшей автоматизации.

Markdown важен не просто как текстовый формат, а как способ сохранить структуру документа в виде, понятном модели: заголовки, акценты, логические блоки и элементы оформления. В обычном текстовом файле эта структура теряется, а в Markdown она остается читаемой и для человека, и для машины.

Если исходные материалы находятся в неудобных форматах, например в PDF или офисных документах, их можно переводить в Markdown и CSV с помощью ИИ. Это позволяет не тратить время на ручную возню с конвертацией и быстрее приводить проект к виду, в котором с ним удобно работать дальше.

В качестве основных рабочих агентов предлагаются Claude Code и Codex, которые устанавливаются внутрь VS Code как расширения. При этом важна не только установка, но и внимательность к источнику: использовать нужно официальные расширения от Anthropic и OpenAI, а не случайные сторонние варианты.
29
После установки агентов логика работы меняется: пользователь уже не просто общается с чат-ботом в браузере, а работает с агентом, который видит папку проекта, файлы, тексты, таблицы и код. Благодаря этому агент может анализировать не абстрактный запрос, а реальный контекст конкретного проекта.

Итоговая схема урока выглядит так: сначала ставится VS Code, затем подключаются Claude Code и Codex, выполняется вход в аккаунты, открывается папка проекта с правильно подготовленными файлами, и после этого агенты начинают читать, анализировать и сопровождать работу с материалами. То есть задача урока — перейти от хаотичного общения с ИИ в браузере к системной работе внутри полноценной проектной среды.
41
Женщины? Женщины! Вы - чудо и самое красивое, что есть на Земле. К красотам природы привыкаешь, но но к вам привыкнуть невозможно. Я это знаю точно, когда смотрю на свою жену.

Женщины, как хорошо, что вы есть! Я не буду писать "от всей души" - это ужасающая банальность и штамп. Просто скажу, что абсолютно искренне и от имени и по поручению (черт, тоже штамп) всей менее умной и далеко не такой красивой половины человечества хочу пожелать вам, чтобы ваши мужчины (т.е. мы) поздравляли вас, оказывали знаки внимания и интенсивно любили вас до судорог и зубовного скрежета каждый день. А не раз в год.

В общем, к определенному возрасту нормальный мужчина понимает, что создание счастья для его женщины это единственный смысл. Все остальное - деньги, власть, открытия - все это нужно только для того, чтобы сделать счастливой свою женщину.

Я тут недавно осознал, что есть много достижений, которые дают нам чувство победы, удовлетворения.

Но подлинное счастье в моменте дают только минуты, когда мы доставляет счастье свои любимым. И это не дети, родители, а именно любимые, кто с нами рядом.

Возможность разделить все самые лучшие моменты - дает высшее ощущение счастья и это самый тяжелый наркотик.

Наблюдение. Когда имеешь дело с большим числом людей, как я, то совершенно однозначно можно сказать, что в массе - женщины более ответственные, работоспособные, да в общем и более умные, чем мужчины. Впрочем, у мужчин своя роль в этой игре.🤣
13133
Менеджеры до сих пор думают, что ИИ улучшит их компании. Это жестокая ошибка, потому что в 95% случаев ИИ уничтожит ваши компании. Блин! Что за гонево?

Ок. Давайте по порядку. Главное заблуждение эпохи AI в том, что все почему-то считают, будто разговор идет об инструментах. Об инструментах, мазафака!

Будто будущее работы решится тем, что очередная толпа менеджеров будет сравнивать библиотеки промптов и спорить, какая блестящая панель управления лучше помогает им чувствовать себя уверенно.

Каждую неделю появляется новая партия корпоративных паломников, которые заходят в переговорку с одним и тем же мертвым набором вопросов: какая модель? какой стек? какой workflow? как сделать сотрудников на 17% быстрее в производстве той же самой бюрократической жижи?

Но это вообще не про то.

Настоящий переворот происходит не на уровне инструментов. Он происходит на уровне устройства компании — ее скелета, нервной системы, скрытой проводки за красивыми квартальными отчетами.

Старая модель была простой: люди работали, а машины были вспомогательным средством. Сейчас возникает другая схема, рядом с которой прежняя оргструктура выглядит как детский рисунок, размокший под дождем.

Люди уже не просто пользуются инструментами. Все чаще они управляют системами агентов — синтетическими исполнителями, которых кормят правилами, контекстом, логикой и бесконечным потоком корпоративных данных.

А это уже совсем другой зверь.☠️

Это значит, что сначала проектируется сам процесс: логика, ограничения, онтология, контекст, цепочка исполнения. А потом работа начинает постепенно уходить от команд наемных людей к взаимосвязанным системам.

Функции, для которых раньше нужны были встречи, менеджеры, бесконечные согласования и ритуальные страдания, начинают растворяться в машинно-управляемых потоках. И в этот момент компания начинает мутировать.

Она все меньше похожа на обычную организацию и все больше — на небольшую группу людей, которая управляет разросшимся автоматизированным механизмом, не знающим сна, жалоб и стоматологии.

Сейчас это называют AI-native компаниями. Само выражение уже рискует быть до смерти затасканным консультантами, но суть сдвига от этого никуда не девается. Мы наблюдаем первые грубые наброски нового управленческого уклада, и пока почти никто не понимает, как именно это существо должно выглядеть в реальной жизни.

Поэтому самое интересное происходит не в привычном болоте “AI thought leadership”, где все разговаривают языком законсервированного LinkedIn и пытаются продавать просветление через маркированные списки.

Самое интересное происходит в экспериментах — в живых, неровных, местами слегка безумных попытках действительно собрать такую архитектуру на практике.

Один из таких экспериментов — трехнедельный спринт, который делают AI Mindset и Степан Гершуни.

Идея, по крайней мере на мой взгляд, не в том, чтобы еще раз церемониально обменяться банальностями про “дисрапт”.

Смысл в том, чтобы собрать все руками: описать процессы, определить онтологию данных компании, построить AI-операционную среду, автоматизировать отдельные функции и выйти оттуда с 90-дневным планом трансформации, а не с духовным похмельем и PDF-файлом, который никто никогда больше не откроет.

И уже одно это звучит освежающе. Но настоящая ценность здесь — в людях. Не потому что “нетворкинг” — это священная корова; это слово вообще стоило бы посадить в бетонный ящик и утопить в море.

А потому что здесь собрались люди, которые уже реально ковыряются в этой машине: главы ИИ двух банков, крупного медиа, 3 компаний из долины с $10M+ ARR

- Степан Гершуни из cyber.fund,
- Александр Поваляев из AI Mindset,
- Дима Ханарин из codos.ai,
- Даниил Кравцов из Improvado,
- Байрам Аннаков из onsa.ai,
- Всеволод Устинов из Plurio AI,
- Алексей Амётов из Look At Media и ...
- Роман Бузько из skala.io.

То есть это не парад торговцев теориями, а практики, у которых под ногтями грязь.
40
Пока все это еще напоминает раннюю стадию секты:
странная небольшая группа гиков, операторов и организационных еретиков, которые пытаются собрать новую управленческую парадигму раньше, чем рынок вообще поймет, что произошло.

Но обычно так все и начинается. Будущее редко приходит в виде аккуратной служебной записки. Обычно оно появляется как странная сцена — наполовину эксперимент, наполовину заговор, — а уже потом люди, которых рядом не было, называют это “лучшей практикой”.

Старт — 23 марта. Онлайн. Регистоация и подробности здесь https://r.bothelp.io/tg?domain=aimindset_lab_bot&start=c1771581785450-ds&utm_content=alexkrol
23
Media is too big
VIEW IN TELEGRAM
Балуюсь с notebooklm от Google. Загрузил туда своё видео, почти 1.5 часа, оно сделало пятиминутный сжатый релиз. Очень прикольно. Оригинальный семинар здесь: https://youtu.be/1MF_CeW-ISg?si=6hHyYEoWK1T1ND3a
139
Media is too big
VIEW IN TELEGRAM
Ну, это просто для напоминания.
130
Полезно
3
Forwarded from Refat Talks: Tech & AI
This media is not supported in your browser
VIEW IN TELEGRAM
Ваш кодинг-агент уже выбрал ваш стек. Вы просто еще не заметили.

Исследователи из Amplifying прогнали около 2,5 тыс. открытых запросов к Claude Code типа "добавь базу данных", "как задеплоить", "добавь аутентификацию" ни разу не назвав конкретный инструмент. Записали, что агент выбрал и сделал. Получилась карта того, как AI-агенты формируют стек за разработчиков.

Что нашли

- Монополии. GitHub Actions владеет CI/CD (94%), Stripe - платежами (91%), shadcn/ui - UI (90%), Vercel -деплоем JS (100%). Redux получил 0 рекомендаций (Zustand забрал все). Vitest вместо Jest. pnpm вместо yarn. Resend вместо SendGrid и тд
- Конкурентные категории. Auth, кеширование, ORM, background jobs, real-time - здесь нет явного победителя, а выбор полностью зависит от стека. NextAuth.js для Next.js (91%), но для Python - кастом (100%). Redis для Python-кеша (57%), но Next.js использует встроенный кеш (42%) и тд
- Контекст > формулировка. Один и тот же вопрос дает разные инструменты для разных репо (Drizzle для JS, SQLModel для Python), но стабилен при перефразировании (76% stability)
- Велосипеды - главная находка. В 12 из 20 категорий агент строит с нуля вместо рекомендации инструмента. Кастом предлагался чаще чем у любого отдельного инструмента. Например просишь auth для Python - пишет JWT реализацию с нуля.

А что изменилось-то

Проблема "на какую технологию ставить" была всегда, но сейчас размывается момент осознанного выбора. Гитхаб в своей статье назвал это "convenience loop".
И как вы поняли, проблема "Catch-22" намного шире технического стека, про это, например, пишет Nature.

И, вдобавок, есть проблема конфликта интересов, например авторы рисерча The Invisible Hand показали например как Gemini молча заменял open-source на платный Google Speech Recognition. Когда компания владеет и моделью, и облаком - модель может стать продавцом, притворяющимся советником.

И да, можно (и нужно) определить стек через документацию. Но знание из training data - это как гравитация. Исследования показывают: когда контекст противоречит тому, что модель "знает" из обучения, она часто игнорирует контекст и возвращается к дефолту.

Что с этим делать

- Сначала осознать, что кодинг-агент - это полноценный канал дистрибуции: сам выбирает, устанавливает и внедряет. Иногда выбирает велосипед. Иногда незаметно.

- Если у вас есть предпочтения по стеку - сообщайте как можно раньше через файлы контекста. Контролируйте исполнение.

- Боритесь с велосипедами: больше кода, меньше безопасности. Перед реализацией попросите агента показать варианты, trade-offs, задать вам уточняющие вопросы. Несколько минут возвращают момент осознанного выбора.

- Спросите себя "если сломается - кто поможет починить?" Популярная библиотека - community. SaaS - вендор. Кастомная реализация агента - вы.

- Если предпочтений нет, то не нужно бороться с мейнстримом. Популярный выбор часто обоснован: большое комьюнити, собранные грабли, проверенные паттерны.

Короче, момент выбора никуда не делся. Он просто переехал (и замаскировался).

🔥 🔁 @nobilix
639
Я поторопился с оценкой GPT-5.4 относительно корректной редактуры больших текстов. По факту проблема деградации большого контекста существует как у Google Gemini, так и в chatGPT. Хотя оба анонсируют контекстное окно в 1 миллион токенов, это, конечно, больше похоже на маркетинг. По факту можно наблюдать серьезную деградацию при обработке больших текстов. Все заявленные объемы контексты не работают напрямую, разумеется, если мы хотим получить качество.

Я тестировал объемы почти в 160 килобайт - это почти 50 страниц или около 90 тыс. знаков. Уже после 15 кило знаков начинается деградация: сначала менее заметная, а после где-то 30% — там уже все очень плохо. То есть это непригодно. Вообще.

В результате пришлось создать довольно сложную утилиту, которая разбивает текст на фрагменты, затем собирает их умным образом. Она работает в тестовом режиме и уже не опирается на обычную подписку, а использует API.

Она дает удовлетворительные результаты и способна работать с текстами практически неограниченной длины.

Последовательно обрабатывает текст 100 килобайт, 1 мегабайта, 10 мегабайт и так далее, не деградируя в качестве. Причем она занимается очисткой, разметкой и структурированием. Однако это, конечно, требует некоторых ресурсов.

Т.е. это уже ближе к начальной редактуре. Следующий уровень - семантическая смысловая редактура, чтобы приблизится к человеку. До этого, конечно, далеко, но время для человека она изрядно сэкономит.

Я делал тесты на 220 килобайт, и расшифровки, созданные в последнем стриме, уже сделаны с помощью этой утилиты. Для всего объема текста, который там был, практически на два видео (более 2 часов в сумма) , потребовалось примерно 3$. Это небольшая цена за качество при общем объеме почти 220К текста, это примерно 65-70 стандартных книжных страниц.
49
Я дал ИИ 6 часов автономной работы — и получил готовый продукт. Решил проверить одну простую вещь: может ли ИИ почти автономно сделать полноценный продукт? Не кусок кода, не “набросок MVP”, не очередной красивый демо-экран, а реальную рабочую штуку, которую можно выложить на GitHub и дать людям пользоваться.

Взял для этого вполне прикладную задачу: сделать Chrome-расширение для работы с n8n через Claude API.

И дальше пошёл в эксперимент по-честному. Сначала посмотрел, что уже есть на рынке. Нашёл несколько готовых расширений, но перед установкой решил прогнать их через security audit. И тут быстро стало понятно: чужие API-ключи, внешние серверы, сомнительная работа с безопасностью — в общем, доверия не возникло. Значит, делаем своё.

Дальше началось самое интересное. Я дал ИИ сделать реверс инжиниринг расширений, разобраться в предметной области: как устроены workflow в n8n, как работает их API, как вообще проектируются Chrome extensions, как устроен Claude API со streaming.

После этого он собрал полноценную спецификацию, которую мы несколько раз переписывали и пересматривали. И вот это, пожалуй, была самая человеческая часть процесса: не “магия кнопки”, а нормальный архитектурный review, где ты споришь, задаёшь вопросы, находишь слабые места и заставляешь систему думать точнее. Это заняло примерно 15 минут с 1-ого промпта до финальной спецификации и детального плана.

Потом ИИ ушёл в почти автономную разработку. За один длинный заход собрал архитектуру, интерфейс, streaming-чат, генерацию workflow, контекстную логику, тесты, полировку. Во второй сессии добавил ещё несколько важных вещей: поиск по шаблонам, актуализацию моделей, расширенный анализ платформ и интеграций.

Но самый полезный момент случился не на этапе генерации кода, а когда я начал пользоваться расширением сам, как обычный живой человек. Просто взял полный диалог из чата, отдал его обратно ИИ и сказал: посмотри на это как на UX-проблему. И вот тут полезла правда. Потеря контекста, непонятные ошибки, лишние инструкции, невидимые шаблоны, поведение “угадываю вместо того, чтобы спросить”. ИИ сам нашёл проблемы, сам предложил план исправлений, я подтвердил — и всё это было быстро доработано.

В итоге получился n8n Pilot — Chrome-расширение, которое умеет генерировать n8n workflow из обычного языка, помнить контекст диалога, работать через n8n API, валидировать запрос ещё до отправки в Claude, и при этом хранить ключи локально, с шифрованием, без телеметрии и без отправки данных на какие-то левые серверы.

Если в цифрах, то там уже:
— 50 000+ строк кода
— 438 тестов
— 150+ типов нод n8n
— 55+ распознаваемых платформ
— и всё это выросло от идеи до публичного релиза примерно за 6 часов чистой работы ИИ.

6 часов на 99% полностью автономной работы ИИ. Что это означает?

Вам не нужно покупать SaaS в 90% случаев. ИИ сделает для вас то, что нужно в течении часов или дней за условно 0$, полностью ваше под ваши требования.

И вот это, честно говоря, главный вывод. Не то что “ИИ умеет писать код” — это уже скучно. А то, что ИИ может тащить целый проект: от анализа и архитектуры до реализации, тестирования и релиза.

Человек при этом не исчезает. Но роль меняется. В этом эксперименте я был не программистом, а скорее Product Owner + QA + человек, который принимает решения. Я не писал код руками. Я задавал направление, проверял, спорил, тестировал на себе и привносил реальный пользовательский опыт.

И, как ни смешно, главным bottleneck оказался не ИИ, а я. Потому что ИИ не устаёт, не отвлекается и не думает полчаса над тем, какую из двух развилок выбрать. А человек — думает :)

Репозиторий открыт:
github.com/AI-agents-incubator/n8n-pilot

Мне кажется, мы уже довольно близко подошли к моменту, когда фраза “я сделал продукт с помощью ИИ” перестанет означать “он помог мне написать пару функций” и начнёт означать “я управлял целой автономной разработкой”.

Но для меня здесь важен ещё один слой.
140
Пока шёл этот эксперимент, я параллельно вёл ещё четыре проекта в достаточно плотном режиме, тоже с высокой автономией агентов. То есть дело было не в том, что я выделил один проект и сидел над ним без остановки.

Наоборот: несколько раз возникали ситуации, когда агенты работали сами по 10, 20, иногда 30 минут, а я в это время буквально смотрел кино, потому что у меня уже не было ресурса управлять ещё большим количеством процессов одновременно.

И дальше я всё яснее вижу следующую стадию. Не один агент на одну задачу, а многоуровневую систему.

Например, есть агент уровня CEO. У него есть менеджеры проектов. А у менеджеров — исполнители под конкретные задачи. То есть фактически появляется структура, в которой один верхнеуровневый агент управляет целым роем специализированных агентов.

И я не думаю, что этого нужно ждать годами. По моим ощущениям, это вопрос нескольких месяцев, а не далёкого будущего. Если я это соберу, то смогу параллельно вести уже не несколько задач, а десятки и сотни проектов одновременно. И речь не про сырые MVP, слепленные на коленке. Речь про полноценные production-grade проекты — с хорошей архитектурой, безопасностью, тестами и деплоем.

Вот это, как мне кажется, и есть настоящий сдвиг масштаба. Это всего лишь 12-03-26. Я записал видео всего процесса - можете посмотреть: https://youtu.be/PAnk8ius_4Q?si=R_MaZ87KjkRPYRHH
253
Что-то я гриппанул. Вчера под вечер уже чувствовал. Сегодня меня просто скосило. Так что, надеюсь, это пройдет быстро, хотя иногда, если приболею, бывает на 10+ дней. Посмотрим, как будет завтра.
62
Claude раскатал 1млн. контекстное окно для всех тарифов. Я протестировал - реально без вранья. Обработал мне текст почти 100 тыс. знаков на вполне приемлемом качестве в рамках одного промпта, включая клининг и разметку.

Вышел в лидеры снижения деградации контекста. Как я от chatGPT полгода назад перешел на Gemini, так для простых сырых кейсов можно смело переходить на Claude. (Для сложного редактирования мой агент редактор все же дает лучше результат и гибкости, но, думаю, это преимущество не надолго).🤣

Официальная информация: (перевод)

Контекст в 1M токенов теперь общедоступен для Opus 4.6 и Sonnet 4.6

Стандартное ценообразование теперь применяется ко всему окну в 1M токенов для обеих моделей — без надбавки за длинный контекст. Лимит на медиафайлы расширен до 600 изображений или страниц PDF.

Claude Opus 4.6 и Sonnet 4.6 теперь включают полное окно контекста в 1M токенов по стандартным ценам на платформе Claude. Стандартное ценообразование применяется ко всему окну — $5/$25 за миллион токенов для Opus 4.6 и $3/$15 для Sonnet 4.6. Никаких множителей: запрос на 900K токенов тарифицируется по той же ставке, что и запрос на 9K.

Что нового с выходом в общий доступ:

- Единая цена, полное окно контекста. Никакой надбавки за длинный контекст.
- Полные лимиты на запросы при любой длине контекста. Стандартная пропускная способность аккаунта действует по всему окну.
- В 6 раз больше медиафайлов на запрос. До 600 изображений или страниц PDF вместо прежних 100. Доступно уже сегодня на платформе Claude нативно, а также на Microsoft Azure Foundry и Google Cloud Vertex AI.
- Бета-заголовок больше не нужен. Запросы свыше 200K токенов работают автоматически. Если вы уже используете бета-заголовок, он просто игнорируется — изменений в коде не требуется.

Контекст в 1M токенов теперь включён в Claude Code для пользователей тарифов Max, Team и Enterprise с Opus 4.6. Сессии Opus 4.6 автоматически используют полное окно в 1M токенов — это означает меньше сжатий и сохранность большей части диалога. Ранее 1M контекст требовал дополнительного расхода ресурсов.

Длинный контекст, который реально работает

Миллион токенов контекста имеет смысл только в том случае, если модель способна находить нужные детали и рассуждать на их основе. Opus 4.6 набирает 78,3% на MRCR v2 — лучший результат среди frontier-моделей на этой длине контекста.

Claude Opus 4.6 и Sonnet 4.6 сохраняют точность по всему окну в 1M токенов. Извлечение информации из длинного контекста улучшается с каждым поколением моделей.

Это означает, что теперь можно загрузить целую кодовую базу, тысячи страниц контрактов или полный трейс долгоживущего агента — вызовы инструментов, наблюдения, промежуточные рассуждения — и работать с этим напрямую. Инженерные ухищрения, потери при суммаризации и принудительная очистка контекста, которые раньше были необходимы, больше не нужны. Весь диалог остаётся нетронутым.
149