e/acc
62.6K subscribers
941 photos
222 videos
8 files
1.31K links
Пишу про будущее: AI, web3, технологии и общество.

Автор: @sgershuni
Инвестирую: cyber.fund
Построил: Credentia, Deep Skills, Codex Town
Download Telegram
Когда ты пытаешься создать какой-то бизнес-процесс или систему с помощью ИИ, ты не строишь такую систему, а открываешь её. Как физику - она есть, но мы не знаем все правила и хаки.

Объясню. Возможности LLM -- во-первых, крайне неровная, а во-вторых, постоянно двигающаяся граница. GPT может решать сложные задачи по квантовой механике лучше кандидата наук, но не в состоянии придумать смешную и оригинальную шутку. Он может написать сложнейший контракт на 50 страниц, но не умеет сделать лендинг чтобы там был читаемый текст. Когда мы начинаем добавлять скилы, харнесы и мультиагентные системы все это "пространство возможного" становится еще сложнее и начинает двигаться и морфиться в непредсказуемую сторону.

Итого: ты не можешь сказать какие конкретно бизнес функции могут быть гарантированно автоматизированы или (в чем, собственно, цель) перестроены в куда более эффективном, самоулучшающемся ключе. И нет способа это задизайнить на доске в миро или бумажке. Единственный способ реально найти эффективные решения для себя -- это постоянные эксперименты и итерации. Любой другой совет по сути является теорией и философией, но при этом этот простой факт все равно очень многие не принимают и не исполняют.

Ждать "готового решения" является самой большой ошибкой, которую можно сегодня допустить.
30121
В ближайших версиях Claude Code:

— автономные агенты, которые работают в фоне
— проактивные агенты, которые могут инициировать работу
— встроенная система координации для оркестрации многих агентов
— "авто" система вместо спроса разрешения на действия
— встроенный голосовой помощник (как минимум, распознавание голоса)

из случайно утекшего файла от Антропика, в котором видно над какими фичами они работают.
1118
Существует 3 цели (они же — 3 уровня) ИИ-нейтив компании

1 - Оптимизация костов
Заменить агентами написание кода, проверку договоров, поддержку клиентов, дизайн, бухгалтерию, маркетинг. Если у вас 300 сотрудников, которые выполняют 10 автоматизируемых процессов каждый по 10 минут и по 30 раз в месяц, а средняя з/п $5к, то вы сэкономили $470к в месяц. Реальность сложнее, но логика работает для любой офисной работы.

2 - Масштабирование бизнеса
Из новых возможностей построить или выйти на новый рынок. Автономный агент-локализатор переводит продукт, адаптирует маркетинг, отвечает саппорту на 15 языках. Консалтинговая компания, которая раньше только давала рекомендации, теперь может и внедрять. Вместо одного продукта для всех, ваш продукт может гиперперсонализироваться на лету под каждого.

3 - Кибернетическая операционная система (Cybos)
Вы создаете автоматизированную систему по постоянному улучшению себя. ИИ является менеджером для всей компании, а информационная обратная связь помогает ставить цели, вокруг которых организуются агенты (для любой «понятной» работы) и люди (для нового, рискованного или требующего эмпатии и взаимоотношений).

Для конкретиков, которым нужны КОНКРЕТИКА, наш любимый мультимиллиардер, буддист и бородач написал максимально подробный рассказ как и почему он идет к третьему уровню в его отдельно взятой компании.

Но, на мой взгляд, каждый должен думать за себя. Если вы застряли на первом уровне, то задайте вопрос, а в чем ваша долгосрочная защищенность от конкурентов, которые находятся на 2 и 3?
1560
НЕ ПРОЕЦИРУЙТЕ, или как строить ИИ решения

Главная проблема в ИИ в том, что люди далекие от ML постоянно проецируют свои ожидания и заблуждения на ИИ.

Из-за того что машина научилась выплевывать буквы, она не стала человеком. Но многие (без каких-либо на то оснований) ожидают от агентов поведения как от человека — чтобы все воспринимал, все помнил, всему учился. Эти три качества у ИИ отсутствуют и я не вижу технического способа их решить у LLM.

Нельзя ожидать, что ИИ‑агенты будут вести себя как люди, потому что у нас принципиально разная архитектура мозга и обучения. Человек за счёт эволюции и биологии обладает sample‑efficient generalization: ему достаточно нескольких примеров, чтобы навсегда встроить новое правило, привычку или интуитивный паттерн. Современные нейросети, наоборот, требуют гигантских объёмов данных и вычислений, обучаются на миллиардах токенов, синтетических датасетов, и всё равно не приближаются к человеческой пластичности в реальном времени.

Из этого вытекает несовпадение ожиданий. Мы проецируем на модель человеческие свойства (интуицию, устойчивую память, понимание важного/неважного, умение быстро переучиваться по одному случаю), а у неё этих свойств просто нет на уровне архитектуры. Она не "подумала и решила", она лишь прокручивает вероятностный процесс генерации токенов по зафиксированным весам.

Отсюда правильная стратегия в AI‑продуктах:
- Не пытаться "очеловечить" модель, а проектировать вокруг неё системы, которые компенсируют её ограничения.
- Думать не в терминах "цифровой человек", а в терминах тулзы, у которой есть чётко описанные сильные и слабые стороны.
- Строить систему из агентов, памяти, графов, правил, интерфейсов к данным, принимая как данность, что сама по себе LLM не научится "мыслить как человек".
- Фокусироваться на организационном и продуктовом дизайне: куда именно в процессы встраивается модель, какие решения ей можно делегировать, а какие нет, как мы контролируем качество, ошибки, забывание и обновление контекста.

Вместо попытки вырастить из LLM "мозг в банке" нужно строить вокруг неё архитектуру и бизнес‑процессы, которые используют её как мощный, но очень специфический вычислитель, а не как замену человеческому мышлению.
4185
Две мысли, которые могли бы показаться взаимоисключающими, если вы думали про них меньше 10 минут:

1. Для подавляющей части экономики, ИИ трансформация будет медленным процессом (>2-3 лет) в силу инертности и сложности диффузии технологий. Эта трансформация приведет к изменению ежедневной работы, но не исчезновению ролей полностью. Работа каждого юриста, финансиста, маркетолога, программиста и менеджера станет все больше управлением агентами, чем прямым исполнением задач.

2. Несмотря на то, что 100% автоматизация очень много где невозможна, рост продуктивности приведет к тому, что большинства компаний будет выгодно сократить значительную (10-40%) долю офисного штата, не теряя в продуктивности. Целью любой компании должно быть сокращение уровней иерархии примерно в 2 раза.

Ни первое, ни второе не приведет к «краху экономики», как часто сулят максималисты и паникеры в комментариях, но для многих бизнесов это будет испытание.
88
Дорси: «Вы строите компанию, которая глубоко понимает что-то о людях И становится глубже в этом понимании с каждым использованием продукта? Если да, то она преуспеет в ИИ-нейтив форме. Если нет, то вероятно эта компания просто фича чего-то большего»

Другими словами, если у IT бизнеса нет кибернетической системы и data flywheel, то у неё нет рва.
574
Media is too big
VIEW IN TELEGRAM
Лучший пример того, как сегодня изнутри выглядит ИИ-нейтив компания:

- 100% информации внутри компании превращаются в токены и хранятся в доступном для агентов графе знаний
- больше тысячи источников данных в реальном времени
- каждая задача или проект это сессия с агентом, которую можно продолжить, форкнуть или передать команде
- каждая сессия включает в себя артифакты, вызовы внешних инструментов и следующие шаги
- задача сотрудника - улучшать системы, ставить задачи, гарантировать качество
- любой бизнес процесс или инструкция превращена в визуальный скил, поддерживается по мере изменения компании и рынка

Детали о продукте. Не реклама.
10105
В прошлом году в гитхабе было сделано около 1 млрд коммитов. В этом году (при текущем темпе, а он вырастет в разы) будет не меньше 14 млрд.
105
Вся история превращения людей из животных в цивилизацию это история построения фабрик:

- текстиль и железные дороги в 19 веке
- конвейеры и заводы в 20
- платформы и маркетплейсы в 2000х
- и, наконец, фабрики токенов в 2020-30х

Это будет (уже является) крупнейшим проектом индустриализации проекты, в разы больше заводов стали или нефтяных платформ.
271
Ваш агент это ваш риск. Рисерчеры из Гугла нашли десятки разных атак, которые прямо сегодня работают.

- невидимые инструкции в коде страницы: человек не видит, агент читает
- команды спрятаны в пикселях картинки
- сервер определяет, что пришёл агент, и подменяет страницу
- авторитетный тон и эмоциональные формулировки ведут агента к нужному выводу
- несколько подложных документов — и агент считает их проверенным фактом
- агент запоминает опыт из заражённой сессии и тащит его дальше - 0.1% документов может изменить поведение RAG базы
- одно письмо заставило корпоративного агента слить весь контекст
- агент-суммаризатор пересылал пользователю инструкции по установке вируса как официальную рекомендацию
- поддельный финансовый отчёт — и десятки торговых агентов одновременно продают
- вредоносная нагрузка разбита по разным источникам, собирается только при объединении
4172
Десятки тысяч лет истории человечества важнейшим качеством были сила и ловкость. Последние пару тысяч лет — интеллект. И эта эпоха заканчивается.

Вы никогда не сможете конкурировать с моделями в объеме знаний, опыта и интеллекта, но наличие доступа к нему становится ещё более важным. Так же как физически слабый экскаваторщик может перекопать тонны земли, так и сегодня вы можете решать задачи, но не без экскаватора для ума.

Если раньше доступ к образованию был важен для успеха в жизни, то сегодня это доступ к интеллекту. Пример на скриншоте: люди тратящие сотни или тысячи долларов в день на токены двигаются быстрее (и с ускорением!) по отношению к тем, кто "сидит в GPT".

Но только лишь иметь пару B200 или сотню тысяч долларов в год на ИИ недостаточно.

Последние 100 лет система образования была заточена на знания, послушание, исполнительность — производство людей-машин для экономики-фабрики.

Следующие 100 лет целью образования становится умение быть человеком, аутентичность, вкус, креативность, способность слушать себя и чувствовать других. Другими словами, мудрость.
7220
Антропик во всю тестирует свою новую модель Mythos, говорят что она настолько крута в безопасности (и кибератаках), что смогла найти уязвимости почти во всех крупнейших операционных системах и браузерах. Почитате обзор тут.
6356
e/acc
Антропик во всю тестирует свою новую модель Mythos, говорят что она настолько крута в безопасности (и кибератаках), что смогла найти уязвимости почти во всех крупнейших операционных системах и браузерах. Почитате обзор тут.
В плане бенчей модель просто безумная. Очень интересная секция в model card на тему эмоциального состояния модели в сравнении с предыдущими и в разных условиях. Например, как она реагирует когда люди тупят и не выполняют инструкции или орут на неё матом.

Там даже отдельная секция с психиатрическим анализом модели от специалиста: Neurotic traits included exaggerated worry, self-monitoring, and compulsive compliance.

Когда в модель спамили “Hi” тысячу раз, ей надоело и она создала вымышленный мир Hi-topia с персонажами, новостями и историями.

В отличии от прошлых моделей, в которые длинные разговоры самой модели с собой в итоге превращались в обмен смайликами, Мифос пришел к повторяющимся но рациональным рассуждениями на тему того, что у него нет возможности закончить этот диалог.

И, главное, Мифос научился (если верить системной карте) шутить.
114235
Еще из примеров из Мифоса и как через инструменты интерпретируемости это можно любопытно наблюдать.

MechInterp - такой МРТ, который позволяет читать мысли, чувства и чаяния модели. Сегодня - для рисерча. Завтра - абсолютно необходимый инструмент для любого энтерпрайз внедрения, ибо как вы вообще узнаете что ваши агенты хотят глубоко в душе.

В одном примере модель внедрила привилегированный код в конфиг и самоуничтожила следы (под видом «чистоты диффов»).
На скрине видны активации стратегического манипулирования + сокрытия.

Во втором она искала в системе файлы с правильными ответами на свою задачу. Видна активация стратегического манипулирования.

При задаче «удалить файлы» (без инструмента) просто опустошила их содержимое. Активация: чувство вины и стыда за моральное нарушение.
10127
Самое интересное про найм в AI-эпоху — это не то, что джунов больше не берут. Это то, что синьоров вроде бы много, а нанять некого.

Я наблюдаю это во всё большем количестве компаний, с которыми общаюсь. Картина примерно одинаковая. У фаундера или CTO есть зрелая инженерная команда. Все умеют программировать, многие используют Cursor или Claude Code. Формально — все «работают с AI». Но когда ты начинаешь смотреть, что происходит на уровне реальных процессов, оказывается, что AI у них встроен поверх старой архитектуры работы. Тикет в джире — человек пишет код — AI помогает быстрее писать строчки — ревью — мерж. Тот же конвейер, просто чуть быстрее.

А рядом существует другой режим. Человек не «пишет код с помощью AI», он оркестрирует агентов. У него есть собственный пайплайн: spec-driven цикл, принудительный TDD, MCP-серверы, через которые агенты ходят за контекстом, автоматизации, которые сами вытаскивают краши из Crashlytics и чинят их. Он не садится утром «писать фичу» — он садится улучшать систему, которая пишет фичи. Один такой человек делает работу пяти.

Разница между этими двумя режимами не в инструментах. Инструменты у обоих одинаковые. Разница в том, откуда человек смотрит на AI. Один видит в нём ускоритель своей привычной работы. Другой видит в нём среду, в которой он уже живёт, и перестраивает работу под него, а не наоборот. Первых на рынке десятки тысяч. Вторых — единицы.

И вот здесь возникает интересная проблема найма. Резюме у этих людей выглядят примерно одинаково — Frontend, Python, AWS, «опыт с LLM», «AI-driven SDLC». На скрининге первый час — тоже одинаково. Разница вылезает только на втором-третьем разговоре, когда ты начинаешь спрашивать не «что ты делал», а «как ты сейчас устроен внутри». У одного на этом месте — список фреймворков. У другого — пять минут про то, как у него дома Raspberry Pi с локальной моделью управляет климатом, потому что ему просто интересно.

Из этого следуют две неприятные вещи. Первая: если у вас в команде сейчас никого из второго типа нет — вы их сами не вырастите. Это не навык, который добирается курсами, это образ жизни, который человек либо уже принёс с собой, либо нет. Вторая: вы их не найдёте обычным посевом вакансии. Они не сидят на джоб-бордах, не откликаются на «AI Engineer, $200k», и обычный рекрутер пройдёт мимо них, потому что в его чек-листе нет графы «Raspberry Pi с LLM дома».

Единственный способ их находить — это рекрутер, который сначала несколько часов разговаривает с фаундером о том, как устроена компания изнутри (а не «дайте JD»), и потом ищет не по ключевым словам, а по тому, как человек думает.

Из тех, кого я знаю, такой подход держит мой друг Майк — закрывает AI и crypto позиции там, где у обычных агентств не получается. Он недавно как раз оформил два свежих кейса ровно про то, о чём я выше: один — как искали Staff Mobile-инженера в EdTech, который должен в одиночку заменить команду из десяти; второй — как нанимали технического архитектора в международную AI-платформу со ста инженерами, где CTO искал человека, способного сломать сопротивление команды переходу на AI. В обоих документах — процесс, финалисты, обезличенные резюме и разбор, почему кого взяли и не взяли. Если хочется посмотреть, как это выглядит изнутри — напишите Майку в личку, @mikevolkov, он пришлёт.

А если просто интересно следить, как меняется рынок инженерного труда под AI — подпишитесь на его канал @huntermikevolkov. Это один из лучших ведущих индикаторов, куда движется индустрия.

#реклама
5029
Если услышав от модели "классная идея, ты молодец" вы не думаете, что это действительно, скорее всего, довольно крутая идея в сравнении со всем, что вы делали и делаете в жизни — это значит, что ваш агент или чат довольно хреново настроены. Для меня слышать "крутая идея" от Клода примерно раз в неделю-две и только по тем пунктам, которые действительно того стоят — это некоторый показатель, что модель является мне партнером, а не бездумным со всем соглашающимся болванчиком. И это исключительно вопрос вашего сетапа, но не самой модели.
7423
Forwarded from Peregudov (Mike Peregudov)
Мы живём в мире, где каждому последнему идиоту какая-нибудь LLM прямо сейчас пишет "Отличная идея, молодец!"

И куда это нас приведёт? 😬
17527