Отличный бесплатный конспект по LLM на русском языке
Праздники не такие длинные, как кажется. Будет жалко, если они снова пройдут бесполезно, потому что это, очевидно, лучшее время для развития.
В общем, пора поделиться с вами вот этим свежим конспектом. Очень качественная подача материала, емко, интересно и с множеством прекрасных схем и картинок. Внутри:
– Необходимая математика: линал и матанализ на пальцах
– Все про механизм внимания и трансформеры
– Детальное объяснение процесса предобучения (а это редкость)
– RL – с нуля до обучения ризонинг-моделей
– Полноценный гайд по тому, как зафайнтюнить модель
Всего 6 глав и 50 страниц – идеальный объем, чтобы осилить за выходные и понять принцип работы современных моделей. Сохраняйте сейчас и не откадывайте в долгий ящик.
Забрать полную pdf-версию абсолютно бесплатно можно здесь
#реклама
Праздники не такие длинные, как кажется. Будет жалко, если они снова пройдут бесполезно, потому что это, очевидно, лучшее время для развития.
В общем, пора поделиться с вами вот этим свежим конспектом. Очень качественная подача материала, емко, интересно и с множеством прекрасных схем и картинок. Внутри:
– Необходимая математика: линал и матанализ на пальцах
– Все про механизм внимания и трансформеры
– Детальное объяснение процесса предобучения (а это редкость)
– RL – с нуля до обучения ризонинг-моделей
– Полноценный гайд по тому, как зафайнтюнить модель
Всего 6 глав и 50 страниц – идеальный объем, чтобы осилить за выходные и понять принцип работы современных моделей. Сохраняйте сейчас и не откадывайте в долгий ящик.
Забрать полную pdf-версию абсолютно бесплатно можно здесь
#реклама
❤58
e/acc
Знакомый из твиттера скопировал полностью продукт компании, которая стоит больше $1 млрд и запустил его за 1/100 стоимости. За ~35 минут агент сделал точную копию продукта. В эпоху Клода и Опуса 4.5 человек почти без технических навыков может сделать продукт…
Пока некоторые тратят время обсуждая чего же ИИ не в состоянии делать, другие люди просто берут и делают. Вот отличный пример.
Первые тратят время на то, чтобы придумать очередную отмазку, другие хватают новые возможности раньше других, создают крутые штуки и зарабатывают много денег :)
Будет ли каждый вайб-продукт успешным и принесет >$10-100k в месяц? Нет, и даже 1% не будет. Но такого плана люди буду делать 10 продуктов месяц, очень быстро экспериментировать и учится, все это с бюджетом в $100 на Клода.
Будет ли каждый ваш запрос в claude code давать гарантированно идеально эффективный код без багов? Нет, но играет ли это роль, если ваш продукт решает важную боль пользователя, а он за это платит?
Победят ли "технари" или "продажники"? Это абсолютно глупая дихотомия. Клод может написать код или спарсить список потенциальных клиентов, он может настроить пайплан деплоя, а может тестировать 20 итераций писем, максимизируя конверсию в платную подписку.
"Слоп" был в мире всегда — не важно, сделанный людьми или LLM. А сегодня мир делится на тех кто действует и тех, кто ждет. Ты маркетолог без опыта программирования? Теперь ты можешь создать технически нетривиальный продукт. Ты программист? Ты можешь настроить систему из десятков агентов на супер персонализированную и качественную поддержку клиентов, которая заставит их отказаться от всех подписок конкурентов.
Проблема не в ИИ, он уже достиг уровня магии и не останавливается. Проблема в агентности и мотивации. Мы увидим десятки тысяч начатых и брошенных проектов, тонны зависти и критики, много эмоций, но победят здесь те, кто молча берут и делают. У них не получается. Они пробуют еще раз. И еще раз. И выигрывают.
Потому что иного способа не существует.
Первые тратят время на то, чтобы придумать очередную отмазку, другие хватают новые возможности раньше других, создают крутые штуки и зарабатывают много денег :)
Будет ли каждый вайб-продукт успешным и принесет >$10-100k в месяц? Нет, и даже 1% не будет. Но такого плана люди буду делать 10 продуктов месяц, очень быстро экспериментировать и учится, все это с бюджетом в $100 на Клода.
Будет ли каждый ваш запрос в claude code давать гарантированно идеально эффективный код без багов? Нет, но играет ли это роль, если ваш продукт решает важную боль пользователя, а он за это платит?
Победят ли "технари" или "продажники"? Это абсолютно глупая дихотомия. Клод может написать код или спарсить список потенциальных клиентов, он может настроить пайплан деплоя, а может тестировать 20 итераций писем, максимизируя конверсию в платную подписку.
"Слоп" был в мире всегда — не важно, сделанный людьми или LLM. А сегодня мир делится на тех кто действует и тех, кто ждет. Ты маркетолог без опыта программирования? Теперь ты можешь создать технически нетривиальный продукт. Ты программист? Ты можешь настроить систему из десятков агентов на супер персонализированную и качественную поддержку клиентов, которая заставит их отказаться от всех подписок конкурентов.
Проблема не в ИИ, он уже достиг уровня магии и не останавливается. Проблема в агентности и мотивации. Мы увидим десятки тысяч начатых и брошенных проектов, тонны зависти и критики, много эмоций, но победят здесь те, кто молча берут и делают. У них не получается. Они пробуют еще раз. И еще раз. И выигрывают.
Потому что иного способа не существует.
23❤199
Середина исчезает
Карри Саринен, CEO Linear, написал пост о том, как исчезает средний слой в софтверной разработке. Его тезис: кодинг-агенты теперь превращают спецификации в рабочий код без ручной имплементации. Средний слой - перевод требований в код - сжимается до нуля. Остаётся только понимание проблемы на входе и управление агентами на выходе.
Адди Османи из Google развил мысль: лучшие инженеры никогда не были кодерами. Они были "торговцами ясности" — людьми, которые понимают проблемы настолько чётко, что код (теперь спецификация для агентов) пишется сам.
Но это касается не только инженеров.
Я вижу похожий паттерн в нетехнических командах. Юристы автоматизируют контракты через агентов. Маркетологи строят воркфлоу для контент-операций. HR создают системы онбординга. Куча примеро в предыдущем посте.
Раньше каждому требовалась команда разработчиков на месяцы. Теперь один человек за выходные делает продукт. Узкое место осталось, но сместилось: критичным стал не кодинг, а оркестрация.
Как координировать 10, 50, 100 агентов? Как управлять состоянием в долгих воркфлоу? Как гарантировать надёжность в продакшене? Как встроить governance и compliance?
Проблема не в моделях. Claude взял 40% enterprise LLM share (рос с 24% в 2023). Модели работают. Проблема в инфраструктуре оркестрации.
Те, кто контролирует оркестрационный слой, контролируют механизм координации для интеллектуальных систем. Как AWS для compute, Stripe для payments.
Для инженеров меняется скилсет. Больше не "как имплементировать", а "как декомпозировать задачу на параллельные подзадачи для агентов", "как спроектировать воркфлоу с failure recovery", "как оценить качество автономных систем".
Для неинженеров открываются возможности. Раньше автоматизация требовала нанимать разработчиков. Теперь можно строить системы самостоятельно.
Linear строит "coordination layer for product work" — воркспейсы, которые снижают неоднозначность для людей И агентов. Карри понял: если твой продукт работает для агентов так же хорошо, как для людей, ты становишься инфраструктурой.
Я ожидаю очень успешные компаний в этом слое оркестрации в этом году. Не "ещё один AI coding agent", а "платформа для оркестрации 100 агентов в регулируемой среде с governance". Не "AI wrapper", а "слой для agent interoperability".
Карри Саринен, CEO Linear, написал пост о том, как исчезает средний слой в софтверной разработке. Его тезис: кодинг-агенты теперь превращают спецификации в рабочий код без ручной имплементации. Средний слой - перевод требований в код - сжимается до нуля. Остаётся только понимание проблемы на входе и управление агентами на выходе.
Адди Османи из Google развил мысль: лучшие инженеры никогда не были кодерами. Они были "торговцами ясности" — людьми, которые понимают проблемы настолько чётко, что код (теперь спецификация для агентов) пишется сам.
Но это касается не только инженеров.
Я вижу похожий паттерн в нетехнических командах. Юристы автоматизируют контракты через агентов. Маркетологи строят воркфлоу для контент-операций. HR создают системы онбординга. Куча примеро в предыдущем посте.
Раньше каждому требовалась команда разработчиков на месяцы. Теперь один человек за выходные делает продукт. Узкое место осталось, но сместилось: критичным стал не кодинг, а оркестрация.
Как координировать 10, 50, 100 агентов? Как управлять состоянием в долгих воркфлоу? Как гарантировать надёжность в продакшене? Как встроить governance и compliance?
Проблема не в моделях. Claude взял 40% enterprise LLM share (рос с 24% в 2023). Модели работают. Проблема в инфраструктуре оркестрации.
Те, кто контролирует оркестрационный слой, контролируют механизм координации для интеллектуальных систем. Как AWS для compute, Stripe для payments.
Для инженеров меняется скилсет. Больше не "как имплементировать", а "как декомпозировать задачу на параллельные подзадачи для агентов", "как спроектировать воркфлоу с failure recovery", "как оценить качество автономных систем".
Для неинженеров открываются возможности. Раньше автоматизация требовала нанимать разработчиков. Теперь можно строить системы самостоятельно.
Linear строит "coordination layer for product work" — воркспейсы, которые снижают неоднозначность для людей И агентов. Карри понял: если твой продукт работает для агентов так же хорошо, как для людей, ты становишься инфраструктурой.
Я ожидаю очень успешные компаний в этом слое оркестрации в этом году. Не "ещё один AI coding agent", а "платформа для оркестрации 100 агентов в регулируемой среде с governance". Не "AI wrapper", а "слой для agent interoperability".
9❤147
За праздники посмотрел 30+ проектов автоматизации на Claude Code. Честно, офигел от масштаба.
Самое интересное — большинство построили нетехнические люди. Юрист из Anthropic Марк Пайк сам собрал систему проверки маркетинговых материалов. Раньше это занимало дни, теперь часы. Маркетолог из Strategic Nerds автоматизировал свои фреймворки позиционирования за выходные.
В корпорациях похожая картина. Thomson Reuters встроил Claude в CoCounsel для проверки контрактов. Matillion добавила AI-ассистента для пайплайнов — создание сократилось с 40 часов до одного.
У персональных проектов другой паттерн. Люди строят себе "life OS" — связка Claude Code + Obsidian + GitHub. Ютубер Kenny Liao использует это для ресёрча контента. AI Maker собрал систему для рассылок. Claudesidian это готовый шаблон для Obsidian с трекингом привычек и дневником. Daniel Miessler выложил целую инфраструктуру PAI для построения персонального ИИ.
Общее между корпоративными и персональными кейсами — один человек теперь может строить системы, которые раньше требовали команды инженеров. Не в смысле "заменяет программистов", а в смысле — порог входа упал радикально.
Скоро большинство офисных функций будут использовать подобные агентские системы. Причём системы будут эволюционировать по мере того, как команды их тюнят под свои задачи.
Самое интересное — большинство построили нетехнические люди. Юрист из Anthropic Марк Пайк сам собрал систему проверки маркетинговых материалов. Раньше это занимало дни, теперь часы. Маркетолог из Strategic Nerds автоматизировал свои фреймворки позиционирования за выходные.
В корпорациях похожая картина. Thomson Reuters встроил Claude в CoCounsel для проверки контрактов. Matillion добавила AI-ассистента для пайплайнов — создание сократилось с 40 часов до одного.
У персональных проектов другой паттерн. Люди строят себе "life OS" — связка Claude Code + Obsidian + GitHub. Ютубер Kenny Liao использует это для ресёрча контента. AI Maker собрал систему для рассылок. Claudesidian это готовый шаблон для Obsidian с трекингом привычек и дневником. Daniel Miessler выложил целую инфраструктуру PAI для построения персонального ИИ.
Общее между корпоративными и персональными кейсами — один человек теперь может строить системы, которые раньше требовали команды инженеров. Не в смысле "заменяет программистов", а в смысле — порог входа упал радикально.
Скоро большинство офисных функций будут использовать подобные агентские системы. Причём системы будут эволюционировать по мере того, как команды их тюнят под свои задачи.
7❤153
23 декабря мы все ушли на праздники как будто ничего и не изменилось
сегодня, мы попали в сингулярность: каждый крутой фаундер, которого я знаю, сидит по 12+ часов с открытыми 4+ параллельными сессиями CC. кто-то вайбкодит, кто-то переделал всю орг структуру, маркетинг, контент, финансы, продажи, семейный бюджет.
я не могу вспомнить ни одного предсказания или прогноза, который обещал бы настолько стремительное изменение всего вообще, как то, каким оно оказалось в реальности
P.S. на скриншоте - Маск о том как люди реагируют на “Claude code moment”
сегодня, мы попали в сингулярность: каждый крутой фаундер, которого я знаю, сидит по 12+ часов с открытыми 4+ параллельными сессиями CC. кто-то вайбкодит, кто-то переделал всю орг структуру, маркетинг, контент, финансы, продажи, семейный бюджет.
я не могу вспомнить ни одного предсказания или прогноза, который обещал бы настолько стремительное изменение всего вообще, как то, каким оно оказалось в реальности
P.S. на скриншоте - Маск о том как люди реагируют на “Claude code moment”
10❤110
Менеджеры в Anthropic теперь тратят 70% времени на проверку AI-кода вместо написания своего. Вся ценность менеджмента - быть мостом между мышлением и действием - автоматизируется.
Gartner прогнозирует, что к 2026 году 20% компаний вырежут половину менеджеров среднего звена. McKinsey ожидает 50-100 агентов на одного человека в зрелых внедрениях.
AI работает. Но 95% компаний не получают возврат на инвестиции от AI внедрений. Почему?
Проблема организационная. Компании прикручивают AI к сломанным процессам вместо того, чтобы переделать как работа делается.
Компании, которые правильно это делают, переходят от функциональных иерархий к сетям, ориентированным на результат.
Традиционный customer success: VP наверху, директор Sales Ops управляет L1/L2/L3 поддержкой, директор Customer Success управляет CSM и онбордингом. Куча людей делают кучу координации.
Agentic-компании делают иначе. Customer resolution в центре. Триаж-агенты анализируют запросы, knowledge-агенты синтезируют документацию, routing-агенты решают эскалации, follow-up агенты отслеживают удовлетворенность, люди-специалисты обрабатывают реально сложные сценарии.
Механизм координации сдвигается от управленческой иерархии к сети агентов.
McKinsey идентифицировал три новых архетипа менеджмента.
M-shaped Supervisor: широкий дженералист, оркеструющий агентов через несколько доменов. Системный мыслитель с высокой AI-грамотностью. Управляет результатами, не людьми.
T-shaped Expert: глубокий специалист, обрабатывающий эскалированные исключения, кейсы которые агенты не могут решить. Нюансированное суждение. Умение коучить.
AI-Augmented Frontline: работник, использующий агентов для рутинных задач, фокусируясь на высокоценной человеческой работе. Знает промт-инжиниринг. Имеет эмпатию.
Заметьте чего не хватает. Классического среднего менеджера, чья работа была получать инфу снизу, синтезировать, передавать вверх. Эта функция брокеринга информации становится избыточной когда агенты собирают, синтезируют и действуют со скоростью машины.
Обычный span of control в менеджменте - 12-15 прямых подчиненных. Число Данбара, биологический лимит человеческой координационной емкости.
Некоторый известный мне стартап оперирует с 5 людьми, надзирающими 60 постоянно работающих агентов. McKinsey проектирует 50-100 агентов на человека в зрелых внедрениях.
Проблема в том, что больше автономии создает больше сложности, не меньше.
Агенты принимают решения в миллисекундах. Люди обрабатывают в минутах или часах. На скорости машин координационные вызовы множатся. Традиционные оргструктуры никогда не сталкивались с этим несовпадением временных масштабов.
Появляющееся решение - иерархические агентские устройства где супер-агенты оркеструют кластеры специализированных агентов, с людьми предоставляющими надзор на более высоких уровнях. Это реально новая организационная конструкция, что-то между софтверной архитектурой и оргдизайном.
У нас нет хорошего языка для этого пока. Это обычно признак чего-то важного.
Это матчится с тем что Karri Saarinen описывает: обращаться с агентами как с распределенными удаленными работниками, не магическими черными ящиками. Четкое владение, async координация, оценка на основе результатов.
Этот сдвиг создает массивную возможность для фаундеров. Рынок оркестрации агентов растет до ~$10B в 2026. Больший play - организационная инфраструктура: платформы governance, протоколы agent-to-agent, HR-слой для нечеловеческих работников, управление идентичностью, атрибуция затрат, отслеживание перформанса. Deloitte называет это FinOps для агентов.
Этот паттерн повторяется через каждый крупный технологический переход:
- индустриальная революция создала фабричную иерархию
- компьютерная революция создала матричную организацию
- агентская революция создает что-то новое, Сетевую организацию.
Те, кто относятся к этому как к развертыванию софта, провалятся. Это ближе к оргдизайну и теории менеджмента чем к чистому софту.
Победители будут те, кто могут вообразить как работа выглядит когда исполнение становится дешевым и координация становится всем.
Gartner прогнозирует, что к 2026 году 20% компаний вырежут половину менеджеров среднего звена. McKinsey ожидает 50-100 агентов на одного человека в зрелых внедрениях.
AI работает. Но 95% компаний не получают возврат на инвестиции от AI внедрений. Почему?
Проблема организационная. Компании прикручивают AI к сломанным процессам вместо того, чтобы переделать как работа делается.
Компании, которые правильно это делают, переходят от функциональных иерархий к сетям, ориентированным на результат.
Традиционный customer success: VP наверху, директор Sales Ops управляет L1/L2/L3 поддержкой, директор Customer Success управляет CSM и онбордингом. Куча людей делают кучу координации.
Agentic-компании делают иначе. Customer resolution в центре. Триаж-агенты анализируют запросы, knowledge-агенты синтезируют документацию, routing-агенты решают эскалации, follow-up агенты отслеживают удовлетворенность, люди-специалисты обрабатывают реально сложные сценарии.
Механизм координации сдвигается от управленческой иерархии к сети агентов.
McKinsey идентифицировал три новых архетипа менеджмента.
M-shaped Supervisor: широкий дженералист, оркеструющий агентов через несколько доменов. Системный мыслитель с высокой AI-грамотностью. Управляет результатами, не людьми.
T-shaped Expert: глубокий специалист, обрабатывающий эскалированные исключения, кейсы которые агенты не могут решить. Нюансированное суждение. Умение коучить.
AI-Augmented Frontline: работник, использующий агентов для рутинных задач, фокусируясь на высокоценной человеческой работе. Знает промт-инжиниринг. Имеет эмпатию.
Заметьте чего не хватает. Классического среднего менеджера, чья работа была получать инфу снизу, синтезировать, передавать вверх. Эта функция брокеринга информации становится избыточной когда агенты собирают, синтезируют и действуют со скоростью машины.
Обычный span of control в менеджменте - 12-15 прямых подчиненных. Число Данбара, биологический лимит человеческой координационной емкости.
Некоторый известный мне стартап оперирует с 5 людьми, надзирающими 60 постоянно работающих агентов. McKinsey проектирует 50-100 агентов на человека в зрелых внедрениях.
Проблема в том, что больше автономии создает больше сложности, не меньше.
Агенты принимают решения в миллисекундах. Люди обрабатывают в минутах или часах. На скорости машин координационные вызовы множатся. Традиционные оргструктуры никогда не сталкивались с этим несовпадением временных масштабов.
Появляющееся решение - иерархические агентские устройства где супер-агенты оркеструют кластеры специализированных агентов, с людьми предоставляющими надзор на более высоких уровнях. Это реально новая организационная конструкция, что-то между софтверной архитектурой и оргдизайном.
У нас нет хорошего языка для этого пока. Это обычно признак чего-то важного.
Это матчится с тем что Karri Saarinen описывает: обращаться с агентами как с распределенными удаленными работниками, не магическими черными ящиками. Четкое владение, async координация, оценка на основе результатов.
Этот сдвиг создает массивную возможность для фаундеров. Рынок оркестрации агентов растет до ~$10B в 2026. Больший play - организационная инфраструктура: платформы governance, протоколы agent-to-agent, HR-слой для нечеловеческих работников, управление идентичностью, атрибуция затрат, отслеживание перформанса. Deloitte называет это FinOps для агентов.
Этот паттерн повторяется через каждый крупный технологический переход:
- индустриальная революция создала фабричную иерархию
- компьютерная революция создала матричную организацию
- агентская революция создает что-то новое, Сетевую организацию.
Те, кто относятся к этому как к развертыванию софта, провалятся. Это ближе к оргдизайну и теории менеджмента чем к чистому софту.
Победители будут те, кто могут вообразить как работа выглядит когда исполнение становится дешевым и координация становится всем.
29❤142
три года я горю идеей автоматизировать всю свою работу с помощью ИИ, и вот сейчас я могу сказать что я близок как никогда
последние 1,5 года я использовал cybos - персональную операционную системы для жизни и работы - на основе курсора. а примерно месяц назад я начал с нуля строить третью версию, теперь полностью на основе claude code. и это поражает воображение!
требования к системе у меня простые:
- она имеет доступ ко всем цифровым инструментам, что и я: от смс и почты до рабочих CRM и генераторов ИИ-видео
- она знает ВСЁ обо мне, моей работе, всех людях с которыми я взаимодействую, моих целях, чаяниях и предпочтениях
- могу взаимодействовать голосом, текстом, с телефона
- качество выполнения работы не хуже, чем я бы делал сам, либо я могу делать ревью и это делает задачи как минимум 10х быстрее
что система умеет сейчас? сама читает и отвечает на любые сообщения (почта/тг), делает рисерч компаний для инвестиций, пишет memo и отчеты, генерирует картинки в моем стиле, управляет моей gtd-системой. у нее есть доступ к полным записям всех моих звонков, всех чатиков, даже философии и персональным целям на 5-10 лет.
например, для рисерча людей / рынков / компаний / тем, используется оркестратор из MCP и тулзов (perplexity, parallel, webfetch, exa, firecrawl) с уровнями глубины анализа (самый глубокий рисерч работает как минимум 60 минут и создает небольшую книжку)
давайте покажу конкретный пример, который добавил сегодня утром. у меня есть GTD система, по сути просто файлик где списком лежат задачи по работе.
теперь, я открываю клод и пишу (или говорю) /gtd, после этого клод:
- проходит по списку и запускает суб-агентов на каждую задачу
- готовит план выполнения по каждой задаче (я корректирую если нужно)
- по каждому типу задач использует заранее созданный workflow (например, у меня есть детальные инструкции как делать интро, как готовиться к подкастам и интервью, как планировать поездки, как отправлять cold emails фаундерам)
- клод имеет доступ к глобальному индексу всех звонков, сообщений, компаний, контактов чтобы иметь максимальный контекст по выполнению
- после выполнения он сохраняет логи,
- и самоулучшается раз в день: смотрит все корректировки, которые я внес руками и добавляет их в инструкции
на скриншоте две реальные задачи: в одной нужно было погуглить контакты и составить письмо в моем стиле, во второй глубокий рисерч и подготовить список вопросов для подкаста. агенты работали параллельно. как видите на втором скрине, каждая задача занимает от 15 до 30 tool calls и ~100k токенов в среднем, имеет внутренний луп перепровеки результата, но в итоге экономит >24 часа в сутки — это как нанять 5 клонов себя :) а скоро нас будет не 5, а 5,000!
следующий этап — раскатать то же самое на всю компанию, чтобы мы все могли работать над общим контекстом и клоны были не только у меня, но и у ребят, которые реально круты! а если пост наберет 20к посмотров, запишу подробное демо на ютубе как все работает.
последние 1,5 года я использовал cybos - персональную операционную системы для жизни и работы - на основе курсора. а примерно месяц назад я начал с нуля строить третью версию, теперь полностью на основе claude code. и это поражает воображение!
требования к системе у меня простые:
- она имеет доступ ко всем цифровым инструментам, что и я: от смс и почты до рабочих CRM и генераторов ИИ-видео
- она знает ВСЁ обо мне, моей работе, всех людях с которыми я взаимодействую, моих целях, чаяниях и предпочтениях
- могу взаимодействовать голосом, текстом, с телефона
- качество выполнения работы не хуже, чем я бы делал сам, либо я могу делать ревью и это делает задачи как минимум 10х быстрее
что система умеет сейчас? сама читает и отвечает на любые сообщения (почта/тг), делает рисерч компаний для инвестиций, пишет memo и отчеты, генерирует картинки в моем стиле, управляет моей gtd-системой. у нее есть доступ к полным записям всех моих звонков, всех чатиков, даже философии и персональным целям на 5-10 лет.
например, для рисерча людей / рынков / компаний / тем, используется оркестратор из MCP и тулзов (perplexity, parallel, webfetch, exa, firecrawl) с уровнями глубины анализа (самый глубокий рисерч работает как минимум 60 минут и создает небольшую книжку)
давайте покажу конкретный пример, который добавил сегодня утром. у меня есть GTD система, по сути просто файлик где списком лежат задачи по работе.
теперь, я открываю клод и пишу (или говорю) /gtd, после этого клод:
- проходит по списку и запускает суб-агентов на каждую задачу
- готовит план выполнения по каждой задаче (я корректирую если нужно)
- по каждому типу задач использует заранее созданный workflow (например, у меня есть детальные инструкции как делать интро, как готовиться к подкастам и интервью, как планировать поездки, как отправлять cold emails фаундерам)
- клод имеет доступ к глобальному индексу всех звонков, сообщений, компаний, контактов чтобы иметь максимальный контекст по выполнению
- после выполнения он сохраняет логи,
- и самоулучшается раз в день: смотрит все корректировки, которые я внес руками и добавляет их в инструкции
на скриншоте две реальные задачи: в одной нужно было погуглить контакты и составить письмо в моем стиле, во второй глубокий рисерч и подготовить список вопросов для подкаста. агенты работали параллельно. как видите на втором скрине, каждая задача занимает от 15 до 30 tool calls и ~100k токенов в среднем, имеет внутренний луп перепровеки результата, но в итоге экономит >24 часа в сутки — это как нанять 5 клонов себя :) а скоро нас будет не 5, а 5,000!
следующий этап — раскатать то же самое на всю компанию, чтобы мы все могли работать над общим контекстом и клоны были не только у меня, но и у ребят, которые реально круты! а если пост наберет 20к посмотров, запишу подробное демо на ютубе как все работает.
99❤690
e/acc
три года я горю идеей автоматизировать всю свою работу с помощью ИИ, и вот сейчас я могу сказать что я близок как никогда последние 1,5 года я использовал cybos - персональную операционную системы для жизни и работы - на основе курсора. а примерно месяц назад…
вчера вечером допилил фичу автоматизации телеграма (с индексированием всех чатов и тем, связкой между чатом и записью звонков, групп с участниками групп и прочие мелочи). думаю, надо сделать скрин и рассказать.
а пока я спал, Антропик выкатил новую десктопную (в дополнение к мобильной) версию CC. так что теперь вы можете даже без терминала запустить свой собственный cybos.
из бонусов: благодаря worktree можно собрать систему для командной работы, а Антропик из коробки дает контейнеры. то есть, всё это может работать уже сегодня не только для вас, но и для целой компании.
из не-смешных анекдотов: как идеально нанять сотрудникас помощью ИИ? берете клод, пихаете в него все документы и отчеты компании, просите определить самые узкие места, просите написать описание вакансии, а потом просите сделать эту работу.
а пока я спал, Антропик выкатил новую десктопную (в дополнение к мобильной) версию CC. так что теперь вы можете даже без терминала запустить свой собственный cybos.
из бонусов: благодаря worktree можно собрать систему для командной работы, а Антропик из коробки дает контейнеры. то есть, всё это может работать уже сегодня не только для вас, но и для целой компании.
из не-смешных анекдотов: как идеально нанять сотрудникас помощью ИИ? берете клод, пихаете в него все документы и отчеты компании, просите определить самые узкие места, просите написать описание вакансии, а потом просите сделать эту работу.
3❤152
2❤20
e/acc
три года я горю идеей автоматизировать всю свою работу с помощью ИИ, и вот сейчас я могу сказать что я близок как никогда последние 1,5 года я использовал cybos - персональную операционную системы для жизни и работы - на основе курсора. а примерно месяц назад…
часто в работе я замечаю что я залип. скролю твиттер, не могу и не хочу делать важные вещи.
как правило, причина этому — игнорирование собственных эмоций, отсутствие эмоциональной ясности, усталость.
поскольку я не вижу чтобы моя работа была вне cybos, я сделал себе простую команду "unstuck" (раззастрянь)
она открывает красивое окошко прям в том же терминале, где я работаю и просит выбрать эмоцию, которая требует внимания. дальше, если это помогло (это методология IFS+Joe Hudson+телесная осознаннность, если кому-то эти слова что-то говорят),
то программка предлагает выбрать одну из ~10 больших целей, которые у меня стоят на годы вперед и найти кусочек работы, который я смогу сделать за следующие 5 минут.
или пойти отдохнуть.
последним шагом она просит меня сказать 2-3 слова рефлексии — что помогло, а что осталось, чтобы записать в лог и затем самоулучшаться.
как правило, причина этому — игнорирование собственных эмоций, отсутствие эмоциональной ясности, усталость.
поскольку я не вижу чтобы моя работа была вне cybos, я сделал себе простую команду "unstuck" (раззастрянь)
она открывает красивое окошко прям в том же терминале, где я работаю и просит выбрать эмоцию, которая требует внимания. дальше, если это помогло (это методология IFS+Joe Hudson+телесная осознаннность, если кому-то эти слова что-то говорят),
то программка предлагает выбрать одну из ~10 больших целей, которые у меня стоят на годы вперед и найти кусочек работы, который я смогу сделать за следующие 5 минут.
или пойти отдохнуть.
последним шагом она просит меня сказать 2-3 слова рефлексии — что помогло, а что осталось, чтобы записать в лог и затем самоулучшаться.
8❤272
e/acc
три года я горю идеей автоматизировать всю свою работу с помощью ИИ, и вот сейчас я могу сказать что я близок как никогда последние 1,5 года я использовал cybos - персональную операционную системы для жизни и работы - на основе курсора. а примерно месяц назад…
cybos с кофе
теперь каждое утро в 7 утра по скрипту у меня запускается сборщик ежедневного брифа. он читает список дел, все новые сообщения и события в календаре и смотрит дедлайны по задачам и проектам.
после этого собирает красивую веб страничку, так чтобы заварив кофе, этот бриф был бы первым что я увидел за компьютером.
задача брифа это не просто апдейт по новостям и задачам, а приоритизация самого важного, работы с максимальным leverage'ом — что мне нужно делать сейчас, что даст самый большой эффект в будущем?
из неочевидных плюшек, около каждой задачи есть описание причины и риска (зачем и почему) и кнопка, которая в бекграунде запустит агента для подготовки первого шага этой задачи. например, завтра я выступаю на конференции и эта кнопка сделает рисерч по теме и предложит темы, которые стоит упомянуть.
теперь каждое утро в 7 утра по скрипту у меня запускается сборщик ежедневного брифа. он читает список дел, все новые сообщения и события в календаре и смотрит дедлайны по задачам и проектам.
после этого собирает красивую веб страничку, так чтобы заварив кофе, этот бриф был бы первым что я увидел за компьютером.
задача брифа это не просто апдейт по новостям и задачам, а приоритизация самого важного, работы с максимальным leverage'ом — что мне нужно делать сейчас, что даст самый большой эффект в будущем?
из неочевидных плюшек, около каждой задачи есть описание причины и риска (зачем и почему) и кнопка, которая в бекграунде запустит агента для подготовки первого шага этой задачи. например, завтра я выступаю на конференции и эта кнопка сделает рисерч по теме и предложит темы, которые стоит упомянуть.
11❤223
хочется поделиться некоторыми фактами, которые стали очевидны за последние три недели примерно всему интернету
1. эра слоп-кода закончилась. да, если руки из ягодиц, то вы все равно будете производить слоп, но это больше не ограничения системы, а только лень/глупость пользователя.
2. любой человек может сегодня создать любой софт, нужно только желание и фокус. вопрос "зачем?" и вопрос мотивации/агентности это делать и доводить до конца LLM не снимают.
3. лучшие организации (на скриншоте СЕО Shopify) получат 100х преимущество от AI-native процессов, худшие — не получат никакого и останутся за гранью релевантности
4. (my bet) то, что сегодня происходит с кодом, в течении года будет происходить со всеми областями knowledge work: продажи, юристы, финансы, контент, логистика, управление, наука, what have you
5. каждый человек теперь является корпорацией, в которой вы - босс, а на вас работают десятки агентов. вашей задачей становится теперь миссия, стратегия, структура управления, постановка задач в этой корпорации
6. каждая компания теперь не просто коллектив людей, но кибернетическая организация, в которой на каждого человека приходятся десятки агентов. структура менеджмента меняется. организационный дизайн перестраивается. это куда важнее (и больнее, дороже), чем классическая «ИТ-трансформация» и «внедрения»
7. навык выстраивать собственную агентскую систему для жизни и бизнеса становится одним из важнейших, а важнейшим — по-прежнему агентность. особенно сейчас, когда возможностей в мире больше, чем когда-либо. но и времени заработать денег тоже всё меньше :)
8. софт постепенно (от простого к все более сложному) перестает быть чем-то уникальным, маржа падает. если клиенту не хочется платить $50 в мес, то он может сделать себе похожий продукт и использовать по себестоимости
9. любая железка — это информационный поток. любой робот — это софт. в конечном счете, это не про то чтобы двинуть атомы из точки а в б, а про процесс: нанять людей, прочитать их резюме, провести интервью, собрать инструкции, заказать оборудование, заполнить таможенные декларации, найти поставщика, купить метериалы, заказать доставку, запустить машины, построить процесс, произвести детали, собрать робота, договориться с ритейлером, продать робота, посчитать налоги.
1. эра слоп-кода закончилась. да, если руки из ягодиц, то вы все равно будете производить слоп, но это больше не ограничения системы, а только лень/глупость пользователя.
2. любой человек может сегодня создать любой софт, нужно только желание и фокус. вопрос "зачем?" и вопрос мотивации/агентности это делать и доводить до конца LLM не снимают.
3. лучшие организации (на скриншоте СЕО Shopify) получат 100х преимущество от AI-native процессов, худшие — не получат никакого и останутся за гранью релевантности
4. (my bet) то, что сегодня происходит с кодом, в течении года будет происходить со всеми областями knowledge work: продажи, юристы, финансы, контент, логистика, управление, наука, what have you
5. каждый человек теперь является корпорацией, в которой вы - босс, а на вас работают десятки агентов. вашей задачей становится теперь миссия, стратегия, структура управления, постановка задач в этой корпорации
6. каждая компания теперь не просто коллектив людей, но кибернетическая организация, в которой на каждого человека приходятся десятки агентов. структура менеджмента меняется. организационный дизайн перестраивается. это куда важнее (и больнее, дороже), чем классическая «ИТ-трансформация» и «внедрения»
7. навык выстраивать собственную агентскую систему для жизни и бизнеса становится одним из важнейших, а важнейшим — по-прежнему агентность. особенно сейчас, когда возможностей в мире больше, чем когда-либо. но и времени заработать денег тоже всё меньше :)
8. софт постепенно (от простого к все более сложному) перестает быть чем-то уникальным, маржа падает. если клиенту не хочется платить $50 в мес, то он может сделать себе похожий продукт и использовать по себестоимости
9. любая железка — это информационный поток. любой робот — это софт. в конечном счете, это не про то чтобы двинуть атомы из точки а в б, а про процесс: нанять людей, прочитать их резюме, провести интервью, собрать инструкции, заказать оборудование, заполнить таможенные декларации, найти поставщика, купить метериалы, заказать доставку, запустить машины, построить процесс, произвести детали, собрать робота, договориться с ритейлером, продать робота, посчитать налоги.
50❤170
Две стратегии имеют наибольший смысл в век ИИ:
1. Быть глубже всех в одной теме. Например, делать невероятно крутой ручной продакшен с нерационально высоким вниманием к деталям. Пока ИИ генерирует миллионы единиц контента, ты делаешь одну вещь, но так, что люди останавливаются.
2. Быть шире всех. Запустить фабрику, которая каждый месяц создаёт 10,000 YouTube-каналов. ИИ придумывает контент, снимает, раскручивает. В конце месяца убиваешь всё, кроме 100 самых популярных. Повторяешь.
Обе стратегии будут работать, если их исполнить хорошо. Что не будет работать вообще — это делать "так себе", "средненько", "и так сойдет", "пипл схавает". Потому что зачем пиплам вы, если есть GPT?
Наступает эра полиматов-виртуозов и масштабных автоматизаторов. Artisans (ремесленников) и промышленников.
А исполнителям, кто про "вы скажите что делать, а я сделаю" придется тяжело.
1. Быть глубже всех в одной теме. Например, делать невероятно крутой ручной продакшен с нерационально высоким вниманием к деталям. Пока ИИ генерирует миллионы единиц контента, ты делаешь одну вещь, но так, что люди останавливаются.
2. Быть шире всех. Запустить фабрику, которая каждый месяц создаёт 10,000 YouTube-каналов. ИИ придумывает контент, снимает, раскручивает. В конце месяца убиваешь всё, кроме 100 самых популярных. Повторяешь.
Обе стратегии будут работать, если их исполнить хорошо. Что не будет работать вообще — это делать "так себе", "средненько", "и так сойдет", "пипл схавает". Потому что зачем пиплам вы, если есть GPT?
Наступает эра полиматов-виртуозов и масштабных автоматизаторов. Artisans (ремесленников) и промышленников.
А исполнителям, кто про "вы скажите что делать, а я сделаю" придется тяжело.
6❤181
Media is too big
VIEW IN TELEGRAM
Маск говорит: не ходите учиться в мед.
Через 3 года (2029), утверждает без-пяти-минут-триллионер, роботов Оптимусов, которые умеют делать сверхточную хирургию будет больше, чем всех хирургов на планете сегодня. И каждый из них превзойдет лучших из врачей. Только его обучение будет занимать не 15 лет, а 15 секунд копирования модельки. Поэтому медицинское образование — это теперь только разве что для души.
Запасаемся попкорном и наблюдаем за сектой «ИИ никогда не сможет понять что нарисовано на картинке» и «чат-боты никогда не станут говорить так же как человек».
Через 3 года (2029), утверждает без-пяти-минут-триллионер, роботов Оптимусов, которые умеют делать сверхточную хирургию будет больше, чем всех хирургов на планете сегодня. И каждый из них превзойдет лучших из врачей. Только его обучение будет занимать не 15 лет, а 15 секунд копирования модельки. Поэтому медицинское образование — это теперь только разве что для души.
Запасаемся попкорном и наблюдаем за сектой «ИИ никогда не сможет понять что нарисовано на картинке» и «чат-боты никогда не станут говорить так же как человек».
4❤164
e/acc
cybos с кофе теперь каждое утро в 7 утра по скрипту у меня запускается сборщик ежедневного брифа. он читает список дел, все новые сообщения и события в календаре и смотрит дедлайны по задачам и проектам. после этого собирает красивую веб страничку, так чтобы…
самая амбициозная фича для cybos — граф контекста.
если вы строите систему ИИ-автоматизации для себя и своего бизнеса, то одной из главных проблем для вас очень быстро станет задача формирования актуального, мультимодального, темпорального контекста для ИИ агента.
он может прочитать ваш телеграм или почту и написать ответ, но этот ответ не будет включать факты, мнения, решения, ожидания и отношения с человеком, сделкой, проектом, которые сформировались на протяжении многих коммуникаций и действий по многим каналам. что-то вы обсуждали лично, что-то на звонке, что-то становится очевидно из календаря или заметки в "to do". для какой-то информации нужно открыть банк и посмотреть остаток на счете, для другой график отпусков коллеги в ноушене.
граф контекста — который не является никаким графом — решает эту задачу. сразу скажу это какой-то готовый и понятный интрумент. вы не можете его "скачать" и сегодня даже нет толком внятной архитектуры за пределами, может, самых банальных кейсов. но при этом это является самой важной задачей, если вы хотите чтобы агент реально мог принимать важные решения и вести коммуникацию без постоянной перепроверки.
это будет длинный проект, но начну рассказывать что я сделал на текущий момент:
автоматический индексер и экстратор сущностей — людей, компаний, обещаний, метрик, решений, планов. он запускается автоматически при добавлении любого нового документа (плюс, каждые 24 часа для реиндекса изменений) и смотрит на все данные в cybos.
каждый актор записывается в базу, при этом происходит дедубликация (Митя = Дима = Dmitry Ivanov).
каждая item (задача, обещание, метрика) имеет связь с одним из актором, ссылку на оригинальный документ (файл со звонком, письмо, и тд) и прямую цитату откуда она взята.
вся информация, кроме акторов, имеет дефолтный период полураспада в год, то есть темпорально данные устаревают и, например, если я год не общался с человеком, а в базе указано что метрика его стартапа это $1M ARR, то уровень доверия этой метрике сильно ниже.
наконец, эти данные подгружаются динамически в контекст в зависимости от задачи. преимущества у подхода два: (1) вместо тысяч токенов в контекст нужно загрузить только несколько строчек (3k -> 50 токенов в среднем) и (2) вместо 3000-4000ms на обработку каждого запроса типа "найди что я обещал в этом звонке" это занимает 5-10ms.
если вы строите систему ИИ-автоматизации для себя и своего бизнеса, то одной из главных проблем для вас очень быстро станет задача формирования актуального, мультимодального, темпорального контекста для ИИ агента.
он может прочитать ваш телеграм или почту и написать ответ, но этот ответ не будет включать факты, мнения, решения, ожидания и отношения с человеком, сделкой, проектом, которые сформировались на протяжении многих коммуникаций и действий по многим каналам. что-то вы обсуждали лично, что-то на звонке, что-то становится очевидно из календаря или заметки в "to do". для какой-то информации нужно открыть банк и посмотреть остаток на счете, для другой график отпусков коллеги в ноушене.
граф контекста — который не является никаким графом — решает эту задачу. сразу скажу это какой-то готовый и понятный интрумент. вы не можете его "скачать" и сегодня даже нет толком внятной архитектуры за пределами, может, самых банальных кейсов. но при этом это является самой важной задачей, если вы хотите чтобы агент реально мог принимать важные решения и вести коммуникацию без постоянной перепроверки.
это будет длинный проект, но начну рассказывать что я сделал на текущий момент:
автоматический индексер и экстратор сущностей — людей, компаний, обещаний, метрик, решений, планов. он запускается автоматически при добавлении любого нового документа (плюс, каждые 24 часа для реиндекса изменений) и смотрит на все данные в cybos.
каждый актор записывается в базу, при этом происходит дедубликация (Митя = Дима = Dmitry Ivanov).
каждая item (задача, обещание, метрика) имеет связь с одним из актором, ссылку на оригинальный документ (файл со звонком, письмо, и тд) и прямую цитату откуда она взята.
вся информация, кроме акторов, имеет дефолтный период полураспада в год, то есть темпорально данные устаревают и, например, если я год не общался с человеком, а в базе указано что метрика его стартапа это $1M ARR, то уровень доверия этой метрике сильно ниже.
наконец, эти данные подгружаются динамически в контекст в зависимости от задачи. преимущества у подхода два: (1) вместо тысяч токенов в контекст нужно загрузить только несколько строчек (3k -> 50 токенов в среднем) и (2) вместо 3000-4000ms на обработку каждого запроса типа "найди что я обещал в этом звонке" это занимает 5-10ms.
22❤144