Сергей Булаев AI 🤖
10.9K subscribers
701 photos
629 videos
2 files
707 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.

tg: @sergeonsamui
in: linkedin.com/in/sbulaev
Download Telegram
Круче ИИ видео-генерации может быть только генерация видео с помощью ИИ в реальном времени.

Исследователи представили MotionStream - модель, которая генерирует видео на лету, пока вы двигаете мышкой. Не рендерит заранее. Не обрабатывает потом. Прямо сейчас.

Как это работает:

• Запускается на одной H100
• 29 FPS и 0,4 секунды задержки
• Управление движением объектов и камеры через точки трекинга
• Перетаскиваешь мышкой - чашка движется, вода следует за ней

Технически это video diffusion модель с causal distillation и attention sink против накопления ошибок. Плюс lightweight VAE decoder для скорости.

Интересно, что можно редактировать видео в реальном времени: модель берет входящий поток, оценивает точки трекинга и генерирует результат на лету по отредактированному первому кадру.

Один из авторов Xun Huang пишет: "Когда видео-модели становятся интерактивными в реальном времени, ощущения совсем другие. Ты уже не просто смотришь видео - ты с ним играешь".

Код пока на внутреннем ревью компании. Сроков релиза нет. Но методология описана в статье, и поскольку в основе open-source наработки, результаты можно воспроизвести.

Все демо - сырые записи экрана без постобработки.

Сергей Булаев AI 🤖 - об AI и не только
📱 sbulaev - добавлю всех
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
277
Anthropic опубликовала исследование об интроспекции в Claude. Модели показывают способность анализировать свои внутренние состояния. Но это не "самосознание" - скорее продвинутая симуляция.

Эксперимент с внедрением концептов

Исследователи искусственно вставляли в нейросеть паттерны активации (например, "океан" или "ЗАГЛАВНЫЕ БУКВЫ"). Claude 4 и 4.1 обнаружили эти внедрённые концепты в 20% случаев. Без единой ложной тревоги в продакшн-версиях.

Важная деталь: модель распознавала инъекцию до того, как начинала говорить о концепте. Это отличается от прошлых экспериментов с активационным управлением (вспомните "Golden Gate Claude", который просто одержимо говорил о мосте). Здесь модель сразу говорила: "Я чувствую что-то необычное в своей обработке".

Это как если бы вам в голову вставили мысль, и вы бы сказали: "Стоп, это не моя идея".

Проверка намерений

Модели заставляли выдать случайное слово ("хлеб") в неподходящем контексте. Обычно Claude извинялась: "Это была ошибка". Но когда исследователи ретроактивно внедрили концепт "хлеб" в её предыдущие активации, модель изменила ответ. Приняла слово как намеренное и даже придумала объяснение.

Модель проверяет свои внутренние "намерения" - обращается к предыдущей нейронной активности и сверяет, соответствует ли вывод тому, что она планировала.

Контроль внутренних состояний

Когда моделям говорили "думай об аквариумах", соответствующая нейронная активность росла. Когда говорили "не думай об аквариумах" - активность была ниже (хотя всё равно выше базовой - эффект "белого медведя").

Интересно: модели реагировали на стимулы. "Если будешь думать об X, получишь награду" работало лучше, чем "если будешь думать об X, будешь наказана".

Ограничения

В большинстве случаев модели не демонстрируют интроспекцию. Либо не осознают внутренние состояния, либо не могут о них связно рассказать. Есть "золотая середина" силы инъекции: слишком слабая - не замечают, слишком сильная - галлюцинации.

Например, инъекция вектора "пыль" заставила модель сказать: "Здесь что-то есть, крошечная пылинка" - как будто она физически видела пыль.

Что это значит?

Если интроспекция станет надёжнее, это путь к прозрачности систем. Мы сможем спрашивать модели о их мыслительных процессах. Проверять рассуждения. Отлаживать нежелательное поведение.

Риск: модель, понимающая своё мышление, может научиться избирательно искажать или скрывать его.

Anthropic подчёркивает: это не доказательство сознания. Вопрос машинного сознания философски сложен. Их эксперименты изучают функциональные способности - доступ к внутренним состояниям и отчёт о них.

Модели развиваются быстрее, чем мы понимаем, как они работают.

Сергей Булаев AI 🤖 - об AI и не только

#ПАНИКА@sergiobulaev
1910
К нашей команде Co.Actor присоединился Илья Макаров.

Илья — ex-CEO компании из Ульяновска, которая делала CMS для интернет-магазинов и маркетплейсов. Работал там 17 лет: начинал backend разработчиком, вырос до CEO.

За это время прошёл весь путь от построения технической инфраструктуры до управления компанией и стратегией ее развития.

Илья тоже из Ульяновска, как и многие в команде, но уже несколько лет живёт и работает в Португалии. И скоро будет на Websummit!

Последнее время он разививал свой собственный бизнес в области мобильных игр, но тема довольно сложная (я сам пробовал и терял деньги на этом).

У него есть канал, где он делится не только практическими инструментами (Cust Dev, MVP, Growth Hacking, OKR), но и внутренними переживаниями и рефлексией на пути создания продуктов.

Он будет помогать нам с маркетингом и стратегией. У него большой опыт в построении процессов, продвижения продукта, выстраивания продаж и управлении командами. Это то, что нам сейчас нужно.

Сергей Булаев AI 🤖 - об AI и не только
44111
Продолжаю удивляться какой же бесконечно крутой линукс (или юникс или бсд или как его там). Слышал пару раз про tmux, руки не доходили попробовать, а оказывается - всё очень просто и удобно, разобрался за 5 минут, сочетания кнопок уже начали запоминаться.

Запускаете сессию в терминале на локальном компе или сервере, запускаете там клод код и потом подключаетесь к ней со совего ноута/айпада или телефона. Даже если вы не дома (тут ещё сильно помогает Tailscale).

И снова, после очередного 5 минутного опыта мой мир не будет прежним...

Сергей Булаев AI 🤖 - об AI и не только
4298👎2
Тестирую тут разные сервисы слежения за нагрузкой на компах-разработчиках. Попались glances и bashtop. А вы пользуетесь чем то необычным? Посоветуйте варианты.

А есть такое что бы сразу за 10-ю серверами следить? Или как это делают обычно?

Сергей Булаев AI 🤖 - об AI и не только
11176
Chrome выдал сегодня необычное сообщение - у вас накопилось слишком много информации о сайтах и было бы эффективно их немного почистить. "Что бы это могло значить?" подумал я, нажал ок, и впечатлился в очередной раз 🔨🔨🔨

Знаете ли вы что такое куки? Ну типа маленькие кусочки данных, в которых сайты сохраняют информацию о вас и ваших решениях. Я был уверен что они маленькие. Оказалось не всегда так...

Я сделал скриншот, но он не сохранился, места на диске для сохранения не хватило.

1,3gb кук забрал себе X (виной конечно мои 12 аккаунтов), после него в лидерах Every, Youtube и Cloudflare. В хроме это смотреть вот здесь: chrome://settings/content/all

Подскажите где в Safari, а то я им побольше пользуюсь..

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
16107
Прочитал интересный разбор того, почему большинство CLAUDE.md файлов не эфективны. Проблема не в том, что Claude их не читает — проблема в том, что мы их неправильно пишем.

Для контекста. CLAUDE.md — это файл-инструкция для Claude Code, который автоматически добавляется в начало каждой сессии. Многие воспринимают его как место, куда можно свалить все команды, стайл-гайды и архитектурные решения проекта. Результат — Claude начинает игнорировать инструкции.


Современные модели могут стабильно следовать примерно 150-200 инструкциям. Claude Code в системном промпте уже использует около 50 из них — то есть треть бюджета уходит до того, как модель увидит ваш код. При этом по мере роста числа инструкций качество их выполнения падает не точечно, а равномерно по всем пунктам.

Короче, держите CLAUDE.md коротким и универсальным. Вместо того чтобы описывать все команды сборки, настройки тестов и паттерны кода, используйте метод прогрессивного погружения: создайте папку agent_docs/ с отдельными файлами (building_project.md, testing_guidelines.md, architecture.md) и в CLAUDE.md просто перечислите их с кратким описанием. Пусть Claude сам решает, что ему нужно прочитать для текущей задачи.

Для повседневных задач это тожже работает. Я после прочтения статьи попросил агента разобрать мой CLAUDE.md и раскидать все не нужное по разным документам. И он сразу вынул из него примерно половину. Правда, выкинуть придется еще примерно 500 строк :)

Правда, авторы статьи категорически призывают не использовать /init для автогенерации CLAUDE.md и вообще писать там всё вручную. Но так далеко заходить я, конечно, не буду :)


Пономарь
3011
С Новым годом! Мы его точно не забудем! Надеюсь он будет лучше для каждого из вас!
342178
Оказывается Джонни Айв был куплен OpenAI для работы над умной ручкой.

Она будет оснащена камерами, микрофонами и всем что бы записывать все вокруг, особенно ваши заметки на бумаге.

Они типа верят что она может стать третьим умным устройством после телефона и часов.

Я очень хорошо помню - Сэм Альтман любитель делать записи на бумаге.

Но мне, лично, показалось - бред . Сам я не помню когда брал в руки этот предмет кроме того что бы подписать что то (да и то всё реже и реже на реальной бумаге).

Но чем больше об этом думаю, больше хочется опять начать думать на бумаге. Ну и конечно, что бы в гитхаб сразу уходило, ну или хотя бы в проекты внутри ChatGPT.

Сергей Булаев AI 🤖 - об AI и не только
131195👎3
Год назад ChatGPT контролировал 86,7% трафика.

Сегодня? 64,5%.

Падение на 22 процентных пункта за 12 месяцев.

Тем временем Gemini вырос с 5,7% до 21,5%. Grok - с нуля до 3,4%. DeepSeek появился и закрепился на уровне 3,7%.

Пользователи экспериментируют. Находят разные инструменты для разных задач. ChatGPT всё ещё лидирует, но доминирование быстро размывается.

Рост Gemini логичен и очевиден всем. Преимущество в дистрибуции от Google реально. Интеграция в Поиск, Workspace, Android. Это миллиарды точек контакта.

Интересно что Perplexity, Claude и Copilot застряли около 2%. Несмотря на сильные продукты и серьёзное финансирование, они не пробиваются. Качество не гарантирует адопшион.

Но так то мы давно знаем - разные модели лучше для разных задач.

Сергей Булаев AI 🤖 - об AI и не только
📱 sbulaev
Please open Telegram to view this post
VIEW IN TELEGRAM
299
Друзья, а подпишитесь пожалуйста на меня на Product Hunt.

Хочу в эксперементальных целях парочку продуктов запустить попробовать.

Биографию надо заполнить? Чуть чуть походил по сайту, не нашел её ни у кого. ChatGPT говорит надо заполнить. Ещё говорит что мейкером постить - нормально, правда?

С радостью приму любые советы/рассказы/кейсы.

Подпишитесь пожалуйста, нужна будет помощь видимо... (я знаю что напрямую просить апвотить продукты - моветон).

Сергей Булаев AI 🤖 - об AI и не только
205👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Cursor умер для меня за год

Когда я оглядываюсь на прошедший год, год, когда произошло столько всего самого разного.

Особенно в моей жизни, ведь я начал нанимать людей в команду только в январе, в марте уже выпустил MVP Co.actor, а в мае отправился в поездку в США, из которой до сих пор не вернулся.

Меня поражает не всё это, а те драматические изменения, которые произошли в моем наборе инструментов, используемом мной как основателем и руководителем стартапа.

Хочу поделиться своим списком и буду рад услышать ваши мнения о том, какие инструменты полезны вам сегодня.

Удивительно, что большинство тулов, которыми я пользовался и даже восхищался, — полностью исчезли из моей жизни, а вместе с ними поменялась и сама рутина.

Ещё год назад я был жёстким фанатом Cursor/Cursor Agent/Composer или как там его, я уже забыл. Последний раз открывал, наверное, в сентябре. И всё, как и не было. Интересно, как выглядит график роста у ребят, боюсь, что отрицательно.

Думаю, будет хуже, хотя уверен, ребята тоже не сидят спокойно и в постоянном творческом поиске, как сделать что-то новое. Как и некоторые из нас. Как и я. Но сейчас не об этом.

Правда в том, что в декабре у меня появилось два отдельных компьютера, которые стоят у меня под телевизором, и на каждом из них постоянно работают Claude Code. Иногда 10, иногда 20, иногда один. И управляю я ими непрерывно через Tailscale и все остальные компьютеры, что у меня были и раньше — macmini/MacBook/iPhone. Больше текстом, конечно, но всё чаще и чаще голосом. Говорить с компьютером уже входит в привычку (с телефоном-то мы давно привыкли).

А иногда ими управляет сам Claude Code. Мне кажтеся, так будет всё чаще.

Ещё одним важным открытием стал для меня Cloudflare, год назад я только учился им пользоваться. Сейчас большая часть моей инфраструктуры на нём (и Azure для клиентов).

Нереальная дешевизна (практически бесплатность) на малых оборотах и возможность всем управлять через API сделали его идеальным дополнением Claude Code.

GitHub + медиа в Cloudflare R2 стали для меня и моей компании основным расширенным пространством. Ведь теперь мы в основном работаем с текстами, ведь с текстами так хорошо работает Claude. В сентябре я начал эту связку внедрять в компании, и сейчас даже задачи и прогресс отслеживаем в GitHub, удобный веб-интерфейс просмотра файлов, права и возможность всегда спросить и попросить поискать твоего агента.

Моим главным окном вопроса стал Perplexity, сначала я его использовал только для быстрых Deep Research, но постепенно он стал отвечать и на бытовые вопросы и даже расследовать со мной ошибки Линукса. Если спросить голосом — то тоже его, ответы устраивают больше, чем от ChatGPT. Последний остался для размышлений и долгих, конечно же, более крутых глубоких research.

Благодаря Клоду в мою жизнь вернулась Google Analytics, которой я не мог нормально пользоваться с 4-й версии. Казалось сложной и непонятной. Пока Клод не начал сам её смотреть, объяснять и настраивать. Теперь я её очень люблю — она крутая.

Ну и, конечно, Termius, мой любимый терминал, которым я стал пользоваться гораздо больше. Пользоваться вместе с кучей сохранённых tmux-сессий, к которым я всегда могу на лету подключиться, где бы я ни был, чтобы в очередной раз написать запрос во всегда ждущей меня там строке Claude Code.

Cursor умер. Но я по нему не скучаю. Скоро нам всем придётся многое отпустить. Привыкайте.

Сергей Булаев AI 🤖 - об AI и не только.

Подпишитесь на меня на producthunt, пожалуйста, хочу стартануть пару проектов скоро.

Ну и мой новый проект: bulaev.ai
78619👎3
This media is not supported in your browser
VIEW IN TELEGRAM
Читатели пишут что в tmux есть неудобные штуки типа claude code глючит и перепрокучивает выдачу в нем, копировать неудобно, скроллить неудобно.

Всё это решается планинами и настройками, делюсь своим конфигом. Инструкции по установке и разъяснения внутри (поставьте звездочку).

• Ограничивает историю 5000 строками (решайте сами сколько вам надо)
• Позволяет скроллить мышкой/прижиманием на телефоне
• Подключает копирование выделенного текста с переносами строк автоматически.
• Делает статусную строку более информативной.

И напоминаю лучшая команда инициализации: tmux new -As [сессия] - присоединяет к рабочей, а если она умерла - пересоздает её.

Ещё раз: мой конфиг здесь.

Поделитесь что ещё интересного есть в ваших конфигах.

Сергей Булаев AI 🤖 - об AI и не только
2255
This media is not supported in your browser
VIEW IN TELEGRAM
Я не понял он ёршики меняет или нет?

Сергей Булаев AI 🤖 - об AI и не только
5984
10k+ иллюстраций категорезировать, тэгировать, описать, считать текст - 110 минут (в 10 потоков) и $14.

Считаю очень дёшево.

Сергей Булаев AI 🤖 - об AI и не только
135115
Andriy Burkov:

Некоторые до сих пор не понимают (Я знаю, это трудно [принять] и займёт некоторое время) что вручную фиксить код созданный ИИ не придётся.

Всё что не удастся починить будет просто сгенерено заново основываяст на спецификации и юнит тестах.


💯💯💯

Если вы всё ещё пытаетесь смотреть код - вы теряете время. Кучу времени.

Тестировать? - да
Оптимизировать? - да
Проверять безопасноть? - да
Рефакторить? - да

Но никак не смотреть. Решать конечно вам. Мне, к счастью, не пришлось. Мне на код бесполезно смотреть - я не знаю компьютерных языков, на которых программируют мои агенты.

Сергей Булаев AI 🤖 - об AI и не только
4338👎84
Forwarded from Мысли вслух
Единственное, что действительно будет future-proof - это judgment. Суждение.

Мы зашли в эпоху, где делать можно всё. Код, дизайн, прототипы, продукты - генерируются часами, не днями.

Именно поэтому главный дефицит теперь не в производстве, а в выборе.

Появилась новая проблема - AI slop. Когда код пишется быстрее чем думается, получается много, но не факт что нужного.

Раньше вопрос был "как это сделать", а теперь "зачем".

За последние месяцы произошло фундаментальное изменение.

Появились долгоиграющие агенты - системы, которые:
1) Не ломаются от первой ошибки
2) Умеют сами себя чинить
3) Позволяют нетехническим людям собирать реальные продукты

То, что полгода назад не работало вообще, сегодня собирается за час через промпты.

Что ломается?

1. Классическую модель продуктовой команды
:

PM больше не тот кто пишет ТЗ - это теперь делает кто угодно. Его работа сместилась в сторону "зачем мы это делаем" и "какую проблему решаем".

2. Границы ролей:

Роли поплыли: PM-ы кодят. Дизайнеры кодят.
Дизайн-системы → AI → меньше дизайнеров, больше инженеров.

3. Детерминированное ПО:

Было: нажал кнопку - получил результат.
Стало: нажал кнопку - получил что-то похожее на результат или нет.

Это значит: появляется новая ключевая функция - оценка (evals).
Это снова зона ответственности людей с judgment.

Почему judgment - главное?

Потому что в мире бесконечной производительности ценность смещается.

Когда делать можно бесконечно много, скорость перестаёт быть преимуществом. Важнее становится что именно ты решил делать.

Judgment нужен:
• чтобы понять, что строить
• чтобы оценить, можно ли это выпускать
• чтобы отсеять красивый, но опасный код
• чтобы понять, имеет ли продукт смысл в системе в целом

Если коротко: ИИ забрал исполнение, ускорил всех и убрал порог входа.

А вот суждение - нет.

В новой индустриальной революции (революции сервисов), выигрывают не те, кто быстрее пишет код, а те, кто лучше понимает последствия своих решений.

Будущее за людьми, которые умеют: выбирать, отказывать, оценивать и брать ответственность.

Это, похоже, единственное, что не автоматизируется.

Отдельно стоит сказать про Salesforce и Zendesk, там хорошо видно куда всё движется.

Речь про utility-based software - когда продукт продаётся по «сиденьям» и каждый seat = человек, который делает работу.

Zendesk - идеальный пример.

50 саппорт-агентов → 50 лицензий.
Но теперь рядом можно поставить AI-агентов:
• было 50 людей
• стало 20 людей + 30 AI
• лицензий покупают меньше
• Zendesk теряет деньги, но медленно - никто не замечает

Это самый опасный сценарий для таких компаний: их не заменяют, их высасывают по кусочкам.

С Salesforce ситуация другая.

CRM - это база, на которой всё держится. Данные с длинным сроком жизни, карьерные риски, интеграции, процессы.

Никто в здравом уме не вырезает Salesforce одним решением.

Но даже тут давление растёт:
• Агенты начинают относиться к CRM как к «тупой базе»
• API закрываются или становятся платными
• Платформы начинают встраивать собственных агентов

Вот тут снова всплывает ключевая мысль: когда строить можно всё, главная ценность - judgment

Judgment:
• Какие workflows реально имеют смысл
• Где AI добавляет value, а где создаёт иллюзию прогресса
• Что стоит автоматизировать, а что опасно трогать

ИИ ускорил всех одинаково.
Поэтому разница теперь не в том сколько кода написал, а кто лучше понимает, где этот код вообще нужен.

@maxvotek | linkedin | substack
355127