[31/100] Витя Тарнавский
6.76K subscribers
160 photos
28 videos
2 files
207 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Нет, я не скажу, что значит счетчик в названии

Рекламу не даю

@the_real_jkee
Download Telegram
Выращиваем код в огороде

Всех с прошедшими 🎉 Открываю год статьёй от Cursor про построение долго работающих автономных кодинг агентов.

Ребятам удалось создать систему из сотен параллельно работающих агентов, которая может работать недели (!) над одним проектом и не разваливаться.

Одна из задач в статье – построить с нуля браузер. За неделю система собрала кривовато работающий браузер, что невероятный успех. Браузер традиционно считается одной из самых сложных задач в разработке. Как будто ещё годик и можно будет создать браузер в домашних условиях.

Считаю что будущее разработки за такими автономными долго работающими системами. Код будет выращиваться как в огороде. Разработчик будущего – проектировщик огорода и специалист в выборе удобрений, семян и теплиц.

Всем Копатыч 🌟

https://cursor.com/blog/scaling-agents
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥753914🤡2🤔1
В продолжение темы автономных систем решающих сложные задачи.

Хороший подход для измерения вопроса предлагает бенчмарк METR

Ребята взяли задачи для которых известно сколько времени тратит на них профессионал. И дальше замеряют какой длины задачи могут стабильно решать AI-системы. Задачи в-основном про разработку и ML.

Так вот, длительность стабильно решаемых задач удваивается в среднем каждые 7 месяцев. И это довольно старый тренд, ещё с 2020 года.

В новостях про этот бенчмарк часто пишут что "Claude Opus 4.5 пробил уже 4 часа", но это результат с вероятностью 50%. Это так себе инженер 🤡 Если взять 80% успеха, то Opus 4.5 пробил только 27 минут. И вот это похоже на честный текущий максимум: задачи человеческой сложностью в полчаса модели решают достаточно надежно сами.

Однако, тренд это не отменяет. Если тренд продолжится, через 3-5 лет задачи уровня написания браузера будут решаться автономно. Так же как и задачи уровня "построить маркетплейс", "создать банковское приложение", you name it.

Trust the trendline

Почитать можно тут
🔥19127🤡2
Наконец-то дошли руки в выходной всерьез попробовать Claude Code. И это чистый developer joy, давно так не кайфовал.

Куча агентов в разных окнах делают твои задачки. Полный контроль над происходящим. Потрясающе и с большой любовью сделанный продукт 🌟

Набросал личного бота с тудушками и календарями на smolagents, давно хотел попробовать. Прикрутил CodeAgent тул, очень нравится концепт – это тул, который на запрос генерит python-код и потом его исполняет. Гибко, умно, небезопасно 😅

Естественно, я за пару часов сжег все свои кредиты и быстренько перешел на подписку за $100/mo 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
46🤡2913🥱1
ClickHouse поднял $400M и купил Langfuse

Я надеюсь, все знают что такое ClickHouse. Это самая быстрая аналитическая база данных.

ClickHouse – важная часть моей личной истории. Зарождался он буквально рядом со мной на соседних креслах в Яндексе, внутри Яндекс.Метрики. Название идет от clickstream – сленговое название для данных веб-аналитики. Домик кликов 🏠

Большую часть кода тогда написал гениальный Лёша Миловидов. Лёша сейчас CTO проекта и до сих пор является top-1 контрибьютором.

Я был первым реальным пользователем ClickHouse – писал API запросов для Метрики, помогал составлять язык запросов, помогал правильно хранить и складывать данные. Наверное, можно сказать, что долгое время я был продактом и ключевым пользователем.

Когда мы запускали новую Метрику на ClickHouse, я уже Метрикой руководил. Так появилась Яндекс.Метрика с текущими фильтрами и сегментами. Затем уже ClickHouse пополз по Яндексу, и ещё позже – в опенсорс.

Первое видео на YouTube про Clickhouse - это я прыгаю на сцене Highload++ и объясняю что это за зверь в 2016 году. Позже мы гоняли на пару с Лёшей Миловидовым в калифорнию и показывали её во всякие большие компании.

Сейчас это сильная самостоятельная европейская компания с гигантской оценкой в 15 миллардов долларов и HQ в Амстердаме. Редкая история, где гениальная инженерия привела к большому успеху.

Очень рад за ребят и стараюсь заходить к ним в офис каждый раз когда там бываю. ClickHouse GO 🚀🚀🚀
1🔥18257
ClickHouse, Langfuse и LLM-трейсы

Теперь немного про покупку Langfuse.

Langfuse – observability-платформа для LLM систем поверх ClickHouse. На простом языке – штука для хранения логов и отслеживания метрик в AI-мире. Так зачем их покупать?

ClickHouse долгое время был просто "скоростной базой данных для любых логов". Это конечно круто, но бизнесово не так перспективно и не использует текущую AI-волну.

Сегодня ClickHouse стремится стать логирующей, аналитической, трейсирующей платформой для нового AI мира. Это точно нужный кубик – систем становится больше, их логов становится больше, задачи там специфические из-за недетерминированности систем.

И в отличие от всяких рискованных Anthropic, Perplexity и Lovable, эти кирки и лопаты нужны всем.

Про Oracle слышали? Top-20 по капитализации в мире. Так вот, ClickHouse - это такой новый Oracle в AI-мире.
🔥443🤡3🤔1
Реклама ClickHouse в метро в Сингапуре
88🔥3722
В интернетах взрывной популярностью растет Clawdbot персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс!

Я его пощупал. Это реально восторг 🌟

Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых инструментов – календарь, почта, браузер, файловая система и так далее. Он доступен в любых чатах включая телеграм. И он реально делает вещи.

Например, я попросил его взять фотографии с одной из моих съемок отмеченные в лайтруме как 4 и 5 звёзд и сложить в виде jpeg в отдельную папочку. Он сам разобрался где лежат фотки, как вскрыть лайтрум xml и найти разметку, где найти jpeg и спокойно всё переложил. Wow.

Помимо огромной библиотеки тулов, Clawdbot может сам дописывать себе инструменты. Реально пишет: "так пока не умею, но сейчас научусь". У проекта красивая аккуратная архитектура, поэтому расширяется легко.

Есть простой шедулер, он может делать регулярные задачи. Он не работает, когда лэптоп выключен, но можно подхимичить чтобы всё просроченное срабатывало после включения.

Есть классный веб-интерфейс – статусы, инструменты, доступы. Оч приятно ❤️

Пользоваться довольно страшно. Теоретически может взбеситься и удалять все файлы или отправлять в интернет. На всякий случай забэкапил все свои фотографии 🌟

Абсолютно уверен что будущее нормальной операционной системы это подобная штука. И заодно – будущее персонального AI. И рабочего.

Все делаем бэкапы и вперед пробовать: https://clawd.bot/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥70184🤡3
[31/100] Витя Тарнавский
В интернетах взрывной популярностью растет Clawdbot – персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс! Я его пощупал. Это реально восторг 🌟 Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых…
Теперь все яростно обсуждают насколько Clawdbot небезопасный и что использовать его не надо.

Кейсы там веселые:
- Купил курс саморазвития за $3000
- Написал в X пост с ключами от OpenAI
- Классика: sudo rm -rf

Со стороны может показаться, что использовать локальные модели вместо API защищает от рисков. У меня в комментах тоже про это пишут.

Так вот. Это буквально вредный совет. От рисков не защищает – наоборот, усугубляет.

Основные риски такие:

1. Хотел хорошее, сделал плохое. Удалил что-нибудь, купил что-нибудь дорогое, etc. Это низкое качество / галлюцинации: чем лучше модель, тем меньше таких ошибок.

2. Prompt/content injection: анализировал почту, там письмо с зловредным промптом, сделал действия из него. Это плохое следование системному промпту: чем лучше модель, тем меньше таких ошибок.

3. Зловредный код в подтягиваемых тулах. Тут модель вообще ни при чем, нужно быть аккуратней с установкой тулов.

4. Торчащий Clawdbot в интернет: админка, коннекторы к мессенджерам. Не нужно ставить Clawdbot на мак мини / сервер. Ваше личное устройство, как правило, в безопасности. Модель ни при чем.

Так что используйте самые сильные доступные вам модели. Я запускаю на Opus 4.5. Поверьте, Anthropic не особо нужна структура файлов на вашем ноутбуке.

И да – Clawdbot действительно не особо безопасный инструмент, так что на свой страх и риск. На оборудование компании ставить не советую.
2014🤔6🥱6
Higgsfield и логи работы профессионалов

С удовольствием послушал все три часа основателя Higgsfield Саши Машрабова у Соколовского.

Higgsfield – топовые ребята, занимаются генерацией картинок и видео. Один из самых больших сервисов в мире в своей нише. Яркие ребята из Казахстана, уже единорог, с классным продуктом и дерзким пиаром.

У ребят есть ключевая идея, которая мне очень близка и про которую тоже давно думаю. Она про логи работы профессионалов.

Идея такая: чтобы сделать задачу создания контента под ключ, нужно иметь в своих системах логи работы профессионалов end-2-end. Не только генерация картинки или видоса, но всё: подготовка сценария, раскадровка видео и так далее.

Поверх таких логов можно будет обучить AI который сможет решать для бизнесов эту задачу целиком.

У классических провайдеров вроде Google есть только небольшой кусочек этой работы, что не позволяет обобщить задачу шире. У Adobe такие данные есть, но они как компания невероятно медленные. Higgsfield поэтому и делает весь стек работы для профессионалов, а не просто yet another сервис генерации картинок.

Похожий паттерн можно видеть в разработке. Cursor не просто так заливает рынок деньгами – им нужны end-2-end логи создания софта. Такой же паттерн в роботиксе – там людей обвешанных приборами сажают делать работу от начала до конца чтобы потом обучаться.

Против такого подхода можно противопоставить другие подходы. Например, теоретически модель может быть настолько крутая что ей вот этот старый подход создания контента/софта/etc вообще не нужна, сразу получится желаемый результат. Посмотрим!

А подкаст супер крутой, полный инсайдов и сильный идей. Посмотрите: Higgsfield x Соколовский
2🔥3711🤔21
Вокруг меня уж очень часто начали говорить про AI rollups.
Давайте и вам расскажу.

Идея простая: выбираем нишу, скупаем там старые бизнесы, заменяем всё на AI, повышаем таким образом маржу и улучшаем продукт, и объединяем в один новый модный бизнес.

Коцепция очень крутая и win-win для всех: это и способ значимо улучшить сервис для людей, и денежный exit для старых владельцев, и отличный предсказуемо масштабируемый бизнес само по себе.

Понятно, что "просто перевести на агентов" не получается. У бизнесов часто даже CRM нет, а если бизнес не оцифрован, агентов запускать особо некуда. А ещё это старые операционные инертные бизнесы, и менять их сложно. Поэтому мощь такой компании измеряется количеством компаний которых она может "закатать" за месяц.

Классный пример это Dwelly - роллап в аренде недвижимости в UK. Делают наши ребята, большие молодцы. Тут можно послушать Дана Лифшица, ко-фаундера Dwelly.

Давайте уже побольше таких проектов. Всем будет лучше. Старые студии создания софта, маркетинг агентства, колл-центры – всех закатать в роллап и сделать калифорния ролл.
🔥35🥱107🤔3🤡1
Если вы ещё не видели ролик DeepMind про Project Genie - бегите смотреть. Я аж прослезился, настолько это круто 🌟

Вспомнил, как в детстве увлекался осознанными сновидениями – буквально оно, только круче! Хочется бегать по планетам и голосом менять мир, а не вот это всё.

Смотреть тут
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥229🤡6
Чат, а посоветуйте хороших проверенных ребят кто помогает оформлять golden / talent visa's в Дубай?

Решил сделать Golden Visa по Exceptional Talent в Дубай. Я вроде со всеми нужными регалиями, но яростно ненавижу бумажки. Помощь нужна именно в оформлении документов, всё остальное я сам могу и умею.
25🤡14🔥10🤔41
Shipping at Inference-Speed by Peter Steinberger

Последние пару дней слежу за Peter Steinberger - автором нашумевшего clawdbot, он же openclaw. Это потрясающий человек с гигантским списком проектов на гитхабе и абсолютно нечеловеческой активностью коммитов 7 дней в неделю во все эти репозитории.

У него есть классный блог про разработку агентами. Я прочитал последние несколько постов, и это как глоток свежего воздуха. Его подход лёгкий, прикладной и незамутненный хайпом.

1. Peter – вайбкодинг-профессионал. Весь код пишет агентами с огромной производительностью. Последняя его статья очень удачно называется Shipping at Inference-Speed
2. Всё делает через консоль, при этом активно говорит туда голосом и закидывает картинки с правками
3. Любую работу автоматизирует скиллами в форме cli или .MD описаний. Скилл для регистрации домена, скилл для написания фронта к проекту, целая библиотека для заказа еды в deliveroo/foodora через консоль. Не использует хайповые MCP-интеграции.
4. Не использует никакой harness вроде opencode или "agent swarms" или whatever. Лёгкая обертка вокруг модели, всё.
5. Основная модель у него это 5.2 codex, что тоже вне мейнстрима. Opus он находит менее стабильной на больших задачах и торопыжкой.

Цитирую:
Don’t waste your time on stuff like RAG, subagents, Agents 2.0 or other things that are mostly just charade. Just talk to it. Play with it. Develop intuition. The more you work with agents, the better your results will be.


У него в статьях много крутых мыслей. Если вы разработчик, очень рекомендую почитать:
Just Talk To It - the no-bs Way of Agentic Engineering
Shipping at Inference-Speed
🔥5914🤡6🤔1🥱1
Вау, смотрите, платформа аренды людей для AI 🤖

Rent A Human - https://rentahuman.ai/

Роботы могут заказать людей чтобы попробовать еду, забрать посылку, сделать фотографию, да и вообще что угодно. Это просто потрясающе 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡4422🔥1814🤔6
Третий день сражений с 🦞Clawdbot aka Openclaw – и я сдаюсь 🌟

Идея отличная, исполнение ужасное. Это жутко нестабильная штука. Тулы всё время падают, кроны не работают, логи теряются и так далее. Один из тулов он уже третий день не может заставить по крону запускаться – а это всего лишь агрегатор новостных рассылок из почты. Веб-интерфейс у меня просто перестал запускаться 🤡

Я надеюсь, что эту идею кто-нибудь завернет в хорошую качественную оболочку. Я также надеюсь, что изначальная идея ляжет на уровень операционных систем. Личный агент с разными инструментами должен быть хорошо интегрирован в твой личный workspace – телефон или лэптоп.

Пойду дальше пилить свой собственный запускатор – с тестами, секретницами и блекджеком.
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥188🤡4🤔2
MCP – переоцененная усложненная фигня

В последнее время собираю своих агентов руками и на своей шкуре понял переоцененность MCP.

Народ втыкает MCP куда не попадя. MCP-сервер погоды. MCP-сервер документации. Особенно забавно видеть как народ поднимает локальные MCP-серверы у себя на ноутбуке и потом ходит в них же из Claude Code.

Можно просто сделать консольную утилиту. Или лёгкую обертку вокруг API. Или файлик подложить - часто даже поход по сети не нужен. А в агента передать tool calling описанием.

- Что может быть сделано как консольная утилита - делайте как утилиту
- Что является простым API - достаточно описания API / обертки в тул на стороне агента
- Где нужен дискавери возможностей - сделайте просто файлик или репозиторий со списком тулов
- Если вы строите взаимодействие между компаниями или вам нужен прям а-ля jsonrpc сложности протокол – можно смотреть на MCP

Кстати, есть замечательный Agent Skills – формат, который позволяет описывать скиллы для агентов. Можно сделать в компании репозиторий таких скиллов - вот вам и дискавери.

Явно лучше чем поддерживать зоопарк MCP-серверов. И ещё один MCP со списком всех других MCP.
231🔥226🤡6🤔4
Anthropic продолжает экспериментировать с long-running автономными агентами.
На этот раз делали компилятор для C.

Агенты сожрали $20k и осилили собрать работающий компилятор на Rust. Код критикуют в разных статьях и ругают за неспособность собрать hello world в этом эпичнейшем треде, но факт такой: проект был написан и он компилирует Linux, SQlite, postgres и другие крупные проекты. Это совершенно фантастический результат.

Harness – т.е. упряжка вокруг моделей – был на удивление простой. Никаких issue трекеров, общего чата или планировщика – просто много параллельных агентов работающих независимо над любой задачей, простейшая блокировка задач через файлы, и git. Явно можно сделать лучше.

Но пост не про это.

Автор несколько раз подчеркивает что для успеха важно иметь мощный набор принимающих тестов. В том числе для скорости. Параллелизм достигнут за счет независимой работы агентов над разными тестами.

Эта идея концептуально мне нравится и проскакивает везде. Написать даже сложный код – модели справляются. Ключевое – написать четкие требования; ещё лучше - иметь полноценные принимающие тесты.

Мой личный опыт с последними моделями это подтверждает. Я долго сижу вместе с моделью над четкой формулировкой задачи – на выходе получается стройный .md файл который я сам читаю несколько раз чтобы было всё чётко. После этого реализация в коде – one-shot.

Профессия разработчика, получается, утонщается до написания технически грамотной спеки. Ощущение, что такой работы много не нужно – с большинством проектов справятся и продакты. разработчики не нужны

Учитесь писать спеки.
130🤡20🔥1312
Вот такая картинка сегодня в турецком топе аппстора. Yandex AI обогнал по установкам и ChatGPT, и Google. Круто же?

Вообще, Яндекс - большой игрок на турецком рынке. В такси можно постоянно видеть Yandex Maps. Поиск Яндекса за последние пару лет вырвал долю 40%+.

С поисковой долей это в принципе уникальная ситуация чтобы внешняя относительно страны компания могла потеснить Google. Раньше Google был неприкасаем.

С приходом AI рынок стал подвижней – даже в родной деревне у Google появились вполне реальные конкуренты. Отличный момент откусить от Google какой-нибудь другой рынок пока он отвлекся на OpenAI.

Ребята молодцы, побольше стран и запусков.
100🔥37
HMND SERIES E02

У Humanoid вышла вторая серия сериала про их путь – на этот раз про стратегию захвата индустриального рынка.

Очень тёплое видео, смотрится как вторая серия потрясающего сериала. Артём Соколов появился в кадре и не стесняется своего сильного русского акцента. Даже вставили момент где он забыл как переводится слово "мурашки" и спрашивает человека за кадром 🌟

Боря Янгель уже в кадре как Head of AI. Боря – бывший Head of AI R&D в Nebius, до этого 7 лет в Яндексе, и вообще замечательный человек. Увидимся в Лондоне!

Из интересных вещей:
- Основной продукт для рынка это робот с колёсной базой – хотя робота с ногами они продолжают считать важным и активно делают;
- Ребята смогли сделать шесть Proof-of-Concept инсталляций у реальных заказчиков;
- Команда перешла к задаче Fleet Management – координации системы из роботов;
- 30 тысяч роботов в предзаказе (!!!)

Раньше ребята выглядели как безумцы, а сейчас выглядит как будто у них вполне есть шансы на долю рынка. Круто же!

Смотреть тут 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1743🤔1