[31/100] Витя Тарнавский
6.64K subscribers
158 photos
27 videos
2 files
202 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Нет, я не скажу, что значит счетчик в названии

Рекламу не даю

@the_real_jkee
Download Telegram
Выращиваем код в огороде

Всех с прошедшими 🎉 Открываю год статьёй от Cursor про построение долго работающих автономных кодинг агентов.

Ребятам удалось создать систему из сотен параллельно работающих агентов, которая может работать недели (!) над одним проектом и не разваливаться.

Одна из задач в статье – построить с нуля браузер. За неделю система собрала кривовато работающий браузер, что невероятный успех. Браузер традиционно считается одной из самых сложных задач в разработке. Как будто ещё годик и можно будет создать браузер в домашних условиях.

Считаю что будущее разработки за такими автономными долго работающими системами. Код будет выращиваться как в огороде. Разработчик будущего – проектировщик огорода и специалист в выборе удобрений, семян и теплиц.

Всем Копатыч 🌟

https://cursor.com/blog/scaling-agents
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥753914🤡2🤔1
В продолжение темы автономных систем решающих сложные задачи.

Хороший подход для измерения вопроса предлагает бенчмарк METR

Ребята взяли задачи для которых известно сколько времени тратит на них профессионал. И дальше замеряют какой длины задачи могут стабильно решать AI-системы. Задачи в-основном про разработку и ML.

Так вот, длительность стабильно решаемых задач удваивается в среднем каждые 7 месяцев. И это довольно старый тренд, ещё с 2020 года.

В новостях про этот бенчмарк часто пишут что "Claude Opus 4.5 пробил уже 4 часа", но это результат с вероятностью 50%. Это так себе инженер 🤡 Если взять 80% успеха, то Opus 4.5 пробил только 27 минут. И вот это похоже на честный текущий максимум: задачи человеческой сложностью в полчаса модели решают достаточно надежно сами.

Однако, тренд это не отменяет. Если тренд продолжится, через 3-5 лет задачи уровня написания браузера будут решаться автономно. Так же как и задачи уровня "построить маркетплейс", "создать банковское приложение", you name it.

Trust the trendline

Почитать можно тут
🔥19127🤡2
Наконец-то дошли руки в выходной всерьез попробовать Claude Code. И это чистый developer joy, давно так не кайфовал.

Куча агентов в разных окнах делают твои задачки. Полный контроль над происходящим. Потрясающе и с большой любовью сделанный продукт 🌟

Набросал личного бота с тудушками и календарями на smolagents, давно хотел попробовать. Прикрутил CodeAgent тул, очень нравится концепт – это тул, который на запрос генерит python-код и потом его исполняет. Гибко, умно, небезопасно 😅

Естественно, я за пару часов сжег все свои кредиты и быстренько перешел на подписку за $100/mo 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
46🤡2812🥱1
ClickHouse поднял $400M и купил Langfuse

Я надеюсь, все знают что такое ClickHouse. Это самая быстрая аналитическая база данных.

ClickHouse – важная часть моей личной истории. Зарождался он буквально рядом со мной на соседних креслах в Яндексе, внутри Яндекс.Метрики. Название идет от clickstream – сленговое название для данных веб-аналитики. Домик кликов 🏠

Большую часть кода тогда написал гениальный Лёша Миловидов. Лёша сейчас CTO проекта и до сих пор является top-1 контрибьютором.

Я был первым реальным пользователем ClickHouse – писал API запросов для Метрики, помогал составлять язык запросов, помогал правильно хранить и складывать данные. Наверное, можно сказать, что долгое время я был продактом и ключевым пользователем.

Когда мы запускали новую Метрику на ClickHouse, я уже Метрикой руководил. Так появилась Яндекс.Метрика с текущими фильтрами и сегментами. Затем уже ClickHouse пополз по Яндексу, и ещё позже – в опенсорс.

Первое видео на YouTube про Clickhouse - это я прыгаю на сцене Highload++ и объясняю что это за зверь в 2016 году. Позже мы гоняли на пару с Лёшей Миловидовым в калифорнию и показывали её во всякие большие компании.

Сейчас это сильная самостоятельная европейская компания с гигантской оценкой в 15 миллардов долларов и HQ в Амстердаме. Редкая история, где гениальная инженерия привела к большому успеху.

Очень рад за ребят и стараюсь заходить к ним в офис каждый раз когда там бываю. ClickHouse GO 🚀🚀🚀
1🔥18055
ClickHouse, Langfuse и LLM-трейсы

Теперь немного про покупку Langfuse.

Langfuse – observability-платформа для LLM систем поверх ClickHouse. На простом языке – штука для хранения логов и отслеживания метрик в AI-мире. Так зачем их покупать?

ClickHouse долгое время был просто "скоростной базой данных для любых логов". Это конечно круто, но бизнесово не так перспективно и не использует текущую AI-волну.

Сегодня ClickHouse стремится стать логирующей, аналитической, трейсирующей платформой для нового AI мира. Это точно нужный кубик – систем становится больше, их логов становится больше, задачи там специфические из-за недетерминированности систем.

И в отличие от всяких рискованных Anthropic, Perplexity и Lovable, эти кирки и лопаты нужны всем.

Про Oracle слышали? Top-20 по капитализации в мире. Так вот, ClickHouse - это такой новый Oracle в AI-мире.
🔥433🤡3🤔1
Реклама ClickHouse в метро в Сингапуре
86🔥3621
В интернетах взрывной популярностью растет Clawdbot персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс!

Я его пощупал. Это реально восторг 🌟

Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых инструментов – календарь, почта, браузер, файловая система и так далее. Он доступен в любых чатах включая телеграм. И он реально делает вещи.

Например, я попросил его взять фотографии с одной из моих съемок отмеченные в лайтруме как 4 и 5 звёзд и сложить в виде jpeg в отдельную папочку. Он сам разобрался где лежат фотки, как вскрыть лайтрум xml и найти разметку, где найти jpeg и спокойно всё переложил. Wow.

Помимо огромной библиотеки тулов, Clawdbot может сам дописывать себе инструменты. Реально пишет: "так пока не умею, но сейчас научусь". У проекта красивая аккуратная архитектура, поэтому расширяется легко.

Есть простой шедулер, он может делать регулярные задачи. Он не работает, когда лэптоп выключен, но можно подхимичить чтобы всё просроченное срабатывало после включения.

Есть классный веб-интерфейс – статусы, инструменты, доступы. Оч приятно ❤️

Пользоваться довольно страшно. Теоретически может взбеситься и удалять все файлы или отправлять в интернет. На всякий случай забэкапил все свои фотографии 🌟

Абсолютно уверен что будущее нормальной операционной системы это подобная штука. И заодно – будущее персонального AI. И рабочего.

Все делаем бэкапы и вперед пробовать: https://clawd.bot/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥66134🤡3
[31/100] Витя Тарнавский
В интернетах взрывной популярностью растет Clawdbot – персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс! Я его пощупал. Это реально восторг 🌟 Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых…
Теперь все яростно обсуждают насколько Clawdbot небезопасный и что использовать его не надо.

Кейсы там веселые:
- Купил курс саморазвития за $3000
- Написал в X пост с ключами от OpenAI
- Классика: sudo rm -rf

Со стороны может показаться, что использовать локальные модели вместо API защищает от рисков. У меня в комментах тоже про это пишут.

Так вот. Это буквально вредный совет. От рисков не защищает – наоборот, усугубляет.

Основные риски такие:

1. Хотел хорошее, сделал плохое. Удалил что-нибудь, купил что-нибудь дорогое, etc. Это низкое качество / галлюцинации: чем лучше модель, тем меньше таких ошибок.

2. Prompt/content injection: анализировал почту, там письмо с зловредным промптом, сделал действия из него. Это плохое следование системному промпту: чем лучше модель, тем меньше таких ошибок.

3. Зловредный код в подтягиваемых тулах. Тут модель вообще ни при чем, нужно быть аккуратней с установкой тулов.

4. Торчащий Clawdbot в интернет: админка, коннекторы к мессенджерам. Не нужно ставить Clawdbot на мак мини / сервер. Ваше личное устройство, как правило, в безопасности. Модель ни при чем.

Так что используйте самые сильные доступные вам модели. Я запускаю на Opus 4.5. Поверьте, Anthropic не особо нужна структура файлов на вашем ноутбуке.

И да – Clawdbot действительно не особо безопасный инструмент, так что на свой страх и риск. На оборудование компании ставить не советую.
1713🤔6🥱6
Higgsfield и логи работы профессионалов

С удовольствием послушал все три часа основателя Higgsfield Саши Машрабова у Соколовского.

Higgsfield – топовые ребята, занимаются генерацией картинок и видео. Один из самых больших сервисов в мире в своей нише. Яркие ребята из Казахстана, уже единорог, с классным продуктом и дерзким пиаром.

У ребят есть ключевая идея, которая мне очень близка и про которую тоже давно думаю. Она про логи работы профессионалов.

Идея такая: чтобы сделать задачу создания контента под ключ, нужно иметь в своих системах логи работы профессионалов end-2-end. Не только генерация картинки или видоса, но всё: подготовка сценария, раскадровка видео и так далее.

Поверх таких логов можно будет обучить AI который сможет решать для бизнесов эту задачу целиком.

У классических провайдеров вроде Google есть только небольшой кусочек этой работы, что не позволяет обобщить задачу шире. У Adobe такие данные есть, но они как компания невероятно медленные. Higgsfield поэтому и делает весь стек работы для профессионалов, а не просто yet another сервис генерации картинок.

Похожий паттерн можно видеть в разработке. Cursor не просто так заливает рынок деньгами – им нужны end-2-end логи создания софта. Такой же паттерн в роботиксе – там людей обвешанных приборами сажают делать работу от начала до конца чтобы потом обучаться.

Против такого подхода можно противопоставить другие подходы. Например, теоретически модель может быть настолько крутая что ей вот этот старый подход создания контента/софта/etc вообще не нужна, сразу получится желаемый результат. Посмотрим!

А подкаст супер крутой, полный инсайдов и сильный идей. Посмотрите: Higgsfield x Соколовский
2🔥3010🤔11
Вокруг меня уж очень часто начали говорить про AI rollups.
Давайте и вам расскажу.

Идея простая: выбираем нишу, скупаем там старые бизнесы, заменяем всё на AI, повышаем таким образом маржу и улучшаем продукт, и объединяем в один новый модный бизнес.

Коцепция очень крутая и win-win для всех: это и способ значимо улучшить сервис для людей, и денежный exit для старых владельцев, и отличный предсказуемо масштабируемый бизнес само по себе.

Понятно, что "просто перевести на агентов" не получается. У бизнесов часто даже CRM нет, а если бизнес не оцифрован, агентов запускать особо некуда. А ещё это старые операционные инертные бизнесы, и менять их сложно. Поэтому мощь такой компании измеряется количеством компаний которых она может "закатать" за месяц.

Классный пример это Dwelly - роллап в аренде недвижимости в UK. Делают наши ребята, большие молодцы. Тут можно послушать Дана Лифшица, ко-фаундера Dwelly.

Давайте уже побольше таких проектов. Всем будет лучше. Старые студии создания софта, маркетинг агентства, колл-центры – всех закатать в роллап и сделать калифорния ролл.
🔥29🥱95🤔1🤡1
Если вы ещё не видели ролик DeepMind про Project Genie - бегите смотреть. Я аж прослезился, настолько это круто 🌟

Вспомнил, как в детстве увлекался осознанными сновидениями – буквально оно, только круче! Хочется бегать по планетам и голосом менять мир, а не вот это всё.

Смотреть тут
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥216🤡6