[31/100] Витя Тарнавский

ТЕПЕРЬ У НАС ЕСТЬ БИБИ 🤖

Please open Telegram to view this post

199💅9🤡5

6.17K views14:29

Ребята из AI Factory сделали большую карту российских ИИ-компаний.
Я потыкался, карта хорошая. Люблю такие карты. И табличка удобная есть.

Можно увидеть что рынок на удивление очень живой и богатый. Одних агрегаторов нейросетей 14 штук, я из них знал три штуки.

Всем молодым компаниям в ИИ удачи в это нелёгкое время. Из таблички 80% компаний умрут 🥲 Но на молодых компаниях всё держится – на ошибках всех этих идей и подходах построится понимание что же на самом деле надо было делать.

p.s. пост не купленный, я ребят вообще не знаю, и рекламу не даю

https://incrussia.ru/specials/karta-rossijskogo-ii-2-0/

❤53🤡7🔥61

8.23K views10:04

[31/100] Витя Тарнавский

Очень вдохновляющая история у Humanoid Артёма Соколова

Артём – бывший владелец той самой ювелирки SOKOLOV. Артём окончательно продал компанию в августе этого года и уже год как занимается гуманоидными роботами в Лондоне. Это круто. Follow the dream, всё такое.

Ребята за 8 месяцев собрали работающего робота, что, конечно, невероятная скорость. Недавно ещё прикрутили к нему ноги, успешно ходит.

Робота целят на заводы, general purpose. Особого позиционирования я пока не заметил, но это чуть ли не единственный такой стартап в европейском регионе.

Ребятам всяческой удачи

Классный видос тут

🤖

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5810❤7🤡7

6.21K views07:27

[31/100] Витя Тарнавский

Я теперь ангел-инвестор в Kodacode

В последнее время много общаюсь со стартапами и фондами. Хочется помогать небольшим компаниям расти и развиваться.

На этой неделе вошел в Kodacode как инвестор и советник.

Kodacode - AI-копилот разработчика для крупных компаний. Такой российский Cursor, но с прицелом на энтерпрайз.

Казалось бы, зачем, есть же Cursor? Рассказываю.

1. Для крупного энтерпрайза текущие "легкие" решения не подходят. И Cursor, и Claude Code перестают работать на больших корпоративных проектах. Тебе нужно иметь карты проектов и зависимостей, уметь вытаскивать правильные куски кода из большой кодовой базы, уметь соблюдать корпоративные политики. Не говоря уж об использовании внешних моделей.

2. Большой энтерпрайз это про сложную интеграцию. Например, кодовую базу нужно правильно обогатить для конкретного кодинг инструмента. Это всегда проще делать с локальным игроком который рядом, а пока границы закрыты иначе уж точно не получится. Кто займет рынок – тот останется надолго.

3. На таких рынках выигрывают команды с сильными технологиями и техническим бэкграундом. Команда Kodacode - одна из самых технически сильных на рынке. Не как обычно вайбкод тяп-ляп.

И вообще – просто круто что есть смелые ребята в технологически сложных стартапах, считаю это надо всячески поддерживать.

Буду помогать советом. Ребята, удачи!

Kodacode | Kodacode TG | Хабр

kodacode.ru

AI-помощник разработчика

Koda — AI-помощник для разработчика, который работает без VPN, отлично понимает русский язык и предоставляет доступ к современным моделям прямо из вашей IDE.

🔥85❤3714🤡13🤔2

8.62K views07:17

[31/100] Витя Тарнавский

Перевел для вас потрясающую пасту с x про внедрение копилотов

В прошлом квартале я выкатил Microsoft Copilot на 4 000 сотрудников.

$30 за место в месяц.

$1,4 млн в год.

Я назвал это «цифровой трансформацией».

Совет директоров обожает такие слова.

Они утвердили всё за одиннадцать минут.

Никто не спросил, что именно это будет делать.

Включая меня.

Я всем сказал, что это «увеличит продуктивность в 10 раз».

Это не настоящее число.

Но звучит как настоящее.

HR спросили, как мы будем измерять эти 10x.

Я сказал, что «подключим аналитические дашборды».

Они перестали спрашивать.

Через три месяца я заглянул в отчёты по использованию.

Copilot открыли 47 человек.

12 пользовались больше одного раза.

Один из них — я.

Я использовал его, чтобы пересказать письмо, которое мог прочитать за 30 секунд.

Это заняло 45 секунд.

Плюс время на исправление галлюцинаций.

Но я назвал это «успешным пилотом».

Успех — это когда пилот заметно не провалился.

CFO спросил про ROI.

Я показал ему график.

График рос вверх и вправо.

Он измерял «AI enablement».

Я придумал эту метрику на месте.

Он одобрительно кивнул.

Теперь мы «AI-enabled».

Я не знаю, что это значит.

Но это есть в нашем инвесторском деке.

Сеньор-разработчик спросил, почему мы не взяли Claude или ChatGPT.

Я сказал, что нам нужна «enterprise-grade security».

Он спросил, что это значит.

Я сказал: «комплаенс».

Он спросил: какой именно комплаенс.

Я сказал: «весь».

Он посмотрел скептически.

Я поставил ему «разговор про карьерное развитие».

Он перестал задавать вопросы.

Microsoft прислали команду для кейс-стади.

Они хотели сделать из нас историю успеха.

Я сказал, что мы «сэкономили 40 000 часов».

Я посчитал это, умножив число сотрудников на число, которое придумал.

Они не проверяли.

Они никогда не проверяют.

Теперь мы на сайте Microsoft.

«Глобальная корпорация получила 40 000 часов прироста продуктивности с Copilot».

CEO запостил это в LinkedIn.

Собрал 3 000 лайков.

Он ни разу не пользовался Copilot.

Никто из руководителей не пользовался.

У нас есть исключение.

«Стратегический фокус требует минимальных цифровых отвлечений».

Эту политику написал я.

Лицензии продлеваются в следующем месяце.

Я запрашиваю расширение.

Ещё 5 000 мест.

Мы не использовали первые 4 000.

Но в этот раз мы «продавим адопшен».

Адопшен — это обязательное обучение.

Обучение — это 45-минутный вебинар, который никто не смотрит.

Но прохождение будет трекаться.

Прохождение — это метрика.

Метрики живут в дашбордах.

Дашборды идут в презентации для совета директоров.

Презентации для совета директоров приносят мне повышение.

К Q3 я буду SVP.

Я всё ещё не знаю, что именно делает Copilot.

Но я знаю, зачем он нужен.

Он нужен, чтобы показать, что мы «инвестируем в AI».

Инвестиции — это траты.

Траты — это приверженность.

Приверженность — значит, мы серьёзно относимся к будущему.

Будущее — это то, что я скажу, что оно такое.

Главное, чтобы график шёл вверх и вправо.

502🔥104🤡4916❤9

9.26K viewsedited 13:09

[31/100] Витя Тарнавский

T-pro 2.0 – с гибридным ризонингом 🥳 Лучшая модель в своём весе среди всех открытых моделей по широкому ряду русскоязычных бенчмарков. В два раза более быстрая и дешевая чем аналоги по качеству. Модель с рассуждениями, создана для построения сложных систем…

Выложили пэйпер про T-pro 2.0

До-тренировка опенсорса на другой язык дает лучше результат на этом языке и значительно эффективней в инференсе за счет локального токенизатора и оптимизированного спекулятивного декодера.

Все расписали в репорте: архитектура, датамикс, подход к обучению, токенизации и прочее.

Если вы захотите повторить наш опыт, можете пользоваться рецептом.

Поставьте нам лайкосов на Hugging Face 🤗

HF | arXiv

1🔥57❤2410🤡6

14.9K views11:33

[31/100] Витя Тарнавский

🎄 T-Pro 2.1 и T-Lite 2.1

Дарим вам на новый год апдейт наших открытых моделей.

В реальных системах задачи отличаются от решения текстовых задач. Мы строим наши модели как хорошие инженерные кубики для реальных систем.

Мы значимо улучшили качество на двух задачах: Instruction Following и Tool Calling. Теперь модели стабильней себя ведут на сложных инструкциях вроде чёткого формата ответа и при вызове тулов. Последнее особенно важно для построение агентских систем.

Пользуйтесь!
И почитайте оч крутой репорт о проделанной работе на Хабре

Hugging Face | Хабр

Хабр

Обновление T-Pro 2.1: как мы улучшили Instruction Following и Tool Calling

Всем привет! На связи Толя Потапов и команда ML Т-Банка. Этим летом мы выпустили большую языковую модель T-pro-2.0 — эффективную русскоязычную модель с гибридным подходом к reasoning. Сегодня...

🔥57❤18123🤡2

8.8K views13:28

[31/100] Витя Тарнавский

Знаете, как моя дочь называет DeepSeek?

Глубокая Болезнь

3139❤47🤡1616🔥10

8.19K views09:44

[31/100] Витя Тарнавский

Ребята, спасибо огромное что читаете канал. Вы - супер 🤖
Я на каникулы. Всех с наступающим!

Please open Telegram to view this post

VIEW IN TELEGRAM

2❤12858🔥34

5.78K views11:23

[31/100] Витя Тарнавский

Channel name was changed to «[31/100] Витя Тарнавский»

11:23

[31/100] Витя Тарнавский

Выращиваем код в огороде

Всех с прошедшими 🎉 Открываю год статьёй от Cursor про построение долго работающих автономных кодинг агентов.

Ребятам удалось создать систему из сотен параллельно работающих агентов, которая может работать недели (!) над одним проектом и не разваливаться.

Одна из задач в статье – построить с нуля браузер. За неделю система собрала кривовато работающий браузер, что невероятный успех. Браузер традиционно считается одной из самых сложных задач в разработке. Как будто ещё годик и можно будет создать браузер в домашних условиях.

Считаю что будущее разработки за такими автономными долго работающими системами. Код будет выращиваться как в огороде. Разработчик будущего – проектировщик огорода и специалист в выборе удобрений, семян и теплиц.

Всем Копатыч 🌟

https://cursor.com/blog/scaling-agents

Please open Telegram to view this post

VIEW IN TELEGRAM

Cursor

Scaling long-running autonomous coding

We've been experimenting with running coding agents autonomously for weeks at a time.

1🔥7539❤14🤡2🤔1

11.3K views10:30

[31/100] Витя Тарнавский

В продолжение темы автономных систем решающих сложные задачи.

Хороший подход для измерения вопроса предлагает бенчмарк METR

Ребята взяли задачи для которых известно сколько времени тратит на них профессионал. И дальше замеряют какой длины задачи могут стабильно решать AI-системы. Задачи в-основном про разработку и ML.

Так вот, длительность стабильно решаемых задач удваивается в среднем каждые 7 месяцев. И это довольно старый тренд, ещё с 2020 года.

В новостях про этот бенчмарк часто пишут что "Claude Opus 4.5 пробил уже 4 часа", но это результат с вероятностью 50%. Это так себе инженер 🤡 Если взять 80% успеха, то Opus 4.5 пробил только 27 минут. И вот это похоже на честный текущий максимум: задачи человеческой сложностью в полчаса модели решают достаточно надежно сами.

Однако, тренд это не отменяет. Если тренд продолжится, через 3-5 лет задачи уровня написания браузера будут решаться автономно. Так же как и задачи уровня "построить маркетплейс", "создать банковское приложение", you name it.

Trust the trendline

Почитать можно тут

🔥1912❤7🤡2

9.64K views09:26

[31/100] Витя Тарнавский

Наконец-то дошли руки в выходной всерьез попробовать Claude Code. И это чистый developer joy, давно так не кайфовал.

Куча агентов в разных окнах делают твои задачки. Полный контроль над происходящим. Потрясающе и с большой любовью сделанный продукт 🌟

Набросал личного бота с тудушками и календарями на smolagents, давно хотел попробовать. Прикрутил CodeAgent тул, очень нравится концепт – это тул, который на запрос генерит python-код и потом его исполняет. Гибко, умно, небезопасно 😅

Естественно, я за пару часов сжег все свои кредиты и быстренько перешел на подписку за $100/mo 🤡

Please open Telegram to view this post

VIEW IN TELEGRAM

❤46🤡2812🥱1

4.41K views13:00

[31/100] Витя Тарнавский

ClickHouse поднял $400M и купил Langfuse

Я надеюсь, все знают что такое ClickHouse. Это самая быстрая аналитическая база данных.

ClickHouse – важная часть моей личной истории. Зарождался он буквально рядом со мной на соседних креслах в Яндексе, внутри Яндекс.Метрики. Название идет от clickstream – сленговое название для данных веб-аналитики. Домик кликов 🏠

Большую часть кода тогда написал гениальный Лёша Миловидов. Лёша сейчас CTO проекта и до сих пор является top-1 контрибьютором.

Я был первым реальным пользователем ClickHouse – писал API запросов для Метрики, помогал составлять язык запросов, помогал правильно хранить и складывать данные. Наверное, можно сказать, что долгое время я был продактом и ключевым пользователем.

Когда мы запускали новую Метрику на ClickHouse, я уже Метрикой руководил. Так появилась Яндекс.Метрика с текущими фильтрами и сегментами. Затем уже ClickHouse пополз по Яндексу, и ещё позже – в опенсорс.

Первое видео на YouTube про Clickhouse - это я прыгаю на сцене Highload++ и объясняю что это за зверь в 2016 году. Позже мы гоняли на пару с Лёшей Миловидовым в калифорнию и показывали её во всякие большие компании.

Сейчас это сильная самостоятельная европейская компания с гигантской оценкой в 15 миллардов долларов и HQ в Амстердаме. Редкая история, где гениальная инженерия привела к большому успеху.

Очень рад за ребят и стараюсь заходить к ним в офис каждый раз когда там бываю. ClickHouse GO 🚀🚀🚀

ClickHouse

ClickHouse raises $400M Series D led by Dragoneer to accelerate expansion across analytics and AI infrastructure

ClickHouse acquires Langfuse to enter LLM observability and introduces a native Postgres service to unify transactional and analytical workloads

1🔥179❤55

5.24K views10:26

[31/100] Витя Тарнавский

ClickHouse, Langfuse и LLM-трейсы

Теперь немного про покупку Langfuse.

Langfuse – observability-платформа для LLM систем поверх ClickHouse. На простом языке – штука для хранения логов и отслеживания метрик в AI-мире. Так зачем их покупать?

ClickHouse долгое время был просто "скоростной базой данных для любых логов". Это конечно круто, но бизнесово не так перспективно и не использует текущую AI-волну.

Сегодня ClickHouse стремится стать логирующей, аналитической, трейсирующей платформой для нового AI мира. Это точно нужный кубик – систем становится больше, их логов становится больше, задачи там специфические из-за недетерминированности систем.

И в отличие от всяких рискованных Anthropic, Perplexity и Lovable, эти кирки и лопаты нужны всем.

Про Oracle слышали? Top-20 по капитализации в мире. Так вот, ClickHouse - это такой новый Oracle в AI-мире.

🔥43❤3🤡3🤔1

4.98K views09:00

[31/100] Витя Тарнавский

Реклама ClickHouse в метро в Сингапуре

❤86🔥3621

5.24K views09:25

[31/100] Витя Тарнавский

В интернетах взрывной популярностью растет Clawdbot – персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс!

Я его пощупал. Это реально восторг 🌟

Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых инструментов – календарь, почта, браузер, файловая система и так далее. Он доступен в любых чатах включая телеграм. И он реально делает вещи.

Например, я попросил его взять фотографии с одной из моих съемок отмеченные в лайтруме как 4 и 5 звёзд и сложить в виде jpeg в отдельную папочку. Он сам разобрался где лежат фотки, как вскрыть лайтрум xml и найти разметку, где найти jpeg и спокойно всё переложил. Wow.

Помимо огромной библиотеки тулов, Clawdbot может сам дописывать себе инструменты. Реально пишет: "так пока не умею, но сейчас научусь". У проекта красивая аккуратная архитектура, поэтому расширяется легко.

Есть простой шедулер, он может делать регулярные задачи. Он не работает, когда лэптоп выключен, но можно подхимичить чтобы всё просроченное срабатывало после включения.

Есть классный веб-интерфейс – статусы, инструменты, доступы. Оч приятно ❤️

Пользоваться довольно страшно. Теоретически может взбеситься и удалять все файлы или отправлять в интернет. На всякий случай забэкапил все свои фотографии 🌟

Абсолютно уверен что будущее нормальной операционной системы это подобная штука. И заодно – будущее персонального AI. И рабочего.

Все делаем бэкапы и вперед пробовать: https://clawd.bot/

Please open Telegram to view this post

VIEW IN TELEGRAM

clawd.bot

Moltbot — Personal AI Assistant

Moltbot — The AI that actually does things. Your personal assistant on any platform.

🔥66❤134🤡3

4.62K views11:49

[31/100] Витя Тарнавский

В интернетах взрывной популярностью растет Clawdbot – персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс! Я его пощупал. Это реально восторг 🌟 Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых…

Теперь все яростно обсуждают насколько Clawdbot небезопасный и что использовать его не надо.

Кейсы там веселые:
- Купил курс саморазвития за $3000
- Написал в X пост с ключами от OpenAI
- Классика: sudo rm -rf

Со стороны может показаться, что использовать локальные модели вместо API защищает от рисков. У меня в комментах тоже про это пишут.

Так вот. Это буквально вредный совет. От рисков не защищает – наоборот, усугубляет.

Основные риски такие:

1. Хотел хорошее, сделал плохое. Удалил что-нибудь, купил что-нибудь дорогое, etc. Это низкое качество / галлюцинации: чем лучше модель, тем меньше таких ошибок.

2. Prompt/content injection: анализировал почту, там письмо с зловредным промптом, сделал действия из него. Это плохое следование системному промпту: чем лучше модель, тем меньше таких ошибок.

3. Зловредный код в подтягиваемых тулах. Тут модель вообще ни при чем, нужно быть аккуратней с установкой тулов.

4. Торчащий Clawdbot в интернет: админка, коннекторы к мессенджерам. Не нужно ставить Clawdbot на мак мини / сервер. Ваше личное устройство, как правило, в безопасности. Модель ни при чем.

Так что используйте самые сильные доступные вам модели. Я запускаю на Opus 4.5. Поверьте, Anthropic не особо нужна структура файлов на вашем ноутбуке.

И да – Clawdbot действительно не особо безопасный инструмент, так что на свой страх и риск. На оборудование компании ставить не советую.

17❤13🤔6🥱6

3.73K views08:40

[31/100] Витя Тарнавский

Higgsfield и логи работы профессионалов

С удовольствием послушал все три часа основателя Higgsfield Саши Машрабова у Соколовского.

Higgsfield – топовые ребята, занимаются генерацией картинок и видео. Один из самых больших сервисов в мире в своей нише. Яркие ребята из Казахстана, уже единорог, с классным продуктом и дерзким пиаром.

У ребят есть ключевая идея, которая мне очень близка и про которую тоже давно думаю. Она про логи работы профессионалов.

Идея такая: чтобы сделать задачу создания контента под ключ, нужно иметь в своих системах логи работы профессионалов end-2-end. Не только генерация картинки или видоса, но всё: подготовка сценария, раскадровка видео и так далее.

Поверх таких логов можно будет обучить AI который сможет решать для бизнесов эту задачу целиком.

У классических провайдеров вроде Google есть только небольшой кусочек этой работы, что не позволяет обобщить задачу шире. У Adobe такие данные есть, но они как компания невероятно медленные. Higgsfield поэтому и делает весь стек работы для профессионалов, а не просто yet another сервис генерации картинок.

Похожий паттерн можно видеть в разработке. Cursor не просто так заливает рынок деньгами – им нужны end-2-end логи создания софта. Такой же паттерн в роботиксе – там людей обвешанных приборами сажают делать работу от начала до конца чтобы потом обучаться.

Против такого подхода можно противопоставить другие подходы. Например, теоретически модель может быть настолько крутая что ей вот этот старый подход создания контента/софта/etc вообще не нужна, сразу получится желаемый результат. Посмотрим!

А подкаст супер крутой, полный инсайдов и сильный идей. Посмотрите: Higgsfield x Соколовский

2🔥30❤10🤔11

2.73K views11:41

[31/100] Витя Тарнавский

Вокруг меня уж очень часто начали говорить про AI rollups.
Давайте и вам расскажу.

Идея простая: выбираем нишу, скупаем там старые бизнесы, заменяем всё на AI, повышаем таким образом маржу и улучшаем продукт, и объединяем в один новый модный бизнес.

Коцепция очень крутая и win-win для всех: это и способ значимо улучшить сервис для людей, и денежный exit для старых владельцев, и отличный предсказуемо масштабируемый бизнес само по себе.

Понятно, что "просто перевести на агентов" не получается. У бизнесов часто даже CRM нет, а если бизнес не оцифрован, агентов запускать особо некуда. А ещё это старые операционные инертные бизнесы, и менять их сложно. Поэтому мощь такой компании измеряется количеством компаний которых она может "закатать" за месяц.

Классный пример это Dwelly - роллап в аренде недвижимости в UK. Делают наши ребята, большие молодцы. Тут можно послушать Дана Лифшица, ко-фаундера Dwelly.

Давайте уже побольше таких проектов. Всем будет лучше. Старые студии создания софта, маркетинг агентства, колл-центры – всех закатать в роллап и сделать калифорния ролл.

🔥26🥱8❤5🤔1🤡1

2.05K views09:38

About

Blog

Apps

Platform