[31/100] Витя Тарнавский
6.62K subscribers
158 photos
27 videos
2 files
202 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Нет, я не скажу, что значит счетчик в названии

Рекламу не даю

@the_real_jkee
Download Telegram
ТЕПЕРЬ У НАС ЕСТЬ БИБИ 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
199💅9🤡5
Ребята из AI Factory сделали большую карту российских ИИ-компаний.
Я потыкался, карта хорошая. Люблю такие карты. И табличка удобная есть.

Можно увидеть что рынок на удивление очень живой и богатый. Одних агрегаторов нейросетей 14 штук, я из них знал три штуки.

Всем молодым компаниям в ИИ удачи в это нелёгкое время. Из таблички 80% компаний умрут 🥲 Но на молодых компаниях всё держится – на ошибках всех этих идей и подходах построится понимание что же на самом деле надо было делать.

p.s. пост не купленный, я ребят вообще не знаю, и рекламу не даю

https://incrussia.ru/specials/karta-rossijskogo-ii-2-0/
53🤡7🔥61
Очень вдохновляющая история у Humanoid Артёма Соколова

Артём – бывший владелец той самой ювелирки SOKOLOV. Артём окончательно продал компанию в августе этого года и уже год как занимается гуманоидными роботами в Лондоне. Это круто. Follow the dream, всё такое.

Ребята за 8 месяцев собрали работающего робота, что, конечно, невероятная скорость. Недавно ещё прикрутили к нему ноги, успешно ходит.

Робота целят на заводы, general purpose. Особого позиционирования я пока не заметил, но это чуть ли не единственный такой стартап в европейском регионе.

Ребятам всяческой удачи

Классный видос тут 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥58107🤡7
Я теперь ангел-инвестор в Kodacode

В последнее время много общаюсь со стартапами и фондами. Хочется помогать небольшим компаниям расти и развиваться.

На этой неделе вошел в Kodacode как инвестор и советник.

Kodacode - AI-копилот разработчика для крупных компаний. Такой российский Cursor, но с прицелом на энтерпрайз.

Казалось бы, зачем, есть же Cursor? Рассказываю.

1. Для крупного энтерпрайза текущие "легкие" решения не подходят. И Cursor, и Claude Code перестают работать на больших корпоративных проектах. Тебе нужно иметь карты проектов и зависимостей, уметь вытаскивать правильные куски кода из большой кодовой базы, уметь соблюдать корпоративные политики. Не говоря уж об использовании внешних моделей.

2. Большой энтерпрайз это про сложную интеграцию. Например, кодовую базу нужно правильно обогатить для конкретного кодинг инструмента. Это всегда проще делать с локальным игроком который рядом, а пока границы закрыты иначе уж точно не получится. Кто займет рынок – тот останется надолго.

3. На таких рынках выигрывают команды с сильными технологиями и техническим бэкграундом. Команда Kodacode - одна из самых технически сильных на рынке. Не как обычно вайбкод тяп-ляп.

И вообще – просто круто что есть смелые ребята в технологически сложных стартапах, считаю это надо всячески поддерживать.

Буду помогать советом. Ребята, удачи!

Kodacode | Kodacode TG | Хабр
🔥853714🤡13🤔2
Перевел для вас потрясающую пасту с x про внедрение копилотов

В прошлом квартале я выкатил Microsoft Copilot на 4 000 сотрудников.

$30 за место в месяц.

$1,4 млн в год.

Я назвал это «цифровой трансформацией».

Совет директоров обожает такие слова.

Они утвердили всё за одиннадцать минут.

Никто не спросил, что именно это будет делать.

Включая меня.

Я всем сказал, что это «увеличит продуктивность в 10 раз».

Это не настоящее число.

Но звучит как настоящее.

HR спросили, как мы будем измерять эти 10x.

Я сказал, что «подключим аналитические дашборды».

Они перестали спрашивать.

Через три месяца я заглянул в отчёты по использованию.

Copilot открыли 47 человек.

12 пользовались больше одного раза.

Один из них — я.

Я использовал его, чтобы пересказать письмо, которое мог прочитать за 30 секунд.

Это заняло 45 секунд.

Плюс время на исправление галлюцинаций.

Но я назвал это «успешным пилотом».

Успех — это когда пилот заметно не провалился.

CFO спросил про ROI.

Я показал ему график.

График рос вверх и вправо.

Он измерял «AI enablement».

Я придумал эту метрику на месте.

Он одобрительно кивнул.

Теперь мы «AI-enabled».

Я не знаю, что это значит.

Но это есть в нашем инвесторском деке.

Сеньор-разработчик спросил, почему мы не взяли Claude или ChatGPT.

Я сказал, что нам нужна «enterprise-grade security».

Он спросил, что это значит.

Я сказал: «комплаенс».

Он спросил: какой именно комплаенс.

Я сказал: «весь».

Он посмотрел скептически.

Я поставил ему «разговор про карьерное развитие».

Он перестал задавать вопросы.

Microsoft прислали команду для кейс-стади.

Они хотели сделать из нас историю успеха.

Я сказал, что мы «сэкономили 40 000 часов».

Я посчитал это, умножив число сотрудников на число, которое придумал.

Они не проверяли.

Они никогда не проверяют.

Теперь мы на сайте Microsoft.

«Глобальная корпорация получила 40 000 часов прироста продуктивности с Copilot».

CEO запостил это в LinkedIn.

Собрал 3 000 лайков.

Он ни разу не пользовался Copilot.

Никто из руководителей не пользовался.

У нас есть исключение.

«Стратегический фокус требует минимальных цифровых отвлечений».

Эту политику написал я.

Лицензии продлеваются в следующем месяце.

Я запрашиваю расширение.

Ещё 5 000 мест.

Мы не использовали первые 4 000.

Но в этот раз мы «продавим адопшен».

Адопшен — это обязательное обучение.

Обучение — это 45-минутный вебинар, который никто не смотрит.

Но прохождение будет трекаться.

Прохождение — это метрика.

Метрики живут в дашбордах.

Дашборды идут в презентации для совета директоров.

Презентации для совета директоров приносят мне повышение.

К Q3 я буду SVP.

Я всё ещё не знаю, что именно делает Copilot.

Но я знаю, зачем он нужен.

Он нужен, чтобы показать, что мы «инвестируем в AI».

Инвестиции — это траты.

Траты — это приверженность.

Приверженность — значит, мы серьёзно относимся к будущему.

Будущее — это то, что я скажу, что оно такое.

Главное, чтобы график шёл вверх и вправо.
502🔥104🤡49169
[31/100] Витя Тарнавский
T-pro 2.0 – с гибридным ризонингом 🥳 Лучшая модель в своём весе среди всех открытых моделей по широкому ряду русскоязычных бенчмарков. В два раза более быстрая и дешевая чем аналоги по качеству. Модель с рассуждениями, создана для построения сложных систем…
Выложили пэйпер про T-pro 2.0

До-тренировка опенсорса на другой язык дает лучше результат на этом языке и значительно эффективней в инференсе за счет локального токенизатора и оптимизированного спекулятивного декодера.

Все расписали в репорте: архитектура, датамикс, подход к обучению, токенизации и прочее.

Если вы захотите повторить наш опыт, можете пользоваться рецептом.

Поставьте нам лайкосов на Hugging Face 🤗

HF | arXiv
1🔥572410🤡6
🎄 T-Pro 2.1 и T-Lite 2.1

Дарим вам на новый год апдейт наших открытых моделей.

В реальных системах задачи отличаются от решения текстовых задач. Мы строим наши модели как хорошие инженерные кубики для реальных систем.

Мы значимо улучшили качество на двух задачах: Instruction Following и Tool Calling. Теперь модели стабильней себя ведут на сложных инструкциях вроде чёткого формата ответа и при вызове тулов. Последнее особенно важно для построение агентских систем.

Пользуйтесь!
И почитайте оч крутой репорт о проделанной работе на Хабре

Hugging Face | Хабр
🔥5718123🤡2
Знаете, как моя дочь называет DeepSeek?

Глубокая Болезнь
313947🤡1616🔥10
Ребята, спасибо огромное что читаете канал. Вы - супер 🤖
Я на каникулы. Всех с наступающим!
Please open Telegram to view this post
VIEW IN TELEGRAM
212858🔥34
Channel name was changed to «[31/100] Витя Тарнавский»
Выращиваем код в огороде

Всех с прошедшими 🎉 Открываю год статьёй от Cursor про построение долго работающих автономных кодинг агентов.

Ребятам удалось создать систему из сотен параллельно работающих агентов, которая может работать недели (!) над одним проектом и не разваливаться.

Одна из задач в статье – построить с нуля браузер. За неделю система собрала кривовато работающий браузер, что невероятный успех. Браузер традиционно считается одной из самых сложных задач в разработке. Как будто ещё годик и можно будет создать браузер в домашних условиях.

Считаю что будущее разработки за такими автономными долго работающими системами. Код будет выращиваться как в огороде. Разработчик будущего – проектировщик огорода и специалист в выборе удобрений, семян и теплиц.

Всем Копатыч 🌟

https://cursor.com/blog/scaling-agents
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥753914🤡2🤔1
В продолжение темы автономных систем решающих сложные задачи.

Хороший подход для измерения вопроса предлагает бенчмарк METR

Ребята взяли задачи для которых известно сколько времени тратит на них профессионал. И дальше замеряют какой длины задачи могут стабильно решать AI-системы. Задачи в-основном про разработку и ML.

Так вот, длительность стабильно решаемых задач удваивается в среднем каждые 7 месяцев. И это довольно старый тренд, ещё с 2020 года.

В новостях про этот бенчмарк часто пишут что "Claude Opus 4.5 пробил уже 4 часа", но это результат с вероятностью 50%. Это так себе инженер 🤡 Если взять 80% успеха, то Opus 4.5 пробил только 27 минут. И вот это похоже на честный текущий максимум: задачи человеческой сложностью в полчаса модели решают достаточно надежно сами.

Однако, тренд это не отменяет. Если тренд продолжится, через 3-5 лет задачи уровня написания браузера будут решаться автономно. Так же как и задачи уровня "построить маркетплейс", "создать банковское приложение", you name it.

Trust the trendline

Почитать можно тут
🔥19127🤡2
Наконец-то дошли руки в выходной всерьез попробовать Claude Code. И это чистый developer joy, давно так не кайфовал.

Куча агентов в разных окнах делают твои задачки. Полный контроль над происходящим. Потрясающе и с большой любовью сделанный продукт 🌟

Набросал личного бота с тудушками и календарями на smolagents, давно хотел попробовать. Прикрутил CodeAgent тул, очень нравится концепт – это тул, который на запрос генерит python-код и потом его исполняет. Гибко, умно, небезопасно 😅

Естественно, я за пару часов сжег все свои кредиты и быстренько перешел на подписку за $100/mo 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
46🤡2812🥱1
ClickHouse поднял $400M и купил Langfuse

Я надеюсь, все знают что такое ClickHouse. Это самая быстрая аналитическая база данных.

ClickHouse – важная часть моей личной истории. Зарождался он буквально рядом со мной на соседних креслах в Яндексе, внутри Яндекс.Метрики. Название идет от clickstream – сленговое название для данных веб-аналитики. Домик кликов 🏠

Большую часть кода тогда написал гениальный Лёша Миловидов. Лёша сейчас CTO проекта и до сих пор является top-1 контрибьютором.

Я был первым реальным пользователем ClickHouse – писал API запросов для Метрики, помогал составлять язык запросов, помогал правильно хранить и складывать данные. Наверное, можно сказать, что долгое время я был продактом и ключевым пользователем.

Когда мы запускали новую Метрику на ClickHouse, я уже Метрикой руководил. Так появилась Яндекс.Метрика с текущими фильтрами и сегментами. Затем уже ClickHouse пополз по Яндексу, и ещё позже – в опенсорс.

Первое видео на YouTube про Clickhouse - это я прыгаю на сцене Highload++ и объясняю что это за зверь в 2016 году. Позже мы гоняли на пару с Лёшей Миловидовым в калифорнию и показывали её во всякие большие компании.

Сейчас это сильная самостоятельная европейская компания с гигантской оценкой в 15 миллардов долларов и HQ в Амстердаме. Редкая история, где гениальная инженерия привела к большому успеху.

Очень рад за ребят и стараюсь заходить к ним в офис каждый раз когда там бываю. ClickHouse GO 🚀🚀🚀
1🔥17955
ClickHouse, Langfuse и LLM-трейсы

Теперь немного про покупку Langfuse.

Langfuse – observability-платформа для LLM систем поверх ClickHouse. На простом языке – штука для хранения логов и отслеживания метрик в AI-мире. Так зачем их покупать?

ClickHouse долгое время был просто "скоростной базой данных для любых логов". Это конечно круто, но бизнесово не так перспективно и не использует текущую AI-волну.

Сегодня ClickHouse стремится стать логирующей, аналитической, трейсирующей платформой для нового AI мира. Это точно нужный кубик – систем становится больше, их логов становится больше, задачи там специфические из-за недетерминированности систем.

И в отличие от всяких рискованных Anthropic, Perplexity и Lovable, эти кирки и лопаты нужны всем.

Про Oracle слышали? Top-20 по капитализации в мире. Так вот, ClickHouse - это такой новый Oracle в AI-мире.
🔥433🤡3🤔1
Реклама ClickHouse в метро в Сингапуре
86🔥3621
В интернетах взрывной популярностью растет Clawdbot персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс!

Я его пощупал. Это реально восторг 🌟

Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых инструментов – календарь, почта, браузер, файловая система и так далее. Он доступен в любых чатах включая телеграм. И он реально делает вещи.

Например, я попросил его взять фотографии с одной из моих съемок отмеченные в лайтруме как 4 и 5 звёзд и сложить в виде jpeg в отдельную папочку. Он сам разобрался где лежат фотки, как вскрыть лайтрум xml и найти разметку, где найти jpeg и спокойно всё переложил. Wow.

Помимо огромной библиотеки тулов, Clawdbot может сам дописывать себе инструменты. Реально пишет: "так пока не умею, но сейчас научусь". У проекта красивая аккуратная архитектура, поэтому расширяется легко.

Есть простой шедулер, он может делать регулярные задачи. Он не работает, когда лэптоп выключен, но можно подхимичить чтобы всё просроченное срабатывало после включения.

Есть классный веб-интерфейс – статусы, инструменты, доступы. Оч приятно ❤️

Пользоваться довольно страшно. Теоретически может взбеситься и удалять все файлы или отправлять в интернет. На всякий случай забэкапил все свои фотографии 🌟

Абсолютно уверен что будущее нормальной операционной системы это подобная штука. И заодно – будущее персонального AI. И рабочего.

Все делаем бэкапы и вперед пробовать: https://clawd.bot/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥66134🤡3
[31/100] Витя Тарнавский
В интернетах взрывной популярностью растет Clawdbot – персональный AI-агент для десктопа который может "реально делать вещи". Опенсорс! Я его пощупал. Это реально восторг 🌟 Это такой агент, который работает у тебя в ноутбуке. У него есть множество готовых…
Теперь все яростно обсуждают насколько Clawdbot небезопасный и что использовать его не надо.

Кейсы там веселые:
- Купил курс саморазвития за $3000
- Написал в X пост с ключами от OpenAI
- Классика: sudo rm -rf

Со стороны может показаться, что использовать локальные модели вместо API защищает от рисков. У меня в комментах тоже про это пишут.

Так вот. Это буквально вредный совет. От рисков не защищает – наоборот, усугубляет.

Основные риски такие:

1. Хотел хорошее, сделал плохое. Удалил что-нибудь, купил что-нибудь дорогое, etc. Это низкое качество / галлюцинации: чем лучше модель, тем меньше таких ошибок.

2. Prompt/content injection: анализировал почту, там письмо с зловредным промптом, сделал действия из него. Это плохое следование системному промпту: чем лучше модель, тем меньше таких ошибок.

3. Зловредный код в подтягиваемых тулах. Тут модель вообще ни при чем, нужно быть аккуратней с установкой тулов.

4. Торчащий Clawdbot в интернет: админка, коннекторы к мессенджерам. Не нужно ставить Clawdbot на мак мини / сервер. Ваше личное устройство, как правило, в безопасности. Модель ни при чем.

Так что используйте самые сильные доступные вам модели. Я запускаю на Opus 4.5. Поверьте, Anthropic не особо нужна структура файлов на вашем ноутбуке.

И да – Clawdbot действительно не особо безопасный инструмент, так что на свой страх и риск. На оборудование компании ставить не советую.
1713🤔6🥱6
Higgsfield и логи работы профессионалов

С удовольствием послушал все три часа основателя Higgsfield Саши Машрабова у Соколовского.

Higgsfield – топовые ребята, занимаются генерацией картинок и видео. Один из самых больших сервисов в мире в своей нише. Яркие ребята из Казахстана, уже единорог, с классным продуктом и дерзким пиаром.

У ребят есть ключевая идея, которая мне очень близка и про которую тоже давно думаю. Она про логи работы профессионалов.

Идея такая: чтобы сделать задачу создания контента под ключ, нужно иметь в своих системах логи работы профессионалов end-2-end. Не только генерация картинки или видоса, но всё: подготовка сценария, раскадровка видео и так далее.

Поверх таких логов можно будет обучить AI который сможет решать для бизнесов эту задачу целиком.

У классических провайдеров вроде Google есть только небольшой кусочек этой работы, что не позволяет обобщить задачу шире. У Adobe такие данные есть, но они как компания невероятно медленные. Higgsfield поэтому и делает весь стек работы для профессионалов, а не просто yet another сервис генерации картинок.

Похожий паттерн можно видеть в разработке. Cursor не просто так заливает рынок деньгами – им нужны end-2-end логи создания софта. Такой же паттерн в роботиксе – там людей обвешанных приборами сажают делать работу от начала до конца чтобы потом обучаться.

Против такого подхода можно противопоставить другие подходы. Например, теоретически модель может быть настолько крутая что ей вот этот старый подход создания контента/софта/etc вообще не нужна, сразу получится желаемый результат. Посмотрим!

А подкаст супер крутой, полный инсайдов и сильный идей. Посмотрите: Higgsfield x Соколовский
2🔥3010🤔11
Вокруг меня уж очень часто начали говорить про AI rollups.
Давайте и вам расскажу.

Идея простая: выбираем нишу, скупаем там старые бизнесы, заменяем всё на AI, повышаем таким образом маржу и улучшаем продукт, и объединяем в один новый модный бизнес.

Коцепция очень крутая и win-win для всех: это и способ значимо улучшить сервис для людей, и денежный exit для старых владельцев, и отличный предсказуемо масштабируемый бизнес само по себе.

Понятно, что "просто перевести на агентов" не получается. У бизнесов часто даже CRM нет, а если бизнес не оцифрован, агентов запускать особо некуда. А ещё это старые операционные инертные бизнесы, и менять их сложно. Поэтому мощь такой компании измеряется количеством компаний которых она может "закатать" за месяц.

Классный пример это Dwelly - роллап в аренде недвижимости в UK. Делают наши ребята, большие молодцы. Тут можно послушать Дана Лифшица, ко-фаундера Dwelly.

Давайте уже побольше таких проектов. Всем будет лучше. Старые студии создания софта, маркетинг агентства, колл-центры – всех закатать в роллап и сделать калифорния ролл.
🔥26🥱85🤔1🤡1