[29/100] Витя Тарнавский
5.97K subscribers
141 photos
26 videos
2 files
172 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Рекламу не даю

@the_real_jkee
Download Telegram
Наконец-до дошли руки до OpenAI Operator
Заказал себе кофту, оч удобно ) Всё заполняет сам кроме оплаты
🔥15🤡41🥱1💅1
Сегодня я обнаружил что потратил на replit $400 в этом месяце 😅

Фильтроняша начала расти как проект и изменения начали ломать старое поведение.

Пришлось сделать:
- Четкие продуктовые требования зафиксированные в одном файле
- TDD: все обвешать тестами и постоянно их гонять

Тогда удалось нормально двигаться дальше. Денег это жрет конечно много, но человеку я бы все равно больше заплатил.

И вообще, я делаю это не потому что оно возвращает инвестиции. О нет.

Я верю что будущим будут управлять люди которые умеют управлять роботами. Я учусь.
А вы?
44🤡14💅3🔥2
Forwarded from Nadir
152🔥24💅5🥱1
Поспорил с разработчиком из команды что смогу с одного промпта добавить в фильтроняшу статистику по юзерам и правила фильтрации по ней 🌟

В результате, с одного промпта Replit смог:
- обновить требования
- закодить сбор статистики в отдельную табличку
- запилить бизнес-правило по юзерам >2 хороших сообщений не удалять
- отобразить это везде в статусах вердикта как надо
- сделать миграционные скрипты для базы
- написать тесты

Получилось потому что до этого яростно перерефакторил всю кодовую базу, слив очередные $100 🤡

Эпический успех. Матвей, жду на тусовке в табличке «вайбкод меня заменит» 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
64🔥21🤡21💅5🥱2
Постоянно спрашивают, почему я сижу в Replit, когда все настоящие пацаны и пацанессы в Cursor. Отвечаю.

1. Деплой в облако по кнопке. Я ненавижу настраивать эти чертовы ssh-ключи, секретницы и домены.
2. Дев-среда в облаке. Не нужно никаких окружений и прочей ерунды на ноутбуке.
3. Работает с телефона. Я пишу в агент с телефона "сделай такую фичу" и он где-то там в облаке сам пашет. Десктоп-мобайл continuity – просто продолжаешь работать где хочешь.

Как будто так и должен выглядеть будущий UX для агентов в разработке. Cursor очень уж привязан к IDE.

Devin и OpenAI Codex тоже двигаются в правильную сторону. Кстати, именно Cognition AI – авторы Devin – приобрели Windsurf после неловкой попытки приорбитения от OpenAI.
232🤡12💅5🥱2
This media is not supported in your browser
VIEW IN TELEGRAM
Waifu в новом Grok напоминает вам что уже в эту субботу пройдет Turbo ML Conf!

Обязательно смотрим видео 🌚

Регистрация еще открыта
https://mlconf.t-bank.ai/
💅18🔥14🤡10
Reflections on OpenAI

Потрясающее чтиво от инженера, который недавно покинул OpenAI. Пишет про культуру, атмосферу, и как всё работает.

Очень душевное и как будто честное, хочется верить. Выжимки делать специально не буду, идите читать. Я мгновенно залип и прочитал целиком.

https://calv.info/openai-reflections
🔥17🤡10
На графике - пулл-реквесты на гитхабе от облачных кодинг агентов, из исследования. Слева – накопленное количество PR, справа – процент принятых PR.

Видим огромный растущий Codex от OpenAI на фоне остальных. Codex сделал уже 600к+ PR. Дальше идут Devin, Cursor Background Agent и Codegen.

Речь именно об автономных облачных агентах. То, что делают Cursor или Github Copilot в IDE, коммитится от имени человека и сюда не попадает. Таких сильно большое – например, Github Copilot репортит о ревью 8 миллиона PR-ов.

Будущее разработки вижу за облачными агентами. Как только ты можешь хоть какую-нибудь задачу отдать на ночь под ключ, привязка к IDE теряет смысл.

На графике – только публичная часть. Остается только догадываться, сколько ещё работы делают агенты в приватных репозиториях.
🔥16🤡106🥱4💅1
T-pro 2.0 – с гибридным ризонингом 🥳

Лучшая модель в своём весе среди всех открытых моделей по широкому ряду русскоязычных бенчмарков. В два раза более быстрая и дешевая чем аналоги по качеству.

Модель с рассуждениями, создана для построения сложных систем и решения сложных задач. Модель в открытом доступе, качай да используй.

– Qwen3 32B based
– Гибридный ризонинг
– Уплотненный токенайзер на русском
– Спекулятивный декодер в комплекте
– Apache 2.0 – используй как хочешь

Больше подробностей выложим в тех репорте – с бенчмарками и накопленными знаниями.

Сама модель и основные бенчмарки
Спекулятивный декодер
Новость
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥14535💅18🤡9
Открыли Turbo ML Conf!
💅31🔥16
This media is not supported in your browser
VIEW IN TELEGRAM
🔥4213💅12
This media is not supported in your browser
VIEW IN TELEGRAM
Все видели громкую историю про обнимающихся CEO + HRD из компании Astronomer на концерте Coldplay?

Какой-то чел успел завайбкодить игру «найди ceo+hrd» на Vercel 🤡

Эффект Барбары Стрейзанд вышел из под контроля )

Поиграть можно тут
🔥78💅1913
Смешная история была на выкладке T-Pro

Открываем для скачивания модельки и видим почти 30к скачиваний буквально через пару часов 😳 Причем только на GGUF – формате для запуска моделей локально на своём устройстве. На остальных ссылках до 500 загрузок.

В результате разборок раскопали, что нас выложил Бэкдор – 2 млн подписчиков – с ссылкой именно на эту версию. И эти люди ломанулись качать себе искусственный интеллект 🤡

Кстати, выложили развернутые бенчмарки на хабр. Тех репорт тоже будет, пишем!
Please open Telegram to view this post
VIEW IN TELEGRAM
💅33🔥16🤡73🥱3
🥳 Выкладываем T-One: открытая потоковая ASR модель для телефонии

Распознать хорошее аудио в оффлайне сегодня – не проблема. Берём какой-нибудь whisper и полетели.

А вот на плохих телефонных каналах всё довольно сложно. 8 килогерц, пшш-пшш, эхо и прочие беды. Для нас это задача типичная, и у нас получается её хорошо решать. Мы решили поделиться наработками.

Модель называется T-One, и это потоковая модель для телефонии. Она супер компактная, быстрая, и адаптирована для телефонных каналов.

→ Потоковая модель
→ 70M параметров, это в 50 раз меньше whisper-large-v3
→ В 2-3 раза (!) лучше WER чем у whisper-large-v3 на телефонных каналах (бенчи)
→ 300 ms чанк данных, можно строить realtime системы
→ Apache 2.0

Читайте крутой развернутый тех репорт на хабре
Качать как обычно на нашем Hugging Face
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥10623🤔3🤡3🥱2
Channel name was changed to «[29/100] Витя Тарнавский»
На T-Pro 2.0 мы потратили всего 120 млн ₽

В эту сумму входит всё: пол-года R&D, удачные и неудачные запуски обучения, стоимость датасетов. Для моделей такого уровня это очень скромно и эффективно.

Финальный прогон – 2.6 млн ₽. Большая разница – норма: нужна широкая сетка экспериментов, чтобы подобрать подход, датамикс и параметры.

Для сравнения: стоимость финального прогона для GPT-4 оценивается примерно в $40 млн (~3 млрд ₽). Да, в 1000 раз больше 😳 Яндекс ещё в 2023 тратил на генеративки больше 10 млрд/год; у Сбера масштабы ещё больше.

Конечно, мы не обучаем модели с нуля. Чтобы мы уложились в 120 млн, Alibaba сожгла миллиарды. Но какой смысл обучать с нуля?

Теперь вы можете взять наши запакованные в T-Pro 120 млн и строить своё – ещё дешевле 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14439🤡10
Это Матвей и он проиграл в споре 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
1172🤡57🔥31💅25
Forwarded from Записки C3PO
Только недавно заметил, что подписчиков стало больше 4к. А ведь помню, как пару месяцев назад было всего 700. Сначала подумал: «Зачем мистер Андерсон вас столько?!», а потом подумал, как типичный капиталист, воспользоваться вами и похантить, так как знаю, что среди вас много крутанов.

В связи с этим - пачка горячих и крутых вакансий ко мне в команду делать лучшее, что можно вообще делать сейчас (да-да, это не обман). В AI-центре Т-Банка мы работаем над задачами, которые находятся на переднем краю мирового продуктового AI прогресса. Здесь есть сложные проблемы, которые нельзя решить просто накрутив промпт к GPT - нужно думать головой и строить собственные и нетривиальные решения. У нас есть ресурсы для экспериментов, свои LLM и главное - задачи, над которыми реально интересно работать, и возможность видеть результат этой работы в продуктах, которыми пользуются люди прямо сейчас.

Group EM во Вселенную Ассистентов - возглавить команду (20+ человек) и их EM'ов , чтобы строить AI-ассистентов, которые изменят то, как люди взаимодействуют с банком и не только
Staff MLE во Вселенную Ассистентов - делать серьезное машинное обучение для ассистентов, которые реально понимают пользователей и помогают им решать их ежедневные задачи
Lead Product Manager в Поиск - трансформировать поиск в экосистеме Т с командой 40+ человек
Analytics Lead в Поиск - копать данные и находить инсайты, которые покажут, как люди на самом деле ищут информацию в банке
Product Manager в Поиск - взять кусок поиска в свои руки и довести его до ума, работая с конкретной вертикалью
Product Manager CallsAI - создавать AI, который понимает контекст каждого звонка в Т-Мобайл и помогает решать задачи клиентов быстрее и точнее

Если хотите работать над нетривиальными AI-задачами, где нужно думать, а не копировать чужие решения - пишите. У нас классная команда, интересные задачи, которые заставляют расти, и нет времени на бессмысленную суету.
23🔥15💅8🤡1
Agentic Web: Business

Продолжаю серию #agenticweb

Для бизнесов прежде всего меняется привлечение клиентов. Если вчера пользователь сам гуглил «ремонт квартиры», то завтра это сделает агент – а потом и забронирует.

Что делать?

1. Бизнес должен быть AI-доступным

AI должен уметь легко считать твой оффер. В будущем – AI должен легко уметь делать действия. Например, бронировать. Для этого нужно делать соответствующие адаптеры.

Есть schema.org, NLWeb, MCP, A2A – это элементы новой концепции. Думаю, скоро появится отдельная бэкофис-интеграция в Google и OpenAI. Здесь нужно перестать мыслить "сайтами". Сайт – устаревший старый адаптер в новый интернет.

2. Бизнес должен продавать себя не людям, а AI-системам

Если AI–агент решает, что показать человеку, бизнесу нужно продавать себя агенту. Задача – сформировать в интернете мнение о своем бизнесе, которое схавают агенты.

SEO превращается в GEO – Generative Engine Optimization. Уже наблюдаем много "агентств нового поколения" которые продвигают бизнес в условном ChatGPT: раз, два

Есть проблема второго рода: интернет ещё больше наполнится фейковыми отзывами и обзорами. Вероятно, придет эпоха валидированных отзывов, или будет перерождение обратной связи от пользователей в принципе.

Для ловких бизнесов это пространство возможностей правильно оседлать новую волну. Для ловких ребят – пространство возможностей создать бизнесы на рукоятках для лопат.
🔥26🤔11🤡4🥱42