[29/100] Витя Тарнавский
5.97K subscribers
141 photos
26 videos
2 files
172 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Рекламу не даю

@the_real_jkee
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🔥4213💅12
This media is not supported in your browser
VIEW IN TELEGRAM
Все видели громкую историю про обнимающихся CEO + HRD из компании Astronomer на концерте Coldplay?

Какой-то чел успел завайбкодить игру «найди ceo+hrd» на Vercel 🤡

Эффект Барбары Стрейзанд вышел из под контроля )

Поиграть можно тут
🔥78💅1913
Смешная история была на выкладке T-Pro

Открываем для скачивания модельки и видим почти 30к скачиваний буквально через пару часов 😳 Причем только на GGUF – формате для запуска моделей локально на своём устройстве. На остальных ссылках до 500 загрузок.

В результате разборок раскопали, что нас выложил Бэкдор – 2 млн подписчиков – с ссылкой именно на эту версию. И эти люди ломанулись качать себе искусственный интеллект 🤡

Кстати, выложили развернутые бенчмарки на хабр. Тех репорт тоже будет, пишем!
Please open Telegram to view this post
VIEW IN TELEGRAM
💅33🔥16🤡73🥱3
🥳 Выкладываем T-One: открытая потоковая ASR модель для телефонии

Распознать хорошее аудио в оффлайне сегодня – не проблема. Берём какой-нибудь whisper и полетели.

А вот на плохих телефонных каналах всё довольно сложно. 8 килогерц, пшш-пшш, эхо и прочие беды. Для нас это задача типичная, и у нас получается её хорошо решать. Мы решили поделиться наработками.

Модель называется T-One, и это потоковая модель для телефонии. Она супер компактная, быстрая, и адаптирована для телефонных каналов.

→ Потоковая модель
→ 70M параметров, это в 50 раз меньше whisper-large-v3
→ В 2-3 раза (!) лучше WER чем у whisper-large-v3 на телефонных каналах (бенчи)
→ 300 ms чанк данных, можно строить realtime системы
→ Apache 2.0

Читайте крутой развернутый тех репорт на хабре
Качать как обычно на нашем Hugging Face
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥10623🤔3🤡3🥱2
Channel name was changed to «[29/100] Витя Тарнавский»
На T-Pro 2.0 мы потратили всего 120 млн ₽

В эту сумму входит всё: пол-года R&D, удачные и неудачные запуски обучения, стоимость датасетов. Для моделей такого уровня это очень скромно и эффективно.

Финальный прогон – 2.6 млн ₽. Большая разница – норма: нужна широкая сетка экспериментов, чтобы подобрать подход, датамикс и параметры.

Для сравнения: стоимость финального прогона для GPT-4 оценивается примерно в $40 млн (~3 млрд ₽). Да, в 1000 раз больше 😳 Яндекс ещё в 2023 тратил на генеративки больше 10 млрд/год; у Сбера масштабы ещё больше.

Конечно, мы не обучаем модели с нуля. Чтобы мы уложились в 120 млн, Alibaba сожгла миллиарды. Но какой смысл обучать с нуля?

Теперь вы можете взять наши запакованные в T-Pro 120 млн и строить своё – ещё дешевле 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14439🤡10
Это Матвей и он проиграл в споре 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
1172🤡57🔥31💅25
Forwarded from Записки C3PO
Только недавно заметил, что подписчиков стало больше 4к. А ведь помню, как пару месяцев назад было всего 700. Сначала подумал: «Зачем мистер Андерсон вас столько?!», а потом подумал, как типичный капиталист, воспользоваться вами и похантить, так как знаю, что среди вас много крутанов.

В связи с этим - пачка горячих и крутых вакансий ко мне в команду делать лучшее, что можно вообще делать сейчас (да-да, это не обман). В AI-центре Т-Банка мы работаем над задачами, которые находятся на переднем краю мирового продуктового AI прогресса. Здесь есть сложные проблемы, которые нельзя решить просто накрутив промпт к GPT - нужно думать головой и строить собственные и нетривиальные решения. У нас есть ресурсы для экспериментов, свои LLM и главное - задачи, над которыми реально интересно работать, и возможность видеть результат этой работы в продуктах, которыми пользуются люди прямо сейчас.

Group EM во Вселенную Ассистентов - возглавить команду (20+ человек) и их EM'ов , чтобы строить AI-ассистентов, которые изменят то, как люди взаимодействуют с банком и не только
Staff MLE во Вселенную Ассистентов - делать серьезное машинное обучение для ассистентов, которые реально понимают пользователей и помогают им решать их ежедневные задачи
Lead Product Manager в Поиск - трансформировать поиск в экосистеме Т с командой 40+ человек
Analytics Lead в Поиск - копать данные и находить инсайты, которые покажут, как люди на самом деле ищут информацию в банке
Product Manager в Поиск - взять кусок поиска в свои руки и довести его до ума, работая с конкретной вертикалью
Product Manager CallsAI - создавать AI, который понимает контекст каждого звонка в Т-Мобайл и помогает решать задачи клиентов быстрее и точнее

Если хотите работать над нетривиальными AI-задачами, где нужно думать, а не копировать чужие решения - пишите. У нас классная команда, интересные задачи, которые заставляют расти, и нет времени на бессмысленную суету.
23🔥15💅8🤡1
Agentic Web: Business

Продолжаю серию #agenticweb

Для бизнесов прежде всего меняется привлечение клиентов. Если вчера пользователь сам гуглил «ремонт квартиры», то завтра это сделает агент – а потом и забронирует.

Что делать?

1. Бизнес должен быть AI-доступным

AI должен уметь легко считать твой оффер. В будущем – AI должен легко уметь делать действия. Например, бронировать. Для этого нужно делать соответствующие адаптеры.

Есть schema.org, NLWeb, MCP, A2A – это элементы новой концепции. Думаю, скоро появится отдельная бэкофис-интеграция в Google и OpenAI. Здесь нужно перестать мыслить "сайтами". Сайт – устаревший старый адаптер в новый интернет.

2. Бизнес должен продавать себя не людям, а AI-системам

Если AI–агент решает, что показать человеку, бизнесу нужно продавать себя агенту. Задача – сформировать в интернете мнение о своем бизнесе, которое схавают агенты.

SEO превращается в GEO – Generative Engine Optimization. Уже наблюдаем много "агентств нового поколения" которые продвигают бизнес в условном ChatGPT: раз, два

Есть проблема второго рода: интернет ещё больше наполнится фейковыми отзывами и обзорами. Вероятно, придет эпоха валидированных отзывов, или будет перерождение обратной связи от пользователей в принципе.

Для ловких бизнесов это пространство возможностей правильно оседлать новую волну. Для ловких ребят – пространство возможностей создать бизнесы на рукоятках для лопат.
🔥26🤔11🤡4🥱42
40🤡30🔥12🤔6💅4
[29/100] Витя Тарнавский
Photo
o3 кстати справился! Сразу видно, что более мощный интеллект 🤡
1🤡6820🔥9💅4
Ребят, кто пропустил, срочно смотрите и готовьте платки

The Remarkable Life of Ibelin

Документалка про подростка-инвалида который постепенно умирает и всю свою жизнь играл в комп. С точки зрения родителей это была грустная несчастная жизнь без друзей и общества.

После смерти родители выяснили что играл он в WoW и у него там огромная жизнь с друзьями и отношениями. И фильм - про это.

Реальные съёмки и врезки виртуальной жизни прямо внутри движка WoW.

Я рыдал весь фильм, а я между прочим в самолете летел 🫠

IMDB | Netflix
90🥱9🔥6🤡4💅2
В GPT-5 теперь можно выбрать модель.

Да, внутри модели можно выбрать модель 🫠 потому что мы не уверены правильную ли модель выбрала наша модель 🫠

Это временная заглушка. Реальные подобные сервисы эволюционируют в сложные параллельно-последовательные каскады разных моделей.

Но слово “model” пора уже перепридумать в контексте пользовательских продуктов. Есть AI-сервис, есть модели внутри.

Хожу в AI, а внутри модели? Хожу в модель, а внутри рабы? Предлагайте!
🤡19💅9🤔63🔥1
Вышло короткое интервью с моим участием про инвестиции в AI для компаний.

- Как понять сколько нужно тратить денег на развитие AI?
- Как правильно определить задачу?
- Как выстраивать AI-функцию?
- Как считать эффективность и стоимость?
- Зачем бигтехам нужна наука в AI?

Отвечаю на эти вопросы на примере Т-Банка. Ну и немного про вайб-кодинг, конечно 🌟

Ютуб
Please open Telegram to view this post
VIEW IN TELEGRAM
23🔥15💅5🤡4
AI в экосистемах

Пытаюсь решить одну личную задачу и в очередной раз натыкаюсь: ChatGPT не может читать странички в Instagram, даже если они публичные.

Все крупные экосистемы закрыты от AI – и правилами, и антибот-системами. Универсальный внешний AI не может, например, найти лучшего кандидата, потому что он в LinkedIn.

Может казаться, что это обходится через Desktop Use, но на масштабе это переходит в юридическую плоскость и доступ всё равно закрывается. Google видит только ту часть Instagram, которую Instagram показывает.

Некоторым выгодно будет открываться. Логика такая: если ты лидер своей ниши, открываться не нужно, так как это раскрытие своего конкурентного барьера из данных. Если ты небольшой – наоборот, будь открыт ко всем.

Всё это означает интересную вещь: в каждой большой экосистеме будет свой AI для работы внутри неё. Хороший пример такого AI это Grok.

И Госуслуги, конечно. Всегда на шаг впереди.
🤔2919🔥1
Давно хотел поделиться тем, что происходит под капотом LLM Platform, которую мы строим внутри ТБанка.
Пост на грани NDA.

В какой-то момент мы осознали, что без цельного платформенного слоя любые инициативы с GenAI будут буксовать. На схеме — как раз тот каркас, который у нас сложился и который мы продолжаем развивать.
И если ещё год назад мы спорили об отдельных «кубиках», то сегодня то, что мы строим, — де-факто канонический GenAI-стек. (вот тут ещё интересная статья)

Из чего он состоит на высоком уровне:

LLM API Gateway — единая точка доступа до внутренних (qwen?) и внешних (deepseek?) моделей,
RAG Platform — конвейер для превращения любых данных в пайплайн Retrieval-Augmented Generation,
Observability Platform — прозрачность всех LLM-процессов в реальном времени,
Orchestration & automation — набор инструментов построения произвольных GenAI-пайплайнов с минимум кода,
LLM Sec — модули безопасности, политик и аудирования,
Assistant Runtime Platform — среда выполнения произвольных AI-ассистентов.

И если LLM Gateway — это нифига себе высоконагруженный модуль, на базе которого построены как внутренние, так и внешние продукты, то вот как конкретно построить единый Tools Registry, мы всё ещё размышляем и экспериментируем.
🔥3013
Взял сегодня день отпуска и целый день фигачил свои личные проекты.

Собираю умный поиск татуировщиков. Чтобы написать "хочу набить в Москве кота в наивном стиле, к кому сходить?" - и он тебе выдает топ мастеров под твой запрос.

Это актуальная проблема: мастера все в инстаграме, единых баз нет, поиска уж и подавно. Есть международные проекты, но они все кривоватые. У нас так совсем ничего, ну или я не в курсе.

За день собрал:
- Поиск аккаунтов по хэштегам (точнее, нашел что заюзать)
- Обогащение каждого из них стилями и прочими метаданными, вместе с парсером инсты
- Простой (пока что) поиск поверх этой базы

Сколько один человек сейчас может делать с нужными знаниями и инструментами - это просто анриал.

Давно себя не чувствовал таким счастливым 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
3119🔥57💅7
🤡22🥱65💅4
Replit продолжает настойчиво убирать gpt-5 🤡
🤡19💅7
Витя и пиджаки, эпизод "Наблюдательный совет альянса ИИ"
82🔥40💅26🤡9