Media is too big
VIEW IN TELEGRAM
Обсудили, как модель предсказывает интенты и интересы пользователя, генерирует и ранжирует кандидатов, а также формирует объяснения к рекомендациям. Поговорили о плюсах подхода, его практических ограничениях и том, насколько он действительно способен заменить традиционный стек RecSys.
Запись встречи уже ждёт вас!
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥10👍5👏2💅1
Большинство современных рекламных и рекомендательных систем используют многостадийную архитектуру (MCA):
1. быстрая генерация пула кандидатов;
2. последующее ранжирование тяжёлой моделью.
Этот подход масштабируем, но имеет системные недостатки:
🟣 несогласованность оптимизационных целей между стадиями;
🟣 смещение распределений пользователей и айтемов;
🟣 падение качества финальных рекомендаций, доходности и UX.
Исследователи из Meituan предлагают решение — UniROM, первую промышленную end-to-end архитектуру, которая заменяет весь каскад одной моделью, генерирующей финальный список объявлений сразу из полного пула кандидатов в Location-Based Services.
Детали
UniROM состоит из двух основных модулей:
1. RecFormer
Моделирует интересы пользователя и externalities между объявлениями:
🟣 Global Cluster-Former — снижает сложность с 𝑂(𝑁*𝑁) до 𝑂(𝑁*𝐶), где С — число кластеров;
🟣 Mid-Fusion Interest Former — балансирует между ранним и поздним объединением признаков, учитывая намерения пользователя.
2. AucFormer
Генерирует финальный список объявлений. Характерные особенности:
🟣 non-autoregressive присвоение позиций;
🟣 permutation-aware оценка pCTR/pCVR;
🟣 отдельная payment-network для корректного ценообразования в аукционе.
Обучение — двухэтапное:
1. обучение pCTR на реальных логах;
2. дообучение через RL для оптимизации аукциона и соблюдения IC/IR-ограничений.
Результаты
UniROM применили для ранжирования рекламных объявлений в городских сервисах — на один запрос приходится около 100 000 кандидатов.
Оффлайн-эксперименты показали:
🟣 Recall@50 ↑ +20.4%
🟣 AUC ↑ +1.48%
🟣 eCTR ↑ +8.3%
🟣 eRPM ↑ +11.4%
Онлайн A/B-тесты (7 дней):
🟣 CTR ↑ +5.2%
🟣 RPM ↑ +13.6%
🟣 ROI рекламодателей ↑ +3.1%
При этом задержка выросла всего на 2.2%, несмотря на обработку пула кандидатов, увеличенного в сотни раз.
Итог: модель одновременно улучшила доход платформы, пользовательский опыт и эффективность рекламодателей — редкое сочетание для рекламных систем.
Заключение
UniROM демонстрирует, что end-to-end ранжирование может успешно заменить классическую каскадную архитектуру в реальной индустриальной среде. Такой подход:
🟣 убирает рассинхрон между стадиями;
🟣 учитывает externalities между объявлениями;
🟣 снижает зависимость от ручного feature engineering;
🟣 улучшает бизнес-показатели без серьёзного роста задержек.
Открытым остаётся вопрос масштабирования: можно ли распространить подход с 100k кандидатов до уровней, где речь идёт о десятках-сотнях миллионов?
Если это удастся, UniROM способен изменить стандарт разработки рекомендательных и рекламных систем глобального масштаба.
Обзор статьи подготовлен командой AI VK
#обзорстатьи
1. быстрая генерация пула кандидатов;
2. последующее ранжирование тяжёлой моделью.
Этот подход масштабируем, но имеет системные недостатки:
Исследователи из Meituan предлагают решение — UniROM, первую промышленную end-to-end архитектуру, которая заменяет весь каскад одной моделью, генерирующей финальный список объявлений сразу из полного пула кандидатов в Location-Based Services.
Детали
UniROM состоит из двух основных модулей:
1. RecFormer
Моделирует интересы пользователя и externalities между объявлениями:
2. AucFormer
Генерирует финальный список объявлений. Характерные особенности:
Обучение — двухэтапное:
1. обучение pCTR на реальных логах;
2. дообучение через RL для оптимизации аукциона и соблюдения IC/IR-ограничений.
Результаты
UniROM применили для ранжирования рекламных объявлений в городских сервисах — на один запрос приходится около 100 000 кандидатов.
Оффлайн-эксперименты показали:
Онлайн A/B-тесты (7 дней):
При этом задержка выросла всего на 2.2%, несмотря на обработку пула кандидатов, увеличенного в сотни раз.
Итог: модель одновременно улучшила доход платформы, пользовательский опыт и эффективность рекламодателей — редкое сочетание для рекламных систем.
Заключение
UniROM демонстрирует, что end-to-end ранжирование может успешно заменить классическую каскадную архитектуру в реальной индустриальной среде. Такой подход:
Открытым остаётся вопрос масштабирования: можно ли распространить подход с 100k кандидатов до уровней, где речь идёт о десятках-сотнях миллионов?
Если это удастся, UniROM способен изменить стандарт разработки рекомендательных и рекламных систем глобального масштаба.
Обзор статьи подготовлен командой AI VK
#обзорстатьи
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤11👍4👏3🙈1
На ридинг-группе 18 декабря обсудим статью SilverTorch — фреймворк, призванный демократизировать применение больших рекомендательных нейросетей.
Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?
Ведущим будет Роман Болозовский, ML-инженер AI VK. Встреча начнется в 18.00.
🔹 18 декабря в 18:00
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
#ридинггруппа #aivk
Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?
Ведущим будет Роман Болозовский, ML-инженер AI VK. Встреча начнется в 18.00.
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤9💅6🙊2👏1
Улучшаем технологии ASR в сервисах VK 😎
Команда AI VK улучшает технологии преобразования речи в текст (ASR), чтобы субтитры в видео и расшифровки голосовых сообщений стали точнее. В последней версии внедрили трансформерный декодер и в разы увеличили датасет для обучения модели. Подробности и результаты — в карточках от Максима Пихенько, руководителя отдела речевых технологий.
#aivk #asr #ml
Команда AI VK улучшает технологии преобразования речи в текст (ASR), чтобы субтитры в видео и расшифровки голосовых сообщений стали точнее. В последней версии внедрили трансформерный декодер и в разы увеличили датасет для обучения модели. Подробности и результаты — в карточках от Максима Пихенько, руководителя отдела речевых технологий.
#aivk #asr #ml
🔥23❤6👏4🎉2💅2
AI VK Hub
На ридинг-группе 18 декабря обсудим статью SilverTorch — фреймворк, призванный демократизировать применение больших рекомендательных нейросетей. Правда демократизация касается только тех, у кого есть сотня-другая видеокарт NVIDIA A100. Но у кого их нет, правда?…
Начинаем через 20 минут!
Ждём вас в Zoom или на трансляции в AI VK Hub.
Zoom: ссылка
ID: 707 776 9330
Код: 464167
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤8👍3👏1
Мы подвели итоги VK RecSys Challenge 2025 — ежегодного соревнования по разработке рекомендательных алгоритмов. В этом году фокус был на одной из самых сложных задач в RecSys — cold start.
Масштаб
Задача
Участникам нужно было предсказать, кому будет интересен новый клип, даже если он ещё ни разу не показывался пользователям.
Данные
Для соревнования был открыт датасет VK-LSVD:
Один из крупнейших публичных датасетов для задач рекомендаций и cold start.
Формат
Награды
⠀⠀1. madgnome
⠀⠀2. Maksim Kuzin
⠀⠀3. Elves do RePlay
⠀⠀Студенческий трек:
⠀⠀1. Онего
⠀⠀2. Andrey Kuznetsov
⠀⠀3. maxvol goes brrr
VK RecSys Challenge — это не только соревнование, но и способ посмотреть, какие подходы к рекомендациям работают на реальных индустриальных данных и куда движется RecSys сегодня.
#RecSysChallenge #RecSys #LSVD
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾19❤9🎉7🔥5💅3
Media is too big
VIEW IN TELEGRAM
Поговорили о месте SilverTorch в экосистеме рекомендательных систем, его возможностях масштабирования, о том, какие задачи он реально закрывает, и где заявленная «демократизация» по-прежнему требует внушительных вычислительных ресурсов. Также обсудили практические кейсы использования и потенциальную ценность инструмента для команд и исследователей.
Запись ридинг-группы уже здесь — можно посмотреть в удобное время.
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍9❤6👏1🤩1
Одна из проблем классических рекомендательных систем — они хорошо улавливают поведенческое сходство пользователей, но слабо учитывают, кто именно этот пользователь и в какой социальной роли он потребляет контент. В результате рекомендации могут быть релевантны по интересам, но логически несогласованны с контекстом и ролью пользователя.
Исследователи из Уханьского университета совместно с Kuaishou Technology предложили подход Who You Are Matters, который объединяет коллаборативную фильтрацию, пространство социальных ролей и логические связи, извлечённые с помощью LLM, для более согласованного ранжирования контента.
Детали
1. Пространство социальных ролей
Авторы вводят дискретное пространство тегов, интерпретируемое как социальные роли пользователей и айтемов:
🟣 последовательность позитивных взаимодействий пользователя дополняется последовательностью тегов;
🟣 последовательности айтемов и тегов кодируются SASRec-подобной моделью для построения пользовательского эмбеддинга;
🟣 эмбеддинг айтема формируется агрегацией его тегов.
Таким образом, рекомендации зависят не только от истории кликов, но и от согласованности ролей пользователя и контента.
2. Логическое согласование с помощью LLM
Дополнительно используется LLM, который по заданным промптам строит два ориентированных графа:
🟣 U2I — логические связи от тегов пользователя к тегам айтемов;
🟣 I2U — связи в обратном направлении.
Обход этих графов позволяет получить набор тегов, логически согласованных с текущей ролью пользователя. Эти теги используются для введения штрафа за логическую несогласованность между рекомендациями модели и логикой, извлечённой LLM.
3. Обучение
Обучение ведётся с использованием:
🟣 binary cross-entropy для задачи ранжирования;
🟣 контрастивного обучения, чтобы похожие пользователи и айтемы имели согласованные теги.
Результаты
Модель протестирована как в оффлайн-экспериментах, так и в промышленной системе видеорекомендаций.
🟣 В A/B-тестах получен рост положительных взаимодействий примерно на 0.9% или увеличение diversity выдачи на 0.1% (в зависимости от конфигурации)
🟣 В оффлайн-экспериментах на индустриальных данных и открытых датасетах Books и Movies метод показал устойчивый прирост по NDCG@K и MRR@K — от нескольких до десятков процентов по сравнению с SOTA-подходами, использующими только коллаборативный сигнал или контентные эмбеддинги.
Отдельно отмечается эффект transfer learning: пространство тегов и графы U2I/I2U, обученные на внутренних данных, успешно переносятся на открытые датасеты после выравнивания тегов, что указывает на обобщаемость выученной логики.
Подход демонстрирует, что интеграция социальных ролей и логических ограничений, извлечённых с помощью LLM, позволяет сделать рекомендации не только более точными, но и более осмысленными с точки зрения пользовательского контекста.
Обзор статьи подготовлен командой AI VK
#обзорстатьи
Исследователи из Уханьского университета совместно с Kuaishou Technology предложили подход Who You Are Matters, который объединяет коллаборативную фильтрацию, пространство социальных ролей и логические связи, извлечённые с помощью LLM, для более согласованного ранжирования контента.
Детали
1. Пространство социальных ролей
Авторы вводят дискретное пространство тегов, интерпретируемое как социальные роли пользователей и айтемов:
Таким образом, рекомендации зависят не только от истории кликов, но и от согласованности ролей пользователя и контента.
2. Логическое согласование с помощью LLM
Дополнительно используется LLM, который по заданным промптам строит два ориентированных графа:
Обход этих графов позволяет получить набор тегов, логически согласованных с текущей ролью пользователя. Эти теги используются для введения штрафа за логическую несогласованность между рекомендациями модели и логикой, извлечённой LLM.
3. Обучение
Обучение ведётся с использованием:
Результаты
Модель протестирована как в оффлайн-экспериментах, так и в промышленной системе видеорекомендаций.
Отдельно отмечается эффект transfer learning: пространство тегов и графы U2I/I2U, обученные на внутренних данных, успешно переносятся на открытые датасеты после выравнивания тегов, что указывает на обобщаемость выученной логики.
Подход демонстрирует, что интеграция социальных ролей и логических ограничений, извлечённых с помощью LLM, позволяет сделать рекомендации не только более точными, но и более осмысленными с точки зрения пользовательского контекста.
Обзор статьи подготовлен командой AI VK
#обзорстатьи
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤6👍6😁1🎉1
Всем привет!
Вышло большое интервью с Андреем Зимовновым, руководителем направления рекомендаций AI VK, в котором он подробно рассказывает про рекомендации, метрики, подходы и векторы будущего развития отрасли.
Ключевые тезисы, которые будут особенно полезны ML-инженерам:
➡️ Рекомендательная система как продукт. В VK подход к развитию рекомендательной системы идентичен подходу к разработке отдельного продукта, у которого есть свои свойства и акторы.
➡️ Баланс метрик важнее time spent. Важно развивать все свойства рекомендаций, а не ориентироваться только на time spent. Иногда улучшение качества рекомендаций, то есть точное попадание в сиюминутный интерес пользователя, может снижать time spent.
➡️ Discovery-платформа — фундамент для рекомендаций, поиска и рекламы. Она формирует точные профили интересов каждого пользователя, помогает быстрее запускать модели.
➡️ Мультимодальные модели и технологии глубокого понимания контента. Современные мультимодальные модели учатся улавливать тонкие смыслы в контенте, эмоции, настроение. В какой-то перспективе алгоритмы рекомендаций научатся понимать и сарказм.
➡️ Переоценённые тренды и будущее рекомендаций. Reinforcement Learning всё ещё считается перспективным, но пока не показывает значимых практических преимуществ в рекомендациях. Потенциал — диалоговые рекомендации, когда пользователь взаимодействует с рекомендациями на естественном языке.
🔗 Читайте полное интервью здесь
#recsys #discovery #aivk
Вышло большое интервью с Андреем Зимовновым, руководителем направления рекомендаций AI VK, в котором он подробно рассказывает про рекомендации, метрики, подходы и векторы будущего развития отрасли.
Ключевые тезисы, которые будут особенно полезны ML-инженерам:
#recsys #discovery #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
Код Дурова
«Алгоритмы рекомендаций научатся понимать сарказм и учитывать настроение пользователя»: интервью с руководителем рекомендаций VK
Андрей Зимовнов о настоящем и будущем алгоритмов рекомендаций в привычных сервисах, о переоценённых трендах и следующем прорыве на этом поприще.
🔥19❤15👍3👏3💅2
Привет, коллеги! 🎄
Перед праздниками делимся с вами подборкой статей от команд VK — для тех, кто работает с ML-системами в продакшне, интересуется рекомендациями, поиском, мультимодальностью и данными «в бою», а не в вакууме.
➡️ Датасет VK-LSVD: как тестировать рекомендательные алгоритмы на реальных данных
Рассказываем про VK-LSVD — открытый датасет для оценки рекомендательных систем, на базе которого прошёл VK RecSys Challenge 2025. В статье подробно разобрали, как формировался датасет, какие сценарии пользовательского поведения он покрывает, какие метрики используются и какие ограничения важно учитывать при офлайн-оценке. Полезно для тех, кто проектирует или валидирует recsys-пайплайны и хочет сравнивать модели в условиях, близких к реальному продукту.
➡️ Что такое шопсы и как мы размечаем shoppable-контент
Глубокий разбор того, как устроена разметка коммерческого контента в соцсети: от определения сущностей и таксономии до процессов контроля качества и масштабирования разметки. Авторы показывают, почему разметка — это не «вспомогательная» задача, а ключевой элемент ML-систем, влияющий на обучение моделей, их устойчивость и бизнес-метрики. Материал особенно полезен для тех, кто работает с CV, мультимодальностью и e-commerce-сценариями.
➡️ MARKER: собираем русскоязычный мультимодальный датасет для оценки VLM
Практический кейс создания датасета для оценки vision-language моделей в русскоязычном контексте. В статье — мотивация, принципы дизайна заданий, сложности с лингвистическими и визуальными искажениями, а также выводы о том, почему прямой перенос англоязычных бенчмарков плохо работает. Отличное чтиво для тех, кто занимается VLM, мультимодальными LLM или оценкой качества моделей за пределами English-first мира.
➡️ Рекомендации историй ВКонтакте: от простой эвристики до ML-системы
Эволюция рекомендательной системы сторис: от базовых правил и эвристик к полноценной ML-архитектуре. Степан Малькевич, руководитель команды рекомендаций ленты ВКонтакте, подробно описывает этапы развития, проблемы роста, работу с холодным стартом, сигналами вовлечённости и онлайновыми ограничениями. Статья хорошо показывает, как реальные продуктовые требования формируют архитектуру ML-системы и почему «идеальная модель» редко возможна в продакшене.
➡️ Как мы внедряли семантический поиск по сообществам ВКонтакте: про раков, астрологию и затянувшийся таймлайн проекта
Честный рассказ о внедрении семантического поиска: от первых прототипов до интеграции в продукт. В статье много про организационные и технические сложности — выбор моделей, качество эмбеддингов, работу с шумными данными, инфраструктурные ограничения и постоянные изменения требований. Особенно ценно для тех, кто запускает semantic search или retrieval-системы в больших продуктах и хочет понимать реальные риски и компромиссы.
🎁 Пусть эти материалы станут полезным чтением на длинных выходных — или источником идей для новых ML-экспериментов в следующем году
#aivk #статьи
Перед праздниками делимся с вами подборкой статей от команд VK — для тех, кто работает с ML-системами в продакшне, интересуется рекомендациями, поиском, мультимодальностью и данными «в бою», а не в вакууме.
Рассказываем про VK-LSVD — открытый датасет для оценки рекомендательных систем, на базе которого прошёл VK RecSys Challenge 2025. В статье подробно разобрали, как формировался датасет, какие сценарии пользовательского поведения он покрывает, какие метрики используются и какие ограничения важно учитывать при офлайн-оценке. Полезно для тех, кто проектирует или валидирует recsys-пайплайны и хочет сравнивать модели в условиях, близких к реальному продукту.
Глубокий разбор того, как устроена разметка коммерческого контента в соцсети: от определения сущностей и таксономии до процессов контроля качества и масштабирования разметки. Авторы показывают, почему разметка — это не «вспомогательная» задача, а ключевой элемент ML-систем, влияющий на обучение моделей, их устойчивость и бизнес-метрики. Материал особенно полезен для тех, кто работает с CV, мультимодальностью и e-commerce-сценариями.
Практический кейс создания датасета для оценки vision-language моделей в русскоязычном контексте. В статье — мотивация, принципы дизайна заданий, сложности с лингвистическими и визуальными искажениями, а также выводы о том, почему прямой перенос англоязычных бенчмарков плохо работает. Отличное чтиво для тех, кто занимается VLM, мультимодальными LLM или оценкой качества моделей за пределами English-first мира.
Эволюция рекомендательной системы сторис: от базовых правил и эвристик к полноценной ML-архитектуре. Степан Малькевич, руководитель команды рекомендаций ленты ВКонтакте, подробно описывает этапы развития, проблемы роста, работу с холодным стартом, сигналами вовлечённости и онлайновыми ограничениями. Статья хорошо показывает, как реальные продуктовые требования формируют архитектуру ML-системы и почему «идеальная модель» редко возможна в продакшене.
Честный рассказ о внедрении семантического поиска: от первых прототипов до интеграции в продукт. В статье много про организационные и технические сложности — выбор моделей, качество эмбеддингов, работу с шумными данными, инфраструктурные ограничения и постоянные изменения требований. Особенно ценно для тех, кто запускает semantic search или retrieval-системы в больших продуктах и хочет понимать реальные риски и компромиссы.
#aivk #статьи
Please open Telegram to view this post
VIEW IN TELEGRAM
❤17🔥12👍5👏2💅2
Всем привет!
Начинаем 2026-й с краткого обзора того, чем 2025 год стал для AI-индустрии — фокус на технологии, инфраструктуру и инженерные последствия.
📌 Итоги 2025: что важно запомнить
🟣 AI стал системной технологией, а не экспериментом
Time назвал «Человеком года» не одного лидера, а коллективный образ — Architects of AI. ИИ перешёл из R&D в основу стратегий крупнейших техкомпаний.
🛍 Социальная коммерция: соцсети + e-commerce
➡️ Конвергенция платформ
🟣 Покупки в ленте через AI-рекомендации и интерактивные форматы → ВКонтакте появился новый формат — шопсы
🟣 Лайв-шоппинг и встроенные витрины стали стандартом видеоплатформ: TikTok Shop уже привлёк 200 000+ малых бизнесов в Великобритании.
Соцсети становятся AI-driven коммерческими экосистемами с нативной конверсией.
⚙️ Мультимодальные модели — из R&D в продакшен
➡️ В 2025 мультимодальные модели вышли в продукты: рынок ≈ $2,5 млрд, CAGR ~37%
🟣 Мультимодальные модели используются для построения контентных эмбеддингов видеороликов (видео + звук + текст), которые затем применяются в рекомендациях VK
🟣 On-device AI: рост локальных мультимодальных моделей — Google Gemma 3n выполняет задачи прямо на смартфонах при ограниченной памяти
🚀 LLM: многополярный мир
➡️ Конец монополий
OpenAI, Google (Gemini), Anthropic — больше не единственные.
Китай догнал западные модели по качеству, стал лидером опенсорса, Kimi K2 — №1 среди open-source моделей (artificialanalysis.ai)
➡️ Reasoning стал стандартом
Модели берут сложные бенчмарки (Humanity’s Last Exam), растёт качество reasoning-сценариев (код, анализ).
➡️ Ускорение прогресса
По данным Epoch AI, темпы улучшения топ-моделей почти удвоились.
➡️ Россия: крупные, но точечные апдейты
🖼 Визуал: редактирование стало нормой
➡️ Генерация → редактирование изображений
Поворотный момент — GPT Image 1 (март 2025).
Дальше рынок быстро стандартизировал:
🟣 multi-image input
🟣 сохранение портретного сходства
🟣 корректный текст на изображениях (включая русский)
К концу года — Flux, Nano Banana, Qwen Image Edit и др. как стандартные инструменты.
➡️ Видео: звук, персонажи, сцены
Модели обучились:
🟣 синхронной речи и звуку
🟣 удержанию сцен
🟣 вертикальным форматам
Лидеры:
🟣 США: Sora 2, Veo 3.1, Runway Gen-4.5
🟣 Китай: Kling 2.6, Wan 2.6, Seedance 1.5 Pro
В опенсорсе доминирует Китай; Kandinsky 5.0 — №1 LMArena.
🤖 Агентные системы — новая архитектурная норма
➡️ AI-агенты перестали быть фичей:
🟣 оформились как архитектура: планирование, tool-calling, автономные цепочки
🟣 одновременно проявились ключевые риски — безопасность, стоимость, контроль
➡️ Vibe coding стал массовым
Термин Андрея Карпатого быстро превратился в практику:
🟣 описание цели → агент пишет код
🟣 резкое снижение порога входа
Для инженеров это означает новые риски:
🟣 рост техдолга
🟣 потерю понимания системы
🟣 усложнение поддержки и отладки
🖥 Браузеры = AI-агенты
➡️ Сдвиг от поиска к действиям
Браузеры движутся в сторону: аналитики, работы с историей, агентских действий (формы, бронирования, покупки)
➡️ Цена удобства — безопасность
Промпт-инъекции и смежные атаки становятся системным риском.
👆 Инфраструктура: главный bottleneck
➡️ Nvidia — $5 трлн капитализации
ИИ-чипы — стратегический ресурс, конкурентов по масштабу нет.
➡️ Упёрлись не только в чипы
Ключевые ограничения: энергия, сети, датацентры.
Массовое строительство ЦОД и повторное использование тепла (ЕС, США) — долгосрочный тренд.
📎 Слова года — маркеры реальности
🟣 Vibe coding — новый стиль разработки
🟣 Slop — индустриальный ИИ-шум и мусорный контент
🟣 В РФ: «промпт», «слоп» — официально зафиксированы языковыми институтами
Вывод
2025 год дал не только технологический рывок, но и чёткое понимание ограничений ИИ.
Фундамент заложен. Дальше — инженерия, контроль и зрелые практики, а не бесконечный хайп.
#дайджест #aivk #итоги2025
Начинаем 2026-й с краткого обзора того, чем 2025 год стал для AI-индустрии — фокус на технологии, инфраструктуру и инженерные последствия.
Time назвал «Человеком года» не одного лидера, а коллективный образ — Architects of AI. ИИ перешёл из R&D в основу стратегий крупнейших техкомпаний.
Соцсети становятся AI-driven коммерческими экосистемами с нативной конверсией.
OpenAI, Google (Gemini), Anthropic — больше не единственные.
Китай догнал западные модели по качеству, стал лидером опенсорса, Kimi K2 — №1 среди open-source моделей (artificialanalysis.ai)
Модели берут сложные бенчмарки (Humanity’s Last Exam), растёт качество reasoning-сценариев (код, анализ).
По данным Epoch AI, темпы улучшения топ-моделей почти удвоились.
Поворотный момент — GPT Image 1 (март 2025).
Дальше рынок быстро стандартизировал:
К концу года — Flux, Nano Banana, Qwen Image Edit и др. как стандартные инструменты.
Модели обучились:
Лидеры:
В опенсорсе доминирует Китай; Kandinsky 5.0 — №1 LMArena.
Термин Андрея Карпатого быстро превратился в практику:
Для инженеров это означает новые риски:
Браузеры движутся в сторону: аналитики, работы с историей, агентских действий (формы, бронирования, покупки)
Промпт-инъекции и смежные атаки становятся системным риском.
ИИ-чипы — стратегический ресурс, конкурентов по масштабу нет.
Ключевые ограничения: энергия, сети, датацентры.
Массовое строительство ЦОД и повторное использование тепла (ЕС, США) — долгосрочный тренд.
Вывод
2025 год дал не только технологический рывок, но и чёткое понимание ограничений ИИ.
Фундамент заложен. Дальше — инженерия, контроль и зрелые практики, а не бесконечный хайп.
#дайджест #aivk #итоги2025
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23❤16👍9👏2💅1
Data Ёлка 2026 — одно из ключевых событий года для ML и Data Science сообщества
24 января VK и ODS проведут Data Ёлку одновременно в Москве, Санкт-Петербурге и онлайн. Программа пройдёт в формате «стерео»: один трек — глубокие инженерные разборы RecSys, NLP, MLOps, CodeGen и других направлений, второй — прикладные инсайты и обсуждение главных технологических трендов индустрии.
🏆 Отдельный блок посвящен разбору лучших сабмитов VK RecSys Challenge и награждению победителей соревнования по рекомендательным системам на датасете VK-LSVD. Ведущий — Александр Пославский, руководитель отдела рекомендательных технологий AI VK.
👤 Владимир Байкалов, ведущий исследователь AI VK подведет итоги года в RecSys.
👤 Степан Малькевич, руководитель группы рекомендаций Ленты ВКонтакте AI VK, расскажет про современные алгоритмические ленты контента в социальных сетях.
Также у микрофона эксперты Сбера, МТС, Авито, Газпром нефти, ИТМО и других ведущих команд.
Регистрация на мероприятие открыта до 22 января включительно:
➡️ Москва
➡️ Санкт-Петербург
#DataЁлка2026 #RecSysChallenge #RecSys #LSVD
24 января VK и ODS проведут Data Ёлку одновременно в Москве, Санкт-Петербурге и онлайн. Программа пройдёт в формате «стерео»: один трек — глубокие инженерные разборы RecSys, NLP, MLOps, CodeGen и других направлений, второй — прикладные инсайты и обсуждение главных технологических трендов индустрии.
Также у микрофона эксперты Сбера, МТС, Авито, Газпром нефти, ИТМО и других ведущих команд.
Регистрация на мероприятие открыта до 22 января включительно:
#DataЁлка2026 #RecSysChallenge #RecSys #LSVD
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23🔥10👍7💅3👏1