AI VK Hub
1.95K subscribers
218 photos
13 videos
118 links
Рассказываем и показываем AI в VK 🔉
Download Telegram
Live stream finished (38 minutes)
🔹 VK выпустила датасет VK-LSVD (Large Short-Video Dataset) для развития рекомендательных систем
Исследователи AI VK открыли доступ к масштабному датасету VK-LSVD для развития рекомендательных систем. В нём собраны 40 млрд обезличенных взаимодействий пользователей с короткими видео (январь–июнь 2025), 20 млн роликов с метаданными и эмбеддингами, а также данные о 10 млн пользователей с соцдем-признаками.

Формат коротких видео удобен для исследований: много фидбека за сессию, чёткая атрибуция реакций и высокая корреляция оффлайн-оценок с онлайном. VK-LSVD позволяет гибко формировать выборку под конкретные задачи и доступные мощности, что делает его полезным как для академических исследований, так и для индустриальных экспериментов.

Датасет уже доступен по ссылке, а скоро на его базе пройдёт открытое соревнование для инженеров.

🔹 Gemini 2.5 Flash Image — новая модель Google для создания и редактирования изображений (eng | ru)
Gemini 2.5 Flash Image, появившаяся под промо-именем Nano-Banana, заняла первые места на LMArena в ряде категорий, включая общую производительность, креативность, инфографику и работу с персонажами и объектами. Модель принимает на вход как текст, так и изображения (можно подать несколько картинок). Пользователи отмечают хорошую работу модели со шрифтами и качественное комбинирование нескольких изображений в одно.

Модель доступна через Gemini API и Google AI Studio, а также бесплатно через Gemini App.

🔹Бенчмарк MPC-Universe от Salesforce для тестирования навыков работы LLM с MCP-серверами (eng)
Компания Salesforce разработала бенчмарк, на котором можно протестировать, насколько LLM хорошо справляется с задачами, требующими использования MCP. Авторы собрали 231 задачу из 6 разных доменов: навигация по картам, управление репозиториями с кодом, финансовый анализ, 3D-проектирование, автоматизация браузера и веб-поиск. Часть задач требует многократного обращения к MCP-серверу, т.е. модель должна хорошо уметь работать с длинным контекстом. 

Результаты показали, что GPT-5 лидирует с большим отрывом, но справляется при этом менее чем с 50% задач. Лучшей опенсорсной моделью оказалась GLM-4.5. 

🔹ZenFlow — новый движок для обучения LLM без простоев GPU от PyTorch (eng)
ZenFlow — это новое расширение традиционного фреймворка DeepSeed. Решение сокращает время простоя GPU при обучении LLM на 85%, разделяя градиенты по важности: приоритетные обновляются сразу на GPU, остальные — асинхронно на CPU: пока графический процессор занят, градиенты из текущей или предыдущей итерации передаются на CPU по выделенному потоку PCIe. Такой подход с полным перекрытием всех операций ускоряет обучение в среднем в 5 раз по сравнению с DeepSpeed ZeRO-Offload. Решение доступно на GitHub

🔹Grok Code Fast 1 — быстрая и экономичная модель для генерации кода от xAI (eng | ru)
xAI выпустил новую модель Grok Code Fast 1 для кодирования. Модель на 314 миллиардов параметров поддерживает контекст до 256К токенов и может генерировать до 92 токенов в секунду. Разработчики позиционируют модель как инструмент решения базовых задач разработки: она отлично подойдет, например, для создания веб-приложений и быстрой разработки прототипов. 

Стоимость модели составляет всего $0,2 за 1 млн входных токенов и $1,5 за 1 млн выходных.

🔹Alibaba анонсировал платформу Qoder — сервис для написания кода при помощи ИИ (eng | ru)
В Qoder доступно два режима работы: Agent Mode и Quest Mode. В Agent Mode платформа Qoder выступает в роли помощника по написанию кода, что подойдет для базовых задач и быстрых правок. В режиме Quest Mode помощник Qoder автономно работает с кодовыми базами по развёрнутому техзаданию. Qoder составляет план работы, отмечает выполненные задачи в to-do листе, автоматизирует тестирование и валидацию, может составить документацию по уже существующим проектам. Система поддерживает MCP.
Новый инструмент пополняет ряды IDE с ИИ и конкурирует с другими системами, такими как Cursor и Windsurf. 

На период беты Qoder доступен полностью бесплатно. 

#дайджест #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
19🔥17👍54🍾1
Media is too big
VIEW IN TELEGRAM
🔹 28 августа на ридинг-группе Алексей Кузин из DL Core RecSys (МТС) разобрал реализацию HSTU для rectools: детали, проблемы, и самое важное — действительно ли приросты двузначные.

Запись встречи уже можно посмотреть!

#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍14🔥42😎1
Как мы переработали архитектуру item2item-отбора кандидатов?

Наша рекомендательная система обрабатывает миллионы запросов в секунду и использует сотни тысяч ядер. Мы нашли способ в десять раз уменьшить объём занимаемой памяти и при этом повысить Timespent на 4%. Рассказываем, как именно мы это сделали.

За подробностями — сюда.
👍19🔥128🎉22
Media is too big
VIEW IN TELEGRAM
🔹 Показываем, как прошла первая встреча AI VK & Pro

Собрали всю RecSys-тусовку: говорили о будущем рекомендаций, технологиях глубокого понимания контента и не только. Ну и, конечно, было много нетворкинга.

Музыка, диджей-сеты, игры, в том числе не обошли стороной турнир по су-е-фа.

🔹 Полное видео с отчётом можно посмотреть здесь.

#aivk #aivkpro
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2116💅4👏33
Мы знаем несколько успешных технологий, название которых начинается со слова one: one-nio, one-cloud, one ring to rule them all. В июле этого года исследователи из Kuaishou выпустили технический отчёт о большой рекомендательной модели OneRec. Так как размер этого отчета 40 страниц (и технологии с префиксом one занимают особое место в нашем сердце), мы решили сделать расширенный разбор.

До конца сентября ридинг-группа AI VK будет собираться каждую неделю, чтобы подробно разобраться с OneRec. Обсудим не только сам репорт, но и сопутствующие статьи:

🔹MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies
🔹MiniCPM4: Ultra-Efficient LLMs on End Devices
🔹BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models
🔹Large Scale Product Graph Construction for Recommendation in E-commerce
🔹QARM: Quantitative Alignment Multi-Modal Recommendation at Kuaishou
🔹TWIN V2: Scaling Ultra-Long User Behavior Sequence Modeling for Enhanced CTR Prediction at Kuaishou
🔹Pantheon: Personalized Multi-objective Ensemble Sort via Iterative Pareto Policy Optimization
🔹OneRec Technical Report

🔹 На ближайшей встрече 11 сентября в 17:00 обсудим первые три статьи. Приходите, будет интересно!

Зум: ссылка
ID: 707 776 9330
Код: 464167

Параллельно запустим стрим прямо в канале AI VK Hub.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27123👍2🤩1
С развитием нейросетей увеличивается и число исследований, изучающих их слабые места. Недавно одно из таких исследований провели мы — выяснили, насколько эффективно можно сбивать большие модели, даже не имея доступа к ним.

Мы перенесли атаку с визуального энкодера на всю мультимодальную модель. Рассказываем, как именно работает такой подход и что у нас получилось. Более подробный материал — по ссылке.
17👍12🔥102🙏1