Исследователи AI VK открыли доступ к масштабному датасету VK-LSVD для развития рекомендательных систем. В нём собраны 40 млрд обезличенных взаимодействий пользователей с короткими видео (январь–июнь 2025), 20 млн роликов с метаданными и эмбеддингами, а также данные о 10 млн пользователей с соцдем-признаками.
Формат коротких видео удобен для исследований: много фидбека за сессию, чёткая атрибуция реакций и высокая корреляция оффлайн-оценок с онлайном. VK-LSVD позволяет гибко формировать выборку под конкретные задачи и доступные мощности, что делает его полезным как для академических исследований, так и для индустриальных экспериментов.
Датасет уже доступен по ссылке, а скоро на его базе пройдёт открытое соревнование для инженеров.
Gemini 2.5 Flash Image, появившаяся под промо-именем Nano-Banana, заняла первые места на LMArena в ряде категорий, включая общую производительность, креативность, инфографику и работу с персонажами и объектами. Модель принимает на вход как текст, так и изображения (можно подать несколько картинок). Пользователи отмечают хорошую работу модели со шрифтами и качественное комбинирование нескольких изображений в одно.
Модель доступна через Gemini API и Google AI Studio, а также бесплатно через Gemini App.
Компания Salesforce разработала бенчмарк, на котором можно протестировать, насколько LLM хорошо справляется с задачами, требующими использования MCP. Авторы собрали 231 задачу из 6 разных доменов: навигация по картам, управление репозиториями с кодом, финансовый анализ, 3D-проектирование, автоматизация браузера и веб-поиск. Часть задач требует многократного обращения к MCP-серверу, т.е. модель должна хорошо уметь работать с длинным контекстом.
Результаты показали, что GPT-5 лидирует с большим отрывом, но справляется при этом менее чем с 50% задач. Лучшей опенсорсной моделью оказалась GLM-4.5.
ZenFlow — это новое расширение традиционного фреймворка DeepSeed. Решение сокращает время простоя GPU при обучении LLM на 85%, разделяя градиенты по важности: приоритетные обновляются сразу на GPU, остальные — асинхронно на CPU: пока графический процессор занят, градиенты из текущей или предыдущей итерации передаются на CPU по выделенному потоку PCIe. Такой подход с полным перекрытием всех операций ускоряет обучение в среднем в 5 раз по сравнению с DeepSpeed ZeRO-Offload. Решение доступно на GitHub.
xAI выпустил новую модель Grok Code Fast 1 для кодирования. Модель на 314 миллиардов параметров поддерживает контекст до 256К токенов и может генерировать до 92 токенов в секунду. Разработчики позиционируют модель как инструмент решения базовых задач разработки: она отлично подойдет, например, для создания веб-приложений и быстрой разработки прототипов.
Стоимость модели составляет всего $0,2 за 1 млн входных токенов и $1,5 за 1 млн выходных.
В Qoder доступно два режима работы: Agent Mode и Quest Mode. В Agent Mode платформа Qoder выступает в роли помощника по написанию кода, что подойдет для базовых задач и быстрых правок. В режиме Quest Mode помощник Qoder автономно работает с кодовыми базами по развёрнутому техзаданию. Qoder составляет план работы, отмечает выполненные задачи в to-do листе, автоматизирует тестирование и валидацию, может составить документацию по уже существующим проектам. Система поддерживает MCP.
Новый инструмент пополняет ряды IDE с ИИ и конкурирует с другими системами, такими как Cursor и Windsurf.
На период беты Qoder доступен полностью бесплатно.
#дайджест #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤19🔥17👍5 4🍾1
Media is too big
VIEW IN TELEGRAM
Запись встречи уже можно посмотреть!
#ридинггруппа #aivk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16👍14🔥4 2😎1
Как мы переработали архитектуру item2item-отбора кандидатов?
Наша рекомендательная система обрабатывает миллионы запросов в секунду и использует сотни тысяч ядер. Мы нашли способ в десять раз уменьшить объём занимаемой памяти и при этом повысить Timespent на 4%. Рассказываем, как именно мы это сделали.
За подробностями — сюда.
Наша рекомендательная система обрабатывает миллионы запросов в секунду и использует сотни тысяч ядер. Мы нашли способ в десять раз уменьшить объём занимаемой памяти и при этом повысить Timespent на 4%. Рассказываем, как именно мы это сделали.
За подробностями — сюда.
👍19🔥12❤8🎉2 2
Media is too big
VIEW IN TELEGRAM
Собрали всю RecSys-тусовку: говорили о будущем рекомендаций, технологиях глубокого понимания контента и не только. Ну и, конечно, было много нетворкинга.
Музыка, диджей-сеты, игры, в том числе не обошли стороной турнир по су-е-фа.
#aivk #aivkpro
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21❤16💅4👏3 3
Мы знаем несколько успешных технологий, название которых начинается со слова one: one-nio, one-cloud, one ring to rule them all. В июле этого года исследователи из Kuaishou выпустили технический отчёт о большой рекомендательной модели OneRec. Так как размер этого отчета 40 страниц (и технологии с префиксом one занимают особое место в нашем сердце), мы решили сделать расширенный разбор.
До конца сентября ридинг-группа AI VK будет собираться каждую неделю, чтобы подробно разобраться с OneRec. Обсудим не только сам репорт, но и сопутствующие статьи:
🔹 MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies
🔹 MiniCPM4: Ultra-Efficient LLMs on End Devices
🔹 BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models
🔹 Large Scale Product Graph Construction for Recommendation in E-commerce
🔹 QARM: Quantitative Alignment Multi-Modal Recommendation at Kuaishou
🔹 TWIN V2: Scaling Ultra-Long User Behavior Sequence Modeling for Enhanced CTR Prediction at Kuaishou
🔹 Pantheon: Personalized Multi-objective Ensemble Sort via Iterative Pareto Policy Optimization
🔹 OneRec Technical Report
🔹 На ближайшей встрече 11 сентября в 17:00 обсудим первые три статьи. Приходите, будет интересно!
Зум: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
До конца сентября ридинг-группа AI VK будет собираться каждую неделю, чтобы подробно разобраться с OneRec. Обсудим не только сам репорт, но и сопутствующие статьи:
Зум: ссылка
ID: 707 776 9330
Код: 464167
Параллельно запустим стрим прямо в канале AI VK Hub.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27❤12 3👍2🤩1
С развитием нейросетей увеличивается и число исследований, изучающих их слабые места. Недавно одно из таких исследований провели мы — выяснили, насколько эффективно можно сбивать большие модели, даже не имея доступа к ним.
Мы перенесли атаку с визуального энкодера на всю мультимодальную модель. Рассказываем, как именно работает такой подход и что у нас получилось. Более подробный материал — по ссылке.
Мы перенесли атаку с визуального энкодера на всю мультимодальную модель. Рассказываем, как именно работает такой подход и что у нас получилось. Более подробный материал — по ссылке.
❤17👍12🔥10 2🙏1
AI VK Hub
Мы знаем несколько успешных технологий, название которых начинается со слова one: one-nio, one-cloud, one ring to rule them all. В июле этого года исследователи из Kuaishou выпустили технический отчёт о большой рекомендательной модели OneRec. Так как размер…
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍8💅3🍾1 1