Data Secrets

Исследователи Яндекса разработали и внедрили в свои сервисы рекомендации нового поколения — на базе больших генеративных моделей

Алгоритмы точнее понимают контекст и подбирают релевантный контент, учитывая большее количество обезличенных действий пользователей. Тема интересная, потому что пока подобные решения есть только у Google, Netflix и нескольких других компаний в мире. Сейчас разберемся, что это значит.

В основном все рексис в мире двухэтапные: сперва одной моделью отбираются кандидаты, другая - сортирует их в выдачу. Модели обычно берутся небольшие, так как строк данных (пользователи, товары, история) в рексис просто триллионы.

Перейти от небольших моделей к большим сложный челлендж – что, исследователи, собственно, и сделали. Их новая модель называется ARGUS (AutoRegressive Generative User Sequential Modeling). Вот, в чем ее отличие:

➖ Быстрее обучается, может работать с более длинными последовательностями
➖ Масштабируется: результаты улучшаются с ростом параметров модели.
➖ Легко пересчитывается в оффлайне. Архитектура построена так, чтобы можно было работать с ней на доступном железе.

ARGUS уже внедрили в Яндекс Музыку и Маркет. Результаты говорят сами за себя:

➖Музыка стала первым сервисом, в который внедрили новые рекомендации и перевели их в онлайн. Так, пользователи стали на 20% чаще ставить лайки и добавлять себе впервые услышанные рекомендованные треки. Разнообразие рекомендаций выросло, и пользователи теперь чаще слушают рекомендованную музыку.
➖ В Маркете покупатели чаще натыкаются на полезные товары: они стали добавлять в корзину больше товаров из ленты и находить новые товары и бренды на платформе.

Подробнее можете почитать на Хабре – здесь и здесь

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤨58👍43❤18🔥8🗿6🤔5🤯3

17.7K views14:01

Data Secrets

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

Вау: Google выпустили опенсорсного агента Gemini CLI для использования ИИ прямо из терминала

Из командной строки можно будет пользоваться всеми возможностями Gemini 2.5 Pro: поиск в Интернете, обработка любых файлов, автоматизация рабочих процессов (типа отправки PR), написание кода и прочее и прочее. Контекст – 1 миллион токенов, так что вместится большинство даже самых больших проектов.

При желании можно прикрутить любой MCP. Например, генерировать прямо из терминала картинки или видео, привязать Notion/Jira или что-то еще.

Ну и самое главное – это лимиты. Абсолютно бесплатно доступно 60 запросов в минуту и 1000 в день. Приятно 🍯

github.com/google-gemini/gemini-cli

1👍123🤯49🔥36❤18❤‍🔥22

22.9K views15:08

Data Secrets

Как понять, что вы написали действительно хорошую статью: у нее есть отдельная страница в Википедии

1😁297🔥83👍39❤16🫡7🍓2🤔1

18.5K views18:33

Data Secrets

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Google анонсировали AlphaGenome – модель для понимания генетики

Она может предсказывать, какое влияние окажут те или иные изменения в ДНК.

При достаточной точности такая модель может абсолютно перевернуть наше понимание болезней и биологии в целом, потому что геном человека, по сути, управляет в нашем организме всем. Небольшие вариации на молекулярном уровне в ДНК могут повлиять на что угодно: внешность, иммунитет, возникновение заболевания. Но как именно устроена эта связь – для людей, по большому счету, до сих пор загадка.

Основное, за счет чего работает AlphaGenome – это длинное контекстное окно в 1 миллион токенов. Без такого контекста модели бы просто не хватило информации для предсказания (и даже 1 миллиона иногда очень мало).

AG принимает на вход огромные последовательности пар оснований ДНК и предсказывает тысячи молекулярных свойств последовательности. Например, сколько вырабатывается РНК, как гены расположены в разных видах тканей, как они реплицируются и тд. Ну а сравнивая свойства одних последовательности с другими, можно оценить эффекты генетических мутаций.

Google утверждают, что по точности предсказаний они достигли SOTA. Обучали модель на открытых данных крупных лабораторий (в которых все это проверяли экспериментально). Под капотом – свертки, трансформер и декодер в нужные модальности.

Самое интересное, что Google уже открыли модель для использования через API – попробовать может каждый желающий. Так они хотят собрать больше фидбэка от ученых.

Блогпост | Статья (103 страницы на секундочку) | GitHub

1❤141🤯44🔥42👍11❤‍🔥1🐳1

25.5K views06:35

Data Secrets

Цукерберг предлагал сотрудникам OpenAI 100 миллионов долларов за переход в Meta Об этом рассказал Сэм Альтман в свежем подкасте с его участием. По его словам, пока никто из инженеров и ученых компании не согласился на предложение Цука. «Мне кажется, наши…

Некоторое время назад Альтман заявил, что его сотрудники не уйдут в Meta даже за предложенные им 100 миллионов долларов, потому что в OpenAI лучшая ✨культура AGI✨

Так вот, кому-то видимо 100 миллионов долларов все-таки оказались дороже, чем атмосфера Сэма: Цукерберг успешно захантил троих крутых исследователей OpenAI.

К нему ушли Лукас Бейер, Александр Колесников и Сяохуа Чжай. Неизвестно, заплатили ли им обещанные 100 миллионов или меньше, но сумма, видимо, была внушительной.

1😁204👍40❤2515🤯8🔥73🗿22

17.6K views08:31

Data Secrets

Cloud․ru открыл доступ к инструментам для работы с ИИ в облаке и запустил AI-помощника для упрощения работы в облаке

Cloud․ru Evolution AI Factory – это облачная среда с готовыми AI- и ML-инструментами для простого и быстрого внедрения LLM и создания мультиагентных систем. Она позволяет пользоваться готовыми опенсорс-решениями, дообучать модели, тестировать и в несколько кликов их деплоить, и даже мгновенно прикручивать и RAG. При этом все получится даже у тех, кто не имеет специфических знаний в ML.

Также Cloud․ru запустил AI-помощника Клаудию на основе GenAI в своем публичном облаке Cloud․ru Evolution — он не только проконсультирует, но и поможет управлять облачными ресурсами и инфраструктурой, самостоятельно выполняя конкретные действия. Этакий второй пилот под любые ваши задачи. AI-помощник доступен в режиме Public Preview.

Так, он поможет с подбором сервисов, самостоятельным развертыванием виртуальных машин, работой в консоли в режиме Co-pilot и настройкой мониторинга и реагирования. Клаудия позволит разработчикам любого уровня, администраторам, техлидам, DevOps и SRE-инженерам автоматизировать рутину, ускорить запуск проектов и высвободить время для архитектурных и стратегических задач.

1🔥35❤26👍15🗿12😁7✍3🤓2🤯11

17.3K views10:28

Data Secrets

Тем временем трещин в отношениях OpenAI и Microsoft становится все больше Новой точкой преткновения стало приобретение Альтманом стартапа Windsurf. Напоминаем, что слухи об этой покупке ходят уже месяцами, но сделка до сих пор не подписана. Оказывается…

Будущее партнёрства OpenAI и Microsoft зависит от того, что именно они подразумевают под AGI

Обе компании продолжают работать над деталями нового соглашения. OpenAI планирует превратиться в полноценную коммерческую компанию и готовится к IPO, но для этого им нужно согласие от Microsoft.

Основной причиной разногласий стало понимание термина AGI. OpenAI считает, что находится на пороге его создания, что позволит компании освободиться от эксклюзивных обязательств перед Microsoft и начать лицензировать технологии другим компаниям. В свою очередь, Microsoft ставит под сомнение реалистичность достижения такого уровня развития ИИ и настаивает на строгих условиях для пересмотра договоренностей.

Сейчас Microsoft контролирует интеллектуальную собственность OpenAI и требует, чтобы стартап продавал свои ИИ-продукты исключительно через платформу Azure. Компания готова принять 35%-ную долю в новой коммерческой структуре OpenAI, однако стремится сохранить своё эксклюзивное положение на случай реального прорыва.

492912❤5👀4😁3🤔2🍓1

16.8K views11:35

Data Secrets

Смотрите, какую прелесть сделали ученые из университета Айдахо

Это система, которая показывает, насколько новым является какое-либо исследование, и рисует вот такие визуализации и карты развития идей во времени. Это отличается от классического анализа цитирования, тут оценивается именно новизна концепций, а не влияние других работ.

Называется KnoVo – то есть Knowledge Evolution. Под капотом LLM, которая извлекает из статьи фичи (типа датасеты, методология, графики), по которым затем сравнивает работу с предыдущими и, при необходимости, с последующими исследованиями.

Так можно даже не просто оценивать новизну, а отслеживать динамику развития идей, тренды или слепые пятна.

Ну и, в конце концов, это просто красиво 😍

www.alphaxiv.org/abs/2506.17508

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥164❤51👍267👏6🤯5🤔2😁11

20.8K views13:07

Data Secrets

В ИИ-сообществе вводят новый термин – «контекст-инженер»

Подразумевается под этим эволюционировавший промпт-инженер. Разница, как пишет Андрей Карпаты, вот в чем:

➡️ «Промпт-инженер» звучит так, как будто человек работает над одним простым коротким запросом: «придумай название, или умрет моя бабушка», «проверь код шаг за шагом», «сделай правильно и я дам тебе 100 долларов» ну и прочее.

На деле же все давно гораздо сложнее.

➡️ «Контекст-инженер» работает не над одной подсказкой, а над целой системой на базе LLM и всем, что модель в этой системе будет видеть. Тут и промпты, и примеры для few-shot, и учет состояния и истории сессии, и мультимодальное подкрепление, и RAG, и использование инструментов, и контроль за количеством токенов и бюджетом ризонинга.

«Это и наука, и искусство, потому что требует и интуиции, и технических навыков. Контекстная инженерия – это часть формирующегося толстого слоя нетривиального ПО, которое трансформирует отдельные вызовы LLM в полноценные приложения. А термин «обертка над ChatGPT» действительно неправильный и уже устарел»

Теперь вы знаете, что писать в резюме 😐

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥180😁76❤32👍14🗿121275❤‍🔥11

22.1K views14:59

Data Secrets

Говорят, в Grok скоро* появится вот такой встроенный редактор кода на базе VSCode

По виду – буквально Cursor: чат с ассистентом, контекстные подсказки, отладка с ИИ и прочие прелести.

Скоро (ско́-ро, наречие) – через небольшой промежуток времени. В случае Илона Маска может также означать «через год» или «никогда».

😁211🔥3326❤8👍5💯1👨‍💻11

19K views17:05

Data Secrets

Цукерберг переманил еще одного ученого OpenAI

И на этот раз улов очень и очень богатый: в Meta ушел Трапит Бансал – один из ключевых исследователей команды ризонинга.

В OpenAI он работал с 2022 года и долгое время непосредственно с Ильей Суцкевером исследовал парадигму RL. А после этого они вместе с Ноамом Брауном разрабатывали o1.

Вот это действительно большая потеря для OpenAI

P.S. Напоминаем, что буквально на днях к Цуку ушли также трое CV-исследователей

1❤11451👍44😁3154🔥3

19.2K viewsedited 05:58

Data Secrets

Google наконец релизнули полную версию Gemma 3n

Это первая модель меньше 10 миллиардов параметров, выбившая на LMArena > 1300 баллов. Плюс это on-device, то есть модель предназначена для локального запуска.

Поддерживается текст, картинки, аудио и даже видео. По размеру есть два варианта: E2B и E4B. Буква E означает effective. По факту в моделях 5В и 8В параметров соответсвенно, но за счет архитектурных особенностей их можно запускать на железе с теми же затратами, как если бы это были 2B и 4В. На первую хватит всего 2GB.

В основе – MatFormer. Дословно «матрешечный трансформер» 🪆

Суть в том, что более крупная модель содержит меньшие версии себя. Теоретически, это значит, что модель сможет на инференсе динамически переключаться между моделями в зависимости от сложности запроса.

Пока что такое не реализовано, зато уже сейчас, имея веса одной модели, можно извлечь из нее подходящую именно под ваше железо под-модель с нужным количеством параметров.

Технически очень занятный релиз

developers.googleblog.com/en/introducing-gemma-3n-developer-guide/

2👍119🔥43❤28🤯7🤔1🗿1

23.4K views08:29

Data Secrets

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

🎞 Сбер продолжает апгрейдить свою нейронку: Kandinsky 4.1 Video

Новую версию видеомодели представили на GigaConf 2025. ИИ помогает создавать короткие ролики на основе текстового описания и делает это не просто быстрее, но и выразительнее: лучше понимает промпт, чётче работает с композицией и визуальными эффектами.

Под капотом — обновлённая архитектура. Она мощнее, но требовательнее, поэтому разработчики отдельно занимались оптимизациями. Дистилляция, ускорение, баланс между скоростью и качеством — время генерации сократилось более чем в три раза.

Первые доступы уже получили участники GigaConf, в том числе дизайнеры и художники. Общий обещают уже скоро.

Ждём, чтобы попробовать и сравнить с аналогами.

1👍84😁29❤2119🗿15🔥7❤‍🔥4😍1

19K viewsedited 11:01

About

Blog

Apps

Platform