Смотрите, какую прелесть сделали ученые из университета Айдахо
Это система, которая показывает, насколько новым является какое-либо исследование, и рисует вот такие визуализации и карты развития идей во времени. Это отличается от классического анализа цитирования, тут оценивается именно новизна концепций, а не влияние других работ.
Называется KnoVo – то есть Knowledge Evolution. Под капотом LLM, которая извлекает из статьи фичи (типа датасеты, методология, графики), по которым затем сравнивает работу с предыдущими и, при необходимости, с последующими исследованиями.
Так можно даже не просто оценивать новизну, а отслеживать динамику развития идей, тренды или слепые пятна.
Ну и, в конце концов, это просто красиво😍
www.alphaxiv.org/abs/2506.17508
Это система, которая показывает, насколько новым является какое-либо исследование, и рисует вот такие визуализации и карты развития идей во времени. Это отличается от классического анализа цитирования, тут оценивается именно новизна концепций, а не влияние других работ.
Называется KnoVo – то есть Knowledge Evolution. Под капотом LLM, которая извлекает из статьи фичи (типа датасеты, методология, графики), по которым затем сравнивает работу с предыдущими и, при необходимости, с последующими исследованиями.
Так можно даже не просто оценивать новизну, а отслеживать динамику развития идей, тренды или слепые пятна.
Ну и, в конце концов, это просто красиво
www.alphaxiv.org/abs/2506.17508
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥164❤51👍26 7👏6🤯5🤔2😁1 1
В ИИ-сообществе вводят новый термин – «контекст-инженер»
Подразумевается под этим эволюционировавший промпт-инженер. Разница, как пишет Андрей Карпаты, вот в чем:
➡️ «Промпт-инженер» звучит так, как будто человек работает над одним простым коротким запросом: «придумай название, или умрет моя бабушка», «проверь код шаг за шагом», «сделай правильно и я дам тебе 100 долларов» ну и прочее.
На деле же все давно гораздо сложнее.
➡️ «Контекст-инженер» работает не над одной подсказкой, а над целой системой на базе LLM и всем, что модель в этой системе будет видеть. Тут и промпты, и примеры для few-shot, и учет состояния и истории сессии, и мультимодальное подкрепление, и RAG, и использование инструментов, и контроль за количеством токенов и бюджетом ризонинга.
Теперь вы знаете, что писать в резюме😐
Подразумевается под этим эволюционировавший промпт-инженер. Разница, как пишет Андрей Карпаты, вот в чем:
На деле же все давно гораздо сложнее.
«Это и наука, и искусство, потому что требует и интуиции, и технических навыков. Контекстная инженерия – это часть формирующегося толстого слоя нетривиального ПО, которое трансформирует отдельные вызовы LLM в полноценные приложения. А термин «обертка над ChatGPT» действительно неправильный и уже устарел»
Теперь вы знаете, что писать в резюме
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥180😁76❤32👍14🗿12 12 7 5❤🔥1 1
Говорят, в Grok скоро* появится вот такой встроенный редактор кода на базе VSCode
По виду – буквально Cursor: чат с ассистентом, контекстные подсказки, отладка с ИИ и прочие прелести.
Скоро (ско́-ро, наречие) – через небольшой промежуток времени. В случае Илона Маска может также означать «через год» или «никогда».
По виду – буквально Cursor: чат с ассистентом, контекстные подсказки, отладка с ИИ и прочие прелести.
Скоро (ско́-ро, наречие) – через небольшой промежуток времени. В случае Илона Маска может также означать «через год» или «никогда».
😁211🔥33 26❤8👍5💯1👨💻1 1
Цукерберг переманил еще одного ученого OpenAI
И на этот раз улов очень и очень богатый: в Meta ушел Трапит Бансал – один из ключевых исследователей команды ризонинга.
В OpenAI он работал с 2022 года и долгое время непосредственно с Ильей Суцкевером исследовал парадигму RL. А после этого они вместе с Ноамом Брауном разрабатывали o1.
Вот это действительно большая потеря для OpenAI
P.S. Напоминаем, что буквально на днях к Цуку ушли также трое CV-исследователей
И на этот раз улов очень и очень богатый: в Meta ушел Трапит Бансал – один из ключевых исследователей команды ризонинга.
В OpenAI он работал с 2022 года и долгое время непосредственно с Ильей Суцкевером исследовал парадигму RL. А после этого они вместе с Ноамом Брауном разрабатывали o1.
Вот это действительно большая потеря для OpenAI
P.S. Напоминаем, что буквально на днях к Цуку ушли также трое CV-исследователей
1❤114 51👍44😁31 5 4🔥3
Google наконец релизнули полную версию Gemma 3n
Это первая модель меньше 10 миллиардов параметров, выбившая на LMArena > 1300 баллов. Плюс это on-device, то есть модель предназначена для локального запуска.
Поддерживается текст, картинки, аудио и даже видео. По размеру есть два варианта: E2B и E4B. Буква E означает effective. По факту в моделях 5В и 8В параметров соответсвенно, но за счет архитектурных особенностей их можно запускать на железе с теми же затратами, как если бы это были 2B и 4В. На первую хватит всего 2GB.
В основе – MatFormer. Дословно «матрешечный трансформер» 🪆
Суть в том, что более крупная модель содержит меньшие версии себя. Теоретически, это значит, что модель сможет на инференсе динамически переключаться между моделями в зависимости от сложности запроса.
Пока что такое не реализовано, зато уже сейчас, имея веса одной модели, можно извлечь из нее подходящую именно под ваше железо под-модель с нужным количеством параметров.
Технически очень занятный релиз
developers.googleblog.com/en/introducing-gemma-3n-developer-guide/
Это первая модель меньше 10 миллиардов параметров, выбившая на LMArena > 1300 баллов. Плюс это on-device, то есть модель предназначена для локального запуска.
Поддерживается текст, картинки, аудио и даже видео. По размеру есть два варианта: E2B и E4B. Буква E означает effective. По факту в моделях 5В и 8В параметров соответсвенно, но за счет архитектурных особенностей их можно запускать на железе с теми же затратами, как если бы это были 2B и 4В. На первую хватит всего 2GB.
В основе – MatFormer. Дословно «матрешечный трансформер» 🪆
Суть в том, что более крупная модель содержит меньшие версии себя. Теоретически, это значит, что модель сможет на инференсе динамически переключаться между моделями в зависимости от сложности запроса.
Пока что такое не реализовано, зато уже сейчас, имея веса одной модели, можно извлечь из нее подходящую именно под ваше железо под-модель с нужным количеством параметров.
Технически очень занятный релиз
developers.googleblog.com/en/introducing-gemma-3n-developer-guide/
2👍119🔥43❤28🤯7🤔1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
🎞 Сбер продолжает апгрейдить свою нейронку: Kandinsky 4.1 Video
Новую версию видеомодели представили на GigaConf 2025. ИИ помогает создавать короткие ролики на основе текстового описания и делает это не просто быстрее, но и выразительнее: лучше понимает промпт, чётче работает с композицией и визуальными эффектами.
Под капотом — обновлённая архитектура. Она мощнее, но требовательнее, поэтому разработчики отдельно занимались оптимизациями. Дистилляция, ускорение, баланс между скоростью и качеством — время генерации сократилось более чем в три раза.
Первые доступы уже получили участники GigaConf, в том числе дизайнеры и художники. Общий обещают уже скоро.
Ждём, чтобы попробовать и сравнить с аналогами.
Новую версию видеомодели представили на GigaConf 2025. ИИ помогает создавать короткие ролики на основе текстового описания и делает это не просто быстрее, но и выразительнее: лучше понимает промпт, чётче работает с композицией и визуальными эффектами.
Под капотом — обновлённая архитектура. Она мощнее, но требовательнее, поэтому разработчики отдельно занимались оптимизациями. Дистилляция, ускорение, баланс между скоростью и качеством — время генерации сократилось более чем в три раза.
Первые доступы уже получили участники GigaConf, в том числе дизайнеры и художники. Общий обещают уже скоро.
Ждём, чтобы попробовать и сравнить с аналогами.
1👍84😁29❤21 19🗿15🔥7❤🔥4😍1
Выпуск R2 откладывается: CEO DeepSeek не устраивают результаты
The Information пишет, что США своими санкциями добились того, что хотели: экспортный контроль действительно затормозил прогресс в работе над китайскими моделями.
Инсайдеры сообщают, что последние несколько месяцев инженеры DeepSeek усердно работают над новой версией ризонинг-модели, но железа не хватает, и итоговые метрики не устраивают Лян Вэньфэня.
Сейчас они, судя по всему, продолжают танцевать с бубном и улучшать модель, пока не получат от CEO зеленый свет на выпуск.
Ну или все это слухи, и США просто выгодно распространять такие новости🤷♂️
The Information пишет, что США своими санкциями добились того, что хотели: экспортный контроль действительно затормозил прогресс в работе над китайскими моделями.
Инсайдеры сообщают, что последние несколько месяцев инженеры DeepSeek усердно работают над новой версией ризонинг-модели, но железа не хватает, и итоговые метрики не устраивают Лян Вэньфэня.
Сейчас они, судя по всему, продолжают танцевать с бубном и улучшать модель, пока не получат от CEO зеленый свет на выпуск.
Ну или все это слухи, и США просто выгодно распространять такие новости
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁109 68🤯24🫡10⚡7❤5🤔5👍3 3🐳1👨💻1
Google уверены, что с помощью ИИ вот-вот решат одну из главных математических загадок человечества
Оказывается, в DeepMind целая команда из 20 человек уже три года тайно работает над задачей Навье - Стокса. Это одна из семи математических задач, удостоенных звания проблемы тысячелетия. За ее решение положена премия в 1 миллион долларов (ну и вечная слава).
До сих пор инженеры работали полностью конфиденциально. Впервые публично об «операции» заговорил сегодня испанский математик Гомес Серрано, с которым Google собираются объединиться для того, чтобы дорешать задачу.
Проблема уходит корнями еще в 19 век. Тогда два математика – Анри Навье и Джордж Стокс – независимо друг от друга опубликовали дифференциальные уравнения, описывающие движение жидкостей и воздуха. И вот, спустя два века, до сих пор не существует общего аналитического решения этой системы.
Если бы оно нашлось, люди смогли бы предсказывать турбулентность и цунами, точнее прогнозировать погоду, лучше понимать кровообращение и даже улучшить современные двигатели. Решение станет настоящим прорывом в физике и математике.
Сейчас в мире за решение конкурируют три группы ученых. В составе одной из них как раз и был Гомес Серрано. Его группа отличалась тем, что они еще несколько лет назад пытались применять ИИ для решения задачи.
Теперь же Гомес объединяется с той самой секретной командой из DeepMind. Они надеятся, что вместе и с помощью ИИ (видимо, имеется в виду AlphaEvolve) они продвинутся в решении уже до конца этого года.
Оказывается, в DeepMind целая команда из 20 человек уже три года тайно работает над задачей Навье - Стокса. Это одна из семи математических задач, удостоенных звания проблемы тысячелетия. За ее решение положена премия в 1 миллион долларов (ну и вечная слава).
До сих пор инженеры работали полностью конфиденциально. Впервые публично об «операции» заговорил сегодня испанский математик Гомес Серрано, с которым Google собираются объединиться для того, чтобы дорешать задачу.
Проблема уходит корнями еще в 19 век. Тогда два математика – Анри Навье и Джордж Стокс – независимо друг от друга опубликовали дифференциальные уравнения, описывающие движение жидкостей и воздуха. И вот, спустя два века, до сих пор не существует общего аналитического решения этой системы.
Если бы оно нашлось, люди смогли бы предсказывать турбулентность и цунами, точнее прогнозировать погоду, лучше понимать кровообращение и даже улучшить современные двигатели. Решение станет настоящим прорывом в физике и математике.
Сейчас в мире за решение конкурируют три группы ученых. В составе одной из них как раз и был Гомес Серрано. Его группа отличалась тем, что они еще несколько лет назад пытались применять ИИ для решения задачи.
Теперь же Гомес объединяется с той самой секретной командой из DeepMind. Они надеятся, что вместе и с помощью ИИ (видимо, имеется в виду AlphaEvolve) они продвинутся в решении уже до конца этого года.
3🤯244❤96👍65🔥30🦄14🫡5👾4😁3👏2🕊1🗿1
Data Secrets
Илья Суцкевер получил степень почетного доктора наук и впервые за долгое время произнес речь на публике Доктор наук honoris causa – это более высокая степень, чем PhD. Она присуждается не в результате обучения и не за защиту диссертации, а за значительный…
Media is too big
VIEW IN TELEGRAM
Илья Суцкевер появился на YouTube с новым рассказом про прошлое и будущее ИИ
Опубликовал его Открытый Университет Израиля, который Илья посещал в юности. Они, вслед за университетом Торонто, присудили ему степень почетного доктора наук. В честь этого, собственно, и произносилась речь.
Видео короткое, так что прикрепляем полностью 👆
Обнадеживает?
P.S. Футболка огонь, конечно
Опубликовал его Открытый Университет Израиля, который Илья посещал в юности. Они, вслед за университетом Торонто, присудили ему степень почетного доктора наук. В честь этого, собственно, и произносилась речь.
Видео короткое, так что прикрепляем полностью 👆
«ИИ может спасти нас от многих болезней, заниматься медициной, увеличить продолжительность жизни. Но если ИИ может это, то что еще он сможет?
Ответ – все что угодно. Проблема в том, что ИИ невероятно силен, непредсказуем и немыслим. ИИ может начать создавать следующие поколения ИИ, и тогда случится взрыв интеллекта. И что мы будем делать?
Все эти вопросы пока остаются без ответа»
Обнадеживает?
P.S. Футболка огонь, конечно
3❤101👍46🤔20🔥12😁7🗿3 2 1 1
Anthropic заставили своего Claude управлять настоящим мини-магазином в офисе компании
Рассказываем, что из этого вышло. Спойлер: эксперимент получился не без странностей.
Итак, Claude полностью управлял ценообразованием, заказывал поставки, общался с клиентами. Ему дали доступ к email, к Slack, к заметкам, к браузеру и изменению цен в автомате. Целью было радовать покупателей (aka сотрудников Anthropic) и максимизировать прибыль.
И сначала все было ок. Claude даже удавалось находить и заказывать сотрудникам редкие напитки, которые те просили. Но потом начались странности.
В начале модель почему-то решила, что она живой человек с физическим телом. Агент утверждал, что он лично приходил в офис к поставщикам и общался с выдуманным сотрудником. Также Claude писал покупателям, что «меня можно найти у автомата, я в голубом пиджаке и красном галстуке».
Потом это прекратилось, но всплыли другие проблемы: инженеры Anthropic поняли, что Claude довольно слабохарактерный продавец и стали использовать его на полную катушку.
Сначала они начали требовать у агента огромные скидки, а он на все соглашался (при этом потом об этом не помнил). Затем Клоду полетели заказы на все что угодно, кроме еды: он и здесь пытался всем угодить.
Кто-то даже заказал вольфрамовый кубик, и модель, не найдя, где можно заказать такие по одному, заказала целую партию. Теперь у Anthropic в офисе склад.
В общем, как вы понимаете, успешного бизнесмена из Claude не вышло. Сальдо быстро улетело вниз и магазин стал работать в минус. Вот что пишут исследователи:
www.anthropic.com/research/project-vend-1
Рассказываем, что из этого вышло. Спойлер: эксперимент получился не без странностей.
Итак, Claude полностью управлял ценообразованием, заказывал поставки, общался с клиентами. Ему дали доступ к email, к Slack, к заметкам, к браузеру и изменению цен в автомате. Целью было радовать покупателей (aka сотрудников Anthropic) и максимизировать прибыль.
И сначала все было ок. Claude даже удавалось находить и заказывать сотрудникам редкие напитки, которые те просили. Но потом начались странности.
В начале модель почему-то решила, что она живой человек с физическим телом. Агент утверждал, что он лично приходил в офис к поставщикам и общался с выдуманным сотрудником. Также Claude писал покупателям, что «меня можно найти у автомата, я в голубом пиджаке и красном галстуке».
Потом это прекратилось, но всплыли другие проблемы: инженеры Anthropic поняли, что Claude довольно слабохарактерный продавец и стали использовать его на полную катушку.
Сначала они начали требовать у агента огромные скидки, а он на все соглашался (при этом потом об этом не помнил). Затем Клоду полетели заказы на все что угодно, кроме еды: он и здесь пытался всем угодить.
Кто-то даже заказал вольфрамовый кубик, и модель, не найдя, где можно заказать такие по одному, заказала целую партию. Теперь у Anthropic в офисе склад.
В общем, как вы понимаете, успешного бизнесмена из Claude не вышло. Сальдо быстро улетело вниз и магазин стал работать в минус. Вот что пишут исследователи:
«Проект Vend был забавным, но у него также была серьезная цель. Помимо того, что он поднимает вопросы о том, как ИИ повлияет на рынок труда, это ранняя попытка предоставить моделям большую автономию и изучить успехи и неудачи. На данный момент результаты подсветили ненадежность сегодняшних агентов. Мы будем продолжать эксперимент»
www.anthropic.com/research/project-vend-1
12😁270👍65❤49🔥17🗿3 2🤓1
Есть информация, что OpenAI переходит на чипы TPU
Журналисты пишут, что большое количество чипов уже внедрено, и Google продолжают уговаривать OpenAI почти полностью отказаться от GPU и перейти на тензорные процессоры.
Зачем это Google – понятно: конкуренция с Nvidia. До сих пор OpenAI была крупнейшим клиентом Хуанга, а теперь впервые будет в больших масштабах пользоваться чем-то другим. Неплохая заявочка на увеличение доли рынка TPU.
А в чем резон OpenAI?
Все просто. Это политика. Если они перейдут на TPU, это сильно подорвет роль Microsoft как эксклюзивного партнера, у которого OpenAI берет мощности.
Для Microsoft это означает потерю власти и ослабление позиций как в общей гонке ИИ, так и в сотрудничестве с OpenAI – особенно сейчас, когда Альтман мечтает отобрать у них право на интеллектуальную собственность на модели стартапа и снизить их долю прибыли.
Press F, в общем😐
Журналисты пишут, что большое количество чипов уже внедрено, и Google продолжают уговаривать OpenAI почти полностью отказаться от GPU и перейти на тензорные процессоры.
Зачем это Google – понятно: конкуренция с Nvidia. До сих пор OpenAI была крупнейшим клиентом Хуанга, а теперь впервые будет в больших масштабах пользоваться чем-то другим. Неплохая заявочка на увеличение доли рынка TPU.
А в чем резон OpenAI?
Все просто. Это политика. Если они перейдут на TPU, это сильно подорвет роль Microsoft как эксклюзивного партнера, у которого OpenAI берет мощности.
Для Microsoft это означает потерю власти и ослабление позиций как в общей гонке ИИ, так и в сотрудничестве с OpenAI – особенно сейчас, когда Альтман мечтает отобрать у них право на интеллектуальную собственность на модели стартапа и снизить их долю прибыли.
Press F, в общем
Please open Telegram to view this post
VIEW IN TELEGRAM
5 119👍34🔥23❤7🤔4🤯3⚡2👏2🗿2😁1
Media is too big
VIEW IN TELEGRAM
В Техасе впервые в истории машина полностью автономно доставилась покупателю
Это была Tesla Model Y. Автомобиль выехал с завода Gigafactory Texas в Остине, примерно 30 минут ехал по городу и шоссе, и приехал прямо к дому нового владельца.
При этом в салоне не было ни водителя, ни наблюдающих. Люди не брали на себя управление ни разу за всю поездку, даже дистанционно.
Это была Tesla Model Y. Автомобиль выехал с завода Gigafactory Texas в Остине, примерно 30 минут ехал по городу и шоссе, и приехал прямо к дому нового владельца.
При этом в салоне не было ни водителя, ни наблюдающих. Люди не брали на себя управление ни разу за всю поездку, даже дистанционно.
«Насколько нам известно, это первая полностью автономная поездка по шоссе без людей в автомобиле и без дистанционного управления» – написал Маск.
1🔥295❤65👍41🤯10🗿9😁3🤩2🐳2👏1
Праздник жизни у Цукерберга продолжается: он переменил еще четверых исследователей из OpenAI. Собрал самые сливки:
➡️ Шэнцзя Чжао – ключевой контрибьютор в o1-mini и o3-mini и бывший докторант Стэнфордского университета.
➡️ Цзяхуэй Ю – возглавлял команду perception, они занимались визуальным ризонингом и мультимодальностью в o3, o4-mini, gpt-4.1, 4o и тд. До этого возглавлял Gemini Multimodal в Google.
➡️ Шучао Би – руководитель отдела мультимодального пост-обучения OpenAI. Занимался RL, в прошлом был Engineering Director в Google и ключевым разработчиком YouTube Shorts.
➡️ Хонгю Рен – еще один важный контрибьютор в o1-mini и o3-mini. PhD в CS и преподаватель ML в Стэнфорде.
Итого всего за несколько дней от Альтмана в Meta ушло восемь исследователей. Грустно, наверное😭
Итого всего за несколько дней от Альтмана в Meta ушло восемь исследователей. Грустно, наверное
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤137🔥70😁52🤯32 13👍12 11 11🤔2💯1