Коллеги подогнали статью про настоящее использование энергии на запросы к ЛЛМкам. В отличие от предыдущих статей, анализируется потребление на основе реальных данных об утилизации в датацентрах гугла, реальных показателей их энергоэффективности, включается потребление электричества от CPU и памяти.
В результате – медианный запрос потребляет 0.24 ватт·ч энергии – 9 секунд просмотра телевизора. Что интересно, за предыдущий год эта цифра снизилась в 47 раз, так что любые цифры устаревают с каждым следующим поколением моделей – оптимизация идёт по всем фронтам.
В результате – медианный запрос потребляет 0.24 ватт·ч энергии – 9 секунд просмотра телевизора. Что интересно, за предыдущий год эта цифра снизилась в 47 раз, так что любые цифры устаревают с каждым следующим поколением моделей – оптимизация идёт по всем фронтам.
🔥65👏12❤6👍3
Выпустили Gemini 2.5 Flash image editing, который завирусился как nano-banana. +171 Эло над следующей моделькой на image edit arena.
Пробовать можно в AI Studio: ai.studio/banana
Пробовать можно в AI Studio: ai.studio/banana
🔥50👍9❤1
Вчера в США был день труда, и было решено этот праздник отметить поездкой с друзьями в родовое гнездо товарищей Рокфеллеров под названием Кайкит. 🤴
Запомнятся огромные сады, гармонично сочетающие современную скульптуру с природой. Очень хороший вкус, не зря половина значимых культурных объектов в Нью-Йорке связано с, пожалуй, самой известной семьёй филантропов в истории.
Запомнятся огромные сады, гармонично сочетающие современную скульптуру с природой. Очень хороший вкус, не зря половина значимых культурных объектов в Нью-Йорке связано с, пожалуй, самой известной семьёй филантропов в истории.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤49🌚10🤣6👍4🤪4
ICPC 2025
Выложили результаты Gemini DeepThink на студенческой олимпиаде по программированию. Система решила задачу, которую не смогла решить ни одна (!) студенческая команда. Если сравнивать с кожаными мешками, AGI уступил только команде СПбГУ.
UPD: товарищи конкуренты говорят, что решили все 12 задач🚨
Выложили результаты Gemini DeepThink на студенческой олимпиаде по программированию. Система решила задачу, которую не смогла решить ни одна (!) студенческая команда. Если сравнивать с кожаными мешками, AGI уступил только команде СПбГУ.
UPD: товарищи конкуренты говорят, что решили все 12 задач
Please open Telegram to view this post
VIEW IN TELEGRAM
3🎉78🔥21👀10🌚3🍓3❤1
Дорогие конкуренты (в множественном числе) на неделе выпустили отчёты о том, как люди пользуются их LLM-продуктами.
OpenAI – в виде препринта NBER, Anthropic – в виде более казуального отчёта и онлайн-дэшборда, который позволяет сравнивать использование по профессиям и по штатам США (версию с картой мира обещают добавить позже.
Anthropic явно интересует уровень автономности, которому доверяют люди, и то, замещает ли "труд" LLMки работу человека или дополняет её. Трафик, который приходит по API (в основном от вайб-кодеров, вестимо) имеет существенный скос в сторону автономного выполнения задач. Оно и логично – computer use (аналог operator у chatgpt) у Anthropic пока не выстрелил.
У OpenAI статья более прагматичная – делают такой классический topic modelling, показывают, что люди всё больше начинают пользоваться ChatGPT как поисковиком.👀
Что интересно, OpenAI видят существенное смещение спектра задач с рабочих на личные. Интересно, какие системы ценностей будут RL-ить в следующие поколения моделек.
OpenAI – в виде препринта NBER, Anthropic – в виде более казуального отчёта и онлайн-дэшборда, который позволяет сравнивать использование по профессиям и по штатам США (версию с картой мира обещают добавить позже.
Anthropic явно интересует уровень автономности, которому доверяют люди, и то, замещает ли "труд" LLMки работу человека или дополняет её. Трафик, который приходит по API (в основном от вайб-кодеров, вестимо) имеет существенный скос в сторону автономного выполнения задач. Оно и логично – computer use (аналог operator у chatgpt) у Anthropic пока не выстрелил.
У OpenAI статья более прагматичная – делают такой классический topic modelling, показывают, что люди всё больше начинают пользоваться ChatGPT как поисковиком.
Что интересно, OpenAI видят существенное смещение спектра задач с рабочих на личные. Интересно, какие системы ценностей будут RL-ить в следующие поколения моделек.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25👍7
#book_review
Chokepoints: American Power in the Age of Economic Warfare by Edward Fishman, 2025
amazon
Стратегические точки в мире глобализации – расчёты в долларах и высокие технологии – в XXI веке начали использоваться как инструмент принуждения. В книге автор увлекательно описывает историю принятия экономический санкций против трёх стран: Ирана, России и Китая. Промежуток времени – с середины двухтысячных, когда в эффективность механизм санкций мало кто верил и приходилось летать по банкам, рассказывая о комплаенсе до нашего времени и точечных санкций по китайскому Huawei. Автор пишет о кухне изнутри – он лично работал над санкциями США на Иран и Россию.
Подход автора прагматично-институциональный: санкции – это государственная операционка, их нужно разрабатывать заранее и уметь применять, не оставляя путей обхода и не забывая про интересы союзников. Из-за технократического склада ума автор фокусируется на эффективности санкций, совершенно не раскрываются гуманитарные последствия применения санкций (Венесуэла и Сирия) и то, как цена их исполнения зачастую ложится на менее крупных игроков. Также не хватает историй про принуждение к исполнению санкций через минюст – упоминаются рекордные штрафы, но не более.
В целом очень рекомендую к прочтению – всегда полезно понимать, как думает гегемон, особенно в контексте экономической политики текущего президента. Да и нашу научку тоже начало касаться – лишь в этом году организационный комитет NeurIPS додумался до того, что получает деньги от разных организаций в списке SDN за участие в конференции.
P.S. Комментарии под постом оставлю, но заранее прошу быть понежнее и не шитпостить мне тут.👮♂️
Chokepoints: American Power in the Age of Economic Warfare by Edward Fishman, 2025
amazon
Стратегические точки в мире глобализации – расчёты в долларах и высокие технологии – в XXI веке начали использоваться как инструмент принуждения. В книге автор увлекательно описывает историю принятия экономический санкций против трёх стран: Ирана, России и Китая. Промежуток времени – с середины двухтысячных, когда в эффективность механизм санкций мало кто верил и приходилось летать по банкам, рассказывая о комплаенсе до нашего времени и точечных санкций по китайскому Huawei. Автор пишет о кухне изнутри – он лично работал над санкциями США на Иран и Россию.
Подход автора прагматично-институциональный: санкции – это государственная операционка, их нужно разрабатывать заранее и уметь применять, не оставляя путей обхода и не забывая про интересы союзников. Из-за технократического склада ума автор фокусируется на эффективности санкций, совершенно не раскрываются гуманитарные последствия применения санкций (Венесуэла и Сирия) и то, как цена их исполнения зачастую ложится на менее крупных игроков. Также не хватает историй про принуждение к исполнению санкций через минюст – упоминаются рекордные штрафы, но не более.
В целом очень рекомендую к прочтению – всегда полезно понимать, как думает гегемон, особенно в контексте экономической политики текущего президента. Да и нашу научку тоже начало касаться – лишь в этом году организационный комитет NeurIPS додумался до того, что получает деньги от разных организаций в списке SDN за участие в конференции.
P.S. Комментарии под постом оставлю, но заранее прошу быть понежнее и не шитпостить мне тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🤔8👀5
Интересный эффект от ИИ-бума, который сейчас происходит – это сильное увеличение текучки кадров в около-ресёрче. За последние пару месяцев от нас ушло порядка 10 (!) людей, с которыми я в разной степени близости работал: кто к Цуку 🤴 , кто в стартапы, кто в OAI/Anthro. Сравним с последними пятью годами, ктогда у нас из команды не уходил никто за исключением LLM-энтузиастов (лэйоффы 2023 нас обошли стороной). Странное ощущение небезопасности, что любой проект может потерять опору, и надо ещё больше хеджироваться и быстрее куда-то бежать. С другой стороны, может, в такой горячей и прикладной области не так и важна длительная работа над одними проектами? Непонятно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔72❤17💅5🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍35🔥21🥴4❤2👏1
Gemini 3
Выпустили превью нового поколения Gemini. SotA по разным бенчмаркам от кодинга до математики, топ-1 на лмарене и вебдев-арене, сильно улучшено зрение и агентские возможности. Доступна в приложении, AI studio и у некоторых провайдеров в виде превью.
Блогпост | model card | AI studio
Выпустили превью нового поколения Gemini. SotA по разным бенчмаркам от кодинга до математики, топ-1 на лмарене и вебдев-арене, сильно улучшено зрение и агентские возможности. Доступна в приложении, AI studio и у некоторых провайдеров в виде превью.
Блогпост | model card | AI studio
1🔥57❤10
Про улучшения хорошо пишет Artificial Analysis. Вкратце:
- Новая самая сильная модель по общему уровню "интеллекта"
- Модель примерно на 30% дороже Sonnet 4.5
- По скорости сопоставима с Gemini 2.5 Pro и GPT-5.1, примерно на 40% быстрее Sonnet 4.5
- Улучшения в кодинге, включая агентские системы: по бенчмаркам AA модель с отрывом первая
- Новая самая сильная модель по общему уровню "интеллекта"
- Модель примерно на 30% дороже Sonnet 4.5
- По скорости сопоставима с Gemini 2.5 Pro и GPT-5.1, примерно на 40% быстрее Sonnet 4.5
- Улучшения в кодинге, включая агентские системы: по бенчмаркам AA модель с отрывом первая
🔥43💅2
Nano Banana Pro
Новая бананья на основе Gemini 3 Pro (блогпост) с использованием поиска (!), генерацией в 4k и очень очень хорошим следованием промпту. Выкатывается сегодня в Gemini app, AI studio, Vertex AI.
Новая бананья на основе Gemini 3 Pro (блогпост) с использованием поиска (!), генерацией в 4k и очень очень хорошим следованием промпту. Выкатывается сегодня в Gemini app, AI studio, Vertex AI.
🔥54🤯14🎉4
На этой неделе буду на NeurIPS в Сан Диего свободным человеком без статей и презентаций.
Кидайте статьи, если приехали с постером, и приходите на наш phd networking event.
Кидайте статьи, если приехали с постером, и приходите на наш phd networking event.
❤43
Любопытная статья (pdf) про связь академической нечестности (плагиаризма) и дальнейшего карьерного развития, написанная на данных китайских университетов. Авторы использовали систему по поиску плагиата и сматчили по именам на дипломах с людьми, которые проходили китайский национальный экзамен на государственную службу (match rate ~17%), а также с открытыми данными китайской служебной системы (~32%).
Оказалось, что доля плагиата у людей, которые в последующем идут на госслужбу, выше на 1.2% (15.6% относительно общей популяции), и индивиды в верхней половине по плагиаризму получают повышения на 10-15% быстрее (с контролем на опыт и департамент).
С судьями примерно такая же ситуация. Судьи, которые занимались плагиатом в университете, на 10-15% чаще выносят вердикты в пользу государственных компаний и на 16.6% чаще попадают под расследования о коррупции.
Чтобы понять, не вызван ли этот эффект банальной некомпетентностью авторы придумали мерить результаты процессов, которые транслировались онлайн. Там размер эффекта существенно снижается.
Оказалось, что доля плагиата у людей, которые в последующем идут на госслужбу, выше на 1.2% (15.6% относительно общей популяции), и индивиды в верхней половине по плагиаризму получают повышения на 10-15% быстрее (с контролем на опыт и департамент).
С судьями примерно такая же ситуация. Судьи, которые занимались плагиатом в университете, на 10-15% чаще выносят вердикты в пользу государственных компаний и на 16.6% чаще попадают под расследования о коррупции.
Чтобы понять, не вызван ли этот эффект банальной некомпетентностью авторы придумали мерить результаты процессов, которые транслировались онлайн. Там размер эффекта существенно снижается.
👍40❤9👀7👏1
Breakneck: China's Quest to Engineer the Future – Dan Wang, 2025.
#book_review
Какое фундаментальное отличие китайского и американского обществ? Дэн Ван, который прожил в Китае несколько последних лет, нашёл новый тезис, вокруг которого построена вся книга. По его словам,
Как пример, в текущей американской администрации большинство – юристы, тогда как в Политбюро ЦК КПК – почти все инженеры. Это приводит к существенным различиям в государственной политике, результаты которой мы можем видеть, например, в Сан-Диего, где общественная инфраструктура проиграет многим китайским деревням. Первая часть книги посвящена контрасту таких различий, и читать её максимально интересно.
Отдельная часть посвящена демографической политике в Китае (политика одного ребенка) как пример того, где инженерное государство с его возможностями планирования не может сравниться с государством, где юристы будут биться за индивидуальные права.
К концу книга немного скатывается из аналитики в описание личного опыта автора, его друзей-эмигрантов из Китая, родителей, что, если честно, быстро становится довольно размазано. Но первую половину (до 5 главы) прочитать точно стоит.
Сейчас на нипсе много мл-стартапов нанимают на возрождение производства – роборуки, создание новых материалов и лекарств. Интересно, смогут ли юристы оперативно решить регуляторные барьеры или всё-таки государство инженеров на его поле побить не получится.
#book_review
Какое фундаментальное отличие китайского и американского обществ? Дэн Ван, который прожил в Китае несколько последних лет, нашёл новый тезис, вокруг которого построена вся книга. По его словам,
Америкой управляют юристы, а Китаем — инженеры.
Как пример, в текущей американской администрации большинство – юристы, тогда как в Политбюро ЦК КПК – почти все инженеры. Это приводит к существенным различиям в государственной политике, результаты которой мы можем видеть, например, в Сан-Диего, где общественная инфраструктура проиграет многим китайским деревням. Первая часть книги посвящена контрасту таких различий, и читать её максимально интересно.
Отдельная часть посвящена демографической политике в Китае (политика одного ребенка) как пример того, где инженерное государство с его возможностями планирования не может сравниться с государством, где юристы будут биться за индивидуальные права.
К концу книга немного скатывается из аналитики в описание личного опыта автора, его друзей-эмигрантов из Китая, родителей, что, если честно, быстро становится довольно размазано. Но первую половину (до 5 главы) прочитать точно стоит.
Сейчас на нипсе много мл-стартапов нанимают на возрождение производства – роборуки, создание новых материалов и лекарств. Интересно, смогут ли юристы оперативно решить регуляторные барьеры или всё-таки государство инженеров на его поле побить не получится.
❤41👀10🤣6👍5👎3🤔1