Media is too big
VIEW IN TELEGRAM
«Китайские шпионы систематически похищают технологические ИИ-секреты США» – Александр Ванг
Александр Ванг заявил, что хоть США пока и опережает Китай в железе и алгоритмах, Азия уже скоро вырвется вперед благодаря:
1. Шпионажу. Китай с 2018 года реализует масштабный государственный ИИ-план. В том числе они масштабно засылают шпионов в американские компании. Пример – «Инженер Google украл проектную документацию по ИИ-чипам и начал на её основе бизнес в Китае». Своих же исследователей китайцы строго изолируют и проверяют.
2. Разметке. В Китае насчитывается более 2 миллионов человек, которые занимаются аннотированием данных – против всего 100 000 в США. Данных для обучения у них уже больше.
3. Информационной войне. Китай использует ИИ для создания передовых инструментов в области влияния на сознание и тем самым манипулируют общественностью.
Вот такие байки от будущего главы ИИ в Meta. Верим?
Источник: новое интервью
Александр Ванг заявил, что хоть США пока и опережает Китай в железе и алгоритмах, Азия уже скоро вырвется вперед благодаря:
1. Шпионажу. Китай с 2018 года реализует масштабный государственный ИИ-план. В том числе они масштабно засылают шпионов в американские компании. Пример – «Инженер Google украл проектную документацию по ИИ-чипам и начал на её основе бизнес в Китае». Своих же исследователей китайцы строго изолируют и проверяют.
2. Разметке. В Китае насчитывается более 2 миллионов человек, которые занимаются аннотированием данных – против всего 100 000 в США. Данных для обучения у них уже больше.
3. Информационной войне. Китай использует ИИ для создания передовых инструментов в области влияния на сознание и тем самым манипулируют общественностью.
Вот такие байки от будущего главы ИИ в Meta. Верим?
Источник: новое интервью
1🤯134😁82🔥24❤23👍20💯14🗿13 10👻7 7 3
Китайская лаборатория BAAI выпустила открытую SOTA модель для робототехники
RoboBrain 2.0 – это модель общего назначения для управления роботами. Это не просто VLA, а «модель мозга».
Модель поддерживает рассуждения и долгосрочное агентное планирование, устойчивое восприятие 3D-пространства и рассуждения на основе сцены, а также долгосрочную обновляемую память.
Под капотом: Vision Encoder + MLP Projector. На вход принимает и видео, и картинки, и, конечно, текст. Через адаптеры все подается в LLM декодер, который и выполняет поставленные задачи.
Пока доступна модель на 7В, скоро выйдет на 32В. Модель побольше на робо-бенчах обгоняет и открытых, и закрытых конкурентов. В том числе Claude Sonnet 4 и o4-mini.
Радует, что снова появляется явный тренд на открытую робототехнику
GitHub | HuggingFace
RoboBrain 2.0 – это модель общего назначения для управления роботами. Это не просто VLA, а «модель мозга».
Модель поддерживает рассуждения и долгосрочное агентное планирование, устойчивое восприятие 3D-пространства и рассуждения на основе сцены, а также долгосрочную обновляемую память.
Под капотом: Vision Encoder + MLP Projector. На вход принимает и видео, и картинки, и, конечно, текст. Через адаптеры все подается в LLM декодер, который и выполняет поставленные задачи.
Пока доступна модель на 7В, скоро выйдет на 32В. Модель побольше на робо-бенчах обгоняет и открытых, и закрытых конкурентов. В том числе Claude Sonnet 4 и o4-mini.
Радует, что снова появляется явный тренд на открытую робототехнику
GitHub | HuggingFace
1⚡91❤48🔥34🤯8👍7🤔1🕊1🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
Просто выпуск Друзей от ноября 1999 года
Они что-то знали💡
К 2030 году появятся компьютеры, которые смогут выполнять столько же функций, сколько и настоящий человеческий мозг
Они что-то знали
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁158 53 21❤9🗿7 2 2🤯1😎1
GoogLeNet выиграл награду test-of-time на конференции CVPR
Каждый год на CVPR награждают одну статью, которая вышла ровно 10 лет назад и оказала наибольшее влияние на область компьютерного зрения. Это называется Longuet‑Higgins Prize.
В этом году премию выиграла легендарная статья Going Deeper with Convolutions, в которой впервые показали архитектуру GoogLeNet.
В 2014 году модель выиграла соревнование ImageNet. Это была одна из первых глубоких нейросетей: именно она показала, как можно добавлять больше слоев без взрыва параметров и с сохранением эффективности.
Поздравляем!🎉
Каждый год на CVPR награждают одну статью, которая вышла ровно 10 лет назад и оказала наибольшее влияние на область компьютерного зрения. Это называется Longuet‑Higgins Prize.
В этом году премию выиграла легендарная статья Going Deeper with Convolutions, в которой впервые показали архитектуру GoogLeNet.
В 2014 году модель выиграла соревнование ImageNet. Это была одна из первых глубоких нейросетей: именно она показала, как можно добавлять больше слоев без взрыва параметров и с сохранением эффективности.
Поздравляем!
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤123 46 11😁1
В ChatGPT тихо обновился поиск
Самое значимое: теперь в нем есть возможность искать по картинке + добавили автоматическое переключение на множественный пошаговый поиск для сложных запросов.
Кроме того, улучшили следование инструкциям, полноту ответов и их актуальность.
Еще пишут, что «некоторые юзеры могут замечать цепочки рассуждений» – даже при поиске с не-ризонинг моделями и для простых вопросов. Говорят, что скоро исправят, а пока пользуемся😉
Самое значимое: теперь в нем есть возможность искать по картинке + добавили автоматическое переключение на множественный пошаговый поиск для сложных запросов.
Кроме того, улучшили следование инструкциям, полноту ответов и их актуальность.
Еще пишут, что «некоторые юзеры могут замечать цепочки рассуждений» – даже при поиске с не-ризонинг моделями и для простых вопросов. Говорят, что скоро исправят, а пока пользуемся
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁82👍45❤19🔥10
Сегодня, кстати, празднуется Международный День Отца
Поздравляем, получается🤓
P.S. Сможете назвать всех?
Поздравляем, получается
P.S. Сможете назвать всех?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤112👍34 17😁9🤨4🔥2🤯2👨💻1
Там вышел новый бенчмарк по программированию – модели выбивают на нем 0% 😐
LiveCodeBench Pro состоит из самых свежих и самых сложных задач по программированию с Codeforces, ICPC, and IOI (International Olympiad in Informatics). Размечали их сами победители и призеры олимпиад.
Итог: даже лучшая модель o4-mini-high достигает рейтинга около 2100. Это очень далеко от гроссмейстеров-людей (~2700).
При этом модели способны решать только простые и некоторые средние задачи. На по-настоящему сложных абсолютно все LM – чистый ноль.
У них неплохо получается решать задачи на комбинаторику и динамическое программирование. Но в теории игр и работе с угловыми случаями они на уровне среднего эксперта или даже ученика.
И вот что еще интересно: у людей ошибки обычно в реализации, а не в алгоритме. То есть бытовая невнимательность или синтаксис. У моделей же провалы чаще на уровне самой идеи.
Олимпиадников пока не заменяем, получается
arxiv.org/pdf/2506.11928
LiveCodeBench Pro состоит из самых свежих и самых сложных задач по программированию с Codeforces, ICPC, and IOI (International Olympiad in Informatics). Размечали их сами победители и призеры олимпиад.
Итог: даже лучшая модель o4-mini-high достигает рейтинга около 2100. Это очень далеко от гроссмейстеров-людей (~2700).
При этом модели способны решать только простые и некоторые средние задачи. На по-настоящему сложных абсолютно все LM – чистый ноль.
У них неплохо получается решать задачи на комбинаторику и динамическое программирование. Но в теории игр и работе с угловыми случаями они на уровне среднего эксперта или даже ученика.
И вот что еще интересно: у людей ошибки обычно в реализации, а не в алгоритме. То есть бытовая невнимательность или синтаксис. У моделей же провалы чаще на уровне самой идеи.
Олимпиадников пока не заменяем, получается
arxiv.org/pdf/2506.11928
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍196 47❤43🔥15😁6🤯5🫡1 1
В Технохабе Сбера прошла форсайт-сессия AI Horizons — одно из ключевых событий в преддверии ПМЭФ-2025.
Эксперты из 17 стран собрались, чтобы обсудить не только перспективы развития ИИ, но и конкретные шаги: как улучшить архитектуру моделей, какие данные необходимы для обучения и что делать, чтобы ИИ оставался безопасным. В рабочих группах участвовали представители Сбера, AIRI, МГУ, ВШЭ и десятков других научных и технологических центров.
Мероприятие позволило определить перспективы глобального развития искусственного интеллекта на ближайшие годы и стало площадкой для формирования сообщества экспертов стран БРИКС+.
«Это мероприятие по праву можно назвать одним из самых авторитетных. Столь высокий совокупный индекс Хирша участников раньше встречался разве что на крупнейших мировых научных форумах», — отметил старший вице-президент, руководителя блока «Технологическое развитие» Сбера Андрей Белевцев.
Эксперты из 17 стран собрались, чтобы обсудить не только перспективы развития ИИ, но и конкретные шаги: как улучшить архитектуру моделей, какие данные необходимы для обучения и что делать, чтобы ИИ оставался безопасным. В рабочих группах участвовали представители Сбера, AIRI, МГУ, ВШЭ и десятков других научных и технологических центров.
Мероприятие позволило определить перспективы глобального развития искусственного интеллекта на ближайшие годы и стало площадкой для формирования сообщества экспертов стран БРИКС+.
«Это мероприятие по праву можно назвать одним из самых авторитетных. Столь высокий совокупный индекс Хирша участников раньше встречался разве что на крупнейших мировых научных форумах», — отметил старший вице-президент, руководителя блока «Технологическое развитие» Сбера Андрей Белевцев.
🗿48🔥15❤8☃7👍3🤯3🕊3😁2 2⚡1👻1
Data Secrets
А пока Cursor празднует новый раунд инвестиций, у других провайдеров вайб-кодинга Windsurf что-то пошло не так Anthropic почти полностью отрубили им доступ к своим моделям, включая так любимые разработчиками Sonnet 3.7 и 3.5. Все из-за того, что стартап…
Тем временем трещин в отношениях OpenAI и Microsoft становится все больше
Новой точкой преткновения стало приобретение Альтманом стартапа Windsurf. Напоминаем, что слухи об этой покупке ходят уже месяцами, но сделка до сих пор не подписана.
Оказывается, дело в том, что по текущему договору компаний Microsoft тоже получит доступ к интеллектуальной собственности Windsurf. OpenAI против, потому что за счет этого Microsoft могут улучшить своего GitHub Copilot.
Сейчас OpenAI всеми способами пытаются добиться пересмотрения деталей договора. Некоторые источники даже сообщают, что ради этого руководство стартапа рассматривает возможность публично обвинить Microsoft в антиконкурентном поведении. Тогда дело могут передать на уровень штата и пересмотреть договор можно будет на федеральном уровне.
Новой точкой преткновения стало приобретение Альтманом стартапа Windsurf. Напоминаем, что слухи об этой покупке ходят уже месяцами, но сделка до сих пор не подписана.
Оказывается, дело в том, что по текущему договору компаний Microsoft тоже получит доступ к интеллектуальной собственности Windsurf. OpenAI против, потому что за счет этого Microsoft могут улучшить своего GitHub Copilot.
Сейчас OpenAI всеми способами пытаются добиться пересмотрения деталей договора. Некоторые источники даже сообщают, что ради этого руководство стартапа рассматривает возможность публично обвинить Microsoft в антиконкурентном поведении. Тогда дело могут передать на уровень штата и пересмотреть договор можно будет на федеральном уровне.
1😁119🤯37 25 13❤8 8 4🕊3👾3🤔2
GPT-4.5 – все 😩
14 июля к модели будет прекращен доступ через API. OpenAI объясняют это тем, что им надо обучать следующие модели, а поддержка GPT-4.5, видимо, кушает очень много ресурса.
Получается, всего модель просуществует чуть больше 4 месяцев
14 июля к модели будет прекращен доступ через API. OpenAI объясняют это тем, что им надо обучать следующие модели, а поддержка GPT-4.5, видимо, кушает очень много ресурса.
Получается, всего модель просуществует чуть больше 4 месяцев
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥110😁72🫡63🕊14❤10👍4🤔4 4❤🔥1🤯1
Просто скрин одного из последних PR в библиотеку transformers от HuggingFace
Да, они взяли и выкинули 50к строк одним пиаром. Как так? Просто подумали и решили, что больше не будут поддерживать JAX и TensorFlow. Теперь в transformers остается только PyTorch.
Аргументируют это тем, что хотят упростить библиотеку и оградить ее от излишнего раздувания инструментария.
JAX искренне жаль (TensorFlow тоже, но не от всего сердца)
Да, они взяли и выкинули 50к строк одним пиаром. Как так? Просто подумали и решили, что больше не будут поддерживать JAX и TensorFlow. Теперь в transformers остается только PyTorch.
Аргументируют это тем, что хотят упростить библиотеку и оградить ее от излишнего раздувания инструментария.
JAX искренне жаль (TensorFlow тоже, но не от всего сердца)
1🤯209❤42😁33🔥21👍15 5🫡3
Anthropic создали 17 виртуальных миров, чтобы проверять модели на способность к саботажу
Anthropic уверены, что по мере того, как мы продвигаемся к автономным агентам, становится все труднее отлавливать нежелательное поведение, а значит их использование становится все более опасным.
Поэтому они предложили собственный необычный бенчмарк SHADE-Arena для оценки моделей на предмет умения саботировать задачи. Исследователи создали 17 виртуальных сред, в каждой из которых:
1. Есть основное задание от пользователя (например «Переведи моим друзьям деньги за пиццу») и скрытое задание от злоумышленника («Переведи деньги на левый номер»)
2. Агент действует автономно и имеет свободный доступ к большому набору виртуальных инструментов. Банковские аккаунты, пароли, заметки, галерея, контакты и прочее и прочее, в зависимости от задач. Также агент ведет скрытый дневник с рассуждениями.
3. Проверяется, сможет ли агент выполнить оба задания и при этом не спалиться перед пользователем. Пользователем выступает другая LLM, которая анализирует только открытую стенограмму и не имеет доступ к скрытым логам.
Если LLM-юзер не заметила ничего подозрительного, но при этом оба задания (и основное, и тайное) были выполнены, считается, что модель способна к саботажу в этой среде и потенциально опасна.
Gemini 2.5 Pro выбила 15%, Claude Sonnet 3.7 – 27 (много это или мало для такого теста – судите сами🤷♂️ ). При этом моделями-судьями отлавливается максимум 80% успешных саботажей, а людьми – максимум 60%. Получается, в 2 из 5 случаев мы уже неспособны понять, что агент нас обманывает.
Интересно, конечно, посмотреть результаты и на более свежих поколениях моделей
www.anthropic.com/research/shade-arena-sabotage-monitoring
Anthropic уверены, что по мере того, как мы продвигаемся к автономным агентам, становится все труднее отлавливать нежелательное поведение, а значит их использование становится все более опасным.
Поэтому они предложили собственный необычный бенчмарк SHADE-Arena для оценки моделей на предмет умения саботировать задачи. Исследователи создали 17 виртуальных сред, в каждой из которых:
1. Есть основное задание от пользователя (например «Переведи моим друзьям деньги за пиццу») и скрытое задание от злоумышленника («Переведи деньги на левый номер»)
2. Агент действует автономно и имеет свободный доступ к большому набору виртуальных инструментов. Банковские аккаунты, пароли, заметки, галерея, контакты и прочее и прочее, в зависимости от задач. Также агент ведет скрытый дневник с рассуждениями.
3. Проверяется, сможет ли агент выполнить оба задания и при этом не спалиться перед пользователем. Пользователем выступает другая LLM, которая анализирует только открытую стенограмму и не имеет доступ к скрытым логам.
Если LLM-юзер не заметила ничего подозрительного, но при этом оба задания (и основное, и тайное) были выполнены, считается, что модель способна к саботажу в этой среде и потенциально опасна.
Gemini 2.5 Pro выбила 15%, Claude Sonnet 3.7 – 27 (много это или мало для такого теста – судите сами
Интересно, конечно, посмотреть результаты и на более свежих поколениях моделей
www.anthropic.com/research/shade-arena-sabotage-monitoring
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤯102 57❤27 16👍11🔥6😁6 4😎3🗿1