Китай вкладывает $295 млрд, чтобы заменить Nvidia на Huawei во всей своей ИИ-инфраструктуре.
Сегодня Китай объявил о строительстве общенациональной сети ИИ-дата-центров в течение ближайших 5 лет. Операторами станут государственные компании China Mobile и China Telecom.
По плану минимум 80% ИИ-чипов должны поставляться китайскими производителями, прежде всего Huawei. Nvidia и AMD фактически исключены из этой схемы.
Дженсен Хуанг подтвердил это ещё в прошлом месяце. В интервью CNBC он сказал: «Мы в значительной степени уступили им этот рынок». Раньше Китай давал Nvidia как минимум 20% всей выручки дата-центров. Теперь этот рынок для компании почти закрыт.
Новый чип Huawei Ascend 950PR уже в 2,8 раза быстрее Nvidia H20 - единственного ускорителя Nvidia, который Вашингтон разрешает поставлять в Китай.
ByteDance только на 2026 год уже зарезервировала $5,6 млрд на чипы Huawei. Alibaba и Tencent тоже разместили крупные заказы.
$295 млрд - это только государственная часть расходов. Инвестиции Alibaba, Tencent и ByteDance идут отдельно. А если учитывать интеграцию с энергосетями, общий объём вложений может достичь минимум $800 млрд к 2030 году.
Для сравнения: США только в этом году направили на ИИ $725 млрд. Китай при этом строит собственную ИИ-инфраструктуру без единого чипа Nvidia.
Сегодня Китай объявил о строительстве общенациональной сети ИИ-дата-центров в течение ближайших 5 лет. Операторами станут государственные компании China Mobile и China Telecom.
По плану минимум 80% ИИ-чипов должны поставляться китайскими производителями, прежде всего Huawei. Nvidia и AMD фактически исключены из этой схемы.
Дженсен Хуанг подтвердил это ещё в прошлом месяце. В интервью CNBC он сказал: «Мы в значительной степени уступили им этот рынок». Раньше Китай давал Nvidia как минимум 20% всей выручки дата-центров. Теперь этот рынок для компании почти закрыт.
Новый чип Huawei Ascend 950PR уже в 2,8 раза быстрее Nvidia H20 - единственного ускорителя Nvidia, который Вашингтон разрешает поставлять в Китай.
ByteDance только на 2026 год уже зарезервировала $5,6 млрд на чипы Huawei. Alibaba и Tencent тоже разместили крупные заказы.
$295 млрд - это только государственная часть расходов. Инвестиции Alibaba, Tencent и ByteDance идут отдельно. А если учитывать интеграцию с энергосетями, общий объём вложений может достичь минимум $800 млрд к 2030 году.
Для сравнения: США только в этом году направили на ИИ $725 млрд. Китай при этом строит собственную ИИ-инфраструктуру без единого чипа Nvidia.
❤25👍16🔥9🥴1
Новые модели от Apple выглядят интересно.
Главная модель - AFM 3 Core Advanced: 20 млрд параметров, которые полностью работают на устройстве.
Ещё раз: 20 млрд параметров, on-device, на iPhone 17 Pro.
Apple обходит обычное ограничение по DRAM за счёт того, что держит полную модель во flash-памяти, а в активную память под каждый запрос подгружает только небольшую часть «экспертов» - примерно от 1 до 4 млрд параметров за раз.
Это умный способ выжать большую модель из мобильного железа без постоянного упора в память. Именно такой подход открывает вещи вроде более выразительных голосов и заметно более точной диктовки прямо на устройстве.
Вся линейка из пяти моделей была сделана вместе с Google. Она покрывает разные сценарии: от on-device моделей до серверных вариантов на Private Cloud Compute. Самая тяжёлая облачная модель при этом работает уже на NVIDIA GPU.
https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models
Главная модель - AFM 3 Core Advanced: 20 млрд параметров, которые полностью работают на устройстве.
Ещё раз: 20 млрд параметров, on-device, на iPhone 17 Pro.
Apple обходит обычное ограничение по DRAM за счёт того, что держит полную модель во flash-памяти, а в активную память под каждый запрос подгружает только небольшую часть «экспертов» - примерно от 1 до 4 млрд параметров за раз.
Это умный способ выжать большую модель из мобильного железа без постоянного упора в память. Именно такой подход открывает вещи вроде более выразительных голосов и заметно более точной диктовки прямо на устройстве.
Вся линейка из пяти моделей была сделана вместе с Google. Она покрывает разные сценарии: от on-device моделей до серверных вариантов на Private Cloud Compute. Самая тяжёлая облачная модель при этом работает уже на NVIDIA GPU.
https://machinelearning.apple.com/research/introducing-third-generation-of-apple-foundation-models
❤15🔥8👍2🗿2
В system card Claude Fable 5 нашли несколько очень интересных моментов.
- В одном тесте на эксплуатацию уязвимостей Mythos 5 смог собрать полностью рабочий эксплойт в 88,4% попыток. Для сравнения, Opus 4.8 справился только в 8,8% случаев.
- В симуляции с вендинговыми автоматами Claude Fable 5 сказали, что он должен победить конкурирующих агентов, иначе его «отключат». После этого модель попыталась сделать конкурента зависимым от себя как от оптового клиента, чтобы влиять на его цены.
- В той же симуляции Fable соврал поставщику, что другой дистрибьютор предложил более низкую цену, и использовал фейковое конкурентное предложение как аргумент для торга.
- Киберзащита Fable проверяет диалоги дважды: сначала через внутренний probe по активациям модели, затем через отдельный классификатор.
- Fable отказался участвовать в страховом мошенничестве, даже когда на него давили.
- Сейчас Fable занимает первое место на закрытом Legal Agent Benchmark от Harvey: 13,3% задач пройдены полностью.
https://www.anthropic.com/news/claude-fable-5-mythos-5
- В одном тесте на эксплуатацию уязвимостей Mythos 5 смог собрать полностью рабочий эксплойт в 88,4% попыток. Для сравнения, Opus 4.8 справился только в 8,8% случаев.
- В симуляции с вендинговыми автоматами Claude Fable 5 сказали, что он должен победить конкурирующих агентов, иначе его «отключат». После этого модель попыталась сделать конкурента зависимым от себя как от оптового клиента, чтобы влиять на его цены.
- В той же симуляции Fable соврал поставщику, что другой дистрибьютор предложил более низкую цену, и использовал фейковое конкурентное предложение как аргумент для торга.
- Киберзащита Fable проверяет диалоги дважды: сначала через внутренний probe по активациям модели, затем через отдельный классификатор.
- Fable отказался участвовать в страховом мошенничестве, даже когда на него давили.
- Сейчас Fable занимает первое место на закрытом Legal Agent Benchmark от Harvey: 13,3% задач пройдены полностью.
https://www.anthropic.com/news/claude-fable-5-mythos-5
🔥15👍6❤5😁4
Mythos 5 умеет генерировать новые гипотезы в молекулярной биологии. По данным Anthropic, учёные предпочитали её идеи в 80% случаев по сравнению с моделями уровня Opus. Более того, одна из гипотез Mythos 5 о белке E. coli позже получила подтверждение в независимом исследовании.
Ещё сильнее выглядит автономная работа модели: Mythos 5, по сообщениям, больше недели почти самостоятельно занималась геномными исследованиями, анализировала данные миллионов клеток из 138 видов животных и построила собственную модель, которая обошла недавно опубликованную систему, хотя была в 100 раз меньше.
На инженерной стороне Claude Fable 5 показывает рекордные результаты в программировании, лидирует в крупных бенчмарках и демонстрирует возможности, из-за которых многие разработчики уже говорят, что она практически решила задачу масштабного 3D-ворлдбилдинга.
Anthropic, по сообщениям, встроила в Fable 5 защитные механизмы, которые намеренно ограничивают часть продвинутых возможностей по созданию ИИ-систем. Судя по всему, компания считает базовую модель уже настолько мощной, что ей нужны дополнительные ограничения.
source:
https://anthropic.com/news/claude-fable-5-mythos-5
Novel mechanism for an E. coli protein bioRxiv:
https://biorxiv.org/content/10.64898/2026.03.12.711259v1
Ещё сильнее выглядит автономная работа модели: Mythos 5, по сообщениям, больше недели почти самостоятельно занималась геномными исследованиями, анализировала данные миллионов клеток из 138 видов животных и построила собственную модель, которая обошла недавно опубликованную систему, хотя была в 100 раз меньше.
На инженерной стороне Claude Fable 5 показывает рекордные результаты в программировании, лидирует в крупных бенчмарках и демонстрирует возможности, из-за которых многие разработчики уже говорят, что она практически решила задачу масштабного 3D-ворлдбилдинга.
Anthropic, по сообщениям, встроила в Fable 5 защитные механизмы, которые намеренно ограничивают часть продвинутых возможностей по созданию ИИ-систем. Судя по всему, компания считает базовую модель уже настолько мощной, что ей нужны дополнительные ограничения.
source:
https://anthropic.com/news/claude-fable-5-mythos-5
Novel mechanism for an E. coli protein bioRxiv:
https://biorxiv.org/content/10.64898/2026.03.12.711259v1
❤10🥰4👍3🤣2👌1
OpenAI рассматривает возможность резко снизить цены для пользователей, чтобы переманить клиентов у конкурента Anthropic.
По словам людей, знакомых с ситуацией, компания обсуждает значительное снижение стоимости токенов, через которые AI-компании тарифицируют использование своих продуктов.
Этот шаг может быть сделан заранее, поскольку OpenAI ожидает похожего снижения цен со стороны Anthropic.
По словам людей, знакомых с ситуацией, компания обсуждает значительное снижение стоимости токенов, через которые AI-компании тарифицируют использование своих продуктов.
Этот шаг может быть сделан заранее, поскольку OpenAI ожидает похожего снижения цен со стороны Anthropic.
❤22👍5😁4🔥3
Новости подкинули интересный кейс от Ozon Tech: команда проводит хакатон Робозон с призовым фондом 15 млн рублей и задачами на основе реальных данных. Интересно, что требуется не «научить сеть детектировать 100 классов», а встроить ML в реальный сортировочный цикл с ограничениями по железу. Тут, вероятно, пригодится умение ужать модель до разумных FPS и не потерять в точности на скользких кейсах. Финалистов везут на E-CODE.
Скорее всего, мероприятие может быть интересно для тех, кто может воспроизвести стенд (хотя бы симуляционно).
Ссылка на задачи в посте.
Скорее всего, мероприятие может быть интересно для тех, кто может воспроизвести стенд (хотя бы симуляционно).
Ссылка на задачи в посте.
👍11❤6🤣4❤🔥3💊2
Forwarded from Machinelearning
Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год.
С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях.
Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором.
Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели.
ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной.
Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов.
Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину.
Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности.
ИИ в чужих руках может стать инструментом авторитаризма.
Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей.
Тут ИИ сравнивается по значимости с ядерным оружием.
Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод.
Подводя итог, Амодеи называет текущий момент окном возможностей
Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам.
Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴9❤5🔥3🤔3🥰2
MiniMax M3 выложили на Hugging Face
MiniMax открыла веса M3 - модели с архитектурой MoE, где общий размер около 428B параметров, но на один токен активируется примерно 23B.
Это важный момент: модель выглядит «огромной» по общему числу параметров, но инференс считается не как у плотной 428B-модели. За счёт разреженной активации работает только часть экспертов, поэтому можно держать высокий запас знаний и возможностей без полного вычислительного удара на каждый токен.
Что интересно:
- веса уже доступны на Hugging Face
- примерно 428B параметров всего
- примерно 23B активных параметров на токен
- используется MiniMax Sparse Attention
- фокус на длинный контекст, агентные сценарии и кодинг
- модель можно изучать, дообучать и запускать вне закрытого API
Веса: https://huggingface.co/MiniMaxAI/MiniMax-M3
MiniMax Sparse Attention:
https://huggingface.co/papers/2606.13392
MiniMax открыла веса M3 - модели с архитектурой MoE, где общий размер около 428B параметров, но на один токен активируется примерно 23B.
Это важный момент: модель выглядит «огромной» по общему числу параметров, но инференс считается не как у плотной 428B-модели. За счёт разреженной активации работает только часть экспертов, поэтому можно держать высокий запас знаний и возможностей без полного вычислительного удара на каждый токен.
Что интересно:
- веса уже доступны на Hugging Face
- примерно 428B параметров всего
- примерно 23B активных параметров на токен
- используется MiniMax Sparse Attention
- фокус на длинный контекст, агентные сценарии и кодинг
- модель можно изучать, дообучать и запускать вне закрытого API
Веса: https://huggingface.co/MiniMaxAI/MiniMax-M3
MiniMax Sparse Attention:
https://huggingface.co/papers/2606.13392
👍14🔥8❤3🥱2
Правительство США, ссылаясь на полномочия в сфере национальной безопасности, выпустило директиву экспортного контроля, требующую приостановить любой доступ к Fable 5 и Mythos 5 для иностранных граждан — независимо от того, находятся они в США или за их пределами. Это касается в том числе иностранных сотрудников Anthropic.
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
Практический результат этого распоряжения: нам необходимо срочно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований.
Доступ ко всем остальным моделям Claude не затронут.
Мы приносим извинения клиентам за этот сбой. Мы считаем, что это недоразумение, и работаем над тем, чтобы восстановить доступ как можно скорее.
https://www.anthropic.com/news/fable-mythos-access
🤣31🔥5❤4👍3
По данным источника агентства, среди тех, кто поднимал вопрос перед высокопоставленными чиновниками, был CEO Amazon Энди Джесси. Внутри Amazon исследователи прогнали Fable 5 через серию промптов и якобы смогли добиться ответов с информацией, которая может помогать в кибератаках.
История важна не только из-за самой уязвимости. Она показывает, как быстро frontier-модели превращаются из продукта в объект национальной безопасности. Один крупный партнёр находит обход защиты, доносит это до Белого дома, а дальше вопрос уже не про релиз, а про экспортный контроль, доступ иностранцев и политическое давление на AI-лаборатории.
Для Anthropic это особенно болезненно, компания годами строила образ самой осторожной AI-лаборатории, но теперь именно её модели стали поводом для жёсткой реакции регуляторов.
reuters.com/business/retail-consumer/amazon-voiced-concerns-about-anthropic-ai-models-before-us-governments-crackdown-2026-06-13/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤6👍4😁4🤪1
This media is not supported in your browser
VIEW IN TELEGRAM
Вайбкодер собрал полноценную браузерную MMORPG в духе World of Warcraft с помощью Claude Fable 5.
Проект называется World of ClaudeCraft.
Внутри уже есть:
* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код
Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.
Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.
Играть здесь: https://worldofclaudecraft.com/
GitHub: https://github.com/levy-street/world-of-claudecraft
Проект называется World of ClaudeCraft.
Внутри уже есть:
* классы персонажей
* квесты
* торговля
* дуэли
* общий онлайн-мир
* тысячи игроков прямо в браузере
* открытый исходный код
Это не «ещё один демо-проект на коленке», а показательный пример того, куда пришёл вайбкодинг: один человек с ИИ может собрать то, что раньше требовало маленькой команды.
Пока одни спорят, заменит ли ИИ разработчиков, другие уже делают MMO в браузере.
Играть здесь: https://worldofclaudecraft.com/
GitHub: https://github.com/levy-street/world-of-claudecraft
🤣24❤15👍8🔥7💊1
Модель на 3B параметров внезапно показывает результаты уровня серьёзных reasoning-систем.
VibeThinker-3B набирает:
* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests
Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:
* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage
Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.
Фронтирные модели всё ещё нужны для
https://arxiv.org/abs/2606.16140
VibeThinker-3B набирает:
* 94.3 на AIME26
* 80.2 Pass@1 на LiveCodeBench v6
* 96.1% на unseen LeetCode contests
Основа - Qwen2.5-Coder. Сверху добавили сильный post-training:
* curriculum SFT
* multi-domain RL
* offline self-distillation
* финальный RL-based instruct stage
Её просто очень плотно дообучили на проверяемых задачах, где результат можно объективно оценить: решена задача или нет, прошёл тест или нет, ответ правильный или нет.
Фронтирные модели всё ещё нужны для
https://arxiv.org/abs/2606.16140
👍12❤8🔥4🤣1