Анализ данных (Data analysis)

«Claude-Mythos-5» ненадолго засветился в API. Похоже, скоро релиз.

Интересно, пойдут ли они с ценами из поста про Glasswing: $25 за миллион входных токенов и $125 за миллион выходных.

Если да, это сделает Mythos примерно в 5 раз дороже Opus 4.8.

https://x.com/Machinelearrn/status/2063246572914160053

❤15🔥10👍6🌚2👏1

4.63K views13:08

Анализ данных (Data analysis)

😱12❤5👍5💯4😐4

4.49K views16:02

Анализ данных (Data analysis)

В Юте жители подали в суд из-за гигантского ИИ-дата-центра Stratos, который продвигает Кевин О’Лири.

Проект изначально планировали как кампус на 40 000 акров в Box Elder County. Местные опасаются нагрузки на воду, энергию, экологию и фактически обхода нормального общественного обсуждения. Иск подали пять жителей и Alliance for a Better Utah: они оспаривают роль Military Installation Development Authority, структуры, которая получила слишком широкие полномочия по земле, налогам, безопасности и развитию территории.

На фоне давления О’Лири уже согласился урезать проект почти вдвое и вывести часть земли из застройки, включая участки рядом с Locomotive Springs Waterfowl Management Area. Но даже после сокращения речь всё равно идёт примерно о 20 000 акров - это больше Манхэттена.

История показательная:

- дата-центры продают как вопрос национальной безопасности
- местным обещают рабочие места и налоги
- жители получают риски по воде, земле, шуму, энергии и экологии
- решения часто двигаются быстрее, чем общество успевает понять масштаб

https://www.nbcnews.com/tech/tech-news/utah-residents-sue-officials-kevin-oleary-data-center-plan-rcna348720

👍15❤9🔥6😁5

4.75K views21:46

Анализ данных (Data analysis)

Google Research показали Agentic RAG для Gemini Enterprise Agent Platform - RAG, который не сдаётся после первого поиска.

Обычный RAG часто ломается на корпоративных вопросах, где ответ лежит не в одном документе, а размазан по нескольким базам. Нашёл кусок про проект, увидел только ID сервера, но не пошёл дальше искать характеристики этого сервера в другой системе - и выдал неполный ответ.

У Google идея такая: превратить RAG в многоагентный процесс.

Что внутри:

- Orchestrator понимает, что запрос не решается за один шаг
- Planner разбивает задачу на маршруты поиска
- Query Rewriter переписывает вопрос в несколько точных запросов
- Search Fanout ищет по разным источникам
- Sufficient Context Agent проверяет, хватает ли данных для ответа

Модель проверяет: закрыты ли все части вопроса. Если данных не хватает, она явно пишет, чего именно не хватает, и отправляет систему искать дальше.

На FramesQA такой подход дал до 34% прироста точности по сравнению со стандартным RAG. В cross-corpus сценарии, где нужно выбрать правильный источник из нескольких, система ответила правильно на 90.1% вопросов.

По сути, Google двигает RAG от «поиска + генерации» к маленькому исследовательскому пайплайну, где есть планирование, маршрутизация, проверка контекста и повторный поиск.

Для enterprise это важнее красивых демо: меньше галлюцинаций, больше трассируемости и понятнее, почему система дала именно такой ответ.

research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/

👍29❤11🔥6🥱4

5.25K views14:31

Анализ данных (Data analysis)

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

Китайская UBTECH Robotics показала тизеры humanoid-роботов серии U1 для массового рынка.

В линейке две бионические модели:

- старшая версия - 183 см и 42 кг
- младшая версия - 168 см и 35,2 кг
- 88 степеней свободы
- поддержка Wi-Fi
- встроенный ИИ для обучения и взаимодействия с окружением
- автономность до 4 часов

Полная презентация запланирована на 30 июня, но предзаказы уже открыты. По данным компании, зарезервировано 1 943 устройства.

❤16👍7🔥7😐6

4.58K views12:04

Анализ данных (Data analysis)

Google, похоже, даёт Intel Foundry самый важный шанс за последние годы.

По данным The Information, Google выбрала Intel для производства 3 млн+ TPU в 2028 году. Для Intel это не просто крупный заказ, а редкий вход в цепочку поставок одного из главных конкурентов Nvidia в ИИ-железе:

- Intel становится потенциальной второй фабрикой для топовых ИИ-чипов
- Google снижает зависимость от TSMC
- рынок получает ещё одного крупного производителя advanced-node чипов
- Nvidia, Apple, Tesla и другие тоже ищут способы не упереться в один производственный узел

Сейчас TSMC фактически держит горлышко бутылки для ИИ-инфраструктуры. Спрос на ускорители растёт быстрее, чем доступные мощности, поэтому даже гигантам приходится искать запасные маршруты.

Для Google это способ масштабировать TPU и меньше зависеть от Nvidia. Для Intel - проверка, сможет ли её foundry-бизнес наконец стать не презентацией для инвесторов, а реальной альтернативой TSMC.

theinformation.com/articles/google-nvidia-consider-intel-backup-chip-manufacturer

🔥13❤5👍3🤔3

4.23K viewsedited 16:04

Анализ данных (Data analysis)

Tencent Hunyuan выкатили UniRL - инфраструктуру для RL-посттрейнинга мультимодальных моделей.

Это попытка собрать один общий RL-цикл для разных семейств моделей: LLM, VLM, diffusion, flow matching и unified multimodal.

Обычный пайплайн выглядит знакомо:

- generate
- score
- advantage
- update
- sync

UniRL пытается сделать этот цикл универсальным. Модель и алгоритм разведены как две независимые оси, поэтому можно комбинировать разные model families и RL-алгоритмы без жёстко зашитого сценария.

Покрытие широкое: text-to-image, text/image-to-video, vision-language, text-only LLM, VLM, LLM-to-diffusion prompt enhancer, а также смешанная autoregressive + diffusion генерация вроде Hunyuan-Image 3 и Bagel.

Есть pluggable rollout engines через единый typed contract: train-side, SGLang, vLLM-Omni. Для масштабирования заявлены FSDP2 sharding и несколько deployment-режимов, которые переключаются из одного конфига.

Отдельно Tencent добавили два своих алгоритма:

- Flow-DPPO - policy optimization для flow/diffusion моделей с trust-region masks на основе exact divergence
- DRPO - RL для LLM со сглаженным advantage-weighted quadratic regularizer

UniRL выглядит как шаг к нормальному post-training стеку для моделей, которые одновременно пишут, видят, генерируют и используют разные типы rollout-движков.

Код: http://github.com/Tencent-Hunyuan/UniRL

Статья: arxiv.org/abs/2606.09821

❤8👍6🔥4

4.19K views11:59

Анализ данных (Data analysis)

Что выбираете ?)

1❤38🐳28👍8🌚6🔥5

3.99K views13:41

Анализ данных (Data analysis)

Что сегодня определяет сильную BI-платформу? Уже не только красивые дашборды.

CNewsMarket опубликовал рейтинг российских BI-систем 2026 года. Аналитики сравнили решения более чем по 130 параметрам: от интеграции с источниками данных и возможностей визуализации до поддержки пользователей, партнерской экосистемы и инструментов self-service аналитики.

Главный вывод исследования — рынок BI продолжает смещаться от отчетности к принятию решений. Компаниям важно не просто собирать данные, а быстро находить инсайты, проверять гипотезы, выявлять аномалии и делать аналитику доступной для бизнес-пользователей без постоянного участия ИТ-команд.

Отдельное внимание в рейтинге уделено ИИ-функциям, работе с разнородными источниками данных и возможностям самостоятельного создания аналитики. По итогам исследования первое место занял DataLens, за ним расположились PIX BI и Luxms BI.

Похоже, что в 2026 году конкуренция между BI-платформами идет уже не столько за количество функций, сколько за скорость получения ответа на бизнес-вопрос.

👍5❤3

3.92K viewsedited 15:59

Анализ данных (Data analysis)

😁38🤣9💯3❤2😢2👍1🔥1

4.73K views18:50

Анализ данных (Data analysis)

Claude 5 Fable - кратко:

- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки

Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.

GPT-5.6 уже близко.

Интересно, выпустит ли OpenAI свой аналог Mythos.

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

https://www.anthropic.com/news/claude-fable-5-mythos-5

🔥17❤10👍9

6.12K views18:55

Анализ данных (Data analysis)

Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀

20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.

Ты будешь:

✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.

А ещё ты станешь частью крупнейшего IT‑комьюнити.

Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!

❤2😁2👍1

4.38K views08:00

Анализ данных (Data analysis)

CUDA 13.3 - это не просто очередной апдейт тулкита NVIDIA, а шаг к более высокоуровневому GPU-программированию.

Главное изменение - CUDA Tile теперь доступен в C++. Это модель, где разработчик описывает вычисления через тайлы, а низкоуровневые детали вроде параллелизма, перемещения данных, асинхронности и работы с памятью берёт на себя компилятор. Для C++-команд это важно: можно встраивать tile-подход в существующие CUDA-кодовые базы, не переписывая всё вокруг нового DSL.

Что ещё добавили:

- CUDA Tile C++ для более компактных и переносимых GPU-кернелов
- поддержку Hopper с Compute Capability 9.0
- CompileIQ - автонастройку компилятора под конкретные кернелы
- CUDA Python 1.0 как стабильную версию Python-интерфейса к CUDA
- обновления для checkpointing, IPC и работы с контекстами
- улучшения для tensor interoperability

Самое интересное здесь не «ещё немного быстрее», а смена уровня абстракции. NVIDIA постепенно двигает CUDA от ручного управления потоками, памятью и синхронизацией к модели, где разработчик описывает вычисления, а компилятор сам ищет эффективный путь к железу.

Для AI-инфраструктуры это особенно важно. Кастомные кернелы для attention, GEMM и инференса остаются узким местом, но писать их руками дорого и сложно. CUDA 13.3 делает этот слой доступнее для C++, Python и production-команд, которые хотят выжимать производительность без полного погружения в низкоуровневую CUDA-магию.

NVIDIA явно строит не просто GPU, а полный стек: язык, компилятор, runtime, Python-интерфейсы и инструменты автооптимизации.

https://developer.nvidia.com/blog/nvidia-cuda-13-3-enhances-gpu-development-with-tile-programming-in-c-compiler-autotuning-and-python-updates

❤15🔥7🥰3

6.87K views09:35

Анализ данных (Data analysis)

Отличные новости из нового исследования, опубликованного в Nature. Слово «историческое» тут действительно уместно.

Пациент впервые получил генную терапию, которая должна заставить повреждённые нейроны глаза снова вести себя как молодые клетки.

Важно, что речь не об обычных клетках глаза. Мишень терапии — нейроны центральной нервной системы, похожие на клетки мозга. Обычно после повреждения они почти не восстанавливаются.

Если подход сработает, это станет ранним признаком того, что медицина может научиться чинить нервную ткань, которую раньше считали необратимо повреждённой.

https://www.nature.com/articles/d41586-026-01836-7

❤43🔥12👍9

4.71K views13:17

Анализ данных (Data analysis)

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

NVIDIA показала CPO-switch, сделанный вместе с Lambda.

CPO, или co-packaged optics, переносит оптическую связь ближе к главному сетевому чипу. Путь сигнала становится короче, потерь меньше, энергопотребление ниже, а потенциальных точек отказа меньше.

NVIDIA объясняет это через экономику токенов: сеть сама токены не генерирует, но без неё GPU простаивают. Чем больше энергии и сбоев в сети, тем дороже каждый токен.

Для масштаба: дата-центр на 128 000 GPU с обычными оптическими модулями требует около 655 000 трансиверов. Каждый из них может сломаться. CPO убирает этот класс компонентов.

🔥14❤4👍3😁2🤯2

4.25K views12:28

Анализ данных (Data analysis)

NVIDIA представила Vera CPU как процессор для новой волны AI-фабрик

Раньше масштабирование ИИ в основном крутилось вокруг обучения, инференса и test-time compute. Теперь растёт другой тип нагрузки: агентные системы и reinforcement learning.

Такие модели планируют, вызывают инструменты, запускают проверки, работают с окружениями, делают больше шагов и постоянно гоняют данные между CPU, GPU, памятью и сетью.

По данным NVIDIA, Vera должна ускорять выполнение агентных задач до 1,8 раза по сравнению с x86 CPU, сокращать CPU-время и повышать общий throughput AI-фабрики. Идея простая: если CPU медленно готовит данные и обслуживает окружение, дорогие GPU ждут и не генерируют токены.

Vera делает ставку на высокую пропускную способность памяти, быструю связку CPU-GPU через NVLink-C2C и более предсказуемое перемещение данных. Для агентных workloads это важно, потому что там стоимость считается не только в FLOPS, а в том, сколько задач система успевает завершить за единицу времени.

NVIDIA усердно двигает идею продажи AI-фабрики целиком: GPU, CPU, сеть, память и софт как одну систему.

https://developer.nvidia.com/blog/nvidia-vera-cpu-sets-a-new-standard-for-agentic-workloads-in-ai-factories/

👍18🔥8❤5

3.9K views17:42

Анализ данных (Data analysis)

Moonshot AI выпустила и открыла Kimi-K2.7-Code - новую модель для кодинга и агентных задач.

По сравнению с K2.6 модель стала заметно сильнее в задачах разработки:

* +21.8% на Kimi Code Bench v2
* +11.0% на Program Bench
* +31.5% на MLS Bench Lite

Отдельно улучшили эффективность рассуждений. Kimi-K2.7-Code меньше «думает вслух» и тратит примерно на 30% меньше reasoning-токенов, чем K2.6. Для кодинг-агентов это важно: меньше лишнего перебора, быстрее выполнение, ниже стоимость.

Ещё один акцент - long-horizon coding. Модель лучше держит длинные инструкции и чаще доводит end-to-end задачи до рабочего результата, а не ломается где-то посередине.

Скоро обещают 6x High-Speed Mode.

Доступна через Kimi API и Kimi Code:

Kimi Code: https://kimi.com/code
API: https://platform.moonshot.ai

❤13👍9🔥5

3.53K views12:05

About

Blog

Apps

Platform