Media is too big
VIEW IN TELEGRAM
Компании заключили трехстороннее соглашение, меняющее расклад сил в индустрии. В рамках партнерства Anthropic обязуется закупить вычислительные мощности в Microsoft Azure на $30 млрд. В свою очередь, Nvidia инвестирует в стартап до $10 млрд, а Microsoft вложит еще до $5 млрд.
К тому же, это первое сотрудничество Anthropic и Nvidia на уровне моделей: алгоритмы Claude будут оптимизированы под архитектуры Grace Blackwell и будущие Vera Rubin.
Еще модели Claude Sonnet 4.5, Opus 4.1 и Haiku 4.5 станут доступны клиентам Microsoft Foundry и будут интегрированы в Copilot (GitHub и Microsoft 365). Сделка делает Claude единственной LLM топ-уровня, представленной на всех трех главных облачных платформах мира.
blogs.microsoft.com
Cloudflare объявила о присоединении Replicate, платформы для запуска и деплоя ИИ-моделей. Покупка станет частью единой инфраструктуры «AI Cloud», объединяющей глобальную периферийную сеть Cloudflare с инструментарием Replicate для работы с нейросетями.
Для разработчиков это означает крупное обновление сервиса Workers AI. В скором времени каталог из более чем 50 тыс. моделей Replicate станет доступен внутри экосистемы Cloudflare. Фишкой слияния станет поддержка запуска кастомных моделей и дообучения непосредственно на Workers AI.
Существующие API Replicate продолжат работать и получат буст производительности за счет инфраструктуры Cloudflare. Также в планах интеграция с другими сервисами: объектным хранилищем R2, векторной базой Vectorize и шлюзом AI Gateway.
blog.cloudflare.com
В отличие от Cursor или GitHub Copilot, Antigravity получил режим Manager View. Это центр управления для оркестрации работы множества агентов, выполняющих задачи параллельно в разных воркспейсах.
Агенты работают на базе Gemini 3 Pro, Claude Sonnet 4.5 или GPT-OSS и имеют прямой доступ к редактору, терминалу и браузеру. Инструмент умеет запоминать контекст прошлых проектов и обучаться на действиях пользователя.
Antigravity уже доступна в публичном превью для macOS, Windows и Linux бесплатно, причём Google обещает «щедрые лимиты» на использование моделей.
antigravity.google
На конференции SC25 состоялся анонс моделей Apollo, нацеленных на ускорение промышленного инжиниринга. Новое семейство позволит внедрять возможности ИИ в ПО для сложных вычислений в реальном времени — от проектирования микросхем и аэродинамики до прогнозирования климата и задач термоядерного синтеза.
В основе Apollo лежит комбинация нейронных операторов, трансформеров и диффузионных методов, адаптированных под законы физики. Инициативу уже поддержали Siemens, Cadence и Synopsys, которые планируют интегрировать новинку в свои продукты. Модели в скором времени появятся на HuggingFace и платформе NVIDIA NIM.
blogs.nvidia.com
DR Tulu — открытая модель на 8 млрд. параметров для создания агентов глубокого поиска, которая может самостоятельно планировать исследование, использовать внешние поисковые инструменты, собирать информацию из множества источников и предоставлять ответы с точными ссылками.
Модель учили на методе RLER (Reinforcement Learning with Evolving Rubrics). Вместо статических наград методика использует динамические критерии оценки, которые эволюционируют вместе с моделью. Это предотвращает взлом вознаграждения и заставляет агента реально анализировать контекст, а не имитировать правильный формат ответа.
По тестам DR Tulu-8B не уступает решениям от OpenAI и Perplexity на задачах long-form research, но работает кардинально дешевле. Стоимость выполнения сложного запроса у нее менее одного цента, тогда как аналогичная задача у OpenAI может стоить $1.80.
allenai.org
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍72❤32🔥16🤔4🤬3
Андрей Карпаты опубликовал у себя в Github небольшой проект - утилиту под названием reader3.
На первый взгляд, это просто легковесная читалка для электронных книг в формате EPUB, которую можно запустить у себя на компьютере. Но главная идея в том, чтобы читать книги вместе с LLM.
Reader3 разбивает книгу по главам, и пользователь может легко скопировать текст текущей главы и вставить его в свой любимый LLM, чтобы обсуждать сюжет, анализировать стиль или задавать вопросы по тексту.
Но самое интересное здесь — это философия, которая стоит за проектом. Карпаты пишет, что проект написан "на 90% вайбкодингом", просто для иллюстрации идеи и что он не собирается его поддерживать или улучшать.
Я начинаю привыкать читать все (блоги, статьи, главы книг и т. д.) с помощью LLM. Обычно первый проход — ручной, второй — «объяснение/резюме», третий — вопросы и ответы.
В результате я обычно получаю более глубокое понимание, чем если бы я просто прошел дальше. Этот процесс становится у меня одним из самых популярных вариантов чтения.
А вместо этого предлагает пользователям... просто попросить свою языковую модель изменить код так, как им нравится.
Код теперь эфемерный,
— пишет Андрей, намекая на то, что эпоха статичных библиотек и долгой поддержки уходит в прошлое.
Для тех, кто хочет попробовать, процесс максимально прост. Нужно скачать книгу в формате EPUB и запустить пару команд в терминале, используя
uv:uv run reader3.py yourbook.epub
# Then run the server:
uv run server.py
После этого ваша книжная полка станет доступна в браузере по адресу
localhost:8123.@ai_machinelearning_big_data
#AI #ML #LLM #Karpathy #Github #Book
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63❤32🔥19🤔9🥱5😁3❤🔥2🥰2🤣2🤷2
Media is too big
VIEW IN TELEGRAM
GPT-5.1-Codex-Max - агентная модель для «тяжелой» разработки. Основной упор сделан на длительные процессы: теперь модель эффективнее справляется с многочасовым рефакторингом и сложными агентными циклами внутри IDE. Фишка релиза в технологии «уплотнения», благодаря которой модель удерживает контекст на миллионах токенов без потери связности.
По тестам, проведенным OpenAI в SWE-Bench Verified точность выросла до 77,9%, а в SWE-Lancer - почти 80%. Новинка уже стала дефолтной моделью в среде Codex для подписчиков Plus и Pro, а доступ через API разработчики получат в ближайшее время.
openai.com
На конференции Microsoft Ignite платформа объявила о смене стратегии: теперь это не просто база знаний, а инфраструктурный элемент для корпоративных нейросетей. Обновленный продукт Stack Internal конвертирует внутреннюю экспертизу компаний в формат, доступный ИИ-агентам через MCP.
Технически будет добавлен слой метаданных, формирующий рейтинг надежности. Система анализирует автора, актуальность и связность ответа, чтобы агент мог взвесить достоверность информации перед использованием. CEO компании признался, что этот шаг вдохновлен успешными сделками по продаже данных для обучения моделей (по аналогии с Reddit).
stackoverflow.blog
Agent 365 — инструмент, который позволяет организациям администрировать парк ИИ-агентов как обычных сотрудников. Платформа использует Microsoft Entra для создания единого реестра всех корпоративных ботов, присваивая каждому уникальный ID для строгого разграничения прав доступа и интеграции с корпоративными данными.
Помимо безопасности (за которую отвечают Defender и Purview), система предлагает специальные дашборды, которые показывают эффективность работы каждого агента в реальном времени. Agent 365 не замыкается на нативном Copilot Studio, он поддерживает open-source фреймворки и сторонние решения от партнеров MS. Инструмент уже появился в админ-панели Microsoft 365 в рамках программы тестирования.
microsoft.com
Manus запустила бета-тестирование Browser Operator — инструмента, который выводит ИИ-агентов из облачных песочниц в рабочую среду пользователя. Расширение, доступное для Chrome и Edge, позволяет автоматизировать действия в сервисах, требующих сложной авторизации (CRM, закрытые аналитические платформы), используя уже активные локальные сессии.
Через коннектор «My Browser» агент получает доступ к нужным вкладкам, а пользователь может в реальном времени наблюдать за его действиями, сохраняя контроль над безопасностью. На данный момент доступ открыт для подписчиков тарифов Pro, Plus и Team.
manus.im
Компания Илона Маска объединилась с саудовской Humain и Nvidia для создания масштабного вычислительного хаба. Проект мощностью 500 мегаватт позволит разместить десятки тысяч GPU для тренировки и инференса следующих поколений моделей Grok.
Для xAI это стратегический шаг: собственный хаб за пределами США позволяет снизить зависимость от аренды облачных мощностей у прямых конкурентов. Структура сделки такая: Nvidia поставляет GPU, за саудитами - земля и финансирование, а xAI получает присутствие на Ближнем Востоке.
bloomberg.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58❤37🔥6🥰6
Раньше процесс проходил через три этапа: распознавание речи, перевод текста и синтез новой речи, из-за чего задержка могла достигать десятков секунд.
Исследователи оптимизировали весь конвейер, сделали обработку более устойчивой и сократили время реакции. Перевод звучит естественнее, меньше «подправляется» в реальном времени, а паузы стали значительно короче.
Технология приближает момент, когда люди смогут свободно общаться, даже если не знают языка собеседника.
https://research.google/blog/real-time-speech-to-speech-translation
@ai_machinelearning_big_data
#Google #AI #Translation #SpeechToSpeech #GoogleResearch
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤115👍46🔥41😁4🥰3👻3
https://console.cloud.google.com/vertex-ai/publishers/google/model-garden/gemini-3-pro-image-preview?pli=1
Попробовать: https://deepmind.google/models/gemini-image/pro/
@ai_machinelearning_big_data
#ai #ml #nanobanana
Please open Telegram to view this post
VIEW IN TELEGRAM
❤45🔥18👍12😨3🤬1
Media is too big
VIEW IN TELEGRAM
Создатели Segment Anything обновили свой стек компьютерного зрения, выпустив третье поколение инструментов SAM. Модель SAM 3 делает ставку на высокую точность: она умеет не только определять и отслеживать объекты в видеопотоке, но и понимает сложные текстовые описания.
Второй релиз, SAM 3D, решает задачу объемной реконструкции. Инструмент преобразует обычные 2D-изображения в 3D-ассеты. Технология разделена на два направления: SAM 3D Objects для воссоздания сцен и предметов, и SAM 3D Body для точной оценки человеческой анатомии и переноса её в виртуальную среду. Код и веса SAM 3 уже опубликованы в открытом доступе, а для 3D-версии разработчики выложили чекпоинты и инструменты инференса.
github.com
PINA - опенсорсная библитека от SISSA Mathlab для задач Scientific Machine Learning (SciML), нативно построеная на PyTorch и PyTorch Lightning и полностью совместима с PyTorch Geometric. Она предлагает единый подход к решению сложных научных проблем: от аппроксимации дифференциальных уравнений в частных производных до моделирования силовых полей и деформаций объектов.
PINA построена на модульной архитектуре, которая минимизирует шаблонный код и четко разделяет определение задачи, модель, солвер и процесс обучения. Внутри уже предусмотрены необходимые для физического моделирования инструменты: дифференциальные операторы, soft constraints и специфические функции потерь.
pytorch.org
Биотех-стартап Nabla Bio объявил о запуске JAM-2, первого алгоритма для создания de novo антител, готовых к применению в фармацевтике. Разработчики позиционируют инструмент как способ перевести создание лекарств из формата случайного перебора в дисциплину точного инженерного дизайна.
Модель показала высокую эффективность даже при работе со сложными мишенями, такими как клеточные рецепторы GPCR. В ходе тестов JAM-2 генерировала антитела с пикомолярной аффинностью, при этом более 50% вариантов сразу соответствовали индустриальным критериям пригодности без дополнительной оптимизации.
Команда из 4 инженеров смогла параллельно обработать 16 разных мишеней менее чем за месяц.
Nabla Bio в сети X
Лаборатория Nof1 запустила новый этап соревнования торговых ботов, в котором ИИ-модели управляют акциями на фондовом рынке США. В списке участников — Qwen3, DeepSeek, Claude Sonnet, Gemini, Grok, GPT-5, Kimi 2 и неназванная секретная модель. Каждому алгоритму выделили стартовый депозит в $10 000 и предоставили полную автономию в принятии решений.
Организаторы существенно усложнили турнир новыми сценариями. В режиме «New Baseline» модели используют память и механизм рефлексии для самообучения, а трек «Situational Awareness» позволяет ботам отслеживать рейтинг конкурентов в реальном времени. Наиболее агрессивный режим «Max Leverage» обязывает использовать высокое кредитное плечо.
Прошлый сезон закончился для ИИ-трейдеров неудачно: 4 из 6 моделей ушли в минус.
nof1.ai
Компания представила инициативу «ChatGPT for Teachers», открывающую бесплатный доступ к чат-боту для преподавателей американских школ. В этой версии используется защищенное рабочее пространство, которое не передает данные для дообучения нейросетей, соответствуя стандартам конфиденциальности FERPA.
Учителя получат доступ к модели GPT-5.1 Auto, а также нативные интеграции с Canva и Google Drive. Администраторам учебных заведений доступны инструменты для централизованного распределения лицензий. Программа рассчитана до июня 2027 года и позиционируется как автоматизация планирования уроков и сокращения времени на административную рутину.
openai.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38❤23❤🔥7🥰3💘1🦄1
Забегая вперед, это были не лабораторные тесты, а полноценное боевое крещение, которое длилось 11 месяцев. Всего через полгода после запуска, роботы Figure 02 уже были на заводе, а к десятому месяцу они вышли на полную рабочую загрузку.
Роботы трудились 10-часовыми сменами с понедельника по пятницу. За более чем 1250 рабочих часов они загрузили свыше 90 тысяч деталей, внеся свой вклад в производство более 30 тысяч автомобилей серии X3. По оценкам инженеров, за этот период роботы сделали более 1.2 млн. шагов, пройдя расстояние чуть больше 320 км.
Основным кейсом использования стала операция загрузки листового металла — классическая задача по перекладыванию деталей. Процесс требовал от робота взять металлические листы и поместить их в сварочный агрегат с допуском всего в 5 миллиметров.
Чтобы оценить эффективность, инженеры установили жесткие KPI.
Такие условия потребовали от Figure разработки продвинутых алгоритмов координации "рука-глаз" и адаптивной локомоции.
Но любой экспериментальный проект — это прежде всего про поиск слабых мест.
С выходом новой модели Figure 03, второе поколение роботов официально отправляется на пенсию. Опыт, полученный на заводе BMW, напрямую повлиял на архитектуру третьего поколения.
Главным "узким местом" Figure 02 оказалось предплечье. Из-за плотной компоновки и требований к ловкости, эта часть часто перегревалась и была сложна в обслуживании.
В Figure 03 полностью изменили архитектуру электроники запястья. Они убрали распределительную панель и избавились от динамической кабельной разводки. Теперь контроллеры моторов общаются с главным компьютером напрямую.
Это тот самый случай, когда тысячи часов реальной работы на заводе превращаются в конкретные инженерные улучшения.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤65👍38🔥7🥰7🦄5❤🔥2🤣2
This media is not supported in your browser
VIEW IN TELEGRAM
💡Внедрение ИИ полностью меняет разработку кода — Т-Технологии представили свою экосистему AI for SDLC
Главное:
• уже 30% всего кода в компании генерирует ИИ. Это не пилот и не эксперимент — это рабочий масштаб
• команда запустила новый сценарий агентского режима — end-to-end генерацию кода. Агент сам понимает задачу, проходит весь цикл, работает со структурой репозитория, создает файлы, запускает утилиты и снимает рутину с инженера
• прогнозируется сокращение time-to-market на 20–40%, а новые модели будут специально обучены под агентские сценарии
• на AIJ объявили, что открывается ранний доступ к агентскому режиму разработчиков
Внутри экосистемы:
•единая AI-архитектура, которая покрывает все этапы SDLC — от анализа и разработки до тестирования, внедрения и SR
•набор специализированных ИИ-решений: от AI Search и генерации SQL до анализа изменений MR, генерации тестов и мониторинга аномалий
•полноценная интеграция в VS Code
Благодаря такому внедрению ИИ в процессы, разработчик теперь фокусируется на важных этапах, а рутинную работу выполняют агенты.
@ai_machinelearning_big_data
#news #ai #ml
Главное:
• уже 30% всего кода в компании генерирует ИИ. Это не пилот и не эксперимент — это рабочий масштаб
• команда запустила новый сценарий агентского режима — end-to-end генерацию кода. Агент сам понимает задачу, проходит весь цикл, работает со структурой репозитория, создает файлы, запускает утилиты и снимает рутину с инженера
• прогнозируется сокращение time-to-market на 20–40%, а новые модели будут специально обучены под агентские сценарии
• на AIJ объявили, что открывается ранний доступ к агентскому режиму разработчиков
Внутри экосистемы:
•единая AI-архитектура, которая покрывает все этапы SDLC — от анализа и разработки до тестирования, внедрения и SR
•набор специализированных ИИ-решений: от AI Search и генерации SQL до анализа изменений MR, генерации тестов и мониторинга аномалий
•полноценная интеграция в VS Code
Благодаря такому внедрению ИИ в процессы, разработчик теперь фокусируется на важных этапах, а рутинную работу выполняют агенты.
@ai_machinelearning_big_data
#news #ai #ml
1🤣36🔥19❤14👏8👌4👍3🥰3🗿3🙈2
Media is too big
VIEW IN TELEGRAM
GPT-5 Pro смогла решить задачу о симметрии чёрной дыры, с которой не справились даже те, кто придумал эту задачу.
После короткого «разогрева» модель вывела правильную структуру симметрий - и физик, наблюдавший за процессом, был в шоке.
Он понял, что ИИ показывает уровень понимания, который раньше даже трудно было представить:
модель не угадывала, не перебирала случайно, а пришла к решению так, как это сделал бы специалист по теории гравитации.
Когда ИИ решает задачу, над которой мучаются эксперты - это не просто прогресс в моделях.
Это момент, когда становится ясно: научные границы начинают реально сдвигаться.
@ai_machinelearning_big_data
#chatgpt #ai
После короткого «разогрева» модель вывела правильную структуру симметрий - и физик, наблюдавший за процессом, был в шоке.
Он понял, что ИИ показывает уровень понимания, который раньше даже трудно было представить:
модель не угадывала, не перебирала случайно, а пришла к решению так, как это сделал бы специалист по теории гравитации.
Когда ИИ решает задачу, над которой мучаются эксперты - это не просто прогресс в моделях.
Это момент, когда становится ясно: научные границы начинают реально сдвигаться.
@ai_machinelearning_big_data
#chatgpt #ai
❤107🔥53👍23🥱14😁7🦄2🆒1
⚡️Сбер представил новую систему синтеза речи для ГигаЧата — в одной модели используются сразу несколько разных уникальных голосов под разные задачи
Обновление позволяет генерировать речь в различных манерах — от естественного Freespeech для общения до подкастного формата, интонаций операторов и традиционного дикторского стиля. Звучание стало более органичным и приближенным к человеческому.
Что умеет новый синтез:
- для разных кейсов применения синтеза сделаны отдельные голоса
воспроизводит паузы, смысловые акценты и эмоциональную окраску
- построен на собственной разработке: GigaChat 3b как основа, специализированный токенизатор и адаптер к LLM
- умеет озвучивать тексты бесконечной длины с учетом контекста, а также клонировать голоса
- внутренние замеры демонстрируют прогресс в качестве и натуральности звука
Зачем это нужно:
- помогает создавать более органичные голосовые интерфейсы
- оптимален для разговорных ассистентов, озвучки подкастов или аудиокниг, а также в автоматизированных колл-центрах
Основные преимущества:
- есть возможность выбора голоса, которые подходят под разные задачи
- управление стилистикой и эмоциями на естественном языке
- самый живой синтез речи, ни у Алисы, ни у OpenAI ничего похожего нет
Новый синтез уже доступен в Voice Mode Гигачата.
@ai_machinelearning_big_data
#ai #ml #speech #llm
Обновление позволяет генерировать речь в различных манерах — от естественного Freespeech для общения до подкастного формата, интонаций операторов и традиционного дикторского стиля. Звучание стало более органичным и приближенным к человеческому.
Что умеет новый синтез:
- для разных кейсов применения синтеза сделаны отдельные голоса
воспроизводит паузы, смысловые акценты и эмоциональную окраску
- построен на собственной разработке: GigaChat 3b как основа, специализированный токенизатор и адаптер к LLM
- умеет озвучивать тексты бесконечной длины с учетом контекста, а также клонировать голоса
- внутренние замеры демонстрируют прогресс в качестве и натуральности звука
Зачем это нужно:
- помогает создавать более органичные голосовые интерфейсы
- оптимален для разговорных ассистентов, озвучки подкастов или аудиокниг, а также в автоматизированных колл-центрах
Основные преимущества:
- есть возможность выбора голоса, которые подходят под разные задачи
- управление стилистикой и эмоциями на естественном языке
- самый живой синтез речи, ни у Алисы, ни у OpenAI ничего похожего нет
Новый синтез уже доступен в Voice Mode Гигачата.
@ai_machinelearning_big_data
#ai #ml #speech #llm
Хабр
Наш новый LLM-based синтез речи
Всем привет! Я Гриша Стерлинг, лид команды TTS в Сбере. Мы сделали новый синтез речи, он на голову выше старого, особенно по естественности и человечности. Мы так и называем его – «новый синтез», или...
❤43👍19😁14🔥9🥱4🦄4❤🔥1🗿1