Media is too big
VIEW IN TELEGRAM
Согласно внутренним финансовым отчетам, к октябрю 2025 года «вычислительная маржа» компании достигла 70%. Этот показатель, отражающий долю выручки, остающуюся после покрытия прямых затрат на работу моделей для пользователей, удвоился с начала 2024 года - тогда он составлял лишь 35%. Такая динамика указывает на успешную оптимизацию инфраструктуры инференса, что делает платных клиентов значительно рентабельнее.
Несмотря на техническую оптимизацию, компания остается глубоко убыточной. За первую половину 2025 года чистый убыток OpenAI составил $13,5 млрд, из которых $6,7 млрд пришлось на R&D и разработку новых моделей.
Тем не менее, бизнес-показатели продолжают расти: годовая выручка преодолела отметку в $12 млрд еще в июле, а к концу года аналитики прогнозируют выход на уровень $15–20 млрд.
theinformation.com
Компания уведомила китайских партнеров о планах отгрузить первую партию H200 в середине февраля. По информации инсайдеров, Nvidia намерена использовать имеющиеся складские запасы, чтобы поставить от 40 до 80 тысяч чипов (примерно 5–10 тысяч модулей). Это реакция смягчение политики Вашингтона: экспорт флагманского железа разрешили при условии уплаты специального 25-процентного сбора.
Основным препятствием остается позиция Пекина. Правительство Китая пока не согласовало закупки H200, и без официального одобрения местных регуляторов сделка не состоится. Если же политический вопрос будет урегулирован, Nvidia планирует не ограничиваться разовой партией и открыть слоты для новых производственных заказов под китайский рынок уже во втором квартале 2026 года.
reuters.com
GLM-4.7 - обновление линейки моделей, оптимизированное для разработчиков. При размере в 358 млрд. параметров модель показала существенный прирост производительности в программировании, работе с терминалом и созданию чистого UI-кода (функция Vibe Coding). На SWE-bench Verified модель улучшила результат до 73.8%, а в тестах на сложное математическое рассуждение прирост составил более 12%.
Архитектурное новшество релиза — развитие механизмов мышления. Функция Preserved Thinking позволяет модели сохранять и переиспользовать CoT между репликами, а механизм Interleaved Thinking дает время на анализ перед каждым вызовом внешних инструментов.
GLM-4.7 уже доступна через API и на OpenRouter, а веса модели выложены на HuggingFace и ModelScope.
z.ai
Инструмент кардинально упрощает процесс оценки безопасности моделей: вместо ручного написания тестов нужно просто описать искомое поведение (сикофанство, самосохранение или склонность к саботажу). На основе этого описания, Bloom автоматически генерирует сотни уникальных сценариев, симулирует диалоги с участием виртуальных пользователей и выносит вердикт о частоте и тяжести выявленных проявлений.
Фреймворк поддерживает интеграцию с W&B для трекинга и экспорт логов в формат Inspect. Вместе с релизом кода на GitHub компания опубликовала результаты проверки 16 моделей по 4 критическим категориям безопасности.
anthropic.com
Design View - интерфейс для редактирования графики в режиме point-and-click с сохранением исходной композиции и стиля. Дизайнеры могут менять цвета объектов, корректировать глубину сцены и исправлять текст прямо на холсте. Инструмент глубоко интегрирован в экосистему Manus: поддерживается редактирование презентаций, созданных Nano Banana Pro, а также доработка UI-элементов и иконок для мобильных приложений в реальном времени.
Функция уже доступна всем пользователям сервиса.
manus.im
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44👍22🔥7🦄2😁1
Детище Alibaba, которое было выпущено отдельно от команд Wan и Qwen и стоит 5 долларов за 1000 изображений на Alibaba Cloud добралась до 1 места в рейтинге Artificial Analysis Image Arena.
Это модель с 6 млрд. параметров, которая может работать на потребительском оборудовании с объемом памяти всего 16 ГБ в полной точночти, а квантованные варианты запускаются на 8 ГБ.
Z-Image Turbo дешевле всех конкурентов: FLUX.2 [dev] ($12/1 тыс. изображений), HiDream-I1-Dev ($26/1 тыс. изображений) и Qwen-Image ($20/1 тыс. изображений), доступна под открытой лицензией Apache 2.0, что позволяет использовать ее в коммерческих целях без ограничений.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45❤18🥰6🔥2😁2🙈2🦄2
Решение автоматизирует ключевые этапы разработки: ИИ-агенты берут на себя до 50% рутинных задач и генерируют до 30% кода, снижая нагрузку на ИТ-команды.
Как это работает:
- AI Product Owner формирует бизнес-требования (−30% нагрузки на продакта);
- AI Analytic декомпозирует требования в техзадачи;
- AI Developer создает до 40% нового кода и собирает версии продукта;
- AI QA-агенты описывают тесты и проводят проверки (−50% времени тестирования).
@ai_machinelearning_big_data
#AI #ML #DevTools #MTS
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23👍16🥱8😁6🔥4🗿2
Ключевыми изменениями стали улучшенные способности в точном следовании инструкциям (Instruction Following) и tool calling.
T-Pro 2.1 (32B): модель стала значительно лучше понимать сложные требования (ответы строго в формат JSON, лимиты длины, многошаговые инструкции) и увереннее работать в агентских сценариях. Она основана на базе Qwen3-32B и отвечает без “тысяч токенов рассуждений”.
T-Lite 2.1 (8B): популярная модель после обновления стала сильнее в прикладных задачах и при этом сохранила скорость и практичность для продакшена и локального запуска.
Для улучшения Instruction Following команда разработала собственный пайплайн генерации синтетических данных на основе подхода AutoIF. На RL-стадии использовался алгоритм GRPO с комбинированной reward-функцией, которая проверяла как выполнение формальных требований через верификационные функции, так и осмысленность ответа через штраф на основе Reward Model.
Это позволило избежать классической проблемы “reward hacking”, когда модель учится подстраиваться под проверку, а не давать хорошие ответы.
Для изменений в tool calling был разработан синтетический пайплайн. Сначала генерировались реалистичные наборы инструментов, а затем — сложные многошаговые диалоги с их использованием через мультиагентную симуляцию. Для обучения на этих данных применялся RL (GRPO) с бинарным reward, проверяющим корректность вызова, и балансировкой датасета.
На локализованном русскоязычном бенчмарке IFeval T-Pro 2.1 демонстрирует результат 0.8065, значительно опережая свою версию 2.0 (0.6865), а T-Lite 2.1 показывает 0.7585. На тесте BFCL v3 (RU), оценивающем tool calling, T-Pro 2.1 набирает 65.96 баллов, что является одним из лучших показателей среди открытых моделей, а T-Lite 2.1 — 56.45. В диалоговых аренах (Arena Hard Ru, WildChat) обновленные модели также показывают существенный рост качества ответов на реальные пользовательские запросы.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤55👍19🔥11🤣9👌2🤗1🦄1
Media is too big
VIEW IN TELEGRAM
A2UI (Agent-to-User Interface) - открытый проект Google, который стандартизирует процесс создания визуальных интерфейсов нейросетями. Инструмент позволяет агентам генерировать полноценные интерактивные элементы (формы, карточки, дашборды) в реальном времени.
Проект декларирует безопасность через абстракцию. Вместо генерации исполняемого кода, который может нести риски, агент отправляет JSON-файл, описывающий структуру. Клиентское приложение само парсит этот манифест и отрисовывает компоненты, используя собственные проверенные библиотеки.
Экосистема уже включает поддержку веб-фреймворков и Flutter (через GenUI SDK), а в дорожной карте заявлена интеграция с React, Jetpack Compose и SwiftUI.
github.com
YouTube Gaming запустила закрытое бета-тестирование сервиса Playables Builder, которое позволяет авторам создавать мини-игры на основе промптов. Система работает на базе Gemini 3: чтобы превратить идею в рабочий интерактивный проект, достаточно загрузить короткое текстовое описание, видеофрагмент или изображение.
Новый инструмент нацелен на удержание аудитории через геймификацию контента. На данный момент доступ конструктору ограничен (требуется активный канал и одобрение заявки) и допускаются только пользователи из США, Канады, Великобритании и Австралии.
Youtube Gaming в сети X
Компания представила инструмент, позволяющий взглянуть на свою активность в чат-боте за прошедший год. Функция генерирует персонализированный отчет, присваивает награды-достижения и создает тематические стихи и изображения, базируясь на содержании диалогов.
Итоги года доступны только в США, Великобритании, Канаде, Австралии и Новой Зеландии для пользователей тарифов Free, Plus и Pro. Корпоративные и образовательные аккаунты остались без поддержки этой опции.
Для получения отчета необходимо, чтобы в настройках были включены история чатов и функция памяти, а сам аккаунт должен иметь достаточный объем накопленных данных. Запустить генерацию можно вручную через баннер на главной странице или прямым запросом к боту.
forbes.com
Материнская компания Google заключила соглашение о приобретении девелопера ЦОДов Intersect Power. Это первый случай, когда бигтех не просто заключает контракты на поставку электричества, а напрямую покупает крупного ресурсного игрока. Сделка, которую планируют закрыть в первой половине 2026 года, будет полностью оплачена денежными средствами.
Стратегический смысл покупки заключается в решении проблемы энерго-дефицита для обучения и работы ИИ. Google получает возможность строить дата-центры в едином комплексе с генерирующими мощностями, что позволяет избежать использования электросетей общего пользования.
Intersect сохранит операционную независимость, хотя ряд действующих активов в Техасе и Калифорнии будут выведены в отдельную структуру и не войдут в периметр сделки.
abc.xyz
Новая версия Qwen-Image-Edit-2511 пришла на смену сборке 2509 и предлагает ряд качественных изменений. Теперь модель лучше сохраняет консистентность персонажей и общую структуру кадра при внесении локальных правок.
Помимо стабильности, усилили способности к геометрическому рассуждению и генерации промышленного дизайна. Попробовать новинку можно через веб-интерфейс Qwen Chat, а веса для локального развертывания уже на HuggingFace и ModelScope.
TongyiLab в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍67❤18🔥11🤔2
В преддверии новогодних праздников платформа подготовила набор обучающих материалов по основным направлениям ИИ:
@ai_machinelearning_big_data
#AI #ML #HuggingFace
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42❤35🔥14🦄2
LM Studio в коллаборации с Unsloth опубликовали подробный туториал по файнтюнингу недавно выпущенной Google модели FunctionGemma.
FunctionGemma - уменьшенная версия Gemma (всего 270Ь параметров) для агентских сценариев и работы в качестве бэкенда приложений, которую можно запускать практически на любом устройстве.
Гайд состоит из подробного описания всего процесса от обучения модели вызову инструментов до преобразования в GGUF-формат и последующего запуска его в LM Studio
Туториал подойдет для локального трейна (Unsloth работает на NVIDIA, AMD и Intel), но есть и готовый Collab Notebook для тренировки в облаке.
⚠️ FunctionGemma не предназначена для использования в качестве прямой диалоговой модели.
@ai_machinelearning_big_data
#AI #ML #LLM #Tutorial #Unsloth #LMStudio
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24🔥16🥰6🦄2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
В отличие от традиционных двуруких андроидов, Midea Group спроектировала платфору исключительно под утилитарную эффективность. Шесть бионических манипуляторов работают скоординированно: нижняя пара отвечает за силовые операции и подъем тяжестей, а верхние конечности выполняют точную сборку и крепеж.
Такая архитектура позволяет роботу выполнять до 3 задач одновременно, при этом сохраняя габариты человеческого торса для интеграции в производственные линии без их переделки.
MIRO U базируется на мобильном колесном шасси с возможностью вращения на 360 градусов и вертикальным лифтом. Midea, использующая наработки своего немецкого подразделения KUKA, уже начала пилотное внедрение системы на заводе в Уси.
Инженеры рассчитывают, что шестирукий форм-фактор повысит эффективность переналадки линий на 30%, минимизируя простои при смене выпускаемых моделей.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥22❤11🤩3🤗2
Media is too big
VIEW IN TELEGRAM
По данным The Information, компания активно обсуждает внедрение рекламы в свой чат-бот. Рассматривается несколько механик: от классических баннеров в боковой панели до нативной интеграции спонсорского контента прямо в ответы нейросети.
Наибольший интерес представляет план использования функции «Memory» для таргетинга. Это означает, что система будет анализировать архивы личных диалогов пользователя, чтобы повысить релевантность объявлений.
Напомним, что ранее Сэм Альтман называл ответы ИИ под влиянием рекламы «антиутопией», однако теперь OpenAI движется именно по этому пути, пытаясь найти баланс между монетизацией и доверием аудитории.
theinformation.com
Группа писателей, включая лауреата Пулитцеровской премии Джона Каррейру, подала коллективный иск в суд Калифорнии против OpenAI, Google, Anthropic, xAI, Perplexity и компании Марка Цукерберга. Это первый случай, когда юридические претензии касательно обучающих выборок затронули компанию Илона Маска и Perplexity.
Истцы обвиняют компании в «преднамеренной краже» контента через использование пиратских библиотек LibGen, Z-Library и OceanofPDF. В иске утверждается, что нарушение авторских прав произошло дважды: сначала при нелегальном скачивании книг для сборки датасетов, а затем — при создании копий во время обучения и оптимизации моделей.
Представители Perplexity уже ответили, что не индексируют книги, а в xAI обвинения назвали коротко «ложью устаревших медиа».
news.bloomberglaw.com
Модель, получившая индекс M2.1, нацелена китайским MiniMax на доминирование в сегменте ИИ-агентов и разработки ПО. Новинка получила архитектуру с 230 млрд. параметров (из которых активны 10 млрд.) и выдает до 100 токенов в секунду в инференсе.
Главный фокус релиза — на vibe coding и поддержке мобильной разработки. M2.1, по словам создателей, хорошо знает Rust, Go и Kotlin, а на тесте SWE-bench Multilingual она показала точность 72,5%, вплотную приблизившись к Claude 3.5 Sonnet.
Одной из ключевых фишек стала технология Interleaved Thinking, которая помогает модели лучше справляться с многослойными инструкциями. Модель доступна через API, OpenRouter и Ollama.
minimax.io
Vibe CLI теперь может работать со Skills - набором инструкций, в которых можно собрать экспертизу и правила разработки для повторного использования в разных проектах. Кроме того, Vibe CLI получил поддержку моделей рассуждения, а также встроенные темы для интерфейса.
Обновление доступно для установки через команду
uv tool install mistral-vibe.Mistral AI в сети X
В преддверии 2026 года Google One запустил промо-кампанию, предлагая новым пользователям скидку 50% на план AI Pro: его стоимость на первый год снижена с $199,99 до $99,99.
Пакет открывает доступ к возможностям модели Gemini 3 Pro, контекстному окну в 1 млн. токенов и инструментам Deep Research.
Акция продлится до 31 декабря 2025 года включительно, после чего подписка будет продлеваться по стандартной цене.
9to5google.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52❤29🔥13🤗2🦄2😁1
Российские вузы обновляют ML-программы вместе с бигтехами — исследование
Делимся результатами недавнего отчета J'son & Partners о подготовке ИИ-специалистов в США, Китае и России. Оно показало: образование во всем мире не успевает за скоростью технологий. Программы обучения перестраиваются 7–10 лет, тогда как требования к специалистам меняются каждые 2–3 года.
В Китае эта проблема решается через госрегулирование: министерства определяют образовательные стандарты и внедряют их одновременно во всех вузах, в США за таланты конкурируют сами университеты. В России выбрали другой путь: прямое участие в образовании бигтеха и практикующих инженеров.
Поэтому сегодня на программах в наших вузах преподают более 1200 специалистов из Яндекса, 1000 специалистов из VK и свыше 900 из Т-Банка. По сути, компании становятся каналом обновления — внедряют в обучение свежие архитектуры, пайплайны, реальные продакшн-кейсы и рабочие датасеты.
@ai_machinelearning_big_data
#news #ml
Делимся результатами недавнего отчета J'son & Partners о подготовке ИИ-специалистов в США, Китае и России. Оно показало: образование во всем мире не успевает за скоростью технологий. Программы обучения перестраиваются 7–10 лет, тогда как требования к специалистам меняются каждые 2–3 года.
В Китае эта проблема решается через госрегулирование: министерства определяют образовательные стандарты и внедряют их одновременно во всех вузах, в США за таланты конкурируют сами университеты. В России выбрали другой путь: прямое участие в образовании бигтеха и практикующих инженеров.
Поэтому сегодня на программах в наших вузах преподают более 1200 специалистов из Яндекса, 1000 специалистов из VK и свыше 900 из Т-Банка. По сути, компании становятся каналом обновления — внедряют в обучение свежие архитектуры, пайплайны, реальные продакшн-кейсы и рабочие датасеты.
@ai_machinelearning_big_data
#news #ml
🥱36👍24❤11🔥7❤🔥2😁2🤔1🦄1