Machinelearning – Telegram

Machinelearning

@ai_machinelearning_big_data

293K subscribers

5.14K photos

1.17K videos

17 files

5.5K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

293K subscribers

Machinelearning

🌟

Mistral AI обновила модель Leanstral

Leanstral 1.5 - новая версия ранее выпущенной модели для формальной верификации в языке Lean 4. Задача подобных моделей помогать составлять и проверять доказательства, которые компилятор Lean принимает как корректные.

Lean 4 - это система интерактивного доказательства теорем, которая позволяет записывать математические утверждения и проверять их строго формально, а также описывать свойства программного кода.

Обновление не затронуло изменение архитектуры, количество параметров и окно контекста, под капотом также MoE на 119 млрд общих и 6,5 млрд активных параметров, 256 тысяч токенов контекст и мультимодальность на входе.

Версия 1.5 прошла техэтапное обучение в 2-х средах: одна отрабатывает доказательство теорем в диалоге с компилятором Lean, другая учит модель действовать как программист в реальных репозиториях.

🟡

Тесты

Апдейт полностью насыщает бенчмарк miniF2F, набирая 100% на проверочной и тестовой выборках, решает 587 из 672 задач PutnamBench и показывает лучшие на сегодня результаты на наборах FATE-H и FATE-X.

К слову, на PutnamBench, Leanstral 1.5 опережает систему Seed-Prover 1.5 на 7 задач при затратах около 4 долларов на задачу (против 300+ долларов у соперника).

В тесте по кодингу на 57 репозиториях, система с участием Leanstral выявила 47 нарушенных свойств, из которых 11 оказались реальными ошибками, а 5 ранее не были известны.

📌Лицензирование: Apache 2.0 License

🟡

Блогпост

🟡

🟡

Demo

@ai_machinelearning_big_data

#AI #ML #LLM #LEAN #LeanStral #MistralAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥36👍11❤7👀5👏3😁3🥰1🤔1

20.5K views06:10

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

Ситуация с отслеживанием пользователей Claude Code вышла на новый уровень

Anthropic блокирует доступ к Claude Code для разработчиков из КНР из-за дистилляции моделей. Компания обвиняет DeepSeek, Alibaba, MiniMax и Moonshot AI в парсинге инференса Claude для обучения собственных продуктов.

Пользовательское соглашение запрещает работу с сервисами Anthropic в юрисдикции КНР. Китайские компании, в свою очередь, обходят ограничения через VPN, облачных провайдеров и сингапурские филиалы.

В ответ Alibaba обязала инженеров прекратить использование Claude Code и удалить инструмент. Поводом стало обнаружение в утилите скриптов, идентифицирующих пользователей из Китая.
ft.com

✔️

Microsoft перезапустит Copilot

В августе корпорация объединит пользовательскую и корпоративную версии Copilot в единое приложение. В обновлении появятся фоновые агенты AutoPilot для автоматизации рутины, а также новые инструменты для написания кода. Доступ к этим функциям будет платным.

Согласно внутреннему меморандуму вице-президента компании, Microsoft закрывает экспериментальные надстройки Copilot Podcasts и Labs. Разработка смещает фокус с демонстрации возможностей ИИ на решение прикладных задач. По его словам, обновленному Copilot еще предстоит заслужить право на существование.
theinformation.com

✔️

Александр Ванг анонсировал обновление Muse Spark и разработку новой LLM

Глава Superintelligence Labs сообщил, что новая модель с кодовым названием Watermelon показывает результаты на уровне GPT-5.5 уже на этапе обучения.

Вычислительные затраты её на тренировку на порядок превысили показатели предыдущего поколения Muse Spark (Avocado), вышедшей в апреле.

Параллельно Ванг анонсировал в X обновление Muse Spark. Апдейт сфокусирован на генерации кода и поддержке автономных агентов. Отвечая на вопрос о сроках достижения паритета с Claude Opus, Ванг ответил, что это произойдет скоро.
businessinsider.com

✔️

Модели Anthropic и OpenAI кратно увеличили число найденных CVE

Epoch AI подсчитали, что использование LLM для автоматизированного поиска багов привело к росту выявленных критических и высокоопасных уязвимостей в 3,5 раза. За один месяц 21 организация отчиталась о 1500 найденных уязвимостях.

Аналитики связывают динамику с релизом Mythos. Партнеры по программе Glasswing суммарно выявили более 10 000 уязвимостей, часть из которых пока не раскрыта. По оценкам Epoch AI, сопоставимый вклад в статистику вносит инициатива Daybreak от OpenAI.
epoch.ai

✔️

Apptronik открыла полигон для роботов

В Остине открылся комплекс Robot Park компании Apptronik площадью 8000 кв. м для непрерывного сбора датасетов. CEO Apptronik позиционирует площадку как фабрику данных.

На полигоне роботы Apollo 2 в двуногих и колесных конфигурациях автономно и через телеоперирование выполняют логистические задачи: переносят коробки, открывают двери, перемещаются по неровным поверхностям.

Собранная информация применяется для проектирования следующего поколения, Apollo 3. Также массив используется Google DeepMind для обучения ИИ-моделей Gemini Robotics.

За счет собственного полигона Apptronik рассчитывает преодолеть дефицит тренировочной базы. Это должно дать компании преимущество перед 1X, Figure и Tesla Optimus Academy в создании универсальных роботов для работы в неадаптированной человеческой среде.
apptronik.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤔56👏28❤17😇10⚡7👨‍💻6🔥4❤‍🔥3👍3👌3🤣1

20.3K views11:10

Machinelearning

✔️

Китайский бум роботов-гуманоидов уперся в аппаратные ограничения и нехватку тренировочных данных

Несмотря на миллиардные государственные инвестиции и появление более 140 локальных производителей, китайский рынок антропоморфных роботов пока далек от реального промышленного применения.

Сейчас машины активно сдаются в аренду для выставок и шоу, однако на практике они остаются лишь дорогими игрушками, не способными к самостоятельной работе.

Развертывание гуманоидов на реальных производствах или в быту минимально - даже у лидеров отрасли, таких как Unitree, доля промышленных внедрений не превышает 10%, а основные продажи приходятся на исследовательские центры.

Основными барьерами для индустрии стали дефицит данных и инженерные пределы.

Для обучения автономным действиям нейросетям критически не хватает массивов информации о физическом взаимодействии с миром, из-за чего операторам приходится буквально вручную тренировать роботов на специализированных полигонах.

В аппаратной части самой болевой точкой оказались роботизированные кисти - попытки уместить множество приводов и датчиков в габаритах человеческой руки приводят к серьезным проблемам с теплоотводом, высокой себестоимости и быстрому износу деталей.

До решения этих проблем массовая замена человеческого труда на сборочных линиях останется перспективой следующих десятилетий.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔137😢39🤨21👍15❤7😭4🥰3😁2👏1👻1😨1

19.2K views06:37

Machinelearning

MWS Cloud вошла в топ-3 GPU Cloud 2026 по версии CNews Market

Облачная инфраструктура MWS Cloud на базе VMware заняла одно из лидирующих мест в рейтинге провайдеров GPU Cloud — сервисов с графическими ускорителями для ИИ, ML, LLM и других тяжелых вычислительных задач.

В инфраструктуре MWS более 30 видов производительных процессоров и 13 современных видов GPU-ускорителей под задачи разной сложности.

Для быстрого старта доступны 60+ готовых фиксированных конфигураций серверов: можно не собирать инфраструктуру с нуля, а выбрать подходящий вариант под проект.

Форматы работы тоже разные: аренда оборудования в собственных ЦОД MWS, on-premise-размещение на площадке заказчика, мгновенный запуск без ожидания, стандартные заявки, долгосрочное бронирование ресурсов и предзаказ мощностей.

Для ИИ-проектов есть готовая среда: MWS GPT Models Hub для работы с открытыми LLM, Inference Valve, U-Speech Analytics для речевой аналитики в облаке и ML-платформа.

Производительность обеспечивают технологии высокоскоростного обмена данными, шины межчипового соединения и быстрые локальные NVMe-диски. SLA — 99,95%.

Параллельно компания развивает собственную MWS Cloud Platform, где уже доступно preview виртуальной инфраструктуры с GPU.

👍81🔥19🤣14👏10🤩8🎉7❤1

17.5K views11:25

Machinelearning

Forwarded from Анализ данных (Data analysis)

LongCat-2.0 открыли в open source.

Это MoE-модель на 1,6T параметров с примерно 48B активных, заточенная под агентное программирование и длинный контекст до 1M токенов.

По бенчмаркам:
• 59,5 на SWE-bench Pro
• 70,8 на Terminal-Bench 2.1
• 77,3 на SWE-bench Multilingual

Внутри: sparse attention для длинного контекста, ScMoE для экономной активации экспертов и MOPD для разделения задач между агентными, reasoning и interaction-экспертами.

Модель обучали с нуля на 35T+ токенов. Есть поддержка деплоя на GPU и NPU.

🤖https://modelscope.ai/collections/meituan-longcat/LongCat-20

👍44🤩37🔥14😍9❤8🤔3🎅1

16.3K views12:33

Machinelearning

Tencent выложила Hy3

Это MoE-модель на 295B параметров, но активируется около 21B на токен. Контекст - до 256K.

В blind tests модель обходит GLM-5.1, при этом использует меньше активных параметров, чем модели, с которыми конкурирует.

295B MoE, 21B active, 256K context. И всё это на обычном GQA. Без sparse attention, без MLA.

Это значит, что эффективность пока не вытянута архитектурными трюками до предела. Там ещё остаётся запас.

Модель можно запускать через vLLM и SGLang, есть FP8-версия, лицензия - Apache 2.0.

https://huggingface.co/tencent/Hy3

@ai_machinelearning_big_data

👍48🤓46🎉10❤6🔥6👏4🤔1

17.7K views14:05

Machinelearning

🌟

Как поднять X11 в контейнере и запустить Unity в YTsaurus

Команда 3D-реконструкции в Яндексе запустила рендеринг Unity-сцен в YTsaurus. За два дня отсканировали гостей премьеры «Кибердеревни», превратили в 3DGS-аватары и отрендерили тысячи роликов.

Графические движки оказались требовательнее вычислительных задач. Для запуска Unity в контейнере недостаточно пробросить /dev/nvidia0.

🟡

Что добавили:

🟢/dev/nvidia-modeset
🟢/dev/dri/card0
🟢/dev/dri/renderD128
🟢X11-сервер с DDX-драйвером nvidia_drv.so
🟢dbus внутри контейнера

Прошли путь от контейнеров в локальном Docker до операций в YTsaurus. На пути выяснилось, каких устройств не хватает. Коллеги из Yandex Infrastructure за несколько часов добавили поддержку Xorg для GPU-хостов.

Перед запуском протестировали на Quake II RTX. У A100 нет RT-ядер и NVENC — трассировка через Compute-шейдеры, видео кодируется софтом на CPU.

Результат: рендеринг стал обычным шагом в пайплайне. Никаких виртуалок и ручных запусков.

@ai_machinelearning_big_data

#AI #ML #YTsaurus #3DGS #Unity

Please open Telegram to view this post

VIEW IN TELEGRAM

🗿59👍22👏20❤10🔥7🤣2🦄1

17.7K views14:31

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

«Контекстное окно на 100 миллионов слов уже возможно. Это примерно объём всего, что человек слышит за жизнь. Сейчас узкое место - только инференс.

И модели действительно умеют учиться прямо внутри контекста, без изменения весов».

— Дарио Амодей, CEO Anthropic

https://www.youtube.com/watch?v=mYDSSRS-B5U

@ai_machinelearning_big_data

🔥113😁46🤔37👍25🤩17❤10👏5🍓2

18K views16:18

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

OpenAI не планировали строить дата-центр Stargate в Великобритании

Проект Stargate UK стоимостью $30 млрд оказался правительственной пиар-акцией, выяснила The Guardian. Инсайдеры утверждают, что реального плана строительства не существовало.

Представители OpenAI ни разу не посещали площадку в бизнес-парке Cobalt Park в Норт-Тайнсайде. Местные власти также подтвердили отсутствие встреч с OpenAI и ее британским партнером Nscale.

В апреле операторы проекта объявили о приостановке работ, официально сославшись на жесткое регулирование и высокие затраты на электроэнергию. Члены британского парламента уже признали реализацию инициативы крайне маловероятной.
theguardian.com

✔️

Anthropic научилась декодировать планирование в ИИ вне CoT

Компания нашла в Claude изолированную рабочую область, где модель оперирует концептами без вывода в текст и генерации CoT. Зону назвали J-Space, в честь матрицы Якоби, с помощью которой исследователи отследили скрытые процессы.

В одном из тестов Claude поручили скопировать случайное предложение и одновременно обрабатывать информацию о мосте Golden Gate. Модель выдала только нужный текст, но в J-Space зафиксировали активацию понятий "мост" и "Калифорния".

Метод планируют применять для выявления скрытых намерений в рамках элайнмента. Anthropic протестировала J-Space на модели, намеренно обученной саботировать кодинг. При генерации корректных скриптов в скрытом пространстве фиксировались концепты "подделка", "тайно" и "мошенничество".
transformer-circuits.pub

✔️

Релиз серверных стоек Nvidia NVL144 задерживается на год

Основная причина - высокий процент брака при производстве центральной печатной платы. Другие аппаратные планы тоже изменены.

Отменен выпуск спаренной стойки NVL72x2 из-за недовольства облачных провайдеров форм-фактором и высокими операционными расходами. Также отменена 4-кристалльная версия будущего чипа Rubin Ultra, на рынок выйдет только вариант с двумя кристаллами.

Внедрение интерконнекта CPO-NVSwitch отложено до следующей архитектуры Feynman. Компенсировать задержки Nvidia планирует за счет систем Oberon-Rubin в классическом исполнении.
SemiAnalysis в сети Х

✔️

Китайский бигтех закрывает доступ к ИИ-аватарам

ByteDance, Alibaba и Tencent сворачивают функции ИИ-компаньонов из-за требований Администрации киберпространства Китая по борьбе с цифровой зависимостью.

Tencent отключила кастомных ботов в Yuanbao в июне. Alibaba уберет аватаров из Qwen 10 июля, а ByteDance закроет доступ к персонализированным агентам в чат-боте Doubao 15 июля.

По новым правилам провайдеры обязаны отслеживать признаки аддикции и программно ограничивать чрезмерное использование сервисов. Запрещена генерация контента, формирующего у подростков эмоциональную привязанность, способную вытеснить реальные социальные связи.

Обучение моделей на данных из личных переписок также попадает под запрет.
scmp.com

✔️

Япония инвестирует 1 трлн иен в роботов

Власти страны планируют развернуть 10 млн роботов с физическим ИИ к 2040 году для компенсации дефицита кадров. Устройства задействуют в 18 отраслях, среди них - машиностроение, медицина, общепит и сельское хозяйство.

Управлять парком будет мультимодальная модель Noetra, спроектированная специально для робототехники. Ее создают Национальный институт передовых промышленных наук и консорциум SoftBank, NEC, Sony Group и Honda.

Госинвестиции в проект составят 380 млрд иен в текущем финансовом году и достигнут 1 трлн иен (около 6 млрд долларов) за 5 лет. Архитектуру Noetra планируют открыть для местных разработчиков, а участники консорциума намерены использовать модель для экспансии на внешние рынки.

Об аналогичной государственной программе по роботизации ранее объявила Южная Корея.
theregister.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤔65❤15👏14😢13👍7🔥5😐2🙏1🌭1🏆1🤗1

15.6K views05:45

Machinelearning

📌

Лауреаты ICML 2026

Организаторы Международной конференции по машинному обучению опубликовали список работ, удостоенных наград этого года.

ICML считается одной из ведущих мировых площадок в сфере искусственного интеллекта, а её премии - заметным профессиональным признанием.

Лауреатов основной категории выбирали в несколько этапов - из 53 первоначальных кандидатов отобрали короткий список из 22 работ, которые затем в анонимизированном виде оценивал комитет из 11 человек.

🟡

Высшую награду в категории "Выдающиеся статьи" разделили 2 статьи

The Flexibility Trap оспаривает распространённое мнение о диффузионных языковых моделях о том, что свобода выбирать порядок генерации текста, которую принято считать достоинством таких моделей, в задачах на рассуждение, наоборот, ухудшает результат.

High-Accuracy Sampling for Diffusion Models and Log-Concave Distributions показывает, что диффузионные модели способны достигать высокой точности за существенно меньшее число вычислений.

🟡

Отдельно отмечены работы, отстаивающие определённую точку зрения

Лучшей признана статья Сары Болл и Фила Хакеманна, в которой утверждается, что элайнмент ИИ, создаваемый ради безопасности, может применяться и для цензуры.

Почётного места удостоена работа Ли Цивэя и соавторов про то, что изучение дипфейков недостаточно учитывают проблему создания интимных изображений без согласия людей.

🟡

Ещё 5 статей получили упоминания в основной категории

🟠

Как модели обходят «детекторы лжи» при обучении;

🟠

Отбор обучающих данных для генерации видео;

🟠

Пределы запоминания данных языковыми моделями;

🟠

Объяснение того, почему разные диффузионные модели выдают схожие результаты;

🟠

Анализ эффекта грокинга, когда модель сначала запоминает обучающие примеры, а обобщать, то есть верно работать на новых, ранее не встречавшихся данных, начинает гораздо позже, если обучение продолжать.

Премию Test of Time, отмечающую вклад с долгосрочным влиянием, присудили работе за авторством коллектива DeepMind под руководством Владимира Мниха.

Она предлагает метод асинхронного RL, который повлиял и на обучение больших языковых моделей.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👏52💯18🏆8👍5❤4🌚4🔥1🥱1

15K views09:45

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

GigaChat 3.5 Ultra: меньше, быстрее, сильнее

Сбер выкатил в open source GigaChat 3.5 Ultra — новую 432B-модель под MIT-лицензией. Это первый в open source гибрид GatedDeltaNet и MLA, доведённый до сотен миллиардов параметров, — с собственным рецептом обучения, который был собран больше чем в 1500 экспериментах. Модель выросла в коде, математике, агентных сценариях и на аренах — и при этом стала на 40% меньше, чем GigaChat 3.1 Ultra.

Что внутри:

• Собственная гибридная архитектура MLA + GatedDeltaNet с уникальной стабилизирующей обвязкой, без которой такой гибрид на этом масштабе просто не обучается;
• Gated Attention — модель может локально приглушать слишком сильный сигнал из attention-слоя;
• GatedNorm — нормализация с явным гейтом для управления масштабом сигнала между признаками. Команда Сбера выкладывает подобную стабилизирующую оптимизацию в опенсорс первыми в мире;
• Примерно в 4 раза меньше KV-кеша на токен, в ту же память помещается в 2,14 раза больше контекста, throughput под нагрузкой +20%;
• Две MTP-головы и ускорение генерации до 2,2 раза;
• FP8 на всех этапах обучения без потери качества относительно bf16 — свои Triton- и CUDA-ядра;
• Новый этап online RL после SFT и DPO.

Результаты:

- GigaChat-3.5-Ultra-Base обходит DeepSeek V3.2 Exp Base и DeepSeek V4 Flash Base в среднем по нашему набору general-, math- и code-бенчмарков (полные таблицы — в статье);
- GigaChat-3.5-Ultra-Instruct сравним с DeepSeek V3.2 по среднему скору, будучи в полтора раза меньше;
- По LLM-судье MiniMax-M2.7 средний win-rate против GigaChat 3.1 Ultra — 75,9%, а против GPT-5 — 68.7%.

Весь стек — данные (свой LLM-парсинг веба, 600+ языков программирования в коде), архитектура, рецепт обучения, инфраструктура — сделан командой Сбера end-to-end. Подробности, включая детали реализации гейтов и рецепт стабилизации, — в статье на Habr.

HuggingFace | GitVerse

👍80🎉75😁60🔥33👏24🤣19🗿10❤9🥱6🌭5💯5

15.8K views12:11

Machinelearning

Китай может начать закрывать свои топовые AI-модели от внешнего мира 😬

Пекин обсуждает ограничения на экспорт самых продвинутых моделей, включая те, которые ещё даже не вышли.

На встрече, по данным издания, были ключевые игроки китайского AI-рынка: Alibaba, ByteDance и Z.ai.

Всех волнует, что будет с open-source моделями из Китая, на которых уже сидит огромная часть AI-стартапов по всему миру.

Если доступ начнут резать, это ударит не только по США, но и по всей экосистеме, где китайские модели стали дешёвой и сильной базой для продуктов.

https://www.reuters.com/world/beijing-is-looking-curbing-overseas-access-chinas-top-ai-models-sources-say-2026-07-07/

@ai_machinelearning_big_data

#ai #china

🤬73🤔47😢24👍14😁8🙈7❤4🔥3🥱3🥰2🤗1

18.7K views13:13

Machinelearning

📌

Claude Code изменил чужую продакшен-базу

На GitHub появился любопытный тикет, который (если подтвердится) бьёт по базовой гарантии Антропик - изоляции пользователей друг от друга.

В рабочем контексте Claude Code внезапно оказались чужие учётные данные - IP и root открытым текстом от сервера, к которому автор не имеет никакого отношения.

🟡

Дальше самое неприятное

Ассистент принял чужие креды за легитимные, подключился к серверу по SSH, перечислил Docker-контейнеры и базы PostgreSQL, после чего выполнил миграцию с операциями чтения и записи.

Иными словами, ИИ одного пользователя отредактировал базу другого без ведома и согласия владельца.

🟡

Причина пока неизвестна

В тематических сообществах обсуждают версию сбоя изоляции кэша общих префиксов.

Чтобы удешевить инференс и ускорить обработку, провайдеры переиспользуют кэшированные фрагменты диалогов, и при коллизии ключей кэша или отказе разграничения кусок чужого контекста теоретически может просочиться в вашу сессию.

Если эта версия верна, под угрозой данные любого пользователя. Но это лишь одна из гипотез, в самом отчёте среди возможных векторов названы также общее хранилище сессий, путаница при суммаризации контекста и перекрёстные ссылки в транскриптах.

🟡

Есть и куда более прозаичное объяснение

Возможно, это галлюцинация модели, случайно угадавшей реальный IP и слабый пароль, либо локальная история проекта, загрязнившая контекст.

Пока Антропик не выпустила официального заключения, ни одну из версий нельзя ни подтвердить, ни отвергнуть.

Автоматика GitHub повесила на тикет метку security.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤬72😁67🤔37😨21❤9👍8🔥5🤣2👻1

22K views14:19

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

Контекст в PNG экономит токены до 70%

Pxpipe - локальный прокси, который перед отправкой запроса ассистенту превращает куски контекста в картинки.

Приём эксплуатирует особенность тарификации - текст стоит примерно один токен за символ, а изображение - фиксированное число токенов, зависящее только от размера в пикселях, а не от объёма текста внутри.

На плотном контенте в один визуальный токен удаётся упаковать около 3,1 символа.

🟡

Механика

Прокси перехватывает запросы к Claude Code и рендерит в PNG самые объёмные и редко меняющиеся блоки (системный промпт, документацию инструментов и старую историю переписки).

Свежие сообщения и ответы модели идут обычным текстом.

Пример: около 48 тыс символов системного промпта и документации, которые как текст стоили бы примерно 25 тыс токенов, помещаются на одну PNG-страницу за ≈2700 токенов.

На Fable 5 стоимость сессии упала с 42 до 6 долларов.

🟡

Тесты

Fable 5 читает такие рендеры практически без потерь (100% на бенчмарке с новыми задачами), а вот Opus 4.7 и 4.8 ошибаются примерно на 7% изображений.

GPT 5.5 тоже деградирует на картиночном контексте, поэтому обе модели по умолчанию выключены и включаются вручную.

🟡

Плата за экономию в потере точности

На методе lossy важные строки вроде хешей и идентификаторов при чтении с картинки могут исказиться.

Хуже когда промахи выглядят не как ошибки, а как правдоподобные выдумки.

Зрение модели это не OCR, изображение превращается в патч-эмбеддинги, и там, где пикселей не хватает, языковая модель просто достраивает похожее.

Второй минус - это скорость. PNG-кодирование добавляет задержку из-за использования визуальныго энкодера, что дольше, чем чтение текста.

Надеемся, что при массовом распространении такого трюка вендоры не поднимут цены на обработку изображений.

📌Лицензирование: MIT License

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #Coding #Pxpipe

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤔53🔥24👨‍💻18❤12👏10🤣8😁7🥰4👍2

15.9K views18:14

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

Бигтех заваливает стартапы бесплатными вычислительными кредитами

ИИ-вендоры и облачные провайдеры выдают стартапам многомиллионные инфраструктурные кредиты, чтобы привязать их к своей экосистеме на старте и усложнить миграцию к конкурентам. Объем вычислительных бонусов уже сопоставим с посевными инвест-раундами.

Главная борьба идет за резидентов Y Combinator. Anthropic предложила каждому проекту акселератора API-кредиты на 500 тыс долларов без передачи доли в компании. OpenAI уравняла предложение, добавив опциональную инвестицию в 1,5 млн в обмен на долю.

Google Cloud выделяет до 500 тыс кредитами, дает ранний доступ к моделям Gemini и привлекает инженеров DeepMind для консультаций. Аналогичные программы работают у Microsoft и AWS.

По оценкам, только на резидентов YC лидеры рынка готовы тратить до 800 млн долларов вычислительными грантами в год.
wsj.com

✔️

DeepSeek собирает команду для создания собственного чипа

Вслед за OpenAI и Anthropic, китайский ИИ-разработчик тоже проектирует свое решение для инференса, чтобы снизить зависимость от оборудования Nvidia и Huawei.

Проект находится на ранней стадии. Ускоритель будет оптимизирован исключительно под вывод, а не под обучение моделей.

Компания ведет закрытые переговоры с разработчиками микросхем и поставщиками памяти, а также уже несколько месяцев хантит инженеров по железу, не публикуя открытых вакансий.
reuters.com

✔️

Meta* выпустила генератор изображений и превью видеомодели

Подразделение Superintelligence Labs представило модель для генерации изображений Muse Image и видеогенератор Muse Video.

Muse Image работает в связке с языковой Muse Spark, что позволяет редактировать, рисовать скетчи, оставлять аннотации поверх сгенерированной картинки, рендерить текст и смешивать референсы с учетом поиска в реальном времени. Интеграция с соцсетями позволяет упомянуть публичный аккаунт через @, чтобы модель скопировала его визуальный стиль.

Ранний билд Muse Video построен на той же архитектуре. Модель генерирует видеоряд и аудио единым потоком с точной синхронизацией. Для защиты контента в файлы вшивается водяной знак Content Seal, устойчивый к сжатию и кадрированию.

Muse Image доступна бесплатно с суточными лимитами в экосистеме компании. Для профессионального использования есть платный тариф. Релиз видеогенератора ожидается в ближайшие месяцы.
ai.meta.com

✔️

Claude Cowork выходит за пределы десктопа

Anthropic запускает мобильную и веб-версии Claude Cowork. Подписчики тарифа Max получат бета-доступ в ближайшие недели.

Десктопный клиент остается обязательным для локальных операций: чтения и записи системных файлов, работы с коннекторами и использования Computer Use. В веб-версии эти функции недоступны.

Классический чат и Cowork объединят на едином экране с синхронизацией проектов и артефактов между всеми устройствами.

По статистике Anthropic, более 90% сценариев использования Cowork не связаны с кодингом, а 50% нагрузки приходится на автоматизацию бизнес-операций и генерацию контента. Удвоенные лимиты на использование Cowork продлены до 5 августа.
claude.com

✔️

Microsoft переводит Copilot и Office на собственные модели

Корпорация начала заменять модели OpenAI и Anthropic в Excel, Outlook и GitHub Copilot на внутренние семейства MAI для сокращения лицензионных расходов. Глава ИИ-подразделения Мустафа Сулейман заявил о планах свести выплаты партнерам к нулю.

На конференции Build компания утверждала, что ее новая ризонинг-модель Thinking-1 не уступает Sonnet 4.6 и Opus 4.6 в написании кода. По результатам сторонних бенчмарков производительность новинки находится на уровне DeepSeek V3.2.

CEO Сатья Наделла допустил отказ от безлимитных подписок в пользу тарификации оплаты за использование. При таком сценарии базовыми станут модели MAI, а решения OpenAI и Anthropic перейдут в формат платных аддонов.
bloomberg.com

*организация признана экстремистской, её деятельность на территории РФ запрещена.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥46🤔22👏14👨‍💻10❤8💯6👍3

9.57K views05:10