Machinelearning – Telegram

Machinelearning

@ai_machinelearning_big_data

297K subscribers

5.05K photos

1.14K videos

17 files

5.41K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

297K subscribers

Machinelearning

✔️

CacheLib внезапно обновился

После 2-х лет тишины проект получил свежее обновление. Возвращение продиктовано бумом искусственного интеллекта: из-за скачка мировых цен на память IT-индустрии потребовались новые способы снижения расходов на инфраструктуру.

CacheLib позволяет выносить большие объемы кэша из дорогой оперативки на более доступные и емкие SSD без существенной потери производительности.

Инструмент предоставляет масштабируемый механизм гибридного кэширования, который автоматически и прозрачно распределяет данные между разными уровнями памяти.

Движок отличается крайне низкими накладными расходами благодаря поточномуу API и структурам данных без копирования, требуя минимум места для хранения метаданных.

Еще одна особенность CacheLib - отказоустойчивость: библиотека умеет сохранять свое состояние, предотвращая потерю прогретого кэша при перезапуске приложений.

Хотя официальный чейнджлог со списком изменений разработчики не опубликовали, актуальный релиз уже доступен на GitHub.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍113🔥31👏25💯18❤9🥰1🤣1

20.9K views09:01

Machinelearning

⚡️

Anthropic готовится представить коммерческую версию Mythos

Компания находится в шаге от релиза Claude Fable 5 - публичной адаптации архитектуры Mythos, которая развивается в рамках закрытого проекта Glasswing.

Оригинальная модель Mythos умеет автономно находить уязвимости нулевого дня и выполнять многоступенчатые хакерские атаки. Чтобы безопасно вывести технологию на рынок, Anthropic разделит релиз.

Базовая версия Mythos останется эксклюзивом для государств и профильных партнеров, а Fable 5 станет общедоступным флагманом для разработчиков.

В публичной Fable 5 будут вшиты строгие системные ограничения на сетевое проникновение и эксплуатацию вредоносного кода, при этом она сохранит возможности Mythos (сложную логику, работу со сверхдлинным контекстом и многоэтапное автономное выполнение задач).

Ожидается, что официальный анонс Fable 5 состоится 10 июня на конференции Code with Claude в Токио.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤66⚡55🤔26👍16🤣10🎉8✍5🔥5🥰1👏1🤬1

30.2K views11:34

Machinelearning

🔒Orion soft представил StarGuard AI — платформу для безопасной работы с LLM в корпоративной среде.

Решение позволяет централизованно управлять доступом к большим языковым моделям, включая ChatGPT, Claude, DeepSeek, GigaChat, YandexGPT и локальные LLM, обеспечивая контроль использования ИИ в компании.

По данным независимого исследования К2 Кибербезопасности и «Лаборатории Касперского» только 22% компаний выделили на отдельный бюджет на безопасность ИИ, при этом 61% компаний стремятся контролировать использование сотрудниками сторонних ИИ-сервисов, но испытывают технологические и организационные сложности.

StarGuard AI работает как reverse proxy-шлюз между пользователями, корпоративными системами и языковыми моделями. Платформа анализирует запросы и ответы, выявляет чувствительные данные, jailbreak-атаки, prompt-инъекции и нецелевой контент, а также ведет аудит взаимодействия с ИИ.

Решение поддерживает интеграцию с OpenWebUI, IDE, AI-агентами и корпоративными платформами и ориентировано на крупный бизнес, промышленность, финансовый сектор и государственные организации.

👍41🤔40👏12❤5🤣5🔥3🎉1

21.2K views14:13

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

OpenAI переделает ChatGPT в суперприложение

В ближайшие недели компания проведёт первый крупный редизайн ChatGPT с 2022 года. Сервис трансформируется из диалогового чат-бота в платформу автономных агентов.

Обновлённый интерфейс интегрирует партнёрские сервисы для самостоятельного выполнения многошаговых задач без дополнительных промптов и переключения между приложениями.

Смена курса обусловлена низкой рентабельностью чат-бота. Перед IPO OpenAI смещает фокус на B2B-сегмент и реструктуризирует продуктовые команды. Бизнес-модель переориентируется на корпоративных клиентов со стабильной монетизацией по аналогии со стратегией Anthropic.
ft.com

✔️

Инженер из аппаратного подразделения OpenAI перешёл в Anthropic

Anthropic наняла бывшего инженера OpenAI Клайва Чана для разработки собственных ИИ-чипов. До этого у компании не было профильного аппаратного подразделения.

В OpenAI Чан проектировал кастомный кремний и участвовал в партнёрстве с Broadcom. До этого он разрабатывал чипы для обучения ML-моделей в Tesla Autopilot, где отвечал за архитектуру дата-центров и энергоэффективные вычисления.

Найм Чана должен помочь Anthropic сформировать команду аппаратных инженеров. Переход на собственное железо планируется для снижения себестоимости вычислений и повышения маржинальности.
Clive Chan в сети Х

✔️

TSMC испытывает дефицит производственных мощностей

Google заказала у Intel производство более 3 млн TPU на 2028 год. Nvidia пока не заключила контракт, но тестирует техпроцессы Intel для будущей GPU-архитектуры Feynman. Причина переноса заказов - из-за нехватки производственных линий у TSMC.

Глава TSMC подтвердил, что индустрия не сможет покрыть спрос на ИИ-чипы в ближайшие несколько лет. Дефицит позволил Intel привлечь новых клиентов на фоне прошлых финансовых убытков и срывов дедлайнов.

Параллельно SK Hynix проверяет совместимость своей памяти с новыми технологиями упаковки Intel.
theinformation.com

✔️

Sakana AI займётся алгоритмической эволюцией ИИ

Японский стартап открыл исследовательскую лабораторию рекурсивного самосовершенствования (RSI). Цель - создание сетей, которые итеративно переписывают, тестируют и оптимизируют собственный код.

Компания рассчитывает, что алгоритмическая эволюция позволит отказаться от парадигмы масштабирования вычислений.

В портфеле стартапа уже есть система LLM-Squared, где одни LLM создают алгоритмы обучения для других, и платформа AI Scientist, автоматизирующая научные исследования.

Следующий этап дорожной карты Sakana AI - разработка автономных агентов, способных улучшать свою архитектуру без участия человека.
sakana.ai

✔️

Динамический биллинг лишил 74% бизнеса контроля над ИИ-бюджетами

По данным неопубликованного отчета KPMG, только 26% компаний полностью контролируют свои расходы на ИИ. 50% ведут ограниченный мониторинг, а 22% узнают о затратах постфактум из выставленных счетов. Причина - неготовность финансовых отделов к токенизированному биллингу и динамическому ценообразованию.

Из-за непрогнозируемой нагрузки потребление ресурсов в отдельных проектах возрастает до 6 раз. Это приводит к исчерпанию годовых бюджетов на облачные вычисления и API за несколько месяцев. По итогам текущего квартала ожидается пересмотр расходов после получения бизнесом реальных счетов от ИИ-провайдеров.

Текущую ситуацию сравнивают с закупками облачных мощностей во время пандемии, за которыми последовало сокращение инфраструктурных бюджетов.
wsj.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔112❤22💔19😐15👍13🤓7🤨6🔥5⚡1👏1🤣1

22.6K views15:15

Machinelearning

⚡️Релиз Claude Fable 5

Бенчмарки выглядят очень солидно, верим ?)

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

Модель уже доступна для пользователей.

https://www.anthropic.com/news/claude-fable-5-mythos-5

⚡104❤45👍23🏆16🔥6

24.4K views17:29

Machinelearning

✔️

OpenAI смягчила формулировку цели по автономному ИИ-учёному

Сэм Альтман и научный руководитель компании Якуб Пахоцки опубликовали программный текст под названием "Built to benefit everyone: our plan".

В нём авторы заявляют, что "полностью автоматизировать всё - не то будущее, которое мы хотим", называя такой сценарий не приносящим удовлетворения и опасным.

По мере роста возможностей ИИ роль человека не уменьшается. Люди должны задавать направление, расставлять приоритеты и решать, что вообще стоит делать.

Заявление контрастирует с тем, как компания описывала свои планы прошлой осенью

В октябре 2025 года, когда OpenAI сменила некоммерческий статус на коммерческий, Альтман и Пахоцки обозначили цель: создать к марту 2028 года полностью автономного ИИ-учёного, способного самостоятельно вести научные проекты, а к сентябрю 2026 года - ассистента уровня стажёра.

В новом тексте та же веха 2028 года сформулирована уже по другому

Компания рассчитывает, что к этому сроку значительная часть её исследований будет вестись ИИ в тандеме с людьми.

Альтман и Пахоцки называют нынешний момент началом "третьей фазы" OpenAI - перехода от разработчика продуктов к партнёру по внедрению.

С этой логикой связана дочерняя структура DeployCo, чьи инженеры работают внутри компаний-клиентов, встраивая ИИ в их процессы.

Реакция в сообществе трактует этот разворот как косвенное признание того, что внедрение ИИ даётся труднее, чем выпуск чат-бота.

Одновременно OpenAI предложила создать международную организацию для координации разработчиков ИИ и снижения катастрофических рисков. Этот орган должен позволять согласованные действия, включая замедление разработки передовых систем, когда это потребуется.

Похожую идею несколькими днями ранее высказала Anthropic.

Что стоит за смягчением риторики OpenAI в тексте не объясняется. Как компания намерена сочетать призыв к возможному замедлению разработок с собственными целями по их ускорению, тоже загадка.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤔87👍26❤13👏12😁9🤣4🤝4🤩1🙈1

20.9K views05:42

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

Китай построит единую национальную вычислительную сеть

В ближайшие 5 лет Пекин планирует объединить разрозненные дата-центры страны в общую инфраструктуру для форсированного развития ИИ-отрасли.

Операционным управлением займутся телеком-гиганты China Mobile и China Telecom, которые должны обеспечить полную связность сети к 2028 году. С учетом модернизации энергосистем общие затраты на проект могут достичь полутриллиона долларов. Основное финансирование обеспечат выпуск гособлигаций и целевые фонды.

План жестко квотирует закупки - не менее 80% оборудования, включая ИИ-чипы, должно поставляться локальными производителями. Для NVIDIA и AMD это означает радикальное сокращение присутствия на китайском рынке.

Масштабная инфраструктурная стройка вошла в государственную стратегию "Шести больших сетей" и призвана обеспечить КНР независимость для лидерства в глобальной ИИ-гонке.
bloomberg.com

✔️

Google представила потоковую модель Gemini 3.5 Live Translate

Новинка генерирует аудио до окончания реплики спикера, балансируя между накоплением контекста и скоростью вывода. Алгоритм поддерживает более 70 языков и сохраняет оригинальную интонацию, темп и высоту голоса.

Технология сразу пошла в конечные продукты. Обновление разворачивается в мобильном Google Translate. Для корпоративных клиентов тестируется интеграция в Google Meet с поддержкой более 2000 языковых комбинаций в рамках одной конференции.

Превью-версия модели доступна в AI Studio и через Gemini Live API. Сгенерированные аудиодорожки маркируются SynthID.
blog.google

✔️

Скоростная версия флагманской модели Xiaomi

Китайская компания выпустила модель MiMo-V2.5-Pro-UltraSpeed на 1 трлн параметров со скоростью вывода 1000 токенов в секунду.

Пропускной способности добились совместно с разработчиками фреймворка TileRT за счёт квантования в FP4 и спекулятивного декодирования DFlash. Скорость генерации выросла в 10 раз по сравнению с прошлыми версиями. Xiaomi позиционирует модель для систем автоматизированного принятия решений с минимальной задержкой.

Доступ к UltraSpeed API стоит в 3 раза дороже базовой MiMo-V2.5-Pro. Открытая версия с весами FP4 опубликована на HuggingFace.

С 9 по 23 июня проходит закрытое корпоративное тестирование облачной версии. В день выделяется 10 слотов на сессии до 30 минут, доступ предоставляется по заявкам.
xiaomi.com

✔️

Perplexity и Гарвард оценили ускорение работы от применения агентов

Гарвардская школа бизнеса и Perplexity опубликовали отчет об эффективности автономного агента Computer. По сравнению со стандартным поиском платформы агент экономит 87% времени на интеллектуальные задачи и снижает условные затраты на труд на 94% (на базе данных о зарплатах в США).

ИИ-поиск требует постоянных действий пользователя при средней сессии в 33 секунды, а основные часы съедает ручная работа человека. Агент Computer берет весь цикл на себя и работает автономно около 26 минут.

Опросы пользователей зафиксировали медианное ускорение рутины в 25 раз. Доля сессий с негативной оценкой результатов выдачи при переходе на агента снизилась с 2,9% до 1,3%.
perplexity.ai

✔️

В США готовятся запустить торговлю фьючерсами на компьют

Goldman Sachs и JPMorgan Chase разрабатывают фьючерсные контракты, привязанные к стоимости аренды GPU. Инструмент нужен для хеджирования рисков дефолта и обесценивания оборудования по кредитам, выданным на создание ИИ-инфраструктуры.

Чикагская товарная биржа и Межконтинентальная биржа планируют начать торги контрактами на компьют в этом году, если инициативу одобрит регулятор.

Механизм позволит банкам открывать короткие позиции для компенсации убытков при падении арендных ставок. Облачные провайдеры, в свою очередь, смогут фиксировать прибыль и защищаться от ценовой волатильности.

Пока регуляторы США оценивают механизмы защиты от манипуляций, на зарубежных площадках уже работают альтернативные платформы ставок на динамику стоимости аренды NVIDIA H100.
theinformation.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍125❤27🔥23👏11🤓9🤩6💯5😁3🎉2🥰1

21.6K views10:26

Machinelearning

Третий год подряд в Москве пройдет Turbo ML Conf – конференцию по AI и ML

⚡️Организаторы держат фокус на практической пользе и реальных кейсах внедрения. Конференция традиционно соберет в одном месте ML-инженеров, исследователей, продактов, техлидов AI/ML-команд и других специалистов из крупнейших российских компаний.

Ключевой темой станет — разработка современных моделей, их архитектурные особенности и интеграция в конечные продукты.

🟡Программа конференции разделена на три ключевых направления

Первый трек Turbo ML Conf 2026 — Fundamental Advances & Exploratory R&D — архитектура и обучение современных моделей, их интерпретируемость, безопасное поведение и способность к рассуждению и самокоррекции.
Второй – Applied ML at Scale & Business Impact — внедрение ML в продукты, интеграция классических и GenAI-моделей, обеспечение их предсказуемости, влияние AI на пользовательский опыт и бизнес-метрики.

Третий трек – ML Infrastructure, Platforms & Engineering Core — технологическое ядро ML-систем: архитектуры, пайплайны данных и масштабного обучения, методы дообучения, низкоуровневая оптимизация инференса и инфраструктура.

Спикерами станут более 20 практиков и руководителей команд ИИ из Т-Банка, Яндекса, Авито, Сбера и Института AIRI, которые также будут участвовать в разборах реальных кейсов.

Участие в конференции – бесплатно, но количество мест ограничено.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍89🔥26👏24❤9😁6👌5💯4🤝1🗿1

20K views14:56

Machinelearning

DiffusionGemma — это новая экспериментальная открытая модель Google с ускорением вывода до 4 раз на выделенных GPU.

Вместо предсказания слово за словом она генерирует целые блоки текста одновременно.

Это позволяет модели самостоятельно исправлять ошибки и форматировать сложный markdown в реальном времени.

goo.gle/4vG0xcI

👍94🔥51👏14❤9🥰4😁3👀1

20.1K views16:09

Machinelearning

🌟

TencentHY открыла фреймворк для RL-дообучения мультимодальных моделей

UniRL построен вокруг концепции универсального цикла:

сгенерировать примеры → оценить их → посчитать преимущества → обновить политику → синхронизировать веса обратно с воркерами роллаута.

Большинство RL-стеков заточены под одну модальность, UniRL применяет этот цикл к text2image, text/image2video, VL, LLM, связке LLM+диффузия и унифицированным авторегрессионно-диффузионным архитектурам.

Точка входа загружает конфиг и создаёт доменный тренер, который координирует подключаемые движки (train-side, SGLang, vLLM-Omni), алгоритмы, наборы моделей и сервисы наград поверх общего рантайма - Ray, FSDP2-шардинг, Transfer Queue, синхронизация весов LoRA или full.

🟡

Релиз сопровождают 2 авторских алгоритма

Flow-DPPO для flow matching и диффузионных моделей.

Метод заменяет клиппинг отношения вероятностей прямым ограничением по дивергенции.

В экспериментах TencentHY на SD3.5, FLUX2-9B и FLUX.1-dev метод показал более высокие награды и меньшую подверженность катастрофическому забыванию, чем базовые Flow-GRPO, Flow-CPS, GRPO-Guard и Diffusion-NFT.

DRPO для текстовых LLM

Это RL на уровне токенов с квадратичным регуляризатором, взвешенным по преимуществу.

DRPO проявил себя в режиме FP8, где GRPO и SPO часто теряли устойчивость. Проверяли на математических задачах на нескольких моделях линейки Qwen3 и на DeepSeek-R1-Distill-Qwen-1.5B.

🟡

UniRL поддерживает семейства и модели:

🟢Stable Diffusion 3/3.5, Qwen-Image, FLUX.2-Klein;
🟢WAN 2.1/2.2, HunyuanVideo 1.0/1.5;
🟢Qwen-VL, Qwen3 (LLM);
🟢HunyuanImage3, Bagel.

Команда планирует расширить набор алгоритмов для новых семейств, распространить Flow-DPPO и DRPO на большее число моделей и добавить новые бэкенды наград и движки в разных доменах.

📌Лицензирование: Apache-2.0

🟡

Страница проекта

🟡

Техотчет Flow-DPPO

🟡

Техотчет DRPO

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #Framework #RL #UniRL #TencentHY

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍74🔥21🤩18❤12👏3🎉2👌2⚡1

21K views18:15

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

К ЧМ по футболу Google открывает бесплатный доступ к возможностям генеративного UI в AI Mode.

Этим летом функции интерактивной визуализации, обычно доступные только на тарифах Pro и Ultra, станут временно бесплатными для всех пользователей поиска Google.

Компания уже делала нечто подобное в 2022 году, но тогда возможности были далеко не такими функциональными, как сейчас.

На сложные запросы о тактике команд поисковик сможет генерировать не просто текстовые ответы, а интерактивные графические схемы, наглядно объясняющие расстановку сил и конкретные игровые ситуации на поле.

Помимо этого, компания существенно обновляет спортивный интерфейс и функциональность приложения Gemini. Оно научилось в реальном времени подтягивать актуальные результаты матчей, генерируя динамические виджеты со статистикой, анимациями и медиафайлами.

Изменения также затронули страницу live-результатов: появилась обновленная панель турнирных таблиц и улучшенная интеграция с сервисами трансляций.

Развертывание функционала уже идет полным ходом и станет доступно к началу турнира.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👏76🎉34🤩20❤12👍5☃1🤔1

22.6K views05:33

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

IPO OpenAI произойдет в 2027 году

Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.

Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.

Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.

В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com

✔️

Arcee AI переезжает из AWS на Hugging Face

Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.

Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.

На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co

✔️

NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5

Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.

Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.

В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.

Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.

Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google

✔️

Cohere выпустила свою первую открытую кодинг-модель

North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.

В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.

Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com

✔️

Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI

Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.

Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.

Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍65🔥22❤20🤔10👏3😍1

18.1K views10:10

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

Релиз диффузионной LLM от Google

DiffusionGemma - экспериментальная языковая модель с открытыми весами, которая заимствовала подход из генерации изображений, где диффузионные модели превращают шум в картинку.

Модель построена на семействе Gemma 4, а сам механизм диффузии восходит к более ранней разработке Gemini Diffusion.

Под капотом MoE на 26 млрд общих и 3,8 млрд активных параметров. После квантования модель умещается в 18 ГБ VRAM.

По словам Google, на одном GPU модель работает до 4 раз быстрее сопоставимой авторегрессионной модели.

Nvidia приводит около 1000 токенов в секунду на H100, 150 - на DGX Spark и до 800 - на DGX Station.

Google заявляет более 700 токенов в секунду на GeForce RTX 5090.

На устройствах с общей памятью (например на Apple Silicon) разница с обычными моделями, вероятно, окажется меньше, а в облаке с параллельными запросами преимущество вовсе исчезает - в этом сценарии диффузия может повышать издержки.

🟡

За скорость приходится платить качеством

Для задач, где оно критично, Google по-прежнему рекомендует обычные модели Gemma 4, а DiffusionGemma позиционирует как инструмент для исследователей и разработчиков.

Сильной стороной компания называет задачи, не предполагающие строго последовательного порядка: вставку текста в готовый абзац, заполнение пропусков в коде, работу со структурированными данными.

🟡

Доступность

Веса опубликованы на Hugging Face под Apache 2.0. Модель работает с Transformers, vLLM и MLX.

Запустить её можно также через Model Garden и Nvidia NIM, а бесплатно потестить на build.nvidia.com.

Для дообучения предлагаются собственный JAX-тулбокс Hackable Diffusion, Unsloth и NeMo от Nvidia.

Google собрала руководство для разработчиков, а Маартен Гроотендорст - визуальное объяснение работы модели.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤43🤔40🔥32👍12👌7👏1

22.8K views14:03

Machinelearning

🙂

Странный мир маркетинговых акций OpenAI

Руководитель Codex Тибо Соттио объявил в соцсети X о 100-дневной программе: каждый день компания будет выбирать одного пользователя, который, по её оценке, делает с Codex впечатляющую или особенно полезную работу, и на месяц повышать ему лимиты использования в 10 раз.

Правила максимально просты

🟢Как именно будут отбирать победителей - неизвестно.

🟢На вопрос о том, как принять участие, Соттио ответил, что нужно просто что-то создавать.

🟢На уточняющие вопросы о метриках и о том, будут ли уведомлять победителей - тоже в ответ тишина.

В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

😁78❤72🤔36👍22🤨8👏6🔥2🎉1🕊1🏆1💘1

19.9K views17:23

Machinelearning

📌

Дарио Амодеи предложил политику регулирования ИИ

Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год.

С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях.

🟡

Регулирование и безопасность

Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором.

Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели.

🟡

Экономика

ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной.

Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов.

🟡

Польза от ИИ

Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину.

Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности.

🟡

Государство

ИИ в чужих руках может стать инструментом авторитаризма.

Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей.

🟡

Лидерство демократий

Тут ИИ сравнивается по значимости с ядерным оружием.

Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод.

Подводя итог, Амодеи называет текущий момент окном возможностей

Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам.

Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔74👍63❤18🔥18🥱14😁12👏5🤷‍♂3🙏3☃1💯1

20.6K views05:25

Machinelearning

Media is too big

VIEW IN TELEGRAM

✔️

OpenAI купила стартап Ona

Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.

Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.

Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com

✔️

AI Alliance коллективно обучит открытую модель

Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.

Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.

Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.

До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai

✔️

Сооснователь xAI запустил стартап персонализированных агентов

Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.

Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.

Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com

✔️

Агенты в ChatGPT получили возможность оплачивать покупки через Visa

Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.

OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.

Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com

✔️

Deezer запустил детектор ИИ-музыки

Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.

По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.

Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

1🤔104👏31👍20🎉16❤13😎7🤓5🔥3🥱2😁1🙊1

22.1K views10:24