После 2-х лет тишины проект получил свежее обновление. Возвращение продиктовано бумом искусственного интеллекта: из-за скачка мировых цен на память IT-индустрии потребовались новые способы снижения расходов на инфраструктуру.
CacheLib позволяет выносить большие объемы кэша из дорогой оперативки на более доступные и емкие SSD без существенной потери производительности.
Инструмент предоставляет масштабируемый механизм гибридного кэширования, который автоматически и прозрачно распределяет данные между разными уровнями памяти.
Движок отличается крайне низкими накладными расходами благодаря поточномуу API и структурам данных без копирования, требуя минимум места для хранения метаданных.
Еще одна особенность CacheLib - отказоустойчивость: библиотека умеет сохранять свое состояние, предотвращая потерю прогретого кэша при перезапуске приложений.
Хотя официальный чейнджлог со списком изменений разработчики не опубликовали, актуальный релиз уже доступен на GitHub.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍113🔥31👏25💯18❤9🥰1🤣1
Компания находится в шаге от релиза Claude Fable 5 - публичной адаптации архитектуры Mythos, которая развивается в рамках закрытого проекта Glasswing.
Оригинальная модель Mythos умеет автономно находить уязвимости нулевого дня и выполнять многоступенчатые хакерские атаки. Чтобы безопасно вывести технологию на рынок, Anthropic разделит релиз.
Базовая версия Mythos останется эксклюзивом для государств и профильных партнеров, а Fable 5 станет общедоступным флагманом для разработчиков.
В публичной Fable 5 будут вшиты строгие системные ограничения на сетевое проникновение и эксплуатацию вредоносного кода, при этом она сохранит возможности Mythos (сложную логику, работу со сверхдлинным контекстом и многоэтапное автономное выполнение задач).
Ожидается, что официальный анонс Fable 5 состоится 10 июня на конференции Code with Claude в Токио.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤66⚡55🤔26👍16🤣10🎉8✍5🔥5🥰1👏1🤬1
🔒Orion soft представил StarGuard AI — платформу для безопасной работы с LLM в корпоративной среде.
Решение позволяет централизованно управлять доступом к большим языковым моделям, включая ChatGPT, Claude, DeepSeek, GigaChat, YandexGPT и локальные LLM, обеспечивая контроль использования ИИ в компании.
StarGuard AI работает как reverse proxy-шлюз между пользователями, корпоративными системами и языковыми моделями. Платформа анализирует запросы и ответы, выявляет чувствительные данные, jailbreak-атаки, prompt-инъекции и нецелевой контент, а также ведет аудит взаимодействия с ИИ.
Решение поддерживает интеграцию с OpenWebUI, IDE, AI-агентами и корпоративными платформами и ориентировано на крупный бизнес, промышленность, финансовый сектор и государственные организации.
Решение позволяет централизованно управлять доступом к большим языковым моделям, включая ChatGPT, Claude, DeepSeek, GigaChat, YandexGPT и локальные LLM, обеспечивая контроль использования ИИ в компании.
По данным независимого исследования К2 Кибербезопасности и «Лаборатории Касперского» только 22% компаний выделили на отдельный бюджет на безопасность ИИ, при этом 61% компаний стремятся контролировать использование сотрудниками сторонних ИИ-сервисов, но испытывают технологические и организационные сложности.
StarGuard AI работает как reverse proxy-шлюз между пользователями, корпоративными системами и языковыми моделями. Платформа анализирует запросы и ответы, выявляет чувствительные данные, jailbreak-атаки, prompt-инъекции и нецелевой контент, а также ведет аудит взаимодействия с ИИ.
Решение поддерживает интеграцию с OpenWebUI, IDE, AI-агентами и корпоративными платформами и ориентировано на крупный бизнес, промышленность, финансовый сектор и государственные организации.
👍41🤔40👏12❤5🤣5🔥3🎉1
Media is too big
VIEW IN TELEGRAM
В ближайшие недели компания проведёт первый крупный редизайн ChatGPT с 2022 года. Сервис трансформируется из диалогового чат-бота в платформу автономных агентов.
Обновлённый интерфейс интегрирует партнёрские сервисы для самостоятельного выполнения многошаговых задач без дополнительных промптов и переключения между приложениями.
Смена курса обусловлена низкой рентабельностью чат-бота. Перед IPO OpenAI смещает фокус на B2B-сегмент и реструктуризирует продуктовые команды. Бизнес-модель переориентируется на корпоративных клиентов со стабильной монетизацией по аналогии со стратегией Anthropic.
ft.com
Anthropic наняла бывшего инженера OpenAI Клайва Чана для разработки собственных ИИ-чипов. До этого у компании не было профильного аппаратного подразделения.
В OpenAI Чан проектировал кастомный кремний и участвовал в партнёрстве с Broadcom. До этого он разрабатывал чипы для обучения ML-моделей в Tesla Autopilot, где отвечал за архитектуру дата-центров и энергоэффективные вычисления.
Найм Чана должен помочь Anthropic сформировать команду аппаратных инженеров. Переход на собственное железо планируется для снижения себестоимости вычислений и повышения маржинальности.
Clive Chan в сети Х
Google заказала у Intel производство более 3 млн TPU на 2028 год. Nvidia пока не заключила контракт, но тестирует техпроцессы Intel для будущей GPU-архитектуры Feynman. Причина переноса заказов - из-за нехватки производственных линий у TSMC.
Глава TSMC подтвердил, что индустрия не сможет покрыть спрос на ИИ-чипы в ближайшие несколько лет. Дефицит позволил Intel привлечь новых клиентов на фоне прошлых финансовых убытков и срывов дедлайнов.
Параллельно SK Hynix проверяет совместимость своей памяти с новыми технологиями упаковки Intel.
theinformation.com
Японский стартап открыл исследовательскую лабораторию рекурсивного самосовершенствования (RSI). Цель - создание сетей, которые итеративно переписывают, тестируют и оптимизируют собственный код.
Компания рассчитывает, что алгоритмическая эволюция позволит отказаться от парадигмы масштабирования вычислений.
В портфеле стартапа уже есть система LLM-Squared, где одни LLM создают алгоритмы обучения для других, и платформа AI Scientist, автоматизирующая научные исследования.
Следующий этап дорожной карты Sakana AI - разработка автономных агентов, способных улучшать свою архитектуру без участия человека.
sakana.ai
По данным неопубликованного отчета KPMG, только 26% компаний полностью контролируют свои расходы на ИИ. 50% ведут ограниченный мониторинг, а 22% узнают о затратах постфактум из выставленных счетов. Причина - неготовность финансовых отделов к токенизированному биллингу и динамическому ценообразованию.
Из-за непрогнозируемой нагрузки потребление ресурсов в отдельных проектах возрастает до 6 раз. Это приводит к исчерпанию годовых бюджетов на облачные вычисления и API за несколько месяцев. По итогам текущего квартала ожидается пересмотр расходов после получения бизнесом реальных счетов от ИИ-провайдеров.
Текущую ситуацию сравнивают с закупками облачных мощностей во время пандемии, за которыми последовало сокращение инфраструктурных бюджетов.
wsj.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔112❤22💔19😐15👍13🤓7🤨6🔥5⚡1👏1🤣1
⚡️Релиз Claude Fable 5
Бенчмарки выглядят очень солидно, верим ?)
Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.
Модель уже доступна для пользователей.
https://www.anthropic.com/news/claude-fable-5-mythos-5
Бенчмарки выглядят очень солидно, верим ?)
Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.
Модель уже доступна для пользователей.
https://www.anthropic.com/news/claude-fable-5-mythos-5
⚡104❤45👍23🏆16🔥6
Сэм Альтман и научный руководитель компании Якуб Пахоцки опубликовали программный текст под названием "Built to benefit everyone: our plan".
В нём авторы заявляют, что "полностью автоматизировать всё - не то будущее, которое мы хотим", называя такой сценарий не приносящим удовлетворения и опасным.
По мере роста возможностей ИИ роль человека не уменьшается. Люди должны задавать направление, расставлять приоритеты и решать, что вообще стоит делать.
Заявление контрастирует с тем, как компания описывала свои планы прошлой осенью
В октябре 2025 года, когда OpenAI сменила некоммерческий статус на коммерческий, Альтман и Пахоцки обозначили цель: создать к марту 2028 года полностью автономного ИИ-учёного, способного самостоятельно вести научные проекты, а к сентябрю 2026 года - ассистента уровня стажёра.
В новом тексте та же веха 2028 года сформулирована уже по другому
Компания рассчитывает, что к этому сроку значительная часть её исследований будет вестись ИИ в тандеме с людьми.
Альтман и Пахоцки называют нынешний момент началом "третьей фазы" OpenAI - перехода от разработчика продуктов к партнёру по внедрению.
С этой логикой связана дочерняя структура DeployCo, чьи инженеры работают внутри компаний-клиентов, встраивая ИИ в их процессы.
Реакция в сообществе трактует этот разворот как косвенное признание того, что внедрение ИИ даётся труднее, чем выпуск чат-бота.
Одновременно OpenAI предложила создать международную организацию для координации разработчиков ИИ и снижения катастрофических рисков. Этот орган должен позволять согласованные действия, включая замедление разработки передовых систем, когда это потребуется.
Похожую идею несколькими днями ранее высказала Anthropic.
Что стоит за смягчением риторики OpenAI в тексте не объясняется. Как компания намерена сочетать призыв к возможному замедлению разработок с собственными целями по их ускорению, тоже загадка.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤔87👍26❤13👏12😁9🤣4🤝4🤩1🙈1
Media is too big
VIEW IN TELEGRAM
В ближайшие 5 лет Пекин планирует объединить разрозненные дата-центры страны в общую инфраструктуру для форсированного развития ИИ-отрасли.
Операционным управлением займутся телеком-гиганты China Mobile и China Telecom, которые должны обеспечить полную связность сети к 2028 году. С учетом модернизации энергосистем общие затраты на проект могут достичь полутриллиона долларов. Основное финансирование обеспечат выпуск гособлигаций и целевые фонды.
План жестко квотирует закупки - не менее 80% оборудования, включая ИИ-чипы, должно поставляться локальными производителями. Для NVIDIA и AMD это означает радикальное сокращение присутствия на китайском рынке.
Масштабная инфраструктурная стройка вошла в государственную стратегию "Шести больших сетей" и призвана обеспечить КНР независимость для лидерства в глобальной ИИ-гонке.
bloomberg.com
Новинка генерирует аудио до окончания реплики спикера, балансируя между накоплением контекста и скоростью вывода. Алгоритм поддерживает более 70 языков и сохраняет оригинальную интонацию, темп и высоту голоса.
Технология сразу пошла в конечные продукты. Обновление разворачивается в мобильном Google Translate. Для корпоративных клиентов тестируется интеграция в Google Meet с поддержкой более 2000 языковых комбинаций в рамках одной конференции.
Превью-версия модели доступна в AI Studio и через Gemini Live API. Сгенерированные аудиодорожки маркируются SynthID.
blog.google
Китайская компания выпустила модель MiMo-V2.5-Pro-UltraSpeed на 1 трлн параметров со скоростью вывода 1000 токенов в секунду.
Пропускной способности добились совместно с разработчиками фреймворка TileRT за счёт квантования в FP4 и спекулятивного декодирования DFlash. Скорость генерации выросла в 10 раз по сравнению с прошлыми версиями. Xiaomi позиционирует модель для систем автоматизированного принятия решений с минимальной задержкой.
Доступ к UltraSpeed API стоит в 3 раза дороже базовой MiMo-V2.5-Pro. Открытая версия с весами FP4 опубликована на HuggingFace.
С 9 по 23 июня проходит закрытое корпоративное тестирование облачной версии. В день выделяется 10 слотов на сессии до 30 минут, доступ предоставляется по заявкам.
xiaomi.com
Гарвардская школа бизнеса и Perplexity опубликовали отчет об эффективности автономного агента Computer. По сравнению со стандартным поиском платформы агент экономит 87% времени на интеллектуальные задачи и снижает условные затраты на труд на 94% (на базе данных о зарплатах в США).
ИИ-поиск требует постоянных действий пользователя при средней сессии в 33 секунды, а основные часы съедает ручная работа человека. Агент Computer берет весь цикл на себя и работает автономно около 26 минут.
Опросы пользователей зафиксировали медианное ускорение рутины в 25 раз. Доля сессий с негативной оценкой результатов выдачи при переходе на агента снизилась с 2,9% до 1,3%.
perplexity.ai
Goldman Sachs и JPMorgan Chase разрабатывают фьючерсные контракты, привязанные к стоимости аренды GPU. Инструмент нужен для хеджирования рисков дефолта и обесценивания оборудования по кредитам, выданным на создание ИИ-инфраструктуры.
Чикагская товарная биржа и Межконтинентальная биржа планируют начать торги контрактами на компьют в этом году, если инициативу одобрит регулятор.
Механизм позволит банкам открывать короткие позиции для компенсации убытков при падении арендных ставок. Облачные провайдеры, в свою очередь, смогут фиксировать прибыль и защищаться от ценовой волатильности.
Пока регуляторы США оценивают механизмы защиты от манипуляций, на зарубежных площадках уже работают альтернативные платформы ставок на динамику стоимости аренды NVIDIA H100.
theinformation.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍125❤27🔥23👏11🤓9🤩6💯5😁3🎉2🥰1
Третий год подряд в Москве пройдет Turbo ML Conf – конференцию по AI и ML
⚡️ Организаторы держат фокус на практической пользе и реальных кейсах внедрения. Конференция традиционно соберет в одном месте ML-инженеров, исследователей, продактов, техлидов AI/ML-команд и других специалистов из крупнейших российских компаний.
Ключевой темой станет — разработка современных моделей, их архитектурные особенности и интеграция в конечные продукты.
🟡 Программа конференции разделена на три ключевых направления
Первый трек Turbo ML Conf 2026 — Fundamental Advances & Exploratory R&D — архитектура и обучение современных моделей, их интерпретируемость, безопасное поведение и способность к рассуждению и самокоррекции.
Второй – Applied ML at Scale & Business Impact — внедрение ML в продукты, интеграция классических и GenAI-моделей, обеспечение их предсказуемости, влияние AI на пользовательский опыт и бизнес-метрики.
Третий трек – ML Infrastructure, Platforms & Engineering Core — технологическое ядро ML-систем: архитектуры, пайплайны данных и масштабного обучения, методы дообучения, низкоуровневая оптимизация инференса и инфраструктура.
Спикерами станут более 20 практиков и руководителей команд ИИ из Т-Банка, Яндекса, Авито, Сбера и Института AIRI, которые также будут участвовать в разборах реальных кейсов.
Участие в конференции – бесплатно, но количество мест ограничено.
@ai_machinelearning_big_data
#news #ai #ml
Ключевой темой станет — разработка современных моделей, их архитектурные особенности и интеграция в конечные продукты.
Первый трек Turbo ML Conf 2026 — Fundamental Advances & Exploratory R&D — архитектура и обучение современных моделей, их интерпретируемость, безопасное поведение и способность к рассуждению и самокоррекции.
Второй – Applied ML at Scale & Business Impact — внедрение ML в продукты, интеграция классических и GenAI-моделей, обеспечение их предсказуемости, влияние AI на пользовательский опыт и бизнес-метрики.
Третий трек – ML Infrastructure, Platforms & Engineering Core — технологическое ядро ML-систем: архитектуры, пайплайны данных и масштабного обучения, методы дообучения, низкоуровневая оптимизация инференса и инфраструктура.
Спикерами станут более 20 практиков и руководителей команд ИИ из Т-Банка, Яндекса, Авито, Сбера и Института AIRI, которые также будут участвовать в разборах реальных кейсов.
Участие в конференции – бесплатно, но количество мест ограничено.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍89🔥26👏24❤9😁6👌5💯4🤝1🗿1
DiffusionGemma — это новая экспериментальная открытая модель Google с ускорением вывода до 4 раз на выделенных GPU.
Вместо предсказания слово за словом она генерирует целые блоки текста одновременно.
Это позволяет модели самостоятельно исправлять ошибки и форматировать сложный markdown в реальном времени.
goo.gle/4vG0xcI
Вместо предсказания слово за словом она генерирует целые блоки текста одновременно.
Это позволяет модели самостоятельно исправлять ошибки и форматировать сложный markdown в реальном времени.
goo.gle/4vG0xcI
👍94🔥51👏14❤9🥰4😁3👀1
UniRL построен вокруг концепции универсального цикла:
сгенерировать примеры → оценить их → посчитать преимущества → обновить политику → синхронизировать веса обратно с воркерами роллаута.
Большинство RL-стеков заточены под одну модальность, UniRL применяет этот цикл к text2image, text/image2video, VL, LLM, связке LLM+диффузия и унифицированным авторегрессионно-диффузионным архитектурам.
Точка входа загружает конфиг и создаёт доменный тренер, который координирует подключаемые движки (train-side, SGLang, vLLM-Omni), алгоритмы, наборы моделей и сервисы наград поверх общего рантайма - Ray, FSDP2-шардинг, Transfer Queue, синхронизация весов LoRA или full.
Flow-DPPO для flow matching и диффузионных моделей.
Метод заменяет клиппинг отношения вероятностей прямым ограничением по дивергенции.
В экспериментах TencentHY на SD3.5, FLUX2-9B и FLUX.1-dev метод показал более высокие награды и меньшую подверженность катастрофическому забыванию, чем базовые Flow-GRPO, Flow-CPS, GRPO-Guard и Diffusion-NFT.
DRPO для текстовых LLM
Это RL на уровне токенов с квадратичным регуляризатором, взвешенным по преимуществу.
DRPO проявил себя в режиме FP8, где GRPO и SPO часто теряли устойчивость. Проверяли на математических задачах на нескольких моделях линейки Qwen3 и на DeepSeek-R1-Distill-Qwen-1.5B.
Команда планирует расширить набор алгоритмов для новых семейств, распространить Flow-DPPO и DRPO на большее число моделей и добавить новые бэкенды наград и движки в разных доменах.
@ai_machinelearning_big_data
#AI #ML #Framework #RL #UniRL #TencentHY
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍74🔥21🤩18❤12👏3🎉2👌2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Этим летом функции интерактивной визуализации, обычно доступные только на тарифах Pro и Ultra, станут временно бесплатными для всех пользователей поиска Google.
Компания уже делала нечто подобное в 2022 году, но тогда возможности были далеко не такими функциональными, как сейчас.
На сложные запросы о тактике команд поисковик сможет генерировать не просто текстовые ответы, а интерактивные графические схемы, наглядно объясняющие расстановку сил и конкретные игровые ситуации на поле.
Помимо этого, компания существенно обновляет спортивный интерфейс и функциональность приложения Gemini. Оно научилось в реальном времени подтягивать актуальные результаты матчей, генерируя динамические виджеты со статистикой, анимациями и медиафайлами.
Изменения также затронули страницу live-результатов: появилась обновленная панель турнирных таблиц и улучшенная интеграция с сервисами трансляций.
Развертывание функционала уже идет полным ходом и станет доступно к началу турнира.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👏76🎉34🤩20❤12👍5☃1🤔1
Media is too big
VIEW IN TELEGRAM
Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.
Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.
Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.
В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com
Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.
Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.
На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co
Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.
Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.
В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.
Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.
Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google
North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.
В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.
Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com
Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.
Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.
Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65🔥22❤20🤔10👏3😍1
DiffusionGemma - экспериментальная языковая модель с открытыми весами, которая заимствовала подход из генерации изображений, где диффузионные модели превращают шум в картинку.
Модель построена на семействе Gemma 4, а сам механизм диффузии восходит к более ранней разработке Gemini Diffusion.
Под капотом MoE на 26 млрд общих и 3,8 млрд активных параметров. После квантования модель умещается в 18 ГБ VRAM.
По словам Google, на одном GPU модель работает до 4 раз быстрее сопоставимой авторегрессионной модели.
Nvidia приводит около 1000 токенов в секунду на H100, 150 - на DGX Spark и до 800 - на DGX Station.
Google заявляет более 700 токенов в секунду на GeForce RTX 5090.
На устройствах с общей памятью (например на Apple Silicon) разница с обычными моделями, вероятно, окажется меньше, а в облаке с параллельными запросами преимущество вовсе исчезает - в этом сценарии диффузия может повышать издержки.
Для задач, где оно критично, Google по-прежнему рекомендует обычные модели Gemma 4, а DiffusionGemma позиционирует как инструмент для исследователей и разработчиков.
Сильной стороной компания называет задачи, не предполагающие строго последовательного порядка: вставку текста в готовый абзац, заполнение пропусков в коде, работу со структурированными данными.
Веса опубликованы на Hugging Face под Apache 2.0. Модель работает с Transformers, vLLM и MLX.
Запустить её можно также через Model Garden и Nvidia NIM, а бесплатно потестить на build.nvidia.com.
Для дообучения предлагаются собственный JAX-тулбокс Hackable Diffusion, Unsloth и NeMo от Nvidia.
Google собрала руководство для разработчиков, а Маартен Гроотендорст - визуальное объяснение работы модели.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43🤔40🔥32👍12👌7👏1
Руководитель Codex Тибо Соттио объявил в соцсети X о 100-дневной программе: каждый день компания будет выбирать одного пользователя, который, по её оценке, делает с Codex впечатляющую или особенно полезную работу, и на месяц повышать ему лимиты использования в 10 раз.
В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
😁78❤72🤔36👍22🤨8👏6🔥2🎉1🕊1🏆1💘1
Сооснователь и руководитель Anthropic опубликовал эссе "Policy on the AI Exponential", в котором он сетует на то, что регулирование ИИ отстает от его фактического развития примерно на год.
С этим, по мнению Дарио, надо что-то делать и он предлагает изменения в 5 направлениях.
Амодеи предлагает перейти от прозрачности, за которую Anthropic всегда выступала, к контролю по аналогии с авиационным надзором.
Модели мощнее определённого порога должны проходить независимую проверку на кибербезопасность, биоугрозу, потерю контроля над системой и автоматизацию исследований. Государство должно иметь право блокировать опасные модели.
ИИ способен вызвать масштабное вытеснение работников. Амодеи считает потерю рабочих мест нежелательной.
Он предлагает точнее измерять последствия, стимулировать сохранение занятости (страхование зарплат, налоговые льготы работодателям), а при массовом проявлении - долгосрочную поддержку доходов людей, вплоть до безусловного базового дохода за счёт налогов.
Здесь обратная проблема: регуляторы, рассчитанные на медленный темп, тормозят области, которые ИИ способен ускорить, прежде всего медицину.
Дарио предлагает заранее разработать стандарты, позволяющие признавать ИИ-методы (моделирование, синтетические контрольные группы) и быстрее одобрять лекарства, не снижая требований к безопасности.
ИИ в чужих руках может стать инструментом авторитаризма.
Поэтому нужны правила подотчётности для военного применения, запрет такого использования внутри США, закрытие лазейки с продажей пользовательских данных и право граждан на ИИ-помощь при действиях государства против них. Это касается и компаний, и властей.
Тут ИИ сравнивается по значимости с ядерным оружием.
Амодеи призывает создать коалицию, делиться внутри неё цепочкой поставок чипов и закрывать к ней доступ соперникам (разумеется, Китаю), согласовывать подходы к рискам и распределению выгод.
Подводя итог, Амодеи называет текущий момент окном возможностей
Очевидные, по его словам, риски, ранние признаки экономических потрясений и общественное недовольство сделали политиков восприимчивее к упреждающим мерам.
Дарио отвергает мнение, что ИИ нужен лишь пиар, и считает тревогу людей обоснованной реакцией на реальные проблемы, надеясь что предложенные меры получат поддержку.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔74👍63❤18🔥18🥱14😁12👏5🤷♂3🙏3☃1💯1
Media is too big
VIEW IN TELEGRAM
Сделка по приобретению стартапа облачной оркестрации Ona позволит агентам OpenAI выполнять долгие задачи автономно, без привязки к локальным устройствам и активным сессиям пользователя.
Интеграция решений Ona даст изолированную среду для многочасовой работы с кодом, с возможностью удаленно подключаться к фоновым процессам для корректировки действий, проверки промежуточных результатов и утверждения решений.
Команда стартапа перейдет в OpenAI после одобрения сделки регуляторами.
openai.com
Консорциум представил платформу Project Tapestry для федеративного обучения открытых моделей. Участники будут тренировать её на локальных данных с использованием собственных вычислительных мощностей. В общую систему попадут только обновленные веса.
Ян Лекун, консультант проекта, пообещал, что контрибьюторы получат доступ к итоговой базовой модели. На ее основе компании смогут создавать независимые версии под свои бизнес-задачи.
Сейчас инженеры проекта тестируют архитектуру платформы и формируют каталог данных. Релиз инфраструктуры запланирован на сентябрь 2026 года.
До конца года AI Alliance планирует обучить первую компактную модель, а к лету 2027 выпустить вариант уровня проприетарных SOTA-решений.
thealliance.ai
Игорь Бабушкин, стоявший у истоков xAI и ранее работавший в OpenAI и Google DeepMind, объявил о создании компании River AI, которая будет заниматься созданием адаптивных ИИ-агентов.
Идеология проекта строится на расширении человеческих возможностей через персонализацию и полном контроле ИИ. В перспективе стартап планирует заняться разработкой аппаратных решений и физической инфраструктуры.
Костяк команды сформировали выходцы из xAI. К Бабушкину присоединились руководитель продуктовой безопасности Винсент Старк, юрисконсульт Лили Лим, а также инженеры братья Соболевы.
bloomberg.com
Visa интегрировала платежную сеть в ChatGPT. ИИ-агенты получили возможность самостоятельно проводить транзакции от лица пользователя у любого продавца с поддержкой карт сервиса. Для работы функции достаточно привязать карту к чат-боту.
OpenAI обеспечивает логику автономных агентов, Visa отвечает за авторизацию платежей и фрод-мониторинг. Пользователям доступны инструменты контроля: лимиты трат, белые списки магазинов и опция обязательного подтверждения операций.
Оспаривание платежей проходит по стандартным правилам Visa. Регламент планируют адаптировать для случаев, когда продавец действовал корректно, а ошибочный заказ произошел из-за сбоя в логике ИИ.
visa.com
Стриминговый сервис создал инструмент, который ищет и определяет ИИ-треки. Алгоритм анализирует медиатеки пользователей и выявляет синтетический контент на 20 стриминговых платформах. Инструмент поддерживает 27 языков.
По словам директора компании Алексиса Лантернье, ежедневно на Deezer загружается около 75 тысяч ИИ-композиций, это более 44% от всех новых релизов, а почти у половины пользователей, переходящих от конкурентов, в сохраненных подборках уже есть сгенерированная музыка.
Исследование Deezer и Ipsos показало, что 97% слушателей не отличают ИИ-музыку от реальной, но 80% требуют обязательной маркировки. Платформа уже начала пессимизировать сгенерированный контент, исключая его из рекомендаций и подборок.
deezer.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤔104👏31👍20🎉16❤13😎7🤓5🔥3🥱2😁1🙊1