Машинное обучение digest
61 subscribers
2.96K photos
487 videos
1.81K links
Download Telegram
Линус Торвальдс мог быть богаче Илона Маска. Но он выбрал другой путь.

В 2005 году его команда внезапно потеряла доступ к инструменту, с помощью которого управляла кодом Linux. Один разработчик сделал реверс-инжиниринг этой системы, и компания, которой она принадлежала, просто отключила проект без предупреждения.

Тысячи разработчиков. Никакого нормального способа совместной работы. Никакого запасного плана.

Торвальдс не стал паниковать. Он сел и написал собственную систему контроля версий с нуля.

За 10 дней.

Он назвал её Git. Уже в первый день Git отслеживал собственный исходный код. Через несколько недель на нём управлялся весь проект Linux. К концу 2005 года официально вышел Git 1.0.

А потом Линус просто отдал его бесплатно. Open source. Без компании. Без патентов. Без монетизации.

Через несколько месяцев он передал проект другим людям и вернулся к Linux, будто ничего особенного не произошло.

Зато другие быстро поняли, что он оставил на столе.

На Git вырос GitHub: 100 млн разработчиков, покупка Microsoft в 2018 году за $7,5 млрд. GitLab вышел на биржу в 2021 году с оценкой почти $12 млрд. Сегодня Git контролирует больше 85% рынка систем контроля версий.

Каждое приложение в вашем телефоне. Каждый сайт, который вы открываете. Почти всё это создаётся с помощью Git.

Торвальдс не заработал на этом $0.

Он создал самый используемый инструмент для разработчиков в истории просто потому, что его достала существующая система.

А потом отдал его бесплатно, потому что считал: такой инструмент должен быть доступен всем.

И он ни разу публично не сказал, что жалеет об этом.
⚡️ Wasserstein Learning Theory: когда ИИ учится сравнивать не точки, а целые распределения

В машинном обучении всё чаще важен не один конкретный пример, а то, как устроены данные целиком.

Например, модель обучали на одном распределении картинок, текстов или действий, а в реальности она получает немного другие данные. Обычная метрика может сказать: “распределения отличаются”. Wasserstein-подход показывает глубже: насколько далеко одно распределение нужно “перенести”, чтобы оно стало похоже на другое.

Идея пришла из оптимального транспорта. Представьте две кучи песка: одна форма - это первое распределение, другая второе. Расстояние Вассерштейна считает минимальную работу, которую нужно сделать, чтобы переложить песок из первой формы во вторую.

Почему это важно для ML:

* помогает анализировать сдвиг данных
* полезно для domain adaptation
* даёт инструменты для устойчивого обучения
* применяется в генеративных моделях
* помогает изучать обобщение нейросетей
* используется в reinforcement learning

В отличие от KL-дивергенции, Wasserstein distance учитывает геометрию пространства. Поэтому два распределения могут отличаться не просто “сильно” или “слабо”, а с учётом того, где именно находятся эти различия.

На практике это важно там, где модель должна быть устойчивой: новые домены, шумные данные, генерация, перенос знаний, обучение агентов.

Wasserstein Learning Theory даёт более точный язык для современной ML-задачи: не просто подогнать модель под датасет, а понять, как она ведёт себя при изменении распределения данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
✔️ Китай построит единую национальную вычислительную сеть

В ближайшие 5 лет Пекин планирует объединить разрозненные дата-центры страны в общую инфраструктуру для форсированного развития ИИ-отрасли.

Операционным управлением займутся телеком-гиганты China Mobile и China Telecom, которые должны обеспечить полную связность сети к 2028 году. С учетом модернизации энергосистем общие затраты на проект могут достичь полутриллиона долларов. Основное финансирование обеспечат выпуск гособлигаций и целевые фонды.

План жестко квотирует закупки - не менее 80% оборудования, включая ИИ-чипы, должно поставляться локальными производителями. Для NVIDIA и AMD это означает радикальное сокращение присутствия на китайском рынке.

Масштабная инфраструктурная стройка вошла в государственную стратегию "Шести больших сетей" и призвана обеспечить КНР независимость для лидерства в глобальной ИИ-гонке.
bloomberg.com

✔️ Google представила потоковую модель Gemini 3.5 Live Translate

Новинка генерирует аудио до окончания реплики спикера, балансируя между накоплением контекста и скоростью вывода. Алгоритм поддерживает более 70 языков и сохраняет оригинальную интонацию, темп и высоту голоса.

Технология сразу пошла в конечные продукты. Обновление разворачивается в мобильном Google Translate. Для корпоративных клиентов тестируется интеграция в Google Meet с поддержкой более 2000 языковых комбинаций в рамках одной конференции.

Превью-версия модели доступна в AI Studio и через Gemini Live API. Сгенерированные аудиодорожки маркируются SynthID.
blog.google

✔️ Скоростная версия флагманской модели Xiaomi

Китайская компания выпустила модель MiMo-V2.5-Pro-UltraSpeed на 1 трлн параметров со скоростью вывода 1000 токенов в секунду.

Пропускной способности добились совместно с разработчиками фреймворка TileRT за счёт квантования в FP4 и спекулятивного декодирования DFlash. Скорость генерации выросла в 10 раз по сравнению с прошлыми версиями. Xiaomi позиционирует модель для систем автоматизированного принятия решений с минимальной задержкой.

Доступ к UltraSpeed API стоит в 3 раза дороже базовой MiMo-V2.5-Pro. Открытая версия с весами FP4 опубликована на HuggingFace.

С 9 по 23 июня проходит закрытое корпоративное тестирование облачной версии. В день выделяется 10 слотов на сессии до 30 минут, доступ предоставляется по заявкам.
xiaomi.com

✔️ Perplexity и Гарвард оценили ускорение работы от применения агентов

Гарвардская школа бизнеса и Perplexity опубликовали отчет об эффективности автономного агента Computer. По сравнению со стандартным поиском платформы агент экономит 87% времени на интеллектуальные задачи и снижает условные затраты на труд на 94% (на базе данных о зарплатах в США).

ИИ-поиск требует постоянных действий пользователя при средней сессии в 33 секунды, а основные часы съедает ручная работа человека. Агент Computer берет весь цикл на себя и работает автономно около 26 минут.

Опросы пользователей зафиксировали медианное ускорение рутины в 25 раз. Доля сессий с негативной оценкой результатов выдачи при переходе на агента снизилась с 2,9% до 1,3%.
perplexity.ai

✔️ В США готовятся запустить торговлю фьючерсами на компьют

Goldman Sachs и JPMorgan Chase разрабатывают фьючерсные контракты, привязанные к стоимости аренды GPU. Инструмент нужен для хеджирования рисков дефолта и обесценивания оборудования по кредитам, выданным на создание ИИ-инфраструктуры.

Чикагская товарная биржа и Межконтинентальная биржа планируют начать торги контрактами на компьют в этом году, если инициативу одобрит регулятор.

Механизм позволит банкам открывать короткие позиции для компенсации убытков при падении арендных ставок. Облачные провайдеры, в свою очередь, смогут фиксировать прибыль и защищаться от ценовой волатильности.

Пока регуляторы США оценивают механизмы защиты от манипуляций, на зарубежных площадках уже работают альтернативные платформы ставок на динамику стоимости аренды NVIDIA H100.
theinformation.com

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️ OpenAI смягчила формулировку цели по автономному ИИ-учёному

Сэм Альтман и научный руководитель компании Якуб Пахоцки опубликовали программный текст под названием "Built to benefit everyone: our plan".

В нём авторы заявляют, что "полностью автоматизировать всё - не то будущее, которое мы хотим", называя такой сценарий не приносящим удовлетворения и опасным.

По мере роста возможностей ИИ роль человека не уменьшается. Люди должны задавать направление, расставлять приоритеты и решать, что вообще стоит делать.


Заявление контрастирует с тем, как компания описывала свои планы прошлой осенью

В октябре 2025 года, когда OpenAI сменила некоммерческий статус на коммерческий, Альтман и Пахоцки обозначили цель: создать к марту 2028 года полностью автономного ИИ-учёного, способного самостоятельно вести научные проекты, а к сентябрю 2026 года - ассистента уровня стажёра.

В новом тексте та же веха 2028 года сформулирована уже по другому

Компания рассчитывает, что к этому сроку значительная часть её исследований будет вестись ИИ в тандеме с людьми.

Альтман и Пахоцки называют нынешний момент началом "третьей фазы" OpenAI - перехода от разработчика продуктов к партнёру по внедрению.


С этой логикой связана дочерняя структура DeployCo, чьи инженеры работают внутри компаний-клиентов, встраивая ИИ в их процессы.

Реакция в сообществе трактует этот разворот как косвенное признание того, что внедрение ИИ даётся труднее, чем выпуск чат-бота.

Одновременно OpenAI предложила создать международную организацию для координации разработчиков ИИ и снижения катастрофических рисков. Этот орган должен позволять согласованные действия, включая замедление разработки передовых систем, когда это потребуется.

Похожую идею несколькими днями ранее высказала Anthropic.

Что стоит за смягчением риторики OpenAI в тексте не объясняется. Как компания намерена сочетать призыв к возможному замедлению разработок с собственными целями по их ускорению, тоже загадка.



#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Roblox заработал в России без ограничений.

Об этой новости сообщила Мизулина.
Вот это революция: в одном из офисов Google сотрудницам ввели ежемесячный доп выходной из-за месячных 😳

О нововведении рассказала одна из разработчиц компании. Теперь женщинам не придётся тратить на это больничный или брать отгул за свой счет.

Правда, в комментариях мнения разделились: одни сотрудники возмущены неравенством, другие считают, что девушки этого действительно заслуживают.

Что думаете?
Please open Telegram to view this post
VIEW IN TELEGRAM
Выжимаем из Claude Mythos максимум — Anthropic выпустили официальный гайд по промтингу модели.

— Модель лучше следует инструкциям, поэтому правила можно прописывать проще и короче;
— Внутри есть готовые шаблоны промтов, лайфхаки и рекомендации;
— До 22 июня модель доступна в подписке — дальше за каждый токен придётся платить.

11 дней, чтобы освоить самую сильную LLM в мире — забираем.
Дарио Амодеи опубликовал необычно откровенное эссе о том, куда движется ИИ.

Кратко, с цитатами.

Его новый текст Policy on the AI Exponential читается не как обычная колонка CEO, а как предупреждение от человека, который сам строит эту технологию.

Главная проблема — скорость. ИИ развивается по экспоненте, и Амодеи говорит об этом прямо. Законы же принимаются со скоростью Древоборода из «Властелина колец»: дерева, которому нужен целый день, чтобы просто поздороваться с другим деревом. Пока Конгресс успеет что-то сделать, пишет Амодеи, ИИ может пройти путь от «забавной игрушки» до «целой страны гениев».

Его горизонт очень короткий:

> «Если эти законы масштабирования продолжатся хотя бы ещё год-два, мы, вероятно, получим то, что я называл Powerful AI, или “страну гениев в дата-центре”».

И он считает, что доказательства уже есть. Указывая на киберриски Claude Mythos Preview, Амодеи пишет, что их более широкий смысл в том, что они «вне всяких сомнений доказывают: ИИ-модели уже стали инструментами глобального и национального стратегического значения».

Поэтому он предлагает обязательные правила по аналогии с авиационным регулятором FAA: независимое тестирование frontier-моделей, обязательные проверки третьими сторонами и право государства блокировать или откатывать релиз, если он признан небезопасным. И это говорит человек, чьи собственные модели как раз могут попасть под такие блокировки.

Часть, к которой хочется возвращаться:

В экономике он реально видит обе стороны. Потенциал, который он описывает, огромен:

> «Если ИИ сможет выполнять большинство когнитивных задач намного лучше людей, логично ожидать, что это приведёт к крайне быстрому и устойчивому экономическому росту за счёт ускорения науки, технологий и операционной эффективности. Способность ИИ итеративно создавать ещё более сильный ИИ может дополнительно усилить этот рост».

Но он не пытается закрыть глаза на обратную сторону:

> «Есть вполне реальная вероятность, что, несмотря на все наши усилия, ИИ всё равно вызовет значительную и долгосрочную потерю рабочих мест, и что это может быть внутренним свойством технологии, которая широко воспроизводит человеческое мышление».

Среди возможных мер он доходит до безусловного базового дохода и повышения налогов на прирост капитала.

О власти он предупреждает, что ИИ в плохих руках может стать «ультимативным инструментом автократии». Но затем разворачивает то же недоверие и в сторону собственной индустрии: ИИ «нельзя безопасно полностью доверить ни государствам, ни компаниям». Включая Anthropic.

И он отказывается относиться к общественному страху как к проблеме пиара:

> «Люди тревожатся из-за ИИ, потому что правильно понимают: его риски реальны».

Не помню, когда в последний раз CEO крупной ИИ-компании так явно вставал на сторону обеспокоенной публики, а не собственного маркетингового отдела.

Весь текст написан не в настроении победы, а в настроении срочности. Амодеи считает, что есть узкое окно, когда доказательства, общественная тревога и политическая воля ещё могут совпасть, и что мы уже примерно на год опаздываем.

Финальный образ почти обнадёживающий:

> «Древобород и его лес просыпаются».

Успеют ли они проснуться достаточно быстро.

https://x.com/DarioAmodei/status/2064781775247950326
“Steering LLMs? Actually, Sparse Autoencoders can outperform simple baselines”

В статье утверждается, что sparse autoencoders, возможно, не такие уж плохие инструменты для steering, как считалось раньше. Значительная часть прошлых неудач могла быть связана не с самими автоэнкодерами, а с тем, что исследователи выбирали и называли неправильные признаки.

Проблема в том, что ранние работы выставляли sparse autoencoders слабыми: их features размечали так, что названия могли не совпадать с тем, что эти признаки реально вызывают внутри модели.

Sparse autoencoder - это небольшая вспомогательная модель, которая раскладывает скрытую активность LLM на множество возможных «признаков»: тему, стиль, концепт или другое внутреннее направление.

То есть sparse autoencoder может найти направление внутри модели, но неназванное направление ещё не становится удобной ручкой управления.

Авторы заменяют размытые или унаследованные названия supervised-пайплайном: они проверяют, действительно ли активность конкретного feature стабильно совпадает с реальной меткой в данных.

Механизм примерно такой: если feature срабатывает на тему «алкоголь», а искусственное усиление этого feature заставляет модель чаще говорить об алкоголе, то метка перестаёт быть просто описательной. У неё появляется причинный смысл.

Ещё один важный вывод: экстремальная разреженность может быть не обязательна. Feature не обязан быть сверхредким, чтобы быть полезным для steering.

Важно и сравнение с prompting. И prompting, и feature steering пытаются подтолкнуть LLM к нужному поведению.

Но prompting обычно сильнее, потому что модель специально обучали следовать промптам. Feature steering работает грубее: мы как будто напрямую нажимаем на внутренний механизм модели и надеемся, что остальная система не развалится.

Prompting говорит модели во входе: «напиши про алкоголь». Feature steering делает иначе: он усиливает внутренний «alcohol-related» feature и проверяет, сдвинется ли ответ в эту сторону.

Ссылка: arxiv.org/abs/2605.31183
Готовимся: РКН готовит большой апгрейд машины блокировок — на расширение инфраструктуры хотят потратить ещё 1,3 млрд (!) рублей.

По данным CNews, Роскомнадзор ранее столкнулся с «нехваткой ресурсов на проведение необходимого комплекса работ». Так что теперь компания ДЦОА, которая занимается инфраструктурой для работы ТСПУ и является ключевым подрядчиком РКН, закупает не менее 154 новых российских серверов на 1,3 млрд рублей.

К 2030 году, кстати, пропускную способность системы блокировок хотят увеличить в 2,5 раза.

💀💀💀
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
✔️ IPO OpenAI произойдет в 2027 году

Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.

Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.

Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.

В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com

✔️ Arcee AI переезжает из AWS на Hugging Face

Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.

Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.

На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co

✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5

Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.

Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.

В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.

Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.

Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google

✔️ Cohere выпустила свою первую открытую кодинг-модель

North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.

В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.

Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com

✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI

Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.

Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.

Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ К ЧМ по футболу Google открывает бесплатный доступ к возможностям генеративного UI в AI Mode.

Этим летом функции интерактивной визуализации, обычно доступные только на тарифах Pro и Ultra, станут временно бесплатными для всех пользователей поиска Google.

Компания уже делала нечто подобное в 2022 году, но тогда возможности были далеко не такими функциональными, как сейчас.


На сложные запросы о тактике команд поисковик сможет генерировать не просто текстовые ответы, а интерактивные графические схемы, наглядно объясняющие расстановку сил и конкретные игровые ситуации на поле.

Помимо этого, компания существенно обновляет спортивный интерфейс и функциональность приложения Gemini. Оно научилось в реальном времени подтягивать актуальные результаты матчей, генерируя динамические виджеты со статистикой, анимациями и медиафайлами.

Изменения также затронули страницу live-результатов: появилась обновленная панель турнирных таблиц и улучшенная интеграция с сервисами трансляций.

Развертывание функционала уже идет полным ходом и станет доступно к началу турнира.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA показала CPO-switch, сделанный вместе с Lambda.

CPO, или co-packaged optics, переносит оптическую связь ближе к главному сетевому чипу. Путь сигнала становится короче, потерь меньше, энергопотребление ниже, а потенциальных точек отказа меньше.

NVIDIA объясняет это через экономику токенов: сеть сама токены не генерирует, но без неё GPU простаивают. Чем больше энергии и сбоев в сети, тем дороже каждый токен.

Для масштаба: дата-центр на 128 000 GPU с обычными оптическими модулями требует около 655 000 трансиверов. Каждый из них может сломаться. CPO убирает этот класс компонентов.
🙂 Странный мир маркетинговых акций OpenAI

Руководитель Codex Тибо Соттио объявил в соцсети X о 100-дневной программе: каждый день компания будет выбирать одного пользователя, который, по её оценке, делает с Codex впечатляющую или особенно полезную работу, и на месяц повышать ему лимиты использования в 10 раз.

Правила максимально просты

🟢Как именно будут отбирать победителей - неизвестно.

🟢На вопрос о том, как принять участие, Соттио ответил, что нужно просто что-то создавать.

🟢На уточняющие вопросы о метриках и о том, будут ли уведомлять победителей - тоже в ответ тишина.

В комментариях ожидаемо начался ад: часть твиттерских назвала акцию щедрым стимулом, другие интересуются, зачем сильному продукту подобные активности, а третьи просто стали публиковать свои проекты.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI рассматривает возможность резко снизить цены для пользователей, чтобы переманить клиентов у конкурента Anthropic.

По словам людей, знакомых с ситуацией, компания обсуждает значительное снижение стоимости токенов, через которые AI-компании тарифицируют использование своих продуктов.

Этот шаг может быть сделан заранее, поскольку OpenAI ожидает похожего снижения цен со стороны Anthropic.
Telegram заработает в России вслед за Roblox, считают в Госдуме. Депутат Андрей Свинцов заявил, что требования Роскомнадзора к мессенджеру несложные. При желании руководства платформы они сделают всё необходимое «за 2-3 месяца».
This media is not supported in your browser
VIEW IN TELEGRAM
Запустил новый Linux-сервер? Не спеши сразу ставить сайт, бота или базу.

Сначала закрой базу безопасности.

Обнови систему, чтобы убрать старые уязвимости. Создай отдельного пользователя и не работай постоянно из-под root. Защити SSH: отключи root-вход, убери пароли и используй ключи.

Дальше включи firewall и оставь открытыми только нужные порты. Поставь Fail2ban, чтобы сервер сам блокировал подозрительные попытки входа.

И обязательно настрой бэкапы, логи и мониторинг. Сервер без резервных копий это лотерея.

Эти шаги занимают немного времени, но сильно снижают риск взлома и проблем в будущем.
Демис Хассабис и Илья Суцкевер подняли главный вопрос: мы строим научный инструмент или пытаемся создать Бога?

Демис Хассабис считает, что ИИ это всего лишь продвинутый инженерный инструмент.

Его ценность в том, что он помогает расшифровывать структуры белков, решать сложные задачи физики и ускорять эмпирические открытия.

Илья Суцкевер смотрит иначе:

> «Большие нейросети, возможно, уже слегка сознательны».


Он считает, что глубокое сжатие данных может быть не просто техническим процессом, а формой предельного понимания реальности.

Один взгляд сводит ИИ к практическому инструменту для решения материальных задач.

Другой видит в нём нечто почти высшее, выходящее за пределы биологического мышления.

Кто прав?