Машинное обучение digest
61 subscribers
2.98K photos
496 videos
1.82K links
Download Telegram
GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозиториев

GitHub сообщил о компрометации одного из сотрудников компании. По предварительным данным, атака прошла через заражённое расширение для VS Code.

В результате злоумышленники получили доступ примерно к 4 000 внутренних репозиториев.

И, конечно, история уже вышла за рамки «внутреннего инцидента»: хакеры выставили похищенные данные на продажу за $50 000.

GitHub обещает позже опубликовать подробный отчёт и итоги расследования.

По текущей оценке, активность злоумышленника свелась к эксфильтрации только внутренних репозиториев GitHub. Заявления атакующего о ~3 800 репозиториях, по словам компании, в целом соответствуют результатам их расследования.

Чтобы снизить риски, GitHub оперативно провёл ротацию критических секретов — вчера и в течение ночи, начав с учётных данных с наибольшим потенциальным влиянием. Команда продолжает анализировать логи, проверять ротацию секретов и отслеживать возможную последующую активность; при необходимости будут предприняты дополнительные меры.

https://x.com/github/status/2056949168208552080

@data_analysis_ml
⚡️Туры в Турцию и Таиланд обвалились до цен 2020 года из-за падения доллара.

Сейчас пятидневный отдых в Турции с перелётом и завтраками можно взять примерно за 40 тысяч рублей. Путёвки в Таиланд стартуют от 90 тысяч.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Квантовые компьютеры могут сломать привычное шифрование быстрее, чем кажется

Почти всё, что мы делаем в интернете, держится на шифровании: банковские переводы, пароли, почта, медицинские данные, HTTPS-соединения в браузере. Сегодня это работает потому, что обычному компьютеру понадобились бы миллионы лет, чтобы взломать такую математику.

Но квантовые компьютеры играют по другим правилам.

В Google уже называют 2029 год дедлайном для перехода на post-quantum cryptography - криптографию, устойчивую к квантовым атакам. По сути, у мира осталось около трёх лет, чтобы перестроить огромную часть цифровой инфраструктуры. Для крупных компаний это не «обновить библиотеку», а многолетняя миграция ключей, протоколов, сертификатов, устройств и legacy-систем.

Повод для паники - не только теория. Google показала квантовый чип Willow, который выполнил стандартную вычислительную задачу менее чем за 5 минут. Для одного из самых быстрых суперкомпьютеров это заняло бы 10 септиллионов лет. Да, это не означает, что RSA и ECC уже можно взломать завтра. Willow использует 105 кубитов, а для серьёзной атаки на криптографию нужны миллионы стабильных кубитов.

Есть стратегия harvest now, decrypt later: злоумышленники крадут зашифрованные данные сегодня, сохраняют их и ждут момента, когда квантовые машины смогут их раскрыть. Если данные должны оставаться секретными через 5-10 лет, они уже находятся в зоне риска.

NIST ещё в 2024 году утвердил стандарты постквантовой криптографии, а Google уже внедряет квантово-устойчивые алгоритмы в Android. Инструменты защиты существуют.
⚡️ Machine Learning Roadmap 2025: большая карта входа в ML без сказок про “нейросети за месяц

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: Python, математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Авианосная ударная группа ВМС США направилась в Карибское море и движется к Кубе. Ранее в NYT сообщали, что Вашингтон собирается реализовать «венесуэльский сценарий». Он предполагает предъявление обвинений 94-летнему Раулю Кастро и его похищение.
Стать ИИ-инженером просто: нашли топовый курс, который обучит вас всем необходимым знаниям с нуля 😮

Внутри ждут 412 уроков, разбитые на 20 этапов: с ними вы освоите математику, принципы создания ИИ-агентов, промт-инжиниринг и другие важные отрасли.

Это бесплатно — забираем.
Please open Telegram to view this post
VIEW IN TELEGRAM
Tencent выкатил переводчик, который помещается почти куда угодно

Tencent Hunyuan открыли Hy-MT2 - серию мультиязычных моделей для перевода с Dense и MoE-вариантами.

Главная фишка не в том, что это «ещё одна модель для перевода». Самое интересное - маленькая версия на 1.8B параметров.

Её ужали через AngelSlim до 1.25-bit, и теперь модель занимает всего 440 МБ. При этом на Apple A15 она работает в 1.5 раза быстрее, чем обычный 4-bit inference.

То есть нормальный on-device перевод уже не выглядит как фантазия, где нужно жертвовать либо скоростью, либо размером.

Что заявляют по моделям:

• поддержка 33 языков и 5 китайских диалектов
• версия 1.8B обходит Microsoft Translate и другие коммерческие API на FLORES-200
• версии 7B и 30B-A3B обходят DeepSeek-V4-Pro
• 7B достигает 97.9% от уровня Gemini 3.1 Pro Think
• 30B-A3B достигает 98.6% от уровня Gemini 3.1 Pro Think
• все три модели показывают 96-99% от Gemini 3.1 Pro Think на реальных и доменных бенчмарках

Плюс Tencent вместе с моделями открыли IFMTBench - бенчмарк для проверки того, насколько хорошо переводческие модели следуют инструкциям.

🤖 https://modelscope.ai/collections/Tencent-Hunyuan/Hy-MT2
This media is not supported in your browser
VIEW IN TELEGRAM
Кристофер Нолан никогда не пользовался электронной почтой — у режиссёра даже нет смартфона.

«Я получаю много распечатанных писем. Меня никогда особо не интересовала эта форма общения. <…> У меня нет смартфона. С каждым днем всё труднее.»
Qwen выкатила Qwen3.7-Max: модель под агентов.

Alibaba показала Qwen3.7-Max - новый флагман семейства, который явно целят не в «ответь на вопрос», а в полноценную агентную работу.

Главный акцент - кодинг и long-horizon задачи. Модель обещают как основу для агентов, которые умеют не только писать куски кода, но и вести задачу end-to-end: собирать фронтенд-прототипы, делать многофайловые рефакторы, дебажить реальные проблемы и работать через инструменты.

Самая громкая заявка - 35 часов автономной работы над задачей по оптимизации kernel. Больше 1000 tool calls и без постоянного ручного контроля. Если это стабильно повторяется не только в демо, это уже другой класс агентных сценариев.

Что ещё заявляют:

- coding agent для реальной разработки, а не игрушечных сниппетов
- офисный ассистент через MCP-интеграции
- multi-agent orchestration для сложных рабочих процессов
- совместимость с разными агентными оболочками
- работа через Claude Code, OpenClaw, Qwen Code или свой стек
- доступ через Alibaba Model Studio и Qwen Studio

📖 Blog: https://qwen.ai/blog?id=qwen3.7
Qwen Studio: https://chat.qwen.ai/?models=qwen3.7-max
⚡️ API:https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.7-max&serviceSite=international

@data_analysis_ml
Rockstar Games официально подтвердила дату выхода GTA 6 — игра поступит в продажу 19 ноября.

Ранее в сети ходили слухи о возможном переносе релиза.
По данным The Information, в первом квартале OpenAI получила около $5,7 млрд выручки. Anthropic за тот же период - примерно $4,7 млрд.

На бумаге OpenAI впереди.

Но у Anthropic годовая выручка в пересчёте с последнего месяца уже якобы достигла $45 млрд. У OpenAI - около $25 млрд. То есть в квартальном отчёте OpenAI ещё выглядит лучше, но по текущей скорости рост Anthropic уже вырвалась вперёд.

Главный драйвер роста OpenAI - Codex, продажи бизнесу и тестирование рекламы в ChatGPT. Но у Anthropic, судя по цифрам, месячная выручка после первого квартала выросла больше чем в два раза.

- Anthropic, по оценкам, выходит к первой операционной прибыли примерно на $600 млн
- OpenAI всё ещё теряет около $1,22 на каждый заработанный доллар
- рост ChatGPT не дотянул до цели в 1 млрд пользователей
- OpenAI при этом продолжает поднимать гигантские раунды финансирования

Получается странный разворот. Компания, которая громче всех ассоциируется с ИИ-бумом, сжигает деньги быстрее, чем превращает аудиторию в устойчивую экономику.

А Anthropic, которую долго воспринимали как догоняющего конкурента, может оказаться бизнесом с более здоровой моделью.
🀄️ 8000 сотрудников уволены
— Уведомления отправили по почте
— В день сокращений всех перевели на удалёнку
— Введён ИИ-мониторинг персонала
— Отслеживаются клики, клавиши и приложения
— Система делает скриншоты экранов
— Данные сотрудников используют для обучения ИИ


И это не админ шизанулся, это *Meta, под руководством Цукерберга решила оптимизировать бизнес-процессы таким образом

Исходя из СМИ, большую часть людей уволили из этих направлений: recruiting, sales, operations, middle management.

Меньше всего пострадали программисты и инженеры, их почти не затронула эта волна, но часть их перевели в "AI-команды" (чтобы это ни значило)

источник: https://www.cnbc.com/2026/05/20/meta-layoffs-zuckerberg-says-success-isnt-a-given-in-memo.html?qsearchterm=Meta

*Meta признана экстремистcкой организацией в России.

Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
Вышел Codex CLI 0.133.0.

Goals теперь работают по умолчанию. У них появилось отдельное хранилище, прогресс трекается сквозь активные ходы, так что агент держит цель в фокусе между шагами и не забывает, куда шёл.

Заметно прокачали Permission profiles: API для списков, наследование настроек, поддержка managed requirements.toml, обновление прав в рантайме без перезапуска и усиленный сэндбокс под Windows.

Расширения получили доступ к событиям подагентов (старт, стоп), вызовам инструментов, метаданным хода и асинхронной обработке аппрувов. Можно строить нормальные обвязки вокруг Codex.

Плагины: discovery теперь учитывает маркетплейсы, показывает установленные версии, видимые корни и умеет работать с удалёнными коллекциями.

https://github.com/openai/codex/releases/tag/rust-v0.133.0
This media is not supported in your browser
VIEW IN TELEGRAM
Пауэрбанк ВЗОРВАЛСЯ прямо в лифте в Сургуте — девушка зашла в кабину, как вдруг сумка вспыхнула.

Пострадавшей повезло: из-за дыма двери лифта открылись автоматически и ей удалось вырваться на свободу. По информации СМИ, здоровью девушки ничего не угрожает.

Пятница однозначно испорчена.
Японцы показали компонент для чипов, который может стать ответом на энергетический ад ИИ

Университет Токио разработал компонент, который обрабатывает данные до 1000 раз быстрее обычных методов и при этом не разгоняет тепловыделение.

Но главная цифра даже не скорость.

По заявке разработчиков, энергопотребление может упасть до 1/100 от текущего уровня. Если очень грубо перевести это на масштаб дата-центров, объект, который сегодня потребляет энергию как 80 000 домов, теоретически мог бы уложиться в уровень около 800 домов.

Прототип чипа ожидается только к 2030 году, а коммерческое применение - ещё позже.
«Цукерберг уволил 8000 человек, а ещё 7000 отправил работать с ИИ.

В день сокращений компания попросила сотрудников работать из дома, чтобы избежать «офисных драм» и хаоса в офисах. А в 4 часа утра людям начали приходить письма об увольнении.

Но тех, кто сохранил работу, шокировала другая новость: на общем созвоне было объявлено, что теперь компания внедряет внутреннюю ИИ-систему, которая будет следить за рабочей активностью сотрудников: движения мыши, нажатия клавиш, действия в программах, скриншоты экранов и т.д.

Цукерберг прямо сказал, что это делается для обучения ИИ.
Его компания обучает ИИ-агентов на действиях собственных сотрудников, потому что они якобы дают более качественные данные, чем внешние подрядчики, которых обычно используют для обучения моделей.

Людей для компании при этом назвали «самым ценным ресурсом».

Как называется такая контора?
Первая победа людей над нейронками: Starbucks отключили ИИ для подсчёта продуктов после 9 месяцев мучений. 😂

Нейросеть должна была автоматически проводить инвентаризацию и учет продуктов через камеры и лидар. Систему запустили осенью прошлого года по всей Северной Америке, но она постоянно путала похожие позиции, пропускала товары и ломала весь учёт. Так что компания приняла решение официально вернуться к ручному учету.

Так и разрабов обратно начнут нанимать 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Anthropic выпустили пост-обновление про Mythos и Project Glasswing с промежуточными результатами.

Спустя месяц большинство партнеров обнаружили в своем коде сотни уязвимостей критического и высокого уровня опасности каждый. В общей сложности они выявили десятки тысяч уязвимостей. Некоторые из партнёров сообщили, что скорость обнаружения багов выросла более чем в десять раз. Например, компания Cloudflare нашла 2000 уязвимостей (400 из которых имеют высокий или критический уровень опасности) в своих критически важных системах, при этом доля ложных срабатываний, по мнению команды Cloudflare, оказалась ниже, чем у тестировщиков-людей.

Я видел много комментариев про то, что, мол, Mythos да может что-то находит, но наверняка выдаёт и много мусора, где уязвимостей нет — так вот это не так. Помимо закрытых проектов, Anthropic натравили Mythos и на опенсурс для сканирования более 1000 крупных репозиториев, на которых во многом держится современный интернет. На данный момент, по оценкам Anthropic, в этих проектах найдено 6202 уязвимости высокого или критического уровня (из 23 тысяч в общей сложности, включая те, которые относятся к среднему или низкому уровню опасности).

На данный момент лишь 1752 из этих уязвимостей с высоким и критическим уровнем прошли тщательную проверку силами одной из шести независимых исследовательских компаний в сфере кибербезопасности. Из них 90% оказались подтвержденными, а 62% (1100 штук) были классифицированы именно как уязвимости высокого или критического уровня.

Некоторые из уязвимостей носили очень серьёзный уровень угрозы, если бы они были обнаружены злоумышленниками. Как пример, Mythos смо написать эксплойт, который позволил бы злоумышленнику подделывать сертификаты через библиотеку wolfSSL. Это, к примеру, дало бы ему возможность разместить фальшивый сайт банка или почтового провайдера, и для конечного пользователя такой сайт выглядел бы абсолютно легитимным, браузер не показал бы никаких уведомлений.

Обнаруженные уязвимости льются как из рога изобилия, их не успевают исправлять, не хватает людей. Некоторые команды/проекты даже просили снизить темпы раскрытия информации об уязвимостях, поскольку им требуется больше времени на создание патчей. (В среднем, на устранение бага высокого или критического уровня, найденного с помощью Mythos Preview, уходит две недели).

В настоящее время ни одна компания — включая Anthropic — не разработала достаточно надежных механизмов защиты, способных предотвратить использование подобных ИИ-моделей во зло и для причинения потенциально серьезного ущерба. Именно поэтому к модели не дают доступ широкой аудитории. Но по этой же причине и был запущен Project Glasswing: если модель с аналогичными возможностями будет выпущена кем-то без соответствующих мер, то в скором времени для любого человека в мире станет значительно дешевле и проще эксплуатировать уязвимый код.