Машинное обучение digest

0:27

✔️

Black Forest Labs запустила MCP-сервер

Сервер доступен по адресу mcp.bfl.ai и позволяет создавать и редактировать изображения в чат-клиентах, поддерживающих этот протокол. Заявлена совместимость с Claude, Cursor, Codex, Windsurf и другими MCP-клиентами.

MCP-сервер предоставляет несколько инструментов: генерацию до 8 изображений параллельно, создание вариаций на основе предыдущего результата, просмотр истории запросов и проверку остатка средств на счёте.

Нужную модель клиент выбирает автоматически в зависимости от запроса. Доступно несколько моделей линейки FLUX.2: от быстрой Klein до топовой Мax. По умолчанию используется Flux2 Pro.

Оплата, согласно документации, производится напрямую BFL: счёт выставляется той организации, которая была выбрана при авторизации.

Актуальные тарифы - на странице bfl.ai/pricing.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

13 views14:27

1:27

Бывший CEO Google Эрик Шмидт выступил на выпускной церемонии Университета Аризоны с речью про ИИ.

Когда он сказал:

Вам не обязательно интересоваться ИИ. Какую бы карьеру вы ни выбрали, ИИ всё равно будет ее частью.

И зал раздался свистом.

Студенты воспринимают это так:

Вам придётся конкурировать с машинами за вашу первую работу.

Но с другой стороны, они находятся в лучшей позиции, чем предшественники и могут использовать мощные ИИ-инструменты уже на самом старте своей карьеры.

12 views15:11

Андрей Карпаты перешёл в Anthropic

Один из самых известных людей в индустрии — сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic.

В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже.

Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ.

Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа.
С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели — у компании явно идёт серьёзная фаза найма под большие задачи.

https://x.com/karpathy/status/2056753169888334312

10 views15:25

0:54

Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами

Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app

11 views17:31

Итак, Google I/O. Основные релизы:

1️⃣ Gemini 3.5 Flash. По бенчмаркам обходит Gemini 3.1 Pro в кодинге, агентных задачах и на мультимодальности, при этом выдает скорость чуть меньше 300 токенов в секунду: это заметно быстрее GPT-5.4 mini и Claude Haiku, и примерно в 4 раза быстрее Opus, Sonnet и GPT-5.5. На презентации также показывали версию, выдающую почти 1500 токенов в секунду. Цена тоже намного доступнее Pro версий, GPT и Opus.

Gemini 3.5 Pro пообещали выпустить в следующем месяце. Gemini 3.5 Flash уже можно попробовать в Antigravity.

2️⃣ Gemini Omni. Как написали Google, это "первый шаг на пути к моделям, которые могут генерировать что угодно из чего угодно". В текущей версии Omni ограничена генерацией видео. На входе может быть текст, изображения, видео и голос, на выходе вы получаете видео. Качество генераций – конкурентоспособное, физика не страдает, фотореалистичность на уровне. Попробовать можно в приложении Gemini.

3️⃣ Antigravity 2.0. Добавили: всякие возможности для оркестрации параллельных агентов и субагентов, фоновые задачи, нативную поддержку голосовых команд. Выпустили Antigravity CLI (на замену Gemini CLI) и Antigravity SDK для создания кастомных агентов. На презентации показали, как система собрала рабочую операционку, на которой можно запустить Doom. На это понадобилось менее 12 часов, 96 агентов и менее 1 тысячи долларов.

4️⃣ Ну и по мелочи:
– полностью обновили интерфейс Gemini App, теперь ответы больше похоже на интерактивные страницы;
– для подписчиков AI Plus, Pro и Ultra добавили Daily Brief: персонализированный дайджест дня на основе Gmail, Календаря и задач;
– для Ultra теперь предлагают Gemini Spark: личного агента, который работает постоянно даже при выключенном ноутбуке и выполняет за вас задачи. Пока что интеграции только с инструментами Google, но обещают скоро добавить и другие;
– подписка Google AI Ultra теперь стартует от $100/месяц (раньше было от $250), а тариф за $250 подешевел до $200 без урезания возможностей и лимитов;
– анонсировали умные очки и новые ноутбуки Googlebooks.

Please open Telegram to view this post

VIEW IN TELEGRAM

7 views20:14

Claude Computer Use: Anthropic наконец объяснила, почему агенты промахиваются по кнопкам

Anthropic выложила практический гайд по computer/browser use для Claude. И там не про «магических агентов будущего», а про скучную инженерию, из-за которой агент либо работает, либо кликает мимо кнопки.

Главный инсайт: точность кликов часто ломается не из-за модели, а из-за скриншотов.

Если отправлять в API нативный 4K-скрин, Claude всё равно может увидеть его в уменьшенном виде. Модель возвращает координаты по одной картинке, а ваш harness кликает по другой системе координат. Итог - стабильные промахи.

Что рекомендует Anthropic:

- заранее downscale скриншотов
- для Claude 4.6 держаться около 1280×720
- для Opus 4.7 можно начинать с 1080p
- не отправлять native 4K без подготовки
- всегда масштабировать координаты обратно в реальный экран
- сначала давать текстовую инструкцию, потом изображение
- для мелких UI-элементов включать zoom или использовать клавиатуру
- логировать transcript и накладывать predicted clicks поверх скриншота

Отдельно интересно про модели. Sonnet 4.6 у них точнее для механических кликов, Opus 4.7 уже почти догнал по click accuracy, но даёт больше reasoning и больший pixel budget.

Самый полезный вывод: browser agent - это не «дал промпт и забыл».

Это система из модели, скриншотов, координат, DPI, zoom, DOM, клавиатуры, логов и fallback-методов. Если хотя бы один слой настроен криво, агент будет выглядеть глупым, хотя проблема вообще не в интеллекте модели.

Агенты становятся реальными не тогда, когда модель «умнее».

А тогда, когда вокруг неё собран нормальный runtime.

https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude

11 views20:59

Это буквально сюжет из комедии: агентство по кибербезопасности США выложило на GitHub… свои ключи и пароли. 😳

Исследователи нашли публичный репозиторий «Private-CISA», внутри которого хранились учетные данные серверов Amazon AWS GovCloud. А в файле AWS-Workspace-Firefox-Passwords.csv были имена пользователей и пароли в открытом виде для десятков внутренних систем CISA и Министерства внутренней безопасности. Более того, кто-то ещё и додумался вручную отключить GitHub Secret Scanning, который обычно предупреждает о публикации таких вещей.

Исследователи уже назвали это худшей утечкой, которую видели за жизнь, а в Сенате требуют срочный закрытый брифинг от CISA. Что неудивительно: агентство занимается кибербезопасностью федеральных сетей США и так-то дает рекомендации другим организациям по безопасному хранению паролей.

И никаких Mythos не надо, чтобы взломать правительство США 🤭

@xor_journal

Please open Telegram to view this post

VIEW IN TELEGRAM

12 views21:34

GitHub взломали через расширение для VS Code. Утекли тысячи внутренних репозиториев

GitHub сообщил о компрометации одного из сотрудников компании. По предварительным данным, атака прошла через заражённое расширение для VS Code.

В результате злоумышленники получили доступ примерно к 4 000 внутренних репозиториев.

И, конечно, история уже вышла за рамки «внутреннего инцидента»: хакеры выставили похищенные данные на продажу за $50 000.

GitHub обещает позже опубликовать подробный отчёт и итоги расследования.

По текущей оценке, активность злоумышленника свелась к эксфильтрации только внутренних репозиториев GitHub. Заявления атакующего о ~3 800 репозиториях, по словам компании, в целом соответствуют результатам их расследования.

Чтобы снизить риски, GitHub оперативно провёл ротацию критических секретов — вчера и в течение ночи, начав с учётных данных с наибольшим потенциальным влиянием. Команда продолжает анализировать логи, проверять ротацию секретов и отслеживать возможную последующую активность; при необходимости будут предприняты дополнительные меры.

https://x.com/github/status/2056949168208552080

@data_analysis_ml

12 views08:23

0:30

0:36

⚡️

Туры в Турцию и Таиланд обвалились до цен 2020 года из-за падения доллара.

Сейчас пятидневный отдых в Турции с перелётом и завтраками можно взять примерно за 40 тысяч рублей. Путёвки в Таиланд стартуют от 90 тысяч.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

15 views09:50

Квантовые компьютеры могут сломать привычное шифрование быстрее, чем кажется

Почти всё, что мы делаем в интернете, держится на шифровании: банковские переводы, пароли, почта, медицинские данные, HTTPS-соединения в браузере. Сегодня это работает потому, что обычному компьютеру понадобились бы миллионы лет, чтобы взломать такую математику.

Но квантовые компьютеры играют по другим правилам.

В Google уже называют 2029 год дедлайном для перехода на post-quantum cryptography - криптографию, устойчивую к квантовым атакам. По сути, у мира осталось около трёх лет, чтобы перестроить огромную часть цифровой инфраструктуры. Для крупных компаний это не «обновить библиотеку», а многолетняя миграция ключей, протоколов, сертификатов, устройств и legacy-систем.

Повод для паники - не только теория. Google показала квантовый чип Willow, который выполнил стандартную вычислительную задачу менее чем за 5 минут. Для одного из самых быстрых суперкомпьютеров это заняло бы 10 септиллионов лет. Да, это не означает, что RSA и ECC уже можно взломать завтра. Willow использует 105 кубитов, а для серьёзной атаки на криптографию нужны миллионы стабильных кубитов.

Есть стратегия harvest now, decrypt later: злоумышленники крадут зашифрованные данные сегодня, сохраняют их и ждут момента, когда квантовые машины смогут их раскрыть. Если данные должны оставаться секретными через 5-10 лет, они уже находятся в зоне риска.

NIST ещё в 2024 году утвердил стандарты постквантовой криптографии, а Google уже внедряет квантово-устойчивые алгоритмы в Android. Инструменты защиты существуют.

14 views10:53

⚡️ Machine Learning Roadmap 2025: большая карта входа в ML без сказок про “нейросети за месяц

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: Python, математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap

Please open Telegram to view this post

VIEW IN TELEGRAM

17 views13:48

0:59

Media is too big

Авианосная ударная группа ВМС США направилась в Карибское море и движется к Кубе. Ранее в NYT сообщали, что Вашингтон собирается реализовать «венесуэльский сценарий». Он предполагает предъявление обвинений 94-летнему Раулю Кастро и его похищение.

16 views20:57

Стать ИИ-инженером просто: нашли топовый курс, который обучит вас всем необходимым знаниям с нуля

😮

Внутри ждут 412 уроков, разбитые на 20 этапов: с ними вы освоите математику, принципы создания ИИ-агентов, промт-инжиниринг и другие важные отрасли.

Это бесплатно — забираем.

Please open Telegram to view this post

VIEW IN TELEGRAM

16 views07:36