Вышла любопытная модель LFM2.5-8B-A1B для запуска на локальном компе. Претендует на SOTA. От таких моделей не надо ждать, что они будут такими же умными как Клод. Но вот если рутинные типовые задачки удастся переложить на них, экономия токенов для того же Клода будет колоссальна.
www.liquid.ai
LFM2.5-8B-A1B: An Even Better On-Device Mixture of Experts | Liquid AI
Today, we’re releasing LFM2.5-8B-A1B, a high-throughput edge model optimized for fast, reliable tool calling and complex instruction following on consumer hardware, delivering compressed performance competitive with much larger models and day-one support…
Смешно. В Х пишут, что у нового Клода лезут следы дистилляции Qwen. Со своей стороны скажу - да иероглифы местами лезут, раньше такого не видел ))
Forwarded from Анализ данных (Data analysis)
StepFun выпустили Step 3.7 Flash - открытую MoE-модель под Apache 2.0, заточенную не просто под чат, а под агентные сценарии: кодинг, поиск, работу с инструментами, документами, интерфейсами и изображениями.
По заявленным бенчмаркам модель выглядит серьёзно:
- #1 на ClawEval-1.1 - 67.1
- #1 на SimpleVQA Search - 79.2
- #2 на SWE-PRO - 56.3
- 95.3 на V* Python
Что внутри:
- 198B параметров всего
- около 11B активных параметров
- до 400 токенов в секунду
- контекст 256K
- 3 уровня reasoning
- открытые веса под Apache 2.0
Главный акцент - не «самая большая модель», а модель, которая быстро и стабильно работает внутри агента.
Она должна понимать UI, графики, документы и изображения, после чего писать код, вызывать инструменты и продолжать задачу без постоянного развала tool calls.
Отдельно заявлена совместимость с Claude Code, KiloCode, Hermes Agent, OpenClaw и протоколами вроде MCP. Локальный запуск тоже в фокусе: Mac Studio M4 Max, DGX Spark, AMD AI Max+ 395.
GitHub: http://github.com/stepfun-ai/Step-3.7-Flash
HuggingFace: http://huggingface.co/stepfun-ai/Step-3.7-Flash
GGUF: http://huggingface.co/stepfun-ai/Step-3.7-Flash-GGUF
ModelScope: http://modelscope.cn/models/stepfun-ai/Step-3.7-Flash
API: http://platform.stepfun.ai
Blog: http://static.stepfun.com/blog/step-3.7-flash/
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Tips AI | IT & AI
Сегодня у Codex парочка интересных обновлений:
Computer Use заработал теперь и на Windows: агент видит экран, управляет мышью, печатает текст и тд.
Запускать и управлять им можно через мобильное приложение, в которое под это тоже добавили функции из десктопа по типу команды /side.
А еще Codex теперь может сам управлять историей чатов:
- искать, переименовывать, закреплять
- создавать новые и читать старые
- работать параллельно сразу в нескольких
Правда есть минус в том, что на винде ты не можешь пользоваться компом пока работает Computer Use.
Потому что он полностью забирает управление, а не работает в фоне как на macOS.
@tips_ai #news
Computer Use заработал теперь и на Windows: агент видит экран, управляет мышью, печатает текст и тд.
Запускать и управлять им можно через мобильное приложение, в которое под это тоже добавили функции из десктопа по типу команды /side.
А еще Codex теперь может сам управлять историей чатов:
- искать, переименовывать, закреплять
- создавать новые и читать старые
- работать параллельно сразу в нескольких
Правда есть минус в том, что на винде ты не можешь пользоваться компом пока работает Computer Use.
Потому что он полностью забирает управление, а не работает в фоне как на macOS.
@tips_ai #news
Forwarded from Вайб-кодинг
This media is not supported in your browser
VIEW IN TELEGRAM
Dynamic Workflows теперь и в Codex: чувак запилил для этого скилл. 😂
1. Скопируйте инструкцию по установке:
2. Выполните команду
Он воспроизводит ту же логику оркестрации, что и Claude Dynamic Workflows:
- Генерирует сценарий оркестрации.
- Запускает рой подагентов.
- Переходит в режим
Бесплатно и с открытым исходным кодом.
1. Скопируйте инструкцию по установке:
Install the AI agent skill at https://github.com/DannyMac180/skills/tree/main/codex-dynamic-workflows2. Выполните команду
/dynamic, чтобы запустить этот навык.Он воспроизводит ту же логику оркестрации, что и Claude Dynamic Workflows:
- Генерирует сценарий оркестрации.
- Запускает рой подагентов.
- Переходит в режим
/goal для выполнения поставленной задачи.Бесплатно и с открытым исходным кодом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Плюс Codex - большие лимиты. Плюс Claude code - общение более легкое, меньше недопонимания, плюс лучшая работа с дизайнами. Мне нравится использовать и то, и другое - обычно оркестрирует Клод, а работает - Кодекс.
https://xn--r1a.website/seeallochnaya/3667
https://xn--r1a.website/seeallochnaya/3667
Telegram
Сиолошная
Ребята из Nebius обновили SWE-rebench после двухмесячного перерыва, добавив 110 новых задач. В отличии от многих других бенчей, наконец-то добавляют запуски в Codex и Claude Code. Просто писать «GPT-5.5 в очередной раз статистически значимо лучше моделей…
Антропик обнулил лимиты, что приятно, так как за два дня я выбрал недельные лимиты на 2 дня вперед. Легко и непринужденно, даже не запуская в параллели множество сессий.
Зато когда Антропик обнуляет лимит, полные лимиты действуют на оставшееся до конца периода время. А вот OpenAI вместе с обнулением лимитов обнуляет и всю неделю - она начинает течь сначала - и если вы оставляли себе побольше лимитов, скажем, на выходные, они просто сгорят.
Поэтому не стоит оставлять лимиты на потом - тратьте сейчас, и если повезет, они обнулятся, в последнее время обе конторы нас этими обнулениями балуют.
Зато когда Антропик обнуляет лимит, полные лимиты действуют на оставшееся до конца периода время. А вот OpenAI вместе с обнулением лимитов обнуляет и всю неделю - она начинает течь сначала - и если вы оставляли себе побольше лимитов, скажем, на выходные, они просто сгорят.
Поэтому не стоит оставлять лимиты на потом - тратьте сейчас, и если повезет, они обнулятся, в последнее время обе конторы нас этими обнулениями балуют.
Говорят, что на днях будет большой релиз от OpenAI. Выжигаю токены, скоро будут новые )) - gpt-шка проработала всю ночь, и результат очень радует
Чем больше я программирую с Клодом, тем больше мне нравится программировать с Кодексом. Все познается в сравнении
Forwarded from Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Секрет Google о квантовой уязвимости биткоина раскрыт
Напомним, что 2 месяца назад Google опубликовали работу о взломе криптографии биткоина через алгоритм Шора.
Сегодня в Х написал большой пост Джастин Дрейк, сотрудник и соавтор статьи Google, где он делится закулисьем этой большой истории, которая многих взволновала.
Джастин говорит, что в своей статье они скрыли ключевую оптимизацию за ZK-пруфом, а это первый случай академической цензуры с помощью ZK-пруфа в истории, что привело к эффекту Барбары Стрейзанд:
1. Вчера, французский исследователь André Schrottenloher независимо переоткрыл главное улучшение и выложил открытую статью на arXiv.
2. А Craig Gidney, ведущий эксперт Google по оптимизациям Шора, признался, что знал об этой оптимизации уже год, но держал в секрете из-за давления цензуры.
3. Запущен открытый челлендж ecdsa.fail, любой может присылать свои улучшения квантовой схемы.
Верификация от Google автоматически проверяет результаты. За первые часы уже выбили +8–11 % лучше оригинала Google.
4. Параллельно вышла статья от стартапа Oratomic. Они взяли оптимизации Google и добавили свои, специфичные для нейтральных атомов и после заявили, что для взлома secp256k1 достаточно всего 10 000 физических кубитов — это крайне мало по нынешним меркам.
Кстати, Google открыл лабораторию нейтральных атомов.
По итогу соавтор Google Джастин Дрейк оценивает в 50% вероятность первого реального взлома криптографии до 2032 года, а 10% до 2030-го.
Паниковать рано, но действовать нужно сейчас. Лучшая дата для миграции на постквантовую криптографию - 2029 год, к такому сроку двигаются Google, Cloudflare и Ethereum Foundation. Ethereum активно работает над этим: переход на hash-based криптографию, leanVM и т.д.
Тут кстати речь Джастина по поводу нейтральных атомов.
Напомним, что 2 месяца назад Google опубликовали работу о взломе криптографии биткоина через алгоритм Шора.
Сегодня в Х написал большой пост Джастин Дрейк, сотрудник и соавтор статьи Google, где он делится закулисьем этой большой истории, которая многих взволновала.
Джастин говорит, что в своей статье они скрыли ключевую оптимизацию за ZK-пруфом, а это первый случай академической цензуры с помощью ZK-пруфа в истории, что привело к эффекту Барбары Стрейзанд:
1. Вчера, французский исследователь André Schrottenloher независимо переоткрыл главное улучшение и выложил открытую статью на arXiv.
2. А Craig Gidney, ведущий эксперт Google по оптимизациям Шора, признался, что знал об этой оптимизации уже год, но держал в секрете из-за давления цензуры.
3. Запущен открытый челлендж ecdsa.fail, любой может присылать свои улучшения квантовой схемы.
Верификация от Google автоматически проверяет результаты. За первые часы уже выбили +8–11 % лучше оригинала Google.
4. Параллельно вышла статья от стартапа Oratomic. Они взяли оптимизации Google и добавили свои, специфичные для нейтральных атомов и после заявили, что для взлома secp256k1 достаточно всего 10 000 физических кубитов — это крайне мало по нынешним меркам.
Кстати, Google открыл лабораторию нейтральных атомов.
По итогу соавтор Google Джастин Дрейк оценивает в 50% вероятность первого реального взлома криптографии до 2032 года, а 10% до 2030-го.
Паниковать рано, но действовать нужно сейчас. Лучшая дата для миграции на постквантовую криптографию - 2029 год, к такому сроку двигаются Google, Cloudflare и Ethereum Foundation. Ethereum активно работает над этим: переход на hash-based криптографию, leanVM и т.д.
Тут кстати речь Джастина по поводу нейтральных атомов.
X (formerly Twitter)
Justin Drake (@drakefjustin) on X
Today a crazy quantum story just got wilder.
On March 31, the Google Quantum AI team published a landmark result on Shor's algorithm for elliptic curve cryptography. Technically, the paper was a bombshell: a dramatic 10x improvement over the state-of-the…
On March 31, the Google Quantum AI team published a landmark result on Shor's algorithm for elliptic curve cryptography. Technically, the paper was a bombshell: a dramatic 10x improvement over the state-of-the…
100% Mythos больше пиар, чем реальный геймченджер. Если доступным моделям дать хорошую обвязку и снять стопперы, они кучу такого найдут…
https://xn--r1a.website/anti_agi/1822
https://xn--r1a.website/anti_agi/1822
Telegram
Неискусственный интеллект
Как наплодить Мифо(со)в
Anthropic продолжает раздувать хайп вокруг своей топ-сикрет LLM Mythos через проект Glasswing: в новой волне +150 организаций из 15+ стран, в орбиту втягивают инфраструктуру, медицину и связь, а после недель уговоров доступ пообещали…
Anthropic продолжает раздувать хайп вокруг своей топ-сикрет LLM Mythos через проект Glasswing: в новой волне +150 организаций из 15+ стран, в орбиту втягивают инфраструктуру, медицину и связь, а после недель уговоров доступ пообещали…
Ну, кстати, я тоже стремлюсь экономить токены на ресерче - поиск документов делает дешевая модель, а исследование - дорогая. А а последнее время перешел на поиск через TinyFish. Работает!
https://xn--r1a.website/tips_ai/4714
https://xn--r1a.website/tips_ai/4714
Telegram
Tips AI | IT & AI
Наткнулся на интересный подход для Deep Research — Dataroom
Где автор Dataroom не видит смысла давать эту работу дорогим моделям (в целях экономии токенов) и предлагает делить эту задачу на две фазы:
1/ Локальная модель ищет в вебе, переранжирует источники…
Где автор Dataroom не видит смысла давать эту работу дорогим моделям (в целях экономии токенов) и предлагает делить эту задачу на две фазы:
1/ Локальная модель ищет в вебе, переранжирует источники…
Майкрософт кучу всего навыпускал, но по мелочи. И OpenAI что-то еще к Кодексу прикрутил - завтра все об этом напишут, будем разбираться.
Forwarded from Вайб-кодинг
This media is not supported in your browser
VIEW IN TELEGRAM
Создавать приложения теперь почти смешно просто.
Завезли Sites для Codex.
Берёшь рабочий документ, идею, план или набросок проекта, а Codex превращает это в интерактивный сайт или приложение, которым можно сразу пользоваться и делиться по URL.
Получаем рабочую штуку, которую команда может открыть и потыкать самостоятельно.
Пока выкатывают для тарифов Business и Enterprise. Позже обещают расширить доступ и на остальные планы.🫡
Завезли Sites для Codex.
Берёшь рабочий документ, идею, план или набросок проекта, а Codex превращает это в интерактивный сайт или приложение, которым можно сразу пользоваться и делиться по URL.
Получаем рабочую штуку, которую команда может открыть и потыкать самостоятельно.
Пока выкатывают для тарифов Business и Enterprise. Позже обещают расширить доступ и на остальные планы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
2 июня в Сан‑Франциско открылась ежегодная конференция для разработчиков Microsoft Build 2026. Программный доклад провёл гендиректор компании Сатья Наделла, центральная тема - агентные системы.
На открытии выступили: глава Nvidia Дженсен Хуанг (по видеосвязи), гендиректор Qualcomm Кристиано Амон и создатель OpenClaw Питер Штайнбергер.
В первый день компания представила несколько групп продуктов и сервисов.
Гендиректор Microsoft AI Мустафа Сулейман анонсировал семейство из 7 новых моделей MAI для работы с изображениями, голосом, транскрипцией и кодом.
Среди названных - MAI‑Thinking‑1 (ризонинг-модель, обученная без дистилляции с 35 млрд активных параметров и окном контекста 128K), MAI‑Code‑1-Flash (заточена под GitHub и VS Code), а также MAI‑Image‑2.5 и MAI‑-Voice-2.
Microsoft представила новую категорию Autopilots, всегда активных агентов с собственной идентичностью, работающих в фоне и действующих от имени пользователя.
Первым стал Scout - персональный ассистент в Windows, построенный на OpenClaw. Он работает с приложениями Microsoft 365 и предназначен для фоновых задач (ведение календаря, отчётности по расходам и подготовка писем).
Scout доступен в режиме превью для клиентов программы Frontier в США.
Также анонсирован Microsoft IQ, слой контекста для агентов (Work IQ, Fabric IQ, Web IQ), который станет общедоступным в GitHub Copilot, Foundry и Copilot Studio.
Сообщили о запуске десктопного приложения GitHub Copilot (в режиме предварительного доступа), функции Frontier Tuning для дообучения агентов в рамках корпоративных требований (закрытый превью), а также Project Rayfin - управляемого бэкенда на платформе Microsoft Fabric.
Windows получает функции для разработчиков: набор Coreutils (Linux-подобные утилиты командной строки, работающие в Windows 11 нативно), создание и запуск Linux-контейнеров через WSL и новый Intelligent Terminal, передающий контекст ИИ-агенту.
Отдельно показали платформу Project Solara для устройств, которые работают на ИИ‑агентах. Microsoft показала два референс‑дизайна (настольный хаб с распознаванием лица и носимый бейдж с камерой и расшифровкой разговоров).
Анонсировали виртуальные машины Azure Cobalt 200 (сказали о приросте производительности на 50%), ускоритель второго поколения Maia 200, базу данных Azure HorizonDB на основе PostgreSQL, а также Foundry Local на Azure Local для развёртывания суверенного ИИ.
Спустя год после чипа Majorana 1 Наделла представил Majorana 2 - следующее поколение, компания заявляет о кубитах примерно в 1000 раз точнее за счёт нового материала на основе свинца и о цели создать квантовый компьютер к 2029 году.
На второй, заключительный день конференции, ожидаются технические сессии и демонстрации по агентам, Copilot, Azure Foundry и локальному ИИ в Windows.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM