very vibe coding

Вышла любопытная модель LFM2.5-8B-A1B для запуска на локальном компе. Претендует на SOTA. От таких моделей не надо ждать, что они будут такими же умными как Клод. Но вот если рутинные типовые задачки удастся переложить на них, экономия токенов для того же Клода будет колоссальна.

www.liquid.ai

LFM2.5-8B-A1B: An Even Better On-Device Mixture of Experts | Liquid AI

Today, we’re releasing LFM2.5-8B-A1B, a high-throughput edge model optimized for fast, reliable tool calling and complex instruction following on consumer hardware, delivering compressed performance competitive with much larger models and day-one support…

41 views06:01

very vibe coding

Смешно. В Х пишут, что у нового Клода лезут следы дистилляции Qwen. Со своей стороны скажу - да иероглифы местами лезут, раньше такого не видел ))

40 views06:04

very vibe coding

Forwarded from Анализ данных (Data analysis)

✔️

Step 3.7 Flash: новая ставка на агентную эффективность

StepFun выпустили Step 3.7 Flash - открытую MoE-модель под Apache 2.0, заточенную не просто под чат, а под агентные сценарии: кодинг, поиск, работу с инструментами, документами, интерфейсами и изображениями.

По заявленным бенчмаркам модель выглядит серьёзно:

- #1 на ClawEval-1.1 - 67.1
- #1 на SimpleVQA Search - 79.2
- #2 на SWE-PRO - 56.3
- 95.3 на V* Python

Что внутри:

- 198B параметров всего
- около 11B активных параметров
- до 400 токенов в секунду
- контекст 256K
- 3 уровня reasoning
- открытые веса под Apache 2.0

Главный акцент - не «самая большая модель», а модель, которая быстро и стабильно работает внутри агента.

Она должна понимать UI, графики, документы и изображения, после чего писать код, вызывать инструменты и продолжать задачу без постоянного развала tool calls.

Отдельно заявлена совместимость с Claude Code, KiloCode, Hermes Agent, OpenClaw и протоколами вроде MCP. Локальный запуск тоже в фокусе: Mac Studio M4 Max, DGX Spark, AMD AI Max+ 395.

GitHub: http://github.com/stepfun-ai/Step-3.7-Flash
HuggingFace: http://huggingface.co/stepfun-ai/Step-3.7-Flash
GGUF: http://huggingface.co/stepfun-ai/Step-3.7-Flash-GGUF
ModelScope: http://modelscope.cn/models/stepfun-ai/Step-3.7-Flash
API: http://platform.stepfun.ai
Blog: http://static.stepfun.com/blog/step-3.7-flash/

Please open Telegram to view this post

VIEW IN TELEGRAM

40 views06:52

very vibe coding

Forwarded from Tips AI | IT & AI

0:23

This media is not supported in your browser

This media is not supported in your browser

VIEW IN TELEGRAM

Сегодня у Codex парочка интересных обновлений:

Computer Use заработал теперь и на Windows: агент видит экран, управляет мышью, печатает текст и тд.

Запускать и управлять им можно через мобильное приложение, в которое под это тоже добавили функции из десктопа по типу команды /side.

А еще Codex теперь может сам управлять историей чатов:
- искать, переименовывать, закреплять
- создавать новые и читать старые
- работать параллельно сразу в нескольких

Правда есть минус в том, что на винде ты не можешь пользоваться компом пока работает Computer Use.

Потому что он полностью забирает управление, а не работает в фоне как на macOS.

@tips_ai #news

38 views05:56

very vibe coding

Forwarded from Вайб-кодинг

This media is not supported in your browser

VIEW IN TELEGRAM

Dynamic Workflows теперь и в Codex: чувак запилил для этого скилл. 😂

1. Скопируйте инструкцию по установке:

 
Install the AI agent skill at https://github.com/DannyMac180/skills/tree/main/codex-dynamic-workflows

2. Выполните команду /dynamic, чтобы запустить этот навык.

Он воспроизводит ту же логику оркестрации, что и Claude Dynamic Workflows:

- Генерирует сценарий оркестрации.
- Запускает рой подагентов.
- Переходит в режим /goal для выполнения поставленной задачи.

Бесплатно и с открытым исходным кодом.

Please open Telegram to view this post

VIEW IN TELEGRAM

37 views05:14

very vibe coding

Minimax 3 вышел. Декларируют высокие бенчмарки, но посмотрим как оно будет в реальности. По цене - в 3 раза дороже DeepSeek.

37 views04:09

very vibe coding

Плюс Codex - большие лимиты. Плюс Claude code - общение более легкое, меньше недопонимания, плюс лучшая работа с дизайнами. Мне нравится использовать и то, и другое - обычно оркестрирует Клод, а работает - Кодекс.

https://xn--r1a.website/seeallochnaya/3667

Сиолошная

Ребята из Nebius обновили SWE-rebench после двухмесячного перерыва, добавив 110 новых задач. В отличии от многих других бенчей, наконец-то добавляют запуски в Codex и Claude Code. Просто писать «GPT-5.5 в очередной раз статистически значимо лучше моделей…

39 views04:55

very vibe coding

Антропик обнулил лимиты, что приятно, так как за два дня я выбрал недельные лимиты на 2 дня вперед. Легко и непринужденно, даже не запуская в параллели множество сессий.

Зато когда Антропик обнуляет лимит, полные лимиты действуют на оставшееся до конца периода время. А вот OpenAI вместе с обнулением лимитов обнуляет и всю неделю - она начинает течь сначала - и если вы оставляли себе побольше лимитов, скажем, на выходные, они просто сгорят.

Поэтому не стоит оставлять лимиты на потом - тратьте сейчас, и если повезет, они обнулятся, в последнее время обе конторы нас этими обнулениями балуют.

36 views18:26

very vibe coding

Очередной вариант памяти…

https://xn--r1a.website/ai_machinelearning_big_data/10253

Machinelearning

Tencent выпустил Hy-Memory — плагин памяти для долгосрочных агентов вроде OpenClaw.

Под капотом: 6-уровневый фреймворк памяти, дуальная система System1/System2 и трёхуровневая цепочка эволюции воспоминаний.

Агент накапливает контекст и уточняет понимание…

28 views21:04

very vibe coding

Новая SOTA по распознаванию документов

https://github.com/PaddlePaddle/PaddleOCR

GitHub

GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit…

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages. - PaddlePaddle/Paddl...

40 views04:07

very vibe coding

Говорят, что на днях будет большой релиз от OpenAI. Выжигаю токены, скоро будут новые )) - gpt-шка проработала всю ночь, и результат очень радует

39 viewsedited 04:11

very vibe coding

Чем больше я программирую с Клодом, тем больше мне нравится программировать с Кодексом. Все познается в сравнении

34 views17:14

very vibe coding

Forwarded from Все о блокчейн/мозге/space/WEB 3.0 в России и мире

Секрет Google о квантовой уязвимости биткоина раскрыт

Напомним, что 2 месяца назад Google опубликовали работу о взломе криптографии биткоина через алгоритм Шора.

Сегодня в Х написал большой пост Джастин Дрейк, сотрудник и соавтор статьи Google, где он делится закулисьем этой большой истории, которая многих взволновала.

Джастин говорит, что в своей статье они скрыли ключевую оптимизацию за ZK-пруфом, а это первый случай академической цензуры с помощью ZK-пруфа в истории, что привело к эффекту Барбары Стрейзанд:

1. Вчера, французский исследователь André Schrottenloher независимо переоткрыл главное улучшение и выложил открытую статью на arXiv.

2. А Craig Gidney, ведущий эксперт Google по оптимизациям Шора, признался, что знал об этой оптимизации уже год, но держал в секрете из-за давления цензуры.

3. Запущен открытый челлендж ecdsa.fail, любой может присылать свои улучшения квантовой схемы.
Верификация от Google автоматически проверяет результаты. За первые часы уже выбили +8–11 % лучше оригинала Google.

4. Параллельно вышла статья от стартапа Oratomic. Они взяли оптимизации Google и добавили свои, специфичные для нейтральных атомов и после заявили, что для взлома secp256k1 достаточно всего 10 000 физических кубитов — это крайне мало по нынешним меркам.

Кстати, Google открыл лабораторию нейтральных атомов.

По итогу соавтор Google Джастин Дрейк оценивает в 50% вероятность первого реального взлома криптографии до 2032 года, а 10% до 2030-го.

Паниковать рано, но действовать нужно сейчас. Лучшая дата для миграции на постквантовую криптографию - 2029 год, к такому сроку двигаются Google, Cloudflare и Ethereum Foundation. Ethereum активно работает над этим: переход на hash-based криптографию, leanVM и т.д.

Тут кстати речь Джастина по поводу нейтральных атомов.

X (formerly Twitter)

Justin Drake (@drakefjustin) on X

Today a crazy quantum story just got wilder.

On March 31, the Google Quantum AI team published a landmark result on Shor's algorithm for elliptic curve cryptography. Technically, the paper was a bombshell: a dramatic 10x improvement over the state-of-the…

37 views17:21

very vibe coding

100% Mythos больше пиар, чем реальный геймченджер. Если доступным моделям дать хорошую обвязку и снять стопперы, они кучу такого найдут…

https://xn--r1a.website/anti_agi/1822

Неискусственный интеллект

Как наплодить Мифо(со)в

Anthropic продолжает раздувать хайп вокруг своей топ-сикрет LLM Mythos через проект Glasswing: в новой волне +150 организаций из 15+ стран, в орбиту втягивают инфраструктуру, медицину и связь, а после недель уговоров доступ пообещали…

35 views17:53

very vibe coding

Ну, кстати, я тоже стремлюсь экономить токены на ресерче - поиск документов делает дешевая модель, а исследование - дорогая. А а последнее время перешел на поиск через TinyFish. Работает!

https://xn--r1a.website/tips_ai/4714

Tips AI | IT & AI

Наткнулся на интересный подход для Deep Research — Dataroom

Где автор Dataroom не видит смысла давать эту работу дорогим моделям (в целях экономии токенов) и предлагает делить эту задачу на две фазы:

1/ Локальная модель ищет в вебе, переранжирует источники…

34 views18:29

very vibe coding

Майкрософт кучу всего навыпускал, но по мелочи. И OpenAI что-то еще к Кодексу прикрутил - завтра все об этом напишут, будем разбираться.

29 views21:28

very vibe coding

Forwarded from Вайб-кодинг

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

Создавать приложения теперь почти смешно просто.

Завезли Sites для Codex.

Берёшь рабочий документ, идею, план или набросок проекта, а Codex превращает это в интерактивный сайт или приложение, которым можно сразу пользоваться и делиться по URL.

Получаем рабочую штуку, которую команда может открыть и потыкать самостоятельно.

Пока выкатывают для тарифов Business и Enterprise. Позже обещают расширить доступ и на остальные планы. 🫡

Please open Telegram to view this post

VIEW IN TELEGRAM

26 views04:20

very vibe coding

Forwarded from Machinelearning

📌

Кейноут первого дня Microsoft Build 2026

2 июня в Сан‑Франциско открылась ежегодная конференция для разработчиков Microsoft Build 2026. Программный доклад провёл гендиректор компании Сатья Наделла, центральная тема - агентные системы.

На открытии выступили: глава Nvidia Дженсен Хуанг (по видеосвязи), гендиректор Qualcomm Кристиано Амон и создатель OpenClaw Питер Штайнбергер.

В первый день компания представила несколько групп продуктов и сервисов.

🟡

Новые модели

Гендиректор Microsoft AI Мустафа Сулейман анонсировал семейство из 7 новых моделей MAI для работы с изображениями, голосом, транскрипцией и кодом.

Среди названных - MAI‑Thinking‑1 (ризонинг-модель, обученная без дистилляции с 35 млрд активных параметров и окном контекста 128K), MAI‑Code‑1-Flash (заточена под GitHub и VS Code), а также MAI‑Image‑2.5 и MAI‑-Voice-2.

🟡

Агенты

Microsoft представила новую категорию Autopilots, всегда активных агентов с собственной идентичностью, работающих в фоне и действующих от имени пользователя.

Первым стал Scout - персональный ассистент в Windows, построенный на OpenClaw. Он работает с приложениями Microsoft 365 и предназначен для фоновых задач (ведение календаря, отчётности по расходам и подготовка писем).

Scout доступен в режиме превью для клиентов программы Frontier в США.

Также анонсирован Microsoft IQ, слой контекста для агентов (Work IQ, Fabric IQ, Web IQ), который станет общедоступным в GitHub Copilot, Foundry и Copilot Studio.

🟡

Инструменты для разработчиков

Сообщили о запуске десктопного приложения GitHub Copilot (в режиме предварительного доступа), функции Frontier Tuning для дообучения агентов в рамках корпоративных требований (закрытый превью), а также Project Rayfin - управляемого бэкенда на платформе Microsoft Fabric.

Windows получает функции для разработчиков: набор Coreutils (Linux-подобные утилиты командной строки, работающие в Windows 11 нативно), создание и запуск Linux-контейнеров через WSL и новый Intelligent Terminal, передающий контекст ИИ-агенту.

Отдельно показали платформу Project Solara для устройств, которые работают на ИИ‑агентах. Microsoft показала два референс‑дизайна (настольный хаб с распознаванием лица и носимый бейдж с камерой и расшифровкой разговоров).

🟡

Облако и инфраструктура

Анонсировали виртуальные машины Azure Cobalt 200 (сказали о приросте производительности на 50%), ускоритель второго поколения Maia 200, базу данных Azure HorizonDB на основе PostgreSQL, а также Foundry Local на Azure Local для развёртывания суверенного ИИ.

🟡

Квантовые вычисления и медицина

Спустя год после чипа Majorana 1 Наделла представил Majorana 2 - следующее поколение, компания заявляет о кубитах примерно в 1000 раз точнее за счёт нового материала на основе свинца и о цели создать квантовый компьютер к 2029 году.

На второй, заключительный день конференции, ожидаются технические сессии и демонстрации по агентам, Copilot, Azure Foundry и локальному ИИ в Windows.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

31 views04:28

About

Blog

Apps

Platform