very vibe coding
99 subscribers
402 photos
110 videos
11 files
814 links
Канал Алексея Макрушина об экспериментах в области vibe coding и всего интересного, что есть в области AI, ML и тому подобного
Download Telegram
Forwarded from Machinelearning
📌 Кейноут первого дня Microsoft Build 2026

2 июня в Сан‑Франциско открылась ежегодная конференция для разработчиков Microsoft Build 2026. Программный доклад провёл гендиректор компании Сатья Наделла, центральная тема - агентные системы.

На открытии выступили: глава Nvidia Дженсен Хуанг (по видеосвязи), гендиректор Qualcomm Кристиано Амон и создатель OpenClaw Питер Штайнбергер.


В первый день компания представила несколько групп продуктов и сервисов.

🟡Новые модели

Гендиректор Microsoft AI Мустафа Сулейман анонсировал семейство из 7 новых моделей MAI для работы с изображениями, голосом, транскрипцией и кодом.

Среди названных - MAI‑Thinking‑1 (ризонинг-модель, обученная без дистилляции с 35 млрд активных параметров и окном контекста 128K), MAI‑Code‑1-Flash (заточена под GitHub и VS Code), а также MAI‑Image‑2.5 и MAI‑-Voice-2.

🟡Агенты

Microsoft представила новую категорию Autopilots, всегда активных агентов с собственной идентичностью, работающих в фоне и действующих от имени пользователя.

Первым стал Scout - персональный ассистент в Windows, построенный на OpenClaw. Он работает с приложениями Microsoft 365 и предназначен для фоновых задач (ведение календаря, отчётности по расходам и подготовка писем).

Scout доступен в режиме превью для клиентов программы Frontier в США.

Также анонсирован Microsoft IQ, слой контекста для агентов (Work IQ, Fabric IQ, Web IQ), который станет общедоступным в GitHub Copilot, Foundry и Copilot Studio.

🟡Инструменты для разработчиков

Сообщили о запуске десктопного приложения GitHub Copilot (в режиме предварительного доступа), функции Frontier Tuning для дообучения агентов в рамках корпоративных требований (закрытый превью), а также Project Rayfin - управляемого бэкенда на платформе Microsoft Fabric.

Windows получает функции для разработчиков: набор Coreutils (Linux-подобные утилиты командной строки, работающие в Windows 11 нативно), создание и запуск Linux-контейнеров через WSL и новый Intelligent Terminal, передающий контекст ИИ-агенту.

Отдельно показали платформу Project Solara для устройств, которые работают на ИИ‑агентах. Microsoft показала два референс‑дизайна (настольный хаб с распознаванием лица и носимый бейдж с камерой и расшифровкой разговоров).

🟡Облако и инфраструктура

Анонсировали виртуальные машины Azure Cobalt 200 (сказали о приросте производительности на 50%), ускоритель второго поколения Maia 200, базу данных Azure HorizonDB на основе PostgreSQL, а также Foundry Local на Azure Local для развёртывания суверенного ИИ.

🟡Квантовые вычисления и медицина

Спустя год после чипа Majorana 1 Наделла представил Majorana 2 - следующее поколение, компания заявляет о кубитах примерно в 1000 раз точнее за счёт нового материала на основе свинца и о цели создать квантовый компьютер к 2029 году.


На второй, заключительный день конференции, ожидаются технические сессии и демонстрации по агентам, Copilot, Azure Foundry и локальному ИИ в Windows.



@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Вайб-кодинг
This media is not supported in your browser
VIEW IN TELEGRAM
Google выпустила новую Gemma 4 12B с заявкой на производительность уровня моделей класса 26B.

Ребята протестировали обе локально.

Обе модели запускались на одной RTX 4090 и получили одинаковое задание: написать самодостаточную HTML5 Canvas-анимацию с реальной физикой в одном файле, без сторонних библиотек. Сцены:

• доска Гальтона
• столкновение двух блоков с отскоком от стены
• хаотический тройной маятник

Результаты:

Gemma 4 26B-A4B
• 15 ГБ VRAM
• 6.9 тыс. токенов
• 138 токенов/с

Gemma 4 12B
• 9 ГБ VRAM
• 8.9 тыс. токенов
• 80 токенов/с

Несмотря на принадлежность к одному семейству Gemma 4, модель 26B-A4B выиграла во всех трёх сценах и работала примерно в 1.7 раза быстрее, используя всего 4 млрд активных параметров.
При этом 12B отстала совсем ненамного, потребляя почти вдвое меньше видеопамяти. Для ноутбуков с 16 ГБ VRAM это делает её одним из самых интересных вариантов для локального запуска.

GGUF: здесь
Guide: здесь
1
⚡️ MOSS-TTS-v1.5 вышла на первое место в Hugging Face Trending среди Text-to-Speech моделей и уже набрала 20,6K загрузок.

Это мультиязычная управляемая TTS-модель, которая умеет:

- стабильно клонировать голос
- генерировать длинные аудио
- точно управлять паузами
- работать с несколькими языками

Теперь MOSS-TTS-v1.5 официально поддерживается в vLLM-Omni и SGLang-Omni, что делает её интересной не только для экспериментов, но и для более серьёзной инфраструктуры голосовых приложений.

Модель разработала команда OpenMOSS-Team.

GitHub: https://github.com/OpenMOSS/MOSS-TTS

Hugging Face: https://huggingface.co/OpenMOSS-Team/MOSS-TTS-v1.5

ModelScope: https://modelscope.ai/organization/openmoss
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from КПД
Неожиданный опенсорс от Ideogram - Ideogram-4.

Чекпоинты прилагаются в fp8 и nf4 форматах.

Утверждается, что оно state-of-the-art среди open-source моделей и не сильно уступает ведущим closed-source. При этом размер модели вообще не огромный - всего 9.3B параметров (то есть превосходит куда более увесистые модели типа Flux-2-dev, Hunyuan-Image-3 и Qwen-Image).

Архитектурно - single-stream DiT с Qwen-3-VL-Instruct энкодером.

Еще из примечательного - учатся и инферятся на структурированных JSON кэпшенах.

Лицензия, правда, некоммерческая.

[Блогпост]
Не исключено, что на этой неделе выйдет GPT-5.6. Это не проходной релиз, скорее - модель на уровне Mythos от Антропика. Да и ее уже пора бы выпускать.

Ну и ждем сегодня новостей от Apple. Начнут ли продавать Mac Studio M5 Ultra? Я бы взял штучку..

Ах, да, еще Gemini 3.5 Pro на подходе
Сегодня ждут Claude Mythos…

Еще Apple, наконец, анонсировал ИИ в айфонах - но здесь на многое уже не рассчитываю, поправили бы Т9, и на том спасибо..
Forwarded from Сиолошная
Модель уже доступна на claude.ai, системная карточка тут, а метрики вот. Нравится, что на графиках скейлинга по оси OX — доллары, и видно, что на низком ризонинге модель всё равно лучше Opus.
Apple сильно подкачал - на WWDC26 никакого Mac Studio M5 не анонсировал - думаю, что сейчас работают над созданием запасов, чтобы не сесть на мель, когда объявят новые модели - спрос должен быть большим...
С 15 июня Антропик начнет списывать расходы на Claude code, подключенный через claude -p, по тарифам API. То есть, если у вас есть агенты, которые обращаются к Клоду по acpx или подобным протоколам, например OpenClaw или Codex - придется платить дорого. Очень дорого.

Типа, если пользуется человек, в таком режиме можно работать по подписке, а если другой агент - то нет.

Я, конечно, все понимаю, надо как-то выходить на прибыльность, особенно когда ты понимаешь, что имеешь лучшую модель. Но настроение так себе - надеюсь, что компаний, которые будут составлять конкренцию Антропику, будет больше.
Ну, кстати, сегодня погонял Fable - неплохо, мне нравится. Поставил уровень прожарки медиум, чтобы не спалить все токены, и скажу что расход был нормальный - можно работать. Лучше ожиданий. Впрочем, может это на первое время так настроили.

Если не переведут модель на апи без подписки, а планы такие есть - буду пользовать. По апи, очевидно, - нет
Forwarded from Вайб-кодинг
This media is not supported in your browser
VIEW IN TELEGRAM
Нашёл интересный Claude Code-плагин для Fable 5 под названием /harness

Штука запускает агента на вашем проекте, отслеживает все ошибки и автоматически собирает CLAUDE.md на основе реальных фейлов. Если агент ошибся с путями, не нашёл нужный скрипт или сделал неверное предположение о структуре проекта — /harness это зафиксирует. В следующий раз агент уже знает об этих проблемах и не наступает на те же грабли.

Настройка занимает пару минут:

Установите Hyperbrowser CLI: тут

Добавьте команду /harness:

mkdir .claude/skills/harness


Дальше закидываете SKILL.md в папку, перезапускаете Claude Code и команда готова к работе.

Получить SKILL.md можно здесь: https://github.com/hyperbrowserai/examples/tree/main/skills

🎉🎉🎉
Please open Telegram to view this post
VIEW IN TELEGRAM
Это, конечно, раздувает промпт, я бы в отдельный документ писал 👆