Технозаметки Малышева

AI-Researcher: автономный научный конвейер

HKUDS продолжают отжигать!

Команда из University of Hong Kong выпустила AI-Researcher — систему полной автоматизации исследований от идеи до публикации.

Принимает либо детальное описание задачи, либо просто список статей, - сам генерит идею, реализует алгоритм, проводит эксперименты и пишет полноценную научную работу.

Архитектура:
- Resource Collector — собирает статьи с arXiv, код с GitHub, датасеты
- Idea Generator — формулирует новые направления на основе анализа ограничений текущих методов
- Design→Implementation→Validation→Refinement — цикл разработки с автоматическим тестированием
- Writer Agent — генерирует итоговую красивую статью в PDF

Поддерживает Claude, OpenAI, DeepSeek через единый API.
Запуск через Docker или веб-интерфейс на Gradio.

#Researcher #исследователь #HKUDS #Китай #OSS
———
@tsingular

🔥18👍3⚡2

1.85K views06:50

Технозаметки Малышева

0:37

Media is too big

VIEW IN TELEGRAM

Wingman: тренажёр в стиле FlappyBird

Интересный пример вайбкода на Gemini3 с камерой.
Обратите внимание у чела в руках гантельки.

#тренажер #vibecoding #flappybird
———
@tsingular

🔥26❤1⚡1

1.83K views06:58

Технозаметки Малышева

💡 Вскрой корневые причины конфликтов в команде перед критичной встречей — через сценарий провала

📋 ПРОМПТ ДНЯ:

Роль: Ты — фасилитатор по разрешению конфликтов в технологических командах с экспертизой в психологии групповой динамики и опытом работы с финтех-проектами, где ИИ меняет привычные процессы.

Ситуация: Я руковожу проектной командой, внедряющей ИИ-решения в финансовые продукты. У нас есть сильные специалисты, но нарастает конфликт — между data scientists и классическими финансистами, между скоростью экспериментов и требованиями регуляторов. Моя цель — выстроить рабочий процесс, дающий команде и мне свободу принимать решения без постоянного тушения пожаров. Завтра у нас ключевая встреча, где нужно договориться о дальнейших шагах.

Задача: Проведи со мной провокационную пре-мортем сессию: представь, что встреча завтра провалилась катастрофически — конфликт обострился, люди демотивированы, проект под угрозой. Помоги мне увидеть, какие скрытые причины и невысказанные страхи каждой стороны привели к этому исходу.

Формат ответа:
— Серия из 5-7 провокационных вопросов, заставляющих меня посмотреть на ситуацию глазами каждой стороны конфликта
— Каждый вопрос должен раскрывать один потенциальный сценарий провала
— Вопросы должны быть конкретными, а не абстрактными, с привязкой к реалиям ИИ-проектов в финансах
— Учитывай, что у меня есть только одна встреча, чтобы изменить траекторию

Ограничения:
— Избегай общих советов по менеджменту — фокус на специфике ИИ в финансах
— Не предлагай долгосрочные программы — только то, что можно адресовать на одной встрече
— Не смягчай углы — провокация должна быть честной и неудобной
— Сначала задай мне 2-3 уточняющих вопроса о составе команды и природе конфликта, затем переходи к пре-мортем вопросам

⚙️ ПРИЁМ:
Пре-мортем анализ — ты смотришь на проблему с конца, представляя провал уже свершившимся фактом, что снимает защитные механизмы психики и позволяет увидеть риски, которые в позитивном планировании остаются в слепой зоне

#промпты
------
@tsingular

✍9🔥2🆒2❤1

1.73K viewsedited 09:02

Технозаметки Малышева

Universal Commerce Protocol: стандарт для ИИ-агентов в e-commerce от Google

Google выпустил UCP — открытый протокол для взаимодействия платформ, магазинов, платёжных провайдеров и ИИ агентов в онлайн-торговле.

Задача: избавиться от кастомных интеграций. Бизнес объявляет поддерживаемые возможности (чекаут, заказы, OAuth-авторизация), агенты их находят автоматически.

Работает через REST, MCP или A2A — на выбор разработчика.

Внутри — протокол AP2 с трёхуровневыми цифровыми мандатами: намерение пользователя → корзина → платёж. Каждый этап подписан криптографически, чтобы агент не мог изменить сумму или переиспользовать токен.

Сайт проекта: https://ucp.dev/

#UCP #AP2 #ecommerce #Google
------
@tsingular

🔥7⚡2✍2❤1👍1

1.76K viewsedited 09:19

Технозаметки Малышева

Google добавит gRPC как транспорт для MCP

Model Context Protocol использует JSON-RPC для связи агентов с инструментами.
Компании с gRPC-инфраструктурой вынуждены разворачивать транскодинг-шлюзы для совместимости.

Google предлагает альтернативу - нативный gRPC-транспорт для MCP.

Зачем это нужно:
- Protobuf сжимает сообщения до 16-37% от размера JSON (до 10x экономии)
- Двусторонний стриминг через единое соединение
- Встроенный контроль потока предотвращает перегрузку
- mTLS, OAuth, авторизация на уровне методов (ReadFile да, DeleteFile нет)
- Трейсинг через OpenTelemetry из коробки

Spotify уже тестирует MCP через gRPC внутри - проще для разработчиков, меньше работы при создании серверов.

Комьюнити уже договорилось о подключаемых транспортах в SDK, Google скоро выкатит пакет.

#gRPC #MCP #Google
------
@tsingular

✍5🔥3⚡1

1.99K views18:15

Технозаметки Малышева

Поздравляю, вы прошли краткий курс промпт-инжиниринга

GPT: ругай меня полностью

#промпты #исследования
------
@tsingular

😁17✍4

1.76K views19:37

Технозаметки Малышева

Cowork: Claude для не-разработчиков Anthropic запустил Cowork — упрощённую версию Claude Code для обычных задач. Даёшь доступ к папке, Claude читает, правит и создаёт файлы: сортирует загрузки, собирает таблицы из скриншотов, пишет черновики из заметок. …

Кстати, прикол Cowork в том, что он был на 100% навайбкожен на ClaudeCode за 1,5 недели.

#вайбкодинг #Anthropic #ClaudeCode #Cowork
------
@tsingular

🔥16⚡32🥰1👀1

1.74K views19:48

Технозаметки Малышева

MedGemma 1.5: медицинский мультимодальный ИИ от Google

Google выкатил MedGemma 1.5 4B — первую публичную открытую мультимодальную модель, которая работает с объёмными медицинскими данными: КТ, МРТ, гистопатологией.

Ключевые улучшения:
- Точность на КТ +3% (61% vs 58%)
- МРТ +14% (65% vs 51%)
- Гистопатология: ROUGE-L скакнул с 0.02 до 0.49, догнав специализированный PolyPath
- Рентген грудной клетки: локализация анатомии +35% (IoU 38% vs 3%)
- Медицинские тексты: MedQA 69% vs 64%, EHRQA 90% vs 68%

Бонусом — MedASR, модель распознавания медицинской речи. Ошибок на 58% меньше чем у Whisper large-v3 на диктовках рентгена (5.2% vs 12.5% WER).

Всё открыто, бесплатно для коммерции.

HuggingFace

#MedGemma #MedASR #медицина #Google
———
@tsingular

⚡9🐳1

1.56K views10:12

Технозаметки Малышева

GLM-Image: генератор изображений от Z.AI

Команда Z.ai выкатила GLM-Image — первую открытую промышленную модель с гибридной архитектурой: авторегрессивный модуль на 9 миллиардов параметров (базируется на GLM-4) генерирует семантические токены, а диффузионный декодер на 7 миллиардов параметров (DiT-архитектура из CogView4) дорисовывает детали.

Авторегрессия создаёт низкочастотный семантический сигнал через semantic-VQ (токенизатор из X-Omni), диффузия восстанавливает высокочастотные детали. Токенизатор сжимает изображение в 16 раз, итоговое разрешение — до 2048 пикселей.

Интересно, что по части метрик пишут, - обгоняет NanoBananaPro

Для локального запуска рекомендуют 80гигов VRAM

По апи цена - $0.015 за изображение
документация тут
Ну и, пользуясь случаем, если будете брать подписку, - с рефералкой до 31 января она дешевле на 10%

GitHub
HuggingFace

#GLM-Image #SemanticVQ #ZAI
———
@tsingular

✍6🔥2❤1⚡1

1.46K views10:27

Технозаметки Малышева

Anthropic Labs: запуск лаборатории для отработки экспериментов

Anthropic за последний год запустила много успешных экспериментальных продуктов:
- Claude Code за полгода вырос до миллиарда долларов выручки
- MCP используют уже десятки тысяч серверов во всём мире
- Skills, Claude in Chrome, Cowork, - это за последний месяц

Теперь, в свете такого прогресса они решили запустить лабораторию инноваций, где команда будет создавать экспериментальные решения с использованием Claude.

Майк Кригер (сооснователь Instagram, два года был CPO) уходит в Labs к Бену Манну строить прототипы.
Продуктовую организацию возглавит Ами Вора — масштабировать то, что уже работает для миллионов пользователей.

Логика простая: быстро тестировать прототипы с бета-тестерами, находить что заходит, масштабировать в стабильные продукты.

#Anthropic #Labs
———
@tsingular

⚡64🏆2❤1

1.63K views10:43

Технозаметки Малышева

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 OpenSource Cowork: китайцы перевайбкодили Антропик!

Не прошло и 72х часов с момента анонса, как китайские товарищи перевайбкодили Cowork в оупенсорс!

Cowork еще не успели зарелизить и к тому же он работает только с официальной подпиской Max и без сторонних API.

Китайский разраб austinit с помощью MiniMax 2.1 за полдня (!) воссоздал это в open-source версии!

🔹 Демка один-в-один повторяет Cowork видео: На видео модель MiniMax M2.1 берёт папки с файлами на китайском: docs, код, таблицы и автоматически:
- Сканирует содержимое.
Классифицирует (документы, код, данные).
- Создаёт папки и перемещает файлы.
Всё через инструменты вроде create_directory и move_file.
Наводит идеальный порядок.
И это с любой Anthropic-совместимой API!

MiniMax называет это "моментом OpenCode", - открытый аналог появился меньше чем за сутки.

Проект на GitHub:
https://github.com/DevAgentForge/Claude-Cowork

#Cowork #OSS #Claude #MiniMax #Китай
———
@tsingular

😁16🔥13👍3🍾2✍1

7.8K viewsedited 12:24

Технозаметки Малышева

Forwarded from Пост Лукацкого

Ну вот и GigaOm, вслед за Gartner, "убил" SOAR 🔫, заменив этот класс решений по автоматизации ИБ на новый, "зонтичный" тип - SecOps Automation. Они уже об этом предупреждали, а теперь выпустили новый отчет про этот новый класс решений: 📝

Автоматизация SecOps – это общая категория, описывающая инструменты, которые используются командами в центрах мониторинга безопасности (SOC) для анализа, расследования и реагирования на угрозы с минимальными вовлечением человека. Это, пожалуй, лучший объект для автоматизации на основе LLM, что проявилось в появлении на рынке десятков новых решений на базе искусственного интеллекта.

Этот отчет является естественным продолжением наших четырех предыдущих исследований по оркестрации, автоматизации и реагированию в области безопасности (SOAR). Он включает в себя большинство возможностей и поставщиков, описанных в предыдущих отчетах SOAR, а также описывает отдельный набор возможностей на базе искусственного интеллекта в разделе "Новые функции". Его цель – предоставить исчерпывающий обзор всех автономных инструментов, которые автоматизируют процессы анализа, расследования и реагирования в центре мониторинга безопасности.

Разница между подходом, похожим на SOAR, и новыми инструментами на базе LLM может быть описана следующим образом:

Детерминированная автоматизация, которая обычно реализуется с помощью рабочих процессов и скриптов с Low Code/No Code или, реже, с помощью роботизированной автоматизации процессов (RPA). Они следуют заранее определенному логическому потоку, который предполагает, что логику описывает оператор-человек.

Недетерминированная автоматизация, которая обычно (возможно, исключительно для данного отчета) реализуется с помощью LLM или DSLM. Стоит отметить, что LLM считаются полностью детерминированными системами авторитетными фигурами в области ИИ. Однако мы просто называем их недетерминированными, учитывая, что модель может давать разные ответы при повторном вводе одного и того же запроса. Поставщики обычно встраивают LLM в агенты ИИ, которые отвечают за отдельные части процессов SecOps.

Практически все поставщики, упомянутые в отчете, так или иначе внедряют автоматизацию на основе LLM. Некоторые из гибридных подходов включают:
– LLM на этапе проектирования, то есть ИИ используется для написания детерминированной автоматизации, такой как скрипты и плейбуки.
– Детерминированные оболочки, в которых LLM являются частью детерминированных рабочих процессов.
– Написание ИИ-агентов, при котором инструмент позволяет клиентам писать свои собственные ИИ-агенты, а не использовать заранее разработанные агенты, предоставляемые поставщиком.

Это наш первый год оценки сферы автоматизации SecOps в контексте наших отчетов «Ключевые критерии» и «Радар».

Как и многие другие отчеты GigaOm, этот, "GigaOm Radar for SecOps Automation v1", тоже достаточно интересен. В нем мало маркетинге и много всяких полезностей и инсайтов для выбора средств автоматизации в SOC 🤔

#средствазащиты #soc #автоматизация

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3❤1✍1⚡1

1.36K views13:44

Технозаметки Малышева

⚡️

Работа для ML разрабов.

В рамках года единства народов РФ выделяется финансирование на проект по сохранению языков коренных малочисленных народов Севера.

Суть проекта: создать ИИ-агента, который умеет озвучивать на нанайском языке тексты, подаваемые на русском.

Кто-нибудь сталкивался с дообучением нейронок редким языкам?

Пишите в комментах или в ЛС, - поделюсь контактом заказчика, кому интересно и у кого есть опыт!

Пусть будет новый тег #job - буду делиться лидами :)

#job
———
@tsingular

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14👍6❤2

1.42K viewsedited 15:14

Технозаметки Малышева

Forwarded from Neural Kovalskii

2:19

Media is too big

VIEW IN TELEGRAM

Cowork-Local-LLM

Вставлю еще 10 копеек своих в эту историю

Решил пару интересных задач
Как запустить на windows
Как перебить на openai-sdk
Как перебить на vllm/ollama
Как запустить на qwen3-30b-a3b-instruct-2507

Точно все будет криво (будем исправлять)

https://github.com/vakovalskii/Cowork-Local-LLM

🔥16⚡2🏆2

1.32K views15:21

Технозаметки Малышева

1:21

This media is not supported in your browser

VIEW IN TELEGRAM

Jupiter от компании Zeroth

$90k

Поставки начнутся в апреле 2026

Опять малайзиец на удалёнке, судя по всему.

#роботы #CES2026 #Китай #Jupiter #Zeroth
-----
@tsingular

👍6⚡2😁2💯1👾11

1.25K viewsedited 19:45

Технозаметки Малышева

0:36

This media is not supported in your browser

VIEW IN TELEGRAM

А может малайзиец на удаленке,- не такой уж и страшный вариант.

Пожалуй, хватит на сегодня интернета. 🤣

#роботы #танцы #крипота
------
@tsingular

11👻6👾3

2.85K views19:55

Технозаметки Малышева

Google Antigravity: Skills для агентов

Google добавил в Антигравити поддержку расширения возможностей агентов через Skills — пакеты инструкций в формате SKILL.md с описанием задач, которые агент может решать.

Каждый навык живёт в папке с обязательным SKILL.md и опциональными скриптами. Агент видит список доступных skills, выбирает подходящие по описанию и следует инструкциям.

Два уровня размещения:
- workspace-root/.agent/skills/ — для проектных workflow
- ~/.gemini/antigravity/skills/ — глобальные навыки

Выбор навыка происходит автоматически на основе LLM-рассуждений без алгоритмической фильтрации.

Есть, правда, риск по части кибербеза: инъекции через SKILL.md тривиальны, изоляция скриптов не предусмотрена. Каждая строка Skills интерпретируется как инструкция без проверки, что делает систему "fundamentally insecure".

Insecure by design, получается.

Agentic Skills прям тема года. Во-первых срочно изучать, кто еще не начал.
Во-вторых надо их сканировать на закладки с LLM.
И минимизировать права агентов.
Загонять в песочницы.

#Antigravity #Skills #cybersecurity
------
@tsingular

👍3✍2⚡1

848 views03:37

About

Blog

Apps

Platform