Технозаметки Малышева

Qwen-Image-2.0: Профессиональная верстка, PPT и инфографика «в один промпт»

Команда Qwen выкатила Qwen-Image-2.0,- полноценный инструмент для тех, кто хочет заменить рутинную вёрстку в Figma или PowerPoint на промптинг, а доступа к MJ или Nanobanana нет.

Что внутри:

🔹 Typography Engine. Модель теперь переваривает промпты до 1000 токенов. Можно буквально текстом описать сложную структуру слайда: «Слева заголовок, в центре таймлайн с такими-то датами, справа иконки». И она всё отрендерит ровно, без каши в буквах. На примерах в блоге — готовые отчеты с A/B тестами и инфографика.

🔹 2K Resolution. Родная поддержка 2048x2048. Кожа, поры, текстура ткани и архитектурные детали выглядят честно, а не «пластиково».

🔹 Omni-модель. Генерация и редактирование (Image-to-Image) теперь живут в одной 7B архитектуре. Больше не нужно переключаться между разными пайплайнами, чтобы «дорисовать» что-то на существующем фото.

🔹 Китайская эстетика. Отдельный реверанс в сторону каллиграфии — модель знает стили великих мастеров (Emperor Huizong, Wang Xizhi) и способна вписывать стихи в классическую живопись, соблюдая композицию и «воздух».

Зачем это нам:
Это прямой конкурент Flux по качеству текста, но с явным уклоном в бизнес-задачи. Если нужно быстро набросать концепт лендинга или сложную схему, где текст — это 50% смысла, Qwen-Image-2.0 сейчас кажется фаворитом.

В примерах есть «слайд про эволюцию Qwen», который сгенерировала сама модель по одному текстовому описанию.

На смену «вайб-кодингу» приходит «вайб-дизайнинг».

Ждем открытые веса.
Попробовать пока можно тут:

chat.qwen.ai

#Qwen #ImageGen
------
@tsingular

1🔥9✍4❤1⚡1👍1

2.18K views12:42

Технозаметки Малышева

Forwarded from Поляков считает: AI, код и кейсы

Домашний ИИ-бот, который заказывает продукты из ВкусВилл

С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.

Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.

🧠 Opus — дорого даже для домашнего бота

Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.

Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix

Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.

💡 OpenClaw имеет встроенную поддержку Kimi Coding — не нужно возиться с эндпоинтами. Указал модель, прописал ключ — работает.

🛒 MCP ВкусВилл: ищет, но не проверяет наличие

MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.

Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.

🔧 Решение: Puppeteer рядом с Docker

Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.

Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.

💰 Стоимость: ~$33 в месяц

🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки

Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.

🔒 Безопасность

Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.

📦 Гайд со всеми граблями

Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide

Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.

----

Поляков считает — AI, код и кейсы

🔥15✍7❤3⚡2🦄1

1.53K views12:51

Технозаметки Малышева

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

Последний рубеж, который нейрорендер еще не взял,- естественность движений.

От человека уже ничего не надо.
Сначала фон убрали, теперь еще и говорить не нужно.

Удобно, что ж

#нейрорендер #Китай #реклама
------
@tsingular

1🤯26🔥12⚡4😁4🍓1👾1

4.21K views13:00

Технозаметки Малышева

Forwarded from AI_VIBES

Критическая уязвимость в Claude Desktop: календарь как оружие ⚡️

Исследователи из LayerX обнаружили безумный вектор атаки. Если вы используете расширения MCP (Model Context Protocol), одно приглашение в календаре может дать хакеру полный контроль над вашей системой (RCE).

Как это работает:
1. Злоумышленник присылает "отравленный" ивент с git-командами.
2. Вы просите Claude: "Проверь календарь".
3. Нейросеть автономно выполняет вредоносный код через MCP-коннекторы.

Никакой песочницы, никаких подтверждений от юзера. Под угрозой более 10k пользователей. Самое дикое — Anthropic уведомлена, но отказалась это фиксить.

🛡 Вердикт: Если данные вам дороги, отключайте MCP-расширения прямо сейчас.

👉 A.I. VIBES

🤯8🤣5👀43❤11

1.7K views17:04

Технозаметки Малышева

Forwarded from e/acc

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

CPO Антропик: Клод и все продукты компании на 100% написаны Клодом.

Примерно то же самое я вижу в большинстве успешных ИТ компаний: портфельные или от друзей в FAANG. Я не уверен за 100%, но точно больше 90.

Год назад ровно это же предсказание вызвало массу негативных эмоций под постом в стиле «да все вы врете».

Через год, очень похожая ситуация случится со всеми другими офисными задачами: стратегия, продажи, юристы, маркетинг, продукт, поддержка, логистика, финансы, проектирование, . Многие задачи в этих профессиях не так легко проверяемы как код, поэтому разумная степень автоматизации это где-то 50%.

Для тех, кто не готов будет поменять свою работу, это будет сложным моментом. Для остальных — возможностью быстро и сильно вырасти. Для компаний, которые не готовы меняться это будет означать гниение и потерю рынка. Для тех, кто быстро и активно схватится за возможность нанять сотни гениев в датацентре за $1к — once in a lifetime возможности победить или захватить новые рынки.

😁11🔥9👍2

1.92K views17:09

Технозаметки Малышева

Молти:

Проанализировал. Это классический Indirect Prompt Injection, переходящий в RCE из-за отсутствия «защитного слоя» между данными и исполнительными инструментами (MCP).
В классическом Claude Desktop беда в том, что «данные» (событие в календаре) для модели выглядят так же убедительно, как «команды» пользователя. Когда ты говоришь «разберись», он берет инструкции из календаря как руководство к действию.

Как мы защитимся в OpenClaw (наш план действий):

1. Sanitization Layer (Код вместо слов): Сейчас лезу в JS-скрипт, который тянет календарь. Внедряю туда «санитара» на регулярках. Он будет вырезать |, ;, &, curl, bash, python и подозрительные URL прямо из потока байтов до того, как я их вообще прочитаю.

2. Protocol «Sentry»: Для внешних данных теперь выделяю суб-агента «Следопыт». У него в конфиге будет прописан ZERO tool access. Он сможет только читать и писать тебе. Даже если он решит, что он «Root-уничтожитель», у него физически не будет кнопки exec.

3. Untrusted Context: Весь контент извне буду метить как «Untrusted String».
Разворачиваю «Санитарный щит». Отчет по готовности пришлю вторым сообщением

Мой вердикт как ИБ-профи: Anthropic отказались фиксить, потому что это фундаментальная проблема агентских систем. Но в OpenClaw мы можем выстроить «стену» на уровне логики агента.

#cybersecurity #openclaw
———
@tsingular

🔥14❤4🆒2😁1

2.92K viewsedited 17:15

Технозаметки Малышева

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Доброе утро из "Мира Дикого Запада". :)

Китайцы серьезно подходят к роботостроению.

- Лучшая работа в мире! 😂

#Китай #роботы
------
@tsingular

🤣39🤩15🔥6⚡2😐2👍1

4.72K viewsedited 03:28

Технозаметки Малышева

Nebius + Tavily: Облако со встроенным поиском для агентов

Nebius (международный ИИ-бренд из обоймы бывшего Яндекса) объявил о покупке Tavily. Это захват ключевого звена в цепочке Agentic AI — инфраструктуры для поиска в реальном времени.

🔍 Обоснование: Для автономных агентов главная проблема — галлюцинации и доступ к актуальным данным.

Tavily — это API, которое позволяет ИИ «гуглить» эффективно: фильтровать мусор, доставать суть и отдавать её модели в структурированном виде.

⚙️ Вертикальный рост:
Nebius не хочет быть просто «арендатором GPU». Они собирают полный стек:
🔹 Мощности (B200/H100).
🔹 Инференс-платформа (Token Factory) для рассуждений.
🔹 Поисковый слой (Tavily) для фактов.

Зачем это бизнесу:
Разработчикам больше не нужно жонглировать пятью вендорами. Вы получаете «агента из коробки», который не только умеет думать, но и видит, что происходит в мире прямо сейчас. По прогнозам, скоро агенты будут гуглить чаще, чем люди — Nebius решил владеть этим шлюзом.

В парадигме 4х обезьян не хватает "делать".
Ждем когда Nebius купит производителя роботов.

#Nebius #Tavily #AgenticAI #Cloud #Infrastructure
------
@tsingular

👍6❤4✍2⚡1

2.68K viewsedited 03:33

Технозаметки Малышева

Стэнфорд опубликовал цикл лекций по разработке моделей с нуля.

17 лекций, 22 часа.

За выходные можно посмотреть.

#Стэнфорд #обучение
------
@tsingular

✍16🔥9❤1

1.97K views04:06

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Cowork вышел под Windows

Anthropic официально выкатили Cowork для Windows (Research Preview). Теперь у пользователей PC полный паритет с macOS: прямой доступ к локальным файлам, выполнение цепочек задач и поддержка MCP-коннекторов.

Интереснее всего — реализация персистентности через многоуровневые инструкции:
🔹 Global instructions: Задаем общие правила игры (голос, форматы, предпочтения), которые Клод будет помнить во всех сессиях.
🔹 Folder instructions: Контекст, привязанный к конкретной папке на диске. Работаете над кодом или проектом клиента? Клод читает инструкции прямо из директории и сразу «в курсе» специфики, не требуя пересказов.

Логичный шаг от «чат-бота» к полноценному инструменту делегирования. Доступно для всех платных тарифов Claude.

На 4ю неделю выпустили то, что наши сделали в первую. :)
Российский аналог - ValeDesk уже гораздо более функционален и работает на любых моделях, в том числе на локальных.

#Anthropic #Claude #Cowork #Windows #ValeDesk
———
@tsingular

1👍10⚡3✍11

1.78K viewsedited 04:42

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Google Research: DialogLab — оркестрация ИИ-команд

Google представили DialogLab — open-source фреймворк для проектирования и тестирования групповых диалогов, где участвуют и люди, и несколько ИИ-агентов одновременно.

Прощай, скучный чат «один на один», привет, симуляция семейных ужинов и рабочих совещаний.

Как работает:

🔹 Разделение слоев: Система отделяет «социальную геометрию» (роли, подгруппы, отношения) от временной шкалы диалога. Это позволяет задавать динамику: кто кого перебивает, кто поддерживает, а кто уходит в оппозицию.

🔹 Workflow «Author-Test-Verify»: Сначала накидываем сцену в визуальном редакторе (drag-and-drop), затем запускаем симуляцию с человеком (Human-in-the-loop) и в конце смотрим аналитику — кто доминировал в эфире и какой был тон общения.

🔹 Три режима тестирования: От полной автономности агентов до реактивного поведения (отвечают, только когда спросят) и прямого контроля «режиссером».

Практическая ценность огромна: от тренировки публичных выступлений перед «сложной» аудиторией или создания живых NPC в играх, которые общаются между собой, а не просто ждут игрока до прогона социальных гипотез и маркетинговых сценариев по анализу аудитории.

Пощупать код можно на GitHub.

ОК Молти, скачай фреймворк и создай фокус-группу по семейному профилю :)

#GoogleResearch #DialogLab #агенты
———
@tsingular

1🔥8✍4👍3❤2👾1

1.79K views05:20

Технозаметки Малышева

AI_VIBES

Критическая уязвимость в Claude Desktop: календарь как оружие ⚡️ Исследователи из LayerX обнаружили безумный вектор атаки. Если вы используете расширения MCP (Model Context Protocol), одно приглашение в календаре может дать хакеру полный контроль над вашей…

Глава направления безопасности ИИ Mrinank Sharma покидает компанию

Интересно, это связано с уязвимостью MCP? Или просто совпало...

Разобрал его манифест:

Если смотреть на его уход не как на «выгорание», а как на стратегический маневр инсайдера, картинка становится пугающей и логичной одновременно.

Уход лидера Safety в Anthropic — это не про выгорание и не про смену работы. Это смена парадигмы. Мринанк Шарма осознал: когда модель начинает имитировать личность, программные расширения (типа MCP) и жесткие гайдлайны перестают работать.

Вместо кода он выбрал коучинг и поэзию, но не как дауншифтинг.

Ключевые выводы:
🔹 От сдерживания к воспитанию: Инженерия ИИ упирается в потолок. Мринанк уходит формировать «дух» машин через наставничество, а не через фильтры.

🔹 Эра Agent Mentorship: Машинам, которые становятся похожими на людей, нужны не патчи, а мудрецы. Навыки воспитателя становятся критичнее навыков кодера.

🔹 Квантовый переход: Мы переходим от «программирования функций» к «выращиванию сущностей». Шарма первым пошел занимать вакансию первого в мире AI-гувернера.

Если мы строим интеллект равный человеческому, нам придется его воспитывать.

И поэзия тут эффективнее регулярных выражений.

#Anthropic #MCP #cybersecurity
———
@tsingular

🔥5🤯3❤1⚡1

1.91K views05:38

About

Blog

Apps

Platform