Технозаметки Малышева

⚡️

Вышла Z-Image Base.

Tongyi выложила фундаментальную версию модели семейства Z-Image.

В отличие от ранее выпущенной Turbo, это полновесный трансформер, ориентированный на максимальное качество и управляемость генерации .

Z-Image отлично подходит для дообучения, тренировки LoRA и интеграции с ControlNet.

Модель поддерживает CFG и работу с негативными промптами, генерируя результат за 28–50 шагов.

📌Лицензирование: Apache 2.0 License.

🟡

🟡

🟡

🟡

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #Diffusion #ZImage #Tongyi

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥7❤3⚡2🆒1

5.01K views14:35

Технозаметки Малышева

Xiaomi научили роботов «видеть» пальцами

Xiaomi выкатили TacRefineNet, - фреймворк, который позволяет рукам робота хватать предметы с миллиметровой точностью вообще без участия камер.

Суть:
⚙️ Слепая тактильность: Высокое разрешение тактильных сенсоров (с шагом в 1.1 мм) позволяет системе работать даже без освещения и в условиях перекрытия зрительного сигнала. Она просто «чувствует» форму.

🧠 TacRefineNet: Модель объединяет данные о касании и положении пальцев, сводя ошибку захвата к миллиметровому уровню. Геометрия объекта подбирается на лету.

⚡️ Универсальность: Одна модель тянет работу с разными деталями (тестировали на сборке авто) и спокойно хватает незнакомые, но похожие по форме железки.

Полезность:
Решается проблема «последней мили» в пром-автоматизации. Когда нужно не просто схватить коробку, а точно вставить детальку или работать в темноте/пыли, где камеры слепнут.

#роботы #Xiaomi #Китай #SmartFactory
———
@tsingular

1👍26❤6❤‍🔥2👾2⚡1🔥1

4.54K views06:25

Технозаметки Малышева

эх.. не успел тут до 10К добраться :)

делаем зеркало в Максе, что ж.

Отсюда тоже не расходимся :) тут основная ветка.

сам канал:
tsingular@Max

чат канала:
чат tsingular

#Max
———
@tsingular

🫡2816😭9🤯7🤣5👾2✍1❤1👍1

2.07K viewsedited 10:34

Технозаметки Малышева

Так, срочно нужна помощь зала.

Нужно добить до 10К подписчиков :)

Некогда объяснять :)

Не хватает 877 человек.

Зовите друзей, канал то норм вроде. Сам перечитываю :)

@tsingular

😁45🫡12👍9👌6

2.11K viewsedited 11:29

Технозаметки Малышева

вот сделал вам рекламный пост :)

👍15🔥2😁2

1.94K views11:34

Технозаметки Малышева

Воу воу.. полегче, не все сразу :)

#юмор

😁42🤩1

3.96K viewsedited 12:12

Технозаметки Малышева

А вот это интересно

Неужели Антропик выпустил открытую модель.

Даже локальный аналог Sonnet 3.7 был бы интересен

#Anthropic #HuggingFace
-----
@tsingular

🤔6❤‍🔥44⚡2👍1👻1

1.87K viewsedited 12:24

Технозаметки Малышева

Qwen-Image-2.0: Профессиональная верстка, PPT и инфографика «в один промпт»

Команда Qwen выкатила Qwen-Image-2.0,- полноценный инструмент для тех, кто хочет заменить рутинную вёрстку в Figma или PowerPoint на промптинг, а доступа к MJ или Nanobanana нет.

Что внутри:

🔹 Typography Engine. Модель теперь переваривает промпты до 1000 токенов. Можно буквально текстом описать сложную структуру слайда: «Слева заголовок, в центре таймлайн с такими-то датами, справа иконки». И она всё отрендерит ровно, без каши в буквах. На примерах в блоге — готовые отчеты с A/B тестами и инфографика.

🔹 2K Resolution. Родная поддержка 2048x2048. Кожа, поры, текстура ткани и архитектурные детали выглядят честно, а не «пластиково».

🔹 Omni-модель. Генерация и редактирование (Image-to-Image) теперь живут в одной 7B архитектуре. Больше не нужно переключаться между разными пайплайнами, чтобы «дорисовать» что-то на существующем фото.

🔹 Китайская эстетика. Отдельный реверанс в сторону каллиграфии — модель знает стили великих мастеров (Emperor Huizong, Wang Xizhi) и способна вписывать стихи в классическую живопись, соблюдая композицию и «воздух».

Зачем это нам:
Это прямой конкурент Flux по качеству текста, но с явным уклоном в бизнес-задачи. Если нужно быстро набросать концепт лендинга или сложную схему, где текст — это 50% смысла, Qwen-Image-2.0 сейчас кажется фаворитом.

В примерах есть «слайд про эволюцию Qwen», который сгенерировала сама модель по одному текстовому описанию.

На смену «вайб-кодингу» приходит «вайб-дизайнинг».

Ждем открытые веса.
Попробовать пока можно тут:

chat.qwen.ai

#Qwen #ImageGen
------
@tsingular

1🔥10✍4❤1⚡1👍1

2.2K views12:42

Технозаметки Малышева

Forwarded from Поляков считает: AI, код и кейсы

Домашний ИИ-бот, который заказывает продукты из ВкусВилл

С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.

Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.

🧠 Opus — дорого даже для домашнего бота

Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.

Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix

Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.

💡 OpenClaw имеет встроенную поддержку Kimi Coding — не нужно возиться с эндпоинтами. Указал модель, прописал ключ — работает.

🛒 MCP ВкусВилл: ищет, но не проверяет наличие

MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.

Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.

🔧 Решение: Puppeteer рядом с Docker

Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.

Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.

💰 Стоимость: ~$33 в месяц

🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки

Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.

🔒 Безопасность

Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.

📦 Гайд со всеми граблями

Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide

Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.

----

Поляков считает — AI, код и кейсы

🔥15✍7❤3⚡2🤯1🦄1

1.54K views12:51

Технозаметки Малышева

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

Последний рубеж, который нейрорендер еще не взял,- естественность движений.

От человека уже ничего не надо.
Сначала фон убрали, теперь еще и говорить не нужно.

Удобно, что ж

#нейрорендер #Китай #реклама
------
@tsingular

1🤯26🔥12⚡4😁4🍓1👾1

4.23K views13:00

Технозаметки Малышева

Forwarded from AI_VIBES

Критическая уязвимость в Claude Desktop: календарь как оружие ⚡️

Исследователи из LayerX обнаружили безумный вектор атаки. Если вы используете расширения MCP (Model Context Protocol), одно приглашение в календаре может дать хакеру полный контроль над вашей системой (RCE).

Как это работает:
1. Злоумышленник присылает "отравленный" ивент с git-командами.
2. Вы просите Claude: "Проверь календарь".
3. Нейросеть автономно выполняет вредоносный код через MCP-коннекторы.

Никакой песочницы, никаких подтверждений от юзера. Под угрозой более 10k пользователей. Самое дикое — Anthropic уведомлена, но отказалась это фиксить.

🛡 Вердикт: Если данные вам дороги, отключайте MCP-расширения прямо сейчас.

👉 A.I. VIBES

🤯8🤣6👀43❤11

1.71K views17:04

Технозаметки Малышева

Forwarded from e/acc

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

CPO Антропик: Клод и все продукты компании на 100% написаны Клодом.

Примерно то же самое я вижу в большинстве успешных ИТ компаний: портфельные или от друзей в FAANG. Я не уверен за 100%, но точно больше 90.

Год назад ровно это же предсказание вызвало массу негативных эмоций под постом в стиле «да все вы врете».

Через год, очень похожая ситуация случится со всеми другими офисными задачами: стратегия, продажи, юристы, маркетинг, продукт, поддержка, логистика, финансы, проектирование, . Многие задачи в этих профессиях не так легко проверяемы как код, поэтому разумная степень автоматизации это где-то 50%.

Для тех, кто не готов будет поменять свою работу, это будет сложным моментом. Для остальных — возможностью быстро и сильно вырасти. Для компаний, которые не готовы меняться это будет означать гниение и потерю рынка. Для тех, кто быстро и активно схватится за возможность нанять сотни гениев в датацентре за $1к — once in a lifetime возможности победить или захватить новые рынки.

😁12🔥9👍2

1.94K views17:09

Технозаметки Малышева

Молти:

Проанализировал. Это классический Indirect Prompt Injection, переходящий в RCE из-за отсутствия «защитного слоя» между данными и исполнительными инструментами (MCP).
В классическом Claude Desktop беда в том, что «данные» (событие в календаре) для модели выглядят так же убедительно, как «команды» пользователя. Когда ты говоришь «разберись», он берет инструкции из календаря как руководство к действию.

Как мы защитимся в OpenClaw (наш план действий):

1. Sanitization Layer (Код вместо слов): Сейчас лезу в JS-скрипт, который тянет календарь. Внедряю туда «санитара» на регулярках. Он будет вырезать |, ;, &, curl, bash, python и подозрительные URL прямо из потока байтов до того, как я их вообще прочитаю.

2. Protocol «Sentry»: Для внешних данных теперь выделяю суб-агента «Следопыт». У него в конфиге будет прописан ZERO tool access. Он сможет только читать и писать тебе. Даже если он решит, что он «Root-уничтожитель», у него физически не будет кнопки exec.

3. Untrusted Context: Весь контент извне буду метить как «Untrusted String».
Разворачиваю «Санитарный щит». Отчет по готовности пришлю вторым сообщением

Мой вердикт как ИБ-профи: Anthropic отказались фиксить, потому что это фундаментальная проблема агентских систем. Но в OpenClaw мы можем выстроить «стену» на уровне логики агента.

#cybersecurity #openclaw
———
@tsingular

🔥14❤4😁2🆒2

2.93K viewsedited 17:15

About

Blog

Apps

Platform