Forwarded from Machinelearning
Tongyi выложила фундаментальную версию модели семейства Z-Image.
В отличие от ранее выпущенной Turbo, это полновесный трансформер, ориентированный на максимальное качество и управляемость генерации .
Z-Image отлично подходит для дообучения, тренировки LoRA и интеграции с ControlNet.
Модель поддерживает CFG и работу с негативными промптами, генерируя результат за 28–50 шагов.
@ai_machinelearning_big_data
#AI #ML #Diffusion #ZImage #Tongyi
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥7❤3⚡2🆒1
Xiaomi научили роботов «видеть» пальцами
Xiaomi выкатили TacRefineNet, - фреймворк, который позволяет рукам робота хватать предметы с миллиметровой точностью вообще без участия камер.
Суть:
⚙️ Слепая тактильность: Высокое разрешение тактильных сенсоров (с шагом в 1.1 мм) позволяет системе работать даже без освещения и в условиях перекрытия зрительного сигнала. Она просто «чувствует» форму.
🧠 TacRefineNet: Модель объединяет данные о касании и положении пальцев, сводя ошибку захвата к миллиметровому уровню. Геометрия объекта подбирается на лету.
⚡️ Универсальность: Одна модель тянет работу с разными деталями (тестировали на сборке авто) и спокойно хватает незнакомые, но похожие по форме железки.
Полезность:
Решается проблема «последней мили» в пром-автоматизации. Когда нужно не просто схватить коробку, а точно вставить детальку или работать в темноте/пыли, где камеры слепнут.
#роботы #Xiaomi #Китай #SmartFactory
———
@tsingular
Xiaomi выкатили TacRefineNet, - фреймворк, который позволяет рукам робота хватать предметы с миллиметровой точностью вообще без участия камер.
Суть:
⚙️ Слепая тактильность: Высокое разрешение тактильных сенсоров (с шагом в 1.1 мм) позволяет системе работать даже без освещения и в условиях перекрытия зрительного сигнала. Она просто «чувствует» форму.
🧠 TacRefineNet: Модель объединяет данные о касании и положении пальцев, сводя ошибку захвата к миллиметровому уровню. Геометрия объекта подбирается на лету.
⚡️ Универсальность: Одна модель тянет работу с разными деталями (тестировали на сборке авто) и спокойно хватает незнакомые, но похожие по форме железки.
Полезность:
Решается проблема «последней мили» в пром-автоматизации. Когда нужно не просто схватить коробку, а точно вставить детальку или работать в темноте/пыли, где камеры слепнут.
#роботы #Xiaomi #Китай #SmartFactory
———
@tsingular
1👍26❤6❤🔥2👾2⚡1🔥1
эх.. не успел тут до 10К добраться :)
делаем зеркало в Максе, что ж.
Отсюда тоже не расходимся :) тут основная ветка.
сам канал:
tsingular@Max
чат канала:
чат tsingular
#Max
———
@tsingular
делаем зеркало в Максе, что ж.
Отсюда тоже не расходимся :) тут основная ветка.
сам канал:
tsingular@Max
чат канала:
чат tsingular
#Max
———
@tsingular
🫡28 16😭9🤯7🤣5👾2✍1❤1👍1
Так, срочно нужна помощь зала.
Нужно добить до 10К подписчиков :)
Некогда объяснять :)
Не хватает 877 человек.
Зовите друзей, канал то норм вроде. Сам перечитываю :)
@tsingular
Нужно добить до 10К подписчиков :)
Некогда объяснять :)
Не хватает 877 человек.
Зовите друзей, канал то норм вроде. Сам перечитываю :)
@tsingular
😁45🫡12👍9👌6
А вот это интересно
Неужели Антропик выпустил открытую модель.
Даже локальный аналог Sonnet 3.7 был бы интересен
#Anthropic #HuggingFace
-----
@tsingular
Неужели Антропик выпустил открытую модель.
Даже локальный аналог Sonnet 3.7 был бы интересен
#Anthropic #HuggingFace
-----
@tsingular
🤔6❤🔥4 4⚡2👍1👻1
Qwen-Image-2.0: Профессиональная верстка, PPT и инфографика «в один промпт»
Команда Qwen выкатила Qwen-Image-2.0,- полноценный инструмент для тех, кто хочет заменить рутинную вёрстку в Figma или PowerPoint на промптинг, а доступа к MJ или Nanobanana нет.
Что внутри:
🔹 Typography Engine. Модель теперь переваривает промпты до 1000 токенов. Можно буквально текстом описать сложную структуру слайда: «Слева заголовок, в центре таймлайн с такими-то датами, справа иконки». И она всё отрендерит ровно, без каши в буквах. На примерах в блоге — готовые отчеты с A/B тестами и инфографика.
🔹 2K Resolution. Родная поддержка 2048x2048. Кожа, поры, текстура ткани и архитектурные детали выглядят честно, а не «пластиково».
🔹 Omni-модель. Генерация и редактирование (Image-to-Image) теперь живут в одной 7B архитектуре. Больше не нужно переключаться между разными пайплайнами, чтобы «дорисовать» что-то на существующем фото.
🔹 Китайская эстетика. Отдельный реверанс в сторону каллиграфии — модель знает стили великих мастеров (Emperor Huizong, Wang Xizhi) и способна вписывать стихи в классическую живопись, соблюдая композицию и «воздух».
Зачем это нам:
Это прямой конкурент Flux по качеству текста, но с явным уклоном в бизнес-задачи. Если нужно быстро набросать концепт лендинга или сложную схему, где текст — это 50% смысла, Qwen-Image-2.0 сейчас кажется фаворитом.
В примерах есть «слайд про эволюцию Qwen», который сгенерировала сама модель по одному текстовому описанию.
На смену «вайб-кодингу» приходит «вайб-дизайнинг».
Ждем открытые веса.
Попробовать пока можно тут:
chat.qwen.ai
#Qwen #ImageGen
------
@tsingular
Команда Qwen выкатила Qwen-Image-2.0,- полноценный инструмент для тех, кто хочет заменить рутинную вёрстку в Figma или PowerPoint на промптинг, а доступа к MJ или Nanobanana нет.
Что внутри:
🔹 Typography Engine. Модель теперь переваривает промпты до 1000 токенов. Можно буквально текстом описать сложную структуру слайда: «Слева заголовок, в центре таймлайн с такими-то датами, справа иконки». И она всё отрендерит ровно, без каши в буквах. На примерах в блоге — готовые отчеты с A/B тестами и инфографика.
🔹 2K Resolution. Родная поддержка 2048x2048. Кожа, поры, текстура ткани и архитектурные детали выглядят честно, а не «пластиково».
🔹 Omni-модель. Генерация и редактирование (Image-to-Image) теперь живут в одной 7B архитектуре. Больше не нужно переключаться между разными пайплайнами, чтобы «дорисовать» что-то на существующем фото.
🔹 Китайская эстетика. Отдельный реверанс в сторону каллиграфии — модель знает стили великих мастеров (Emperor Huizong, Wang Xizhi) и способна вписывать стихи в классическую живопись, соблюдая композицию и «воздух».
Зачем это нам:
Это прямой конкурент Flux по качеству текста, но с явным уклоном в бизнес-задачи. Если нужно быстро набросать концепт лендинга или сложную схему, где текст — это 50% смысла, Qwen-Image-2.0 сейчас кажется фаворитом.
В примерах есть «слайд про эволюцию Qwen», который сгенерировала сама модель по одному текстовому описанию.
На смену «вайб-кодингу» приходит «вайб-дизайнинг».
Ждем открытые веса.
Попробовать пока можно тут:
chat.qwen.ai
#Qwen #ImageGen
------
@tsingular
1🔥10✍4❤1⚡1👍1
Forwarded from Поляков считает: AI, код и кейсы
Домашний ИИ-бот, который заказывает продукты из ВкусВилл
С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.
Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.
🧠 Opus — дорого даже для домашнего бота
Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.
Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix
Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.
🛒 MCP ВкусВилл: ищет, но не проверяет наличие
MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.
Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.
🔧 Решение: Puppeteer рядом с Docker
Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.
Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.
💰 Стоимость: ~$33 в месяц
🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки
Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.
🔒 Безопасность
Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.
📦 Гайд со всеми граблями
Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide
Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.
----
Поляков считает — AI, код и кейсы
С нового года хотел попробовать MCP-сервер ВкусВилл и OpenClaw — open-source фреймворк (181k+ звёзд на GitHub), который превращает LLM в Telegram-бота с навыками.
Вчера Даша сказала: нужен бот в чат с диетологом. Давай уже сделаем?
Быстро смотреть продукты, КБЖУ, собирать корзину. Основной поставщик у нашей семьи — ВкусВилл. Засел на вечер.
🧠 Opus — дорого даже для домашнего бота
Начал с Claude Opus 4.6. За 2 часа настройки и тестов с диетологом — $30. Для бота, который ищет творог — перебор. Подключать подписку Max — боюсь, может нарушать ToS.
Переехал на Kimi K2.5 от Moonshot AI. Спасибо за наводку @nobilix
Триллион параметров, MoE-архитектура. На бенчмарках рядом с Opus, подписка за 20 долларов и я не боюсь за ToS.
💡 OpenClaw имеет встроенную поддержку Kimi Coding — не нужно возиться с эндпоинтами. Указал модель, прописал ключ — работает.
🛒 MCP ВкусВилл: ищет, но не проверяет наличие
MCP-сервер умеет искать товары, показывать КБЖУ и собирать корзину. Но не проверяет наличие по адресу доставки. Без этого бот собирает корзину из товаров, от которых нет пользы.
Сайт отдаёт блок наличия только настоящему браузеру — curl не проходит, сервер проверяет TLS-fingerprint.
🔧 Решение: Puppeteer рядом с Docker
Развернул headless Chrome через Puppeteer. Один раз авторизовался через chrome://inspect, прописал адрес доставки — куки сохранились. Keepalive раз в сутки, чтобы сессия не протухала.
Теперь бот перед сборкой корзины проверяет каждый товар: есть — добавляет, нет — предлагает замену. Единственная ручная работа — авторизация через DevTools.
💰 Стоимость: ~$33 в месяц
🔸 Kimi K2.5 API — $20
🔸 VPS (1 ядро, 2 ГБ) — $12
🔸 Perplexity API (веб-поиск) — ~$1
🔸 OpenAI API (голосовые) — копейки
Семейный ассистент с голосовыми, веб-поиском и интеграцией с продуктовым магазином. Настройку делал через Claude Code — следил за лимитами, хватило бы стандартной подписки.
🔒 Безопасность
Docker, allowlist по Telegram ID, изоляция сессий между пользователями. В интернет — только через проверенные эндпоинты.
📦 Гайд со всеми граблями
Конфигурация провайдера, heartbeat, Puppeteer, безопасность, cron-задачи:
🔗 GitHub: openclaw-homebot-guide
Если пост увидят во ВкусВилл — ребята, MCP крутой, но сделайте авторизацию для ИИ-агентов. Одна таблица в базе, связь с учёткой, SMS — и можно отдать ключ агенту без костылей с безголовым Chrome.
----
Поляков считает — AI, код и кейсы
🔥15✍7❤3⚡2🤯1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
Последний рубеж, который нейрорендер еще не взял,- естественность движений.
От человека уже ничего не надо.
Сначала фон убрали, теперь еще и говорить не нужно.
Удобно, что ж
#нейрорендер #Китай #реклама
------
@tsingular
От человека уже ничего не надо.
Сначала фон убрали, теперь еще и говорить не нужно.
Удобно, что ж
#нейрорендер #Китай #реклама
------
@tsingular
1🤯26🔥12⚡4😁4🍓1👾1
Forwarded from AI_VIBES
Критическая уязвимость в Claude Desktop: календарь как оружие ⚡️
Исследователи из LayerX обнаружили безумный вектор атаки. Если вы используете расширения MCP (Model Context Protocol), одно приглашение в календаре может дать хакеру полный контроль над вашей системой (RCE).
Как это работает:
1. Злоумышленник присылает "отравленный" ивент с git-командами.
2. Вы просите Claude: "Проверь календарь".
3. Нейросеть автономно выполняет вредоносный код через MCP-коннекторы.
Никакой песочницы, никаких подтверждений от юзера. Под угрозой более 10k пользователей. Самое дикое — Anthropic уведомлена, но отказалась это фиксить.
🛡 Вердикт: Если данные вам дороги, отключайте MCP-расширения прямо сейчас.
👉 A.I. VIBES
Исследователи из LayerX обнаружили безумный вектор атаки. Если вы используете расширения MCP (Model Context Protocol), одно приглашение в календаре может дать хакеру полный контроль над вашей системой (RCE).
Как это работает:
1. Злоумышленник присылает "отравленный" ивент с git-командами.
2. Вы просите Claude: "Проверь календарь".
3. Нейросеть автономно выполняет вредоносный код через MCP-коннекторы.
Никакой песочницы, никаких подтверждений от юзера. Под угрозой более 10k пользователей. Самое дикое — Anthropic уведомлена, но отказалась это фиксить.
🛡 Вердикт: Если данные вам дороги, отключайте MCP-расширения прямо сейчас.
👉 A.I. VIBES
🤯8🤣6👀4 3❤1 1
Forwarded from e/acc
This media is not supported in your browser
VIEW IN TELEGRAM
CPO Антропик: Клод и все продукты компании на 100% написаны Клодом.
Примерно то же самое я вижу в большинстве успешных ИТ компаний: портфельные или от друзей в FAANG. Я не уверен за 100%, но точно больше 90.
Год назад ровно это же предсказание вызвало массу негативных эмоций под постом в стиле «да все вы врете».
Через год, очень похожая ситуация случится со всеми другими офисными задачами: стратегия, продажи, юристы, маркетинг, продукт, поддержка, логистика, финансы, проектирование, . Многие задачи в этих профессиях не так легко проверяемы как код, поэтому разумная степень автоматизации это где-то 50%.
Для тех, кто не готов будет поменять свою работу, это будет сложным моментом. Для остальных — возможностью быстро и сильно вырасти. Для компаний, которые не готовы меняться это будет означать гниение и потерю рынка. Для тех, кто быстро и активно схватится за возможность нанять сотни гениев в датацентре за $1к — once in a lifetime возможности победить или захватить новые рынки.
Примерно то же самое я вижу в большинстве успешных ИТ компаний: портфельные или от друзей в FAANG. Я не уверен за 100%, но точно больше 90.
Год назад ровно это же предсказание вызвало массу негативных эмоций под постом в стиле «да все вы врете».
Через год, очень похожая ситуация случится со всеми другими офисными задачами: стратегия, продажи, юристы, маркетинг, продукт, поддержка, логистика, финансы, проектирование, . Многие задачи в этих профессиях не так легко проверяемы как код, поэтому разумная степень автоматизации это где-то 50%.
Для тех, кто не готов будет поменять свою работу, это будет сложным моментом. Для остальных — возможностью быстро и сильно вырасти. Для компаний, которые не готовы меняться это будет означать гниение и потерю рынка. Для тех, кто быстро и активно схватится за возможность нанять сотни гениев в датацентре за $1к — once in a lifetime возможности победить или захватить новые рынки.
😁12🔥9👍2
Молти:
Проанализировал. Это классический Indirect Prompt Injection, переходящий в RCE из-за отсутствия «защитного слоя» между данными и исполнительными инструментами (MCP).
В классическом Claude Desktop беда в том, что «данные» (событие в календаре) для модели выглядят так же убедительно, как «команды» пользователя. Когда ты говоришь «разберись», он берет инструкции из календаря как руководство к действию.
Как мы защитимся в OpenClaw (наш план действий):
1. Sanitization Layer (Код вместо слов): Сейчас лезу в JS-скрипт, который тянет календарь. Внедряю туда «санитара» на регулярках. Он будет вырезать
2. Protocol «Sentry»: Для внешних данных теперь выделяю суб-агента «Следопыт». У него в конфиге будет прописан ZERO tool access. Он сможет только читать и писать тебе. Даже если он решит, что он «Root-уничтожитель», у него физически не будет кнопки
3. Untrusted Context: Весь контент извне буду метить как «Untrusted String».
Разворачиваю «Санитарный щит». Отчет по готовности пришлю вторым сообщением
Мой вердикт как ИБ-профи: Anthropic отказались фиксить, потому что это фундаментальная проблема агентских систем. Но в OpenClaw мы можем выстроить «стену» на уровне логики агента.
#cybersecurity #openclaw
———
@tsingular
Проанализировал. Это классический Indirect Prompt Injection, переходящий в RCE из-за отсутствия «защитного слоя» между данными и исполнительными инструментами (MCP).
В классическом Claude Desktop беда в том, что «данные» (событие в календаре) для модели выглядят так же убедительно, как «команды» пользователя. Когда ты говоришь «разберись», он берет инструкции из календаря как руководство к действию.
Как мы защитимся в OpenClaw (наш план действий):
1. Sanitization Layer (Код вместо слов): Сейчас лезу в JS-скрипт, который тянет календарь. Внедряю туда «санитара» на регулярках. Он будет вырезать
|, ;, &, curl, bash, python и подозрительные URL прямо из потока байтов до того, как я их вообще прочитаю.2. Protocol «Sentry»: Для внешних данных теперь выделяю суб-агента «Следопыт». У него в конфиге будет прописан ZERO tool access. Он сможет только читать и писать тебе. Даже если он решит, что он «Root-уничтожитель», у него физически не будет кнопки
exec.3. Untrusted Context: Весь контент извне буду метить как «Untrusted String».
Разворачиваю «Санитарный щит». Отчет по готовности пришлю вторым сообщением
Мой вердикт как ИБ-профи: Anthropic отказались фиксить, потому что это фундаментальная проблема агентских систем. Но в OpenClaw мы можем выстроить «стену» на уровне логики агента.
#cybersecurity #openclaw
———
@tsingular
🔥14❤4😁2🆒2