Константин Доронин
3.89K subscribers
622 photos
317 videos
1 file
338 links
По любым вопросам, которые не хотите задавать в комментариях, можете писать напрямую – @kdoronin
Download Telegram
Про разницу подходов корпораций к реализации инструментов для AI-coding.

Сегодня обнаружил, что на странице Gemini Code Assist есть упоминание расширения с Gemini для VS Code.

Конечно же, тут же решил поставить его себе в IDE.

Оно какое-то пустое. Никаких новых идей или даже развития существующих. Просто Gemini-чат с возможностью писать/читать/редактировать файлы. Спасибо хоть поиск завезли (ну, это же Google).

Спасает положение, что это всё-таки Gemini и он бесплатный (при соблюдении рекомендаций из этого поста). Поэтому что-то создать с его помощью всё-таки можно.

Но в таком формате будет очень сложно забрать значимый кусок рынка у тех же Cursor и Claude Code. Может хотя бы Gemini CLI подсобит (я до него ещё не добрался).

Так вот. Про разницу подходов. У рассматриваемого выше Kiro от Amazon есть какие-то новые концепции. Они могут не работать, не нравиться или не использоваться, но они всё же есть. Это развитие рынка и создание конкурентной среды.

То, что сделал Google на данный момент – это "Давайте воткнём продукт для AI-Coding, чтобы в этой нише у нас что-то существовало". И почему-то сразу невольно вспоминается Google+...
1👍72🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Veo3 и JSON-промпты.

Veo3 отлично следует промптам. Однако формат JSON позволяет получить над происходящим в видео ещё больше контроля.

Это очень актуально, учитывая, сколько стоит одна генерация с использованием Veo3.

Интересно, что к самому формату пришли в результате экспериментов с моделью. В официальной документации для Vertex-AI упоминаются только доп.параметры при обращении через API.

Для освоения премудростей JSON-промптинга стоит ознакомиться со следующими материалами:

1. Один из первых материалов про JSON-промптинг. Предлагает достаточно подробную расширенную схему. Осторожно: не все third-party-платформы, предоставляющие доступ к Veo3 примут такой развёрнутый промпт.

2. Статья с альтернативной схемой. Автор добавляет negative_prompt в схему, а сама по себе схема у него попроще.

3. А эта статья поможет правильно подобрать вам параметры для генерации. Движение камеры, стиль видео и другие нюансы работы с Veo3.

Ленивый способ, как и всегда, – просто закидываем эти статьи в ChatGPT/Claude/Любимую LLM и просим сгенерировать промпт для того видео, что вам нужно, с использованием рекомендаций из статей.

Я примерно таким образом и сгенерировал видео из медиа данного поста. Вот JSON-промпт, который я использовал:

{ "shot": { "composition": "Medium close-up, 35 mm lens, light handheld wobble for sitcom timing", "camera_motion": "slow dolly-in then micro zoom-out punchline beat", "frame_rate": "24fps", "film_grain": "clean digital" }, "subject": { "description": "Holographic neon brain wearing pixelated sunglasses, hovering above a chrome pedestal, faint circuit-glow pulsing", "wardrobe": "Pixel sunglasses only — no body needed" }, "scene": { "location": "retro-futuristic comedy-club stage with purple-teal neon and floating binary rain", "time_of_day": "night", "environment": "holographic spotlights, soft audience silhouette" }, "action": "Brain lifts a mug labelled \"0xCaffeine\", sips dramatically, turns to the audience and quips: \"I don’t always optimize, but when I do — it’s in O(ha-ha)!\" then laughs in binary \"010010\"", "audio": { "voice": { "tone": "cheeky androgynous", "language": "en", "line": "I don’t always optimize, but when I do — it’s in O-ha-ha!" }, "ambient": "audience chuckles, retro synth rim-shot" }, "visual_rules": { "prohibited_elements": ["subtitles", "watermarks", "text overlays"] } }


Шутит, кстати, ChatGPT. Это он себя так видит.
2🔥10👍53
Media is too big
VIEW IN TELEGRAM
В своём обзоре на Kiro я писал о том, что у них достаточно жёсткие лимиты, из-за которых я не успел даже рабочее окружение до конца настроить.

Похоже, что с тех пор либо хайп на новую IDE спал, либо Amazon увеличили лимиты.

Kiro уже на протяжении нескольких дней (с того самого обзора) открыт у меня в фоне и занимается тем, что делает по одному тестовому проекту задачи, которые сам же себе и создал.

За всё это время у меня ни разу не закончились токены для использования Claude 4 Sonnet.

Кстати, оцените интерфейс того, как Kiro работает с Tasks внутри их Specs. Мало того, что он отслеживает статус каждой задачи (а если задача в In progress, то у неё ещё и loader появляется), но ещё и сохраняет изменения в коде по задаче, чтобы можно было их в любой момент посмотреть. Также сохраняет историю чата с процессом работы над задачей. А начать работу над новой задачей можно просто нажатием на кнопку "Start task".

В общем, если у вас закончились 45 запросов за 5 часов в Claude Code при подписке за $20, попробуйте запустить Kiro в качестве альтернативы. Пока что он своей щедростью очень приятно удивляет.
2👍10🔥54
Model Context Protocol, оказывается, перевели целый список официальных MCP-серверов от разработчиков протокола в статус "архивных".

С полным списком можно ознакомиться по ссылке.

GitHub, например, выпустил на замену собственный MCP-сервер, о котором писал тут. Сделали они это, к слову, ещё до того, как MCP поставили свой GitHub MCP-сервер в статус Archived.

Для Puppeteer, например, официального MCP-сервера теперь просто нет... А у того, который архивный, последний коммит в репозитории – это сообщение о рисках, связанных с безопасностью. Собственно, именно поиск MCP для Puppeteer привёл меня в репозиторий с archived-серверами.

Итог: тренд "не поддерживать собственные MCP-сервера" – это не просто прихоть однажды хайпанувших на популярном сервере разработчиков, но и практика, идущая от авторов протокола.
2👍74🔥2🤯2
Вообще, я долгое время обходил стороной сервис krea.ai.

Добрался я до него всего лишь 3-4 недели назад. И меня поразило количество инструментов, с помощью которых можно контролировать генерации.

Сегодня – про инструмент "Realtime".

С его помощью можно нарисовать (или частично сгенерировать) исходное изображение (слева), а потом преобразовать его при помощи промпта. Всё это происходит, как вы понимаете, в режиме "Realtime".

Что интересно, помимо самого промпта, есть ещё параметр "AI Strength", который позволяет соблюсти баланс между тем, что нарисовано и тем, что на базе этого сгенерировано. В итоге будет сильнее влиять на результат либо исходное изображение, либо ваш промпт.

В медиа разместил несколько примеров того, как разные существа превращаются в роботов. Заметьте, что для каждого существа AI Strength подобран индивидуально.
2👍116🔥5
Не так давно Manus улучшили свою работу с презентациями.

У меня уже есть работающий пайплайн с созданием презентаций в Gamma.app. Купленная подписка, генерация презентаций до 20 слайдов по предоставленному до этого описанию каждого слайда. И вполне устраивающее качество после нескольких итераций редактирования.

Поэтому в Manus я шёл с некоторым скепсисом.

Тем приятнее то удивление, которое Manus вызвал.

Я не знаю, как его создатели это сделали, но AI-агент в Manus обладает хорошим вкусом. Что в сайтах, что в презентациях. Размещает элементы гармонично, понимает, где можно добавить медиа, а где и инфографику прикрутить. Сравните в медиа слайды по идентичным промптам от Manus и Gamma (Manus использует красные акценты). Как по мне, Manus заметно впереди.

Также Manus хорошо работает с текстами, которые нужно использовать в презентации. "Хорошо работает" – это в смысле он их сам не редактирует. Ибо какой смысл в том, что я работаю с планом презентации, если потом мой посыл может изменить AI? Собственно, такую проблему я часто встречал у Gamma. А ещё она может просто потерять часть информации, если вдруг что-то не вошло на слайд.

Наконец-то Manus честно выполняет работу до конца. Без вопросов в стиле "Я сделал 10 слайдов, мне продолжать?". Презентацию из 16 слайдов он генерирует и перегенерирует полностью с одного запроса. То есть адекватно понимает, какую работу надо выполнить, чтобы отчитаться о завершении задачи.

Генерация выходит достаточно дешёвой. За мою презентацию из 16 слайдов Manus снял чуть больше 300 кредитов. Правда, есть минус – если я захочу сменить оформление (тему) презентации на какую-то другую из числа предложенных, то Manus проведёт генерацию заново и потратит 300+ кредитов ещё раз.

Manus - это прежде всего AI-агент, поэтому он может сам найти какую-то дополнительную информацию в интернете и добавить её в презентацию. Или, например, поставить в слайд настоящую фотографию, а не сгенерированную через AIGamma все изображения исключительно AI-generated).

Однозначных минусов для меня у Manus (в сравнении с Gamma) три:

1. Отсутствие возможностей генерировать что-либо в презентации через интерфейс. Приходится либо в HTML-код слайда лезть, либо просить AI что-то менять. И тут уже на мелких правках через AI можно потратить сильно больше кредитов, чем планировалось.

2. Время. Генерация занимает сильно больше времени, чем в Gamma. Особенно это заметно на процессе смены темы. В Gamma это происходит почти мгновенно, тогда как Manus может уйти на 10-15 минут, чтобы всю презентацию создать заново, но с обновлённым визуалом. Понятно, что у Manus другой процесс работы над презентациями, но времени всё равно много уходит.

3. В моём случае, за всю презентацию Manus не использовал ни одного изображения. Только графики и диаграммы. Думаю, причина в том, что в изначальном плане презентации нужно указывать, что вот в этом слайде должна быть определённая картинка или фотография.

Итог: Manus всё ещё хорошо чувствует себя на рынке. И происходит это, во многом, благодаря качественным обновлениям, в которых разработчики предлагают готовые пайплайны по работе с контентом. И, судя по работе с презентациями, у них это весьма неплохо получается.
1👍5🔥42
Бесполезный Google Stitch.

Stitch – это генератор дизайнов от Google. Попробовать его можно здесь.

Пример сервиса, который создавался исключительно ради рекламного "вау-эффекта".

Потому что, в моём случае, он применим только для очень небольших задач. А именно – когда надо сгенерировать одну страницу в каком-то конкретном состоянии.

Всё. Больше никакой пользы.

Потому что есть два фундаментальных минуса:

1. При генерации нескольких страниц сайта, у них нет между собой согласованности. То есть стиль внутри проекта отличается от страницы к странице. Общие элементы, вроде header и footer, также не одинаковы. Попросить сделать разные состояния одной и той же страницы – бесперспективная задача.

2. Нет инструмента для AI-редактирования конкретного макета. Можно попросить что-то изменить, но в таком случае Stitch ведёт себя как ChatGPT при генерации картинок. То есть перерисовывает дизайн с нуля. При этом может потерять цвета, изменить какие-то элементы и, в качестве бонуса, – не выполнить поставленную задачу.

Думаю, в этом причина, почему Stitch доступен без ограничений. Просто он не особо-то нужен. Прошёл, как разовый информационный повод, не став рабочим инструментом ни для кого.

Если вдруг вы всё-таки сумели встроить Google Stitch в свой рабочий пайплайн, расскажите в комментариях, как вам это удалось. И, самое главное, почему не подошли другие инструменты.
26👍3🔥3🤝2