Про разницу подходов корпораций к реализации инструментов для AI-coding.
Сегодня обнаружил, что на странице Gemini Code Assist есть упоминание расширения с Gemini для VS Code.
Конечно же, тут же решил поставить его себе в IDE.
Оно какое-то пустое. Никаких новых идей или даже развития существующих. Просто Gemini-чат с возможностью писать/читать/редактировать файлы. Спасибо хоть поиск завезли (ну, это же Google).
Спасает положение, что это всё-таки Gemini и он бесплатный (при соблюдении рекомендаций из этого поста). Поэтому что-то создать с его помощью всё-таки можно.
Но в таком формате будет очень сложно забрать значимый кусок рынка у тех же Cursor и Claude Code. Может хотя бы Gemini CLI подсобит (я до него ещё не добрался).
Так вот. Про разницу подходов. У рассматриваемого выше Kiro от Amazon есть какие-то новые концепции. Они могут не работать, не нравиться или не использоваться, но они всё же есть. Это развитие рынка и создание конкурентной среды.
То, что сделал Google на данный момент – это "Давайте воткнём продукт для AI-Coding, чтобы в этой нише у нас что-то существовало". И почему-то сразу невольно вспоминается Google+...
Сегодня обнаружил, что на странице Gemini Code Assist есть упоминание расширения с Gemini для VS Code.
Конечно же, тут же решил поставить его себе в IDE.
Оно какое-то пустое. Никаких новых идей или даже развития существующих. Просто Gemini-чат с возможностью писать/читать/редактировать файлы. Спасибо хоть поиск завезли (ну, это же Google).
Спасает положение, что это всё-таки Gemini и он бесплатный (при соблюдении рекомендаций из этого поста). Поэтому что-то создать с его помощью всё-таки можно.
Но в таком формате будет очень сложно забрать значимый кусок рынка у тех же Cursor и Claude Code. Может хотя бы Gemini CLI подсобит (я до него ещё не добрался).
Так вот. Про разницу подходов. У рассматриваемого выше Kiro от Amazon есть какие-то новые концепции. Они могут не работать, не нравиться или не использоваться, но они всё же есть. Это развитие рынка и создание конкурентной среды.
То, что сделал Google на данный момент – это "Давайте воткнём продукт для AI-Coding, чтобы в этой нише у нас что-то существовало". И почему-то сразу невольно вспоминается Google+...
1👍7❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Veo3 и JSON-промпты.
Veo3 отлично следует промптам. Однако формат JSON позволяет получить над происходящим в видео ещё больше контроля.
Это очень актуально, учитывая, сколько стоит одна генерация с использованием Veo3.
Интересно, что к самому формату пришли в результате экспериментов с моделью. В официальной документации для Vertex-AI упоминаются только доп.параметры при обращении через API.
Для освоения премудростей JSON-промптинга стоит ознакомиться со следующими материалами:
1. Один из первых материалов про JSON-промптинг. Предлагает достаточно подробную расширенную схему. Осторожно: не все third-party-платформы, предоставляющие доступ к Veo3 примут такой развёрнутый промпт.
2. Статья с альтернативной схемой. Автор добавляет negative_prompt в схему, а сама по себе схема у него попроще.
3. А эта статья поможет правильно подобрать вам параметры для генерации. Движение камеры, стиль видео и другие нюансы работы с Veo3.
Ленивый способ, как и всегда, – просто закидываем эти статьи в ChatGPT/Claude/Любимую LLM и просим сгенерировать промпт для того видео, что вам нужно, с использованием рекомендаций из статей.
Я примерно таким образом и сгенерировал видео из медиа данного поста. Вот JSON-промпт, который я использовал:
Шутит, кстати, ChatGPT. Это он себя так видит.
Veo3 отлично следует промптам. Однако формат JSON позволяет получить над происходящим в видео ещё больше контроля.
Это очень актуально, учитывая, сколько стоит одна генерация с использованием Veo3.
Интересно, что к самому формату пришли в результате экспериментов с моделью. В официальной документации для Vertex-AI упоминаются только доп.параметры при обращении через API.
Для освоения премудростей JSON-промптинга стоит ознакомиться со следующими материалами:
1. Один из первых материалов про JSON-промптинг. Предлагает достаточно подробную расширенную схему. Осторожно: не все third-party-платформы, предоставляющие доступ к Veo3 примут такой развёрнутый промпт.
2. Статья с альтернативной схемой. Автор добавляет negative_prompt в схему, а сама по себе схема у него попроще.
3. А эта статья поможет правильно подобрать вам параметры для генерации. Движение камеры, стиль видео и другие нюансы работы с Veo3.
Ленивый способ, как и всегда, – просто закидываем эти статьи в ChatGPT/Claude/Любимую LLM и просим сгенерировать промпт для того видео, что вам нужно, с использованием рекомендаций из статей.
Я примерно таким образом и сгенерировал видео из медиа данного поста. Вот JSON-промпт, который я использовал:
{ "shot": { "composition": "Medium close-up, 35 mm lens, light handheld wobble for sitcom timing", "camera_motion": "slow dolly-in then micro zoom-out punchline beat", "frame_rate": "24fps", "film_grain": "clean digital" }, "subject": { "description": "Holographic neon brain wearing pixelated sunglasses, hovering above a chrome pedestal, faint circuit-glow pulsing", "wardrobe": "Pixel sunglasses only — no body needed" }, "scene": { "location": "retro-futuristic comedy-club stage with purple-teal neon and floating binary rain", "time_of_day": "night", "environment": "holographic spotlights, soft audience silhouette" }, "action": "Brain lifts a mug labelled \"0xCaffeine\", sips dramatically, turns to the audience and quips: \"I don’t always optimize, but when I do — it’s in O(ha-ha)!\" then laughs in binary \"010010\"", "audio": { "voice": { "tone": "cheeky androgynous", "language": "en", "line": "I don’t always optimize, but when I do — it’s in O-ha-ha!" }, "ambient": "audience chuckles, retro synth rim-shot" }, "visual_rules": { "prohibited_elements": ["subtitles", "watermarks", "text overlays"] } }
Шутит, кстати, ChatGPT. Это он себя так видит.
2🔥10👍5❤3
Media is too big
VIEW IN TELEGRAM
В своём обзоре на Kiro я писал о том, что у них достаточно жёсткие лимиты, из-за которых я не успел даже рабочее окружение до конца настроить.
Похоже, что с тех пор либо хайп на новую IDE спал, либо Amazon увеличили лимиты.
Kiro уже на протяжении нескольких дней(с того самого обзора) открыт у меня в фоне и занимается тем, что делает по одному тестовому проекту задачи, которые сам же себе и создал.
За всё это время у меня ни разу не закончились токены для использования Claude 4 Sonnet.
Кстати, оцените интерфейс того, как Kiro работает с Tasks внутри их Specs. Мало того, что он отслеживает статус каждой задачи(а если задача в In progress, то у неё ещё и loader появляется) , но ещё и сохраняет изменения в коде по задаче, чтобы можно было их в любой момент посмотреть. Также сохраняет историю чата с процессом работы над задачей. А начать работу над новой задачей можно просто нажатием на кнопку "Start task".
В общем, если у вас закончились 45 запросов за 5 часов в Claude Code при подписке за $20, попробуйте запустить Kiro в качестве альтернативы. Пока что он своей щедростью очень приятно удивляет.
Похоже, что с тех пор либо хайп на новую IDE спал, либо Amazon увеличили лимиты.
Kiro уже на протяжении нескольких дней
За всё это время у меня ни разу не закончились токены для использования Claude 4 Sonnet.
Кстати, оцените интерфейс того, как Kiro работает с Tasks внутри их Specs. Мало того, что он отслеживает статус каждой задачи
В общем, если у вас закончились 45 запросов за 5 часов в Claude Code при подписке за $20, попробуйте запустить Kiro в качестве альтернативы. Пока что он своей щедростью очень приятно удивляет.
2👍10🔥5❤4
Model Context Protocol, оказывается, перевели целый список официальных MCP-серверов от разработчиков протокола в статус "архивных".
С полным списком можно ознакомиться по ссылке.
GitHub, например, выпустил на замену собственный MCP-сервер, о котором писал тут. Сделали они это, к слову, ещё до того, как MCP поставили свой GitHub MCP-сервер в статус Archived.
Для Puppeteer, например, официального MCP-сервера теперь просто нет... А у того, который архивный, последний коммит в репозитории – это сообщение о рисках, связанных с безопасностью. Собственно, именно поиск MCP для Puppeteer привёл меня в репозиторий с archived-серверами.
Итог: тренд "не поддерживать собственные MCP-сервера" – это не просто прихоть однажды хайпанувших на популярном сервере разработчиков, но и практика, идущая от авторов протокола.
С полным списком можно ознакомиться по ссылке.
GitHub, например, выпустил на замену собственный MCP-сервер, о котором писал тут. Сделали они это, к слову, ещё до того, как MCP поставили свой GitHub MCP-сервер в статус Archived.
Для Puppeteer, например, официального MCP-сервера теперь просто нет... А у того, который архивный, последний коммит в репозитории – это сообщение о рисках, связанных с безопасностью. Собственно, именно поиск MCP для Puppeteer привёл меня в репозиторий с archived-серверами.
Итог: тренд "не поддерживать собственные MCP-сервера" – это не просто прихоть однажды хайпанувших на популярном сервере разработчиков, но и практика, идущая от авторов протокола.
2👍7❤4🔥2🤯2
Вообще, я долгое время обходил стороной сервис krea.ai.
Добрался я до него всего лишь 3-4 недели назад. И меня поразило количество инструментов, с помощью которых можно контролировать генерации.
Сегодня – про инструмент "Realtime".
С его помощью можно нарисовать (или частично сгенерировать) исходное изображение (слева), а потом преобразовать его при помощи промпта. Всё это происходит, как вы понимаете, в режиме "Realtime".
Что интересно, помимо самого промпта, есть ещё параметр "AI Strength", который позволяет соблюсти баланс между тем, что нарисовано и тем, что на базе этого сгенерировано. В итоге будет сильнее влиять на результат либо исходное изображение, либо ваш промпт.
В медиа разместил несколько примеров того, как разные существа превращаются в роботов. Заметьте, что для каждого существа AI Strength подобран индивидуально.
Добрался я до него всего лишь 3-4 недели назад. И меня поразило количество инструментов, с помощью которых можно контролировать генерации.
Сегодня – про инструмент "Realtime".
С его помощью можно нарисовать (или частично сгенерировать) исходное изображение (слева), а потом преобразовать его при помощи промпта. Всё это происходит, как вы понимаете, в режиме "Realtime".
Что интересно, помимо самого промпта, есть ещё параметр "AI Strength", который позволяет соблюсти баланс между тем, что нарисовано и тем, что на базе этого сгенерировано. В итоге будет сильнее влиять на результат либо исходное изображение, либо ваш промпт.
В медиа разместил несколько примеров того, как разные существа превращаются в роботов. Заметьте, что для каждого существа AI Strength подобран индивидуально.
2👍11❤6🔥5
Не так давно Manus улучшили свою работу с презентациями.
У меня уже есть работающий пайплайн с созданием презентаций в Gamma.app. Купленная подписка, генерация презентаций до 20 слайдов по предоставленному до этого описанию каждого слайда. И вполне устраивающее качество после нескольких итераций редактирования.
Поэтому в Manus я шёл с некоторым скепсисом.
Тем приятнее то удивление, которое Manus вызвал.
Я не знаю, как его создатели это сделали, но AI-агент в Manus обладает хорошим вкусом. Что в сайтах, что в презентациях. Размещает элементы гармонично, понимает, где можно добавить медиа, а где и инфографику прикрутить. Сравните в медиа слайды по идентичным промптам от Manus и Gamma (Manus использует красные акценты). Как по мне, Manus заметно впереди.
Также Manus хорошо работает с текстами, которые нужно использовать в презентации. "Хорошо работает" – это в смысле он их сам не редактирует. Ибо какой смысл в том, что я работаю с планом презентации, если потом мой посыл может изменить AI? Собственно, такую проблему я часто встречал у Gamma. А ещё она может просто потерять часть информации, если вдруг что-то не вошло на слайд.
Наконец-то Manus честно выполняет работу до конца. Без вопросов в стиле "Я сделал 10 слайдов, мне продолжать?". Презентацию из 16 слайдов он генерирует и перегенерирует полностью с одного запроса. То есть адекватно понимает, какую работу надо выполнить, чтобы отчитаться о завершении задачи.
Генерация выходит достаточно дешёвой. За мою презентацию из 16 слайдов Manus снял чуть больше 300 кредитов. Правда, есть минус – если я захочу сменить оформление (тему) презентации на какую-то другую из числа предложенных, то Manus проведёт генерацию заново и потратит 300+ кредитов ещё раз.
Manus - это прежде всего AI-агент, поэтому он может сам найти какую-то дополнительную информацию в интернете и добавить её в презентацию. Или, например, поставить в слайд настоящую фотографию, а не сгенерированную через AI (у Gamma все изображения исключительно AI-generated).
Однозначных минусов для меня у Manus (в сравнении с Gamma) три:
1. Отсутствие возможностей генерировать что-либо в презентации через интерфейс. Приходится либо в HTML-код слайда лезть, либо просить AI что-то менять. И тут уже на мелких правках через AI можно потратить сильно больше кредитов, чем планировалось.
2. Время. Генерация занимает сильно больше времени, чем в Gamma. Особенно это заметно на процессе смены темы. В Gamma это происходит почти мгновенно, тогда как Manus может уйти на 10-15 минут, чтобы всю презентацию создать заново, но с обновлённым визуалом. Понятно, что у Manus другой процесс работы над презентациями, но времени всё равно много уходит.
3. В моём случае, за всю презентацию Manus не использовал ни одного изображения. Только графики и диаграммы. Думаю, причина в том, что в изначальном плане презентации нужно указывать, что вот в этом слайде должна быть определённая картинка или фотография.
Итог: Manus всё ещё хорошо чувствует себя на рынке. И происходит это, во многом, благодаря качественным обновлениям, в которых разработчики предлагают готовые пайплайны по работе с контентом. И, судя по работе с презентациями, у них это весьма неплохо получается.
У меня уже есть работающий пайплайн с созданием презентаций в Gamma.app. Купленная подписка, генерация презентаций до 20 слайдов по предоставленному до этого описанию каждого слайда. И вполне устраивающее качество после нескольких итераций редактирования.
Поэтому в Manus я шёл с некоторым скепсисом.
Тем приятнее то удивление, которое Manus вызвал.
Я не знаю, как его создатели это сделали, но AI-агент в Manus обладает хорошим вкусом. Что в сайтах, что в презентациях. Размещает элементы гармонично, понимает, где можно добавить медиа, а где и инфографику прикрутить. Сравните в медиа слайды по идентичным промптам от Manus и Gamma (Manus использует красные акценты). Как по мне, Manus заметно впереди.
Также Manus хорошо работает с текстами, которые нужно использовать в презентации. "Хорошо работает" – это в смысле он их сам не редактирует. Ибо какой смысл в том, что я работаю с планом презентации, если потом мой посыл может изменить AI? Собственно, такую проблему я часто встречал у Gamma. А ещё она может просто потерять часть информации, если вдруг что-то не вошло на слайд.
Наконец-то Manus честно выполняет работу до конца. Без вопросов в стиле "Я сделал 10 слайдов, мне продолжать?". Презентацию из 16 слайдов он генерирует и перегенерирует полностью с одного запроса. То есть адекватно понимает, какую работу надо выполнить, чтобы отчитаться о завершении задачи.
Генерация выходит достаточно дешёвой. За мою презентацию из 16 слайдов Manus снял чуть больше 300 кредитов. Правда, есть минус – если я захочу сменить оформление (тему) презентации на какую-то другую из числа предложенных, то Manus проведёт генерацию заново и потратит 300+ кредитов ещё раз.
Manus - это прежде всего AI-агент, поэтому он может сам найти какую-то дополнительную информацию в интернете и добавить её в презентацию. Или, например, поставить в слайд настоящую фотографию, а не сгенерированную через AI (у Gamma все изображения исключительно AI-generated).
Однозначных минусов для меня у Manus (в сравнении с Gamma) три:
1. Отсутствие возможностей генерировать что-либо в презентации через интерфейс. Приходится либо в HTML-код слайда лезть, либо просить AI что-то менять. И тут уже на мелких правках через AI можно потратить сильно больше кредитов, чем планировалось.
2. Время. Генерация занимает сильно больше времени, чем в Gamma. Особенно это заметно на процессе смены темы. В Gamma это происходит почти мгновенно, тогда как Manus может уйти на 10-15 минут, чтобы всю презентацию создать заново, но с обновлённым визуалом. Понятно, что у Manus другой процесс работы над презентациями, но времени всё равно много уходит.
3. В моём случае, за всю презентацию Manus не использовал ни одного изображения. Только графики и диаграммы. Думаю, причина в том, что в изначальном плане презентации нужно указывать, что вот в этом слайде должна быть определённая картинка или фотография.
Итог: Manus всё ещё хорошо чувствует себя на рынке. И происходит это, во многом, благодаря качественным обновлениям, в которых разработчики предлагают готовые пайплайны по работе с контентом. И, судя по работе с презентациями, у них это весьма неплохо получается.
1👍5🔥4❤2
Бесполезный Google Stitch.
Stitch – это генератор дизайнов от Google. Попробовать его можно здесь.
Пример сервиса, который создавался исключительно ради рекламного "вау-эффекта".
Потому что, в моём случае, он применим только для очень небольших задач. А именно – когда надо сгенерировать одну страницу в каком-то конкретном состоянии.
Всё. Больше никакой пользы.
Потому что есть два фундаментальных минуса:
1. При генерации нескольких страниц сайта, у них нет между собой согласованности. То есть стиль внутри проекта отличается от страницы к странице. Общие элементы, вроде header и footer, также не одинаковы. Попросить сделать разные состояния одной и той же страницы – бесперспективная задача.
2. Нет инструмента для AI-редактирования конкретного макета. Можно попросить что-то изменить, но в таком случае Stitch ведёт себя как ChatGPT при генерации картинок. То есть перерисовывает дизайн с нуля. При этом может потерять цвета, изменить какие-то элементы и, в качестве бонуса, – не выполнить поставленную задачу.
Думаю, в этом причина, почему Stitch доступен без ограничений. Просто он не особо-то нужен. Прошёл, как разовый информационный повод, не став рабочим инструментом ни для кого.
Если вдруг вы всё-таки сумели встроить Google Stitch в свой рабочий пайплайн, расскажите в комментариях, как вам это удалось. И, самое главное, почему не подошли другие инструменты.
Stitch – это генератор дизайнов от Google. Попробовать его можно здесь.
Пример сервиса, который создавался исключительно ради рекламного "вау-эффекта".
Потому что, в моём случае, он применим только для очень небольших задач. А именно – когда надо сгенерировать одну страницу в каком-то конкретном состоянии.
Всё. Больше никакой пользы.
Потому что есть два фундаментальных минуса:
1. При генерации нескольких страниц сайта, у них нет между собой согласованности. То есть стиль внутри проекта отличается от страницы к странице. Общие элементы, вроде header и footer, также не одинаковы. Попросить сделать разные состояния одной и той же страницы – бесперспективная задача.
2. Нет инструмента для AI-редактирования конкретного макета. Можно попросить что-то изменить, но в таком случае Stitch ведёт себя как ChatGPT при генерации картинок. То есть перерисовывает дизайн с нуля. При этом может потерять цвета, изменить какие-то элементы и, в качестве бонуса, – не выполнить поставленную задачу.
Думаю, в этом причина, почему Stitch доступен без ограничений. Просто он не особо-то нужен. Прошёл, как разовый информационный повод, не став рабочим инструментом ни для кого.
Если вдруг вы всё-таки сумели встроить Google Stitch в свой рабочий пайплайн, расскажите в комментариях, как вам это удалось. И, самое главное, почему не подошли другие инструменты.
2❤6👍3🔥3🤝2