Константин Доронин

Базовая настройка AI-ассистента Goose. Как получить себе сообразительного AI-агента с поддержкой MCP-серверов.

Я показывал его на эфире по «AI для бизнеса», после чего получил запрос о том, что неплохо бы написать инструкцию о том, как получить себе на компьютер такого же.

Собственно, инструкция:

1. Устанавливаем по гайду отсюда Goose Desktop. Лучше иметь на компьютере MacOS или Linux. Под Windows он работает только из-под wsl (но всё равно работает).

2. Из провайдеров выбираем OpenRouter. Так как он позволяет работать с любым другим провайдером через API.

3. Если ещё нет аккаунта в OpenRouter, то заводим его здесь.

4. Далее надо пополнить счёт. Хотя бы на $10. Это можно сделать картой (российские не принимают), через криптовалюту или выбрать продавца на plati.

5. Создаём API-ключ на специальной странице. Вводим его в настройках Goose для Openrouter в поле OPENROUTER_API_KEY.

6. Выбираем модель, с которой будет работать наш агент. Я рекомендую anthropic/claude-3.7-sonnet , так как в качестве AI-агента в связке с MCP она работает лучше всего.

7. При добавлении модели в агента, сначала выбираем провайдера Openrouter, а в имя модели вставляем то, которое имеет формат company/model. В нашем случае это anthropic/claude-3.7-sonnet.

8. У Goose есть свой стандартный список расширений (инструментов) для AI-агента, который находится тут. Их можно установить через кнопку "Install" прямо из браузера.

9. В окне с чатом в левом-нижнем углу нужно выбрать папку, в которой AI-агент будет работать. Чтобы он в системные папки не грузил свои документы.

10. Открываем чат с агентом и начинаем диалог.

Дополнительно:

1. Если завести аккаунт на https://tavily.com/ , то можно получить API-ключ (без ввода карточки) и использовать его с соответствующим инструментом для поиска. 1000 запросов в месяц на бесплатном тарифе.

2. По-умолчанию в Goose есть инструмент Memory. Он позволяет хранить данные в постоянной памяти. Также он умеет их распределять по категориям.

3. Goose умеет писать программы и сам их запускает. Так он решает вопросы сложных автоматизаций, которые не получается выполнить имеющимися инструментами.

Пробовали ли вы использовать Goose? Или ваш AI-ассистент работает на базе другого фреймворка?

2🔥11❤5👍5

556 views19:53

Константин Доронин

Новый генератор изображений со своей "фишкой".

Имя ему Reve. Живёт тут.

Ворвался в топ Leaderboard на Artificial Analysis.

Я уже попробовал его в задачах по text-to-image генерации. Благо они дают достаточно бесплатных токенов за регистрацию.

Есть одно преимущество, которое у генератора не отнять: он детально и достаточно дотошно следует промпту. Из 4-х изображений цветика-семицветика он с первой попытки два сделал корректно. Это очень хороший результат. Recraft давал корректный результат примерно в 5% случаев. Да и то с ухищрениями и после нескольких доработок промпта.

Минусы я отметил следующие:

1. Качество всего до 1360px по большей стороне. По сравнению с Flux1.1-pro-ultra с его 2К очень слабо.

2. Детальное следование промпту – да. Но как будто бы Ideogram и Flux умеют самостоятельно добавлять в генерацию "жизни". В случае с Reve все детали нужно прописывать самостоятельно.

Вывод: инструмент 100% найдёт своего пользователя. Так как качество генерации на уровне с остальными топовыми моделями, а ещё и следование промпту лучше, чем у многих конкурентов.

1❤5👍5🔥5

452 views18:25

Кейс про создание достаточно длинных консистентных видео с озвучкой.

Само видео – в медиа поста. Смотреть, разумеется, со звуком.

Этапы работы:

1. Сгенерировал при помощи нового инструмента от OpenAI картинку по запросу "Нарисуй мне уровень в 3D-бумершутере с видом от первого лица".

2. За счёт того, что сгенерированные изображения у ChatGPT имеют с недавних пор повышенную консистентность, я подвигал персонажа по уровню и создал набор изображений.

3. Попарно, через первый и последний кадры, в Kling1.6 создал несколько 5-секундных роликов.

4. Каждый из 5-секундных роликов я озвучил через модель mmaudio-v2, которая есть у fal.ai и доступна тут.

5. После чего соединил 5-секундные ролики в один при помощи скрипта, написанного в Cursor.

У OpenAI вышел по-настоящему крутой инструмент! В ближайшее время выпущу по нему детальный практический разбор.

1🔥10❤4👍4

1.13K views19:56

Константин Доронин

Вчера, 26 марта, я отменил свою подписку на Recraft.

Потому что OpenAI выкатили инструмент, который 90% практических кейсов использования AI-генераторов изображений реализует просто через диалог в чате.

Если вы подписаны на каналы про AI, думаю, уже заметили поток генераций, где люди проверяют "А что, он и так умеет?". И, чаще всего, да. Умеет.

Напомню, доступен он нативно в веб-версии ChatGPT, если выбрать модель ChatGPT 4o. Только для платных подписчиков.

10 примеров, как можно использовать новый инструмент для генерации изображений от OpenAI:

1. Убрать фон у объекта на изображении.

2. Вырезать объект.

3. Поменять стиль изображения.

4. Перенести объекты с одного изображения на другое. Включая людей, да.

5. Сделать интеллектуальный апскейл фотографии.

6. Добавить/изменить текст на изображение.

7. Сделать из просто фотографии предмета профессиональную предметную съёмку (продавцы на маркетплейсах – всё для вас).

8. Изменить объект на фотографии, его положение или состояние, сохранив при этом консистентность (вчерашний пост построен именно на этом пункте).

9. Расширить изображение, дополнив его по сторонам.

10. Простые картинки можно сразу перевести в svg.

И немного дёгтя во всю эту переслащённую бочку:

1. Каждое изображение – это генерация с нуля. И с сохранением исходного лица, например, она справляется плохо. Поэтому на переработанной фотографии себя можно и не узнать.

2. ChatGPT вполне может начать глючить и портить ваше исходное фото. Это нормально для AI в целом.

3. Цензура и авторское право. Нейросеть может начисто отказаться создавать какой-нибудь образ, который может напоминать что-либо, защищённое авторским правом. Хоть это может быть и просто похожий образ. (выкуси, Альтман! Световой меч из так защищаемой тобой вселенной Star Wars я всё-таки сгенерировал!)

4. Помимо п.3, может даже заартачиться и не захотеть работать с изображением человека в принципе. Но ChatGPT отходчивый. Через несколько попыток передумает.

Очень жду, когда подтянутся Open Source модели, поняв, что теперь можно и так.

Какие кейсы использования нового инструмента от OpenAI вы уже попробовали?

1🔥10❤5👍3

425 views20:40

About

Blog

Apps

Platform