Константин Доронин pinned «❇️ КОНЦЕНТРАТ. ЧАСТЬ 2 Сегодня собрал для вас посты, которые выходили про технологию Deep Research. Заодно составил свой личный топ компаний, её предлагающих. Полезные материалы, чтобы использовать Deep Research эффективнее: 1. Общая информация про использование…»
На созвоне "AI для бизнеса" я высказывал мысль, которую очень часто повторяю при ответе на вопрос "Как нам начать работать с AI?".
Повторю ещё раз:
Направления, в которых можно делать первые шаги:
1. Автоматический поиск информации в интернете по заранее заданным параметрам.
2. Формирование документа на основе переданных данных. Например, выбирать необходимые параметры из текста, переданного в свободном формате (как клиент скинул), и формировать договор.
3. Получать из документа нужную информацию. Эдакий mini-RAG, но без громадной базы знаний с той стороны (мы же говорим про первые шаги, помните?).
4. Упростить взаимодействие с корпоративным сайтом или магазином. Чтобы частично обновление контента производил AI вместо контент-менеджера. При этом информацию может забирать из текстового описания задачи в свободной форме или даже формировать цену на основе внешних параметров (полученных при помощи п.1, например).
Вместо того, чтобы скидывать вам "список ссылок для сохранения в бесконечном Избранном", предлагаю небольшой интерактив.
❗️Напишите в комментариях, какие у вас есть кейсы в бизнесе, подходящие под критерии "максимально-простой интеграции". А я со своей стороны по некоторым из них соберу работающий кейс и расскажу, как его применить. Возможно, даже проведём эфир-практикум.
p.s.: вы просили вернуть в media life-контент. В прошлые выходные был хайк до самой высокой точки в ОАЭ. Красивые виды с вершины прилагаю 🙂
Повторю ещё раз:
Начинать внедрять AI всегда нужно с максимально-простой задачи. Только работа с текстом (в некоторых случаях можно использовать img-to-text). Желательно, автоматизировать рутину самого низкооплачиваемого сотрудника.
Направления, в которых можно делать первые шаги:
1. Автоматический поиск информации в интернете по заранее заданным параметрам.
2. Формирование документа на основе переданных данных. Например, выбирать необходимые параметры из текста, переданного в свободном формате (как клиент скинул), и формировать договор.
3. Получать из документа нужную информацию. Эдакий mini-RAG, но без громадной базы знаний с той стороны (мы же говорим про первые шаги, помните?).
4. Упростить взаимодействие с корпоративным сайтом или магазином. Чтобы частично обновление контента производил AI вместо контент-менеджера. При этом информацию может забирать из текстового описания задачи в свободной форме или даже формировать цену на основе внешних параметров (полученных при помощи п.1, например).
Вместо того, чтобы скидывать вам "список ссылок для сохранения в бесконечном Избранном", предлагаю небольшой интерактив.
❗️Напишите в комментариях, какие у вас есть кейсы в бизнесе, подходящие под критерии "максимально-простой интеграции". А я со своей стороны по некоторым из них соберу работающий кейс и расскажу, как его применить. Возможно, даже проведём эфир-практикум.
p.s.: вы просили вернуть в media life-контент. В прошлые выходные был хайк до самой высокой точки в ОАЭ. Красивые виды с вершины прилагаю 🙂
1👍7🔥6❤4
Ключевые концепции, позволяющие AI-агентам (и их сетям) решать задачи эффективнее, чем стандартный чат с LLM.
90% эффективности AI-агента заключается в следующих его настройках:
1. Правильно выбранная "роль" для агента и формирование его целей.
2. Управление памятью. Для агента нужно организовать, как минимум, оперативную, постоянную и объектную виды памяти. Первая – содержит самую актуальную информацию и существует в контексте модели, вторая хранится в базе данных или на сервере, а третья является списком существующих в постоянной памяти объектов, чтобы агент по ним мог обращаться в постоянную память.
3. Эффективные инструменты. Для формирования памяти либо выполнения действий, способствующих достижению цели.
Как при этом узнать, что система работает корректно?
Нужен набор входных параметров и возможность оценить то, что агент даёт на выходе (очень хорошо, если он выполняет детерменированную задачу). Через оценку того, где именно ошибается агент, перерабатывать входные параметры, роль и цели.
Механика тестов AI-агентов чем-то похожа на механику формирования эффективного промпта в LLM. Только параметров чуть больше.
Все улучшения сводятся к тому, что мы ограничиваем для AI-агента всевозможные действия, которые мешают достичь корректного результата.
p.s.: Фотография в стиле "Найди кота" или "Сфотографируй, как мы красиво идём в этом ущелье». 🙂
90% эффективности AI-агента заключается в следующих его настройках:
1. Правильно выбранная "роль" для агента и формирование его целей.
2. Управление памятью. Для агента нужно организовать, как минимум, оперативную, постоянную и объектную виды памяти. Первая – содержит самую актуальную информацию и существует в контексте модели, вторая хранится в базе данных или на сервере, а третья является списком существующих в постоянной памяти объектов, чтобы агент по ним мог обращаться в постоянную память.
3. Эффективные инструменты. Для формирования памяти либо выполнения действий, способствующих достижению цели.
Как при этом узнать, что система работает корректно?
Нужен набор входных параметров и возможность оценить то, что агент даёт на выходе (очень хорошо, если он выполняет детерменированную задачу). Через оценку того, где именно ошибается агент, перерабатывать входные параметры, роль и цели.
Механика тестов AI-агентов чем-то похожа на механику формирования эффективного промпта в LLM. Только параметров чуть больше.
Все улучшения сводятся к тому, что мы ограничиваем для AI-агента всевозможные действия, которые мешают достичь корректного результата.
p.s.: Фотография в стиле "Найди кота" или "Сфотографируй, как мы красиво идём в этом ущелье». 🙂
1🔥8👍4❤3
Базовая настройка AI-ассистента Goose. Как получить себе сообразительного AI-агента с поддержкой MCP-серверов.
Я показывал его на эфире по «AI для бизнеса», после чего получил запрос о том, что неплохо бы написать инструкцию о том, как получить себе на компьютер такого же.
Собственно, инструкция:
1. Устанавливаем по гайду отсюда Goose Desktop. Лучше иметь на компьютере MacOS или Linux. Под Windows он работает только из-под wsl (но всё равно работает).
2. Из провайдеров выбираем OpenRouter. Так как он позволяет работать с любым другим провайдером через API.
3. Если ещё нет аккаунта в OpenRouter, то заводим его здесь.
4. Далее надо пополнить счёт. Хотя бы на $10. Это можно сделать картой (российские не принимают), через криптовалюту или выбрать продавца на plati.
5. Создаём API-ключ на специальной странице. Вводим его в настройках Goose для Openrouter в поле
6. Выбираем модель, с которой будет работать наш агент. Я рекомендую
7. При добавлении модели в агента, сначала выбираем провайдера Openrouter, а в имя модели вставляем то, которое имеет формат company/model. В нашем случае это
8. У Goose есть свой стандартный список расширений (инструментов) для AI-агента, который находится тут. Их можно установить через кнопку "Install" прямо из браузера.
9. В окне с чатом в левом-нижнем углу нужно выбрать папку, в которой AI-агент будет работать. Чтобы он в системные папки не грузил свои документы.
10. Открываем чат с агентом и начинаем диалог.
Дополнительно:
1. Если завести аккаунт на https://tavily.com/ , то можно получить API-ключ (без ввода карточки) и использовать его с соответствующим инструментом для поиска. 1000 запросов в месяц на бесплатном тарифе.
2. По-умолчанию в Goose есть инструмент Memory. Он позволяет хранить данные в постоянной памяти. Также он умеет их распределять по категориям.
3. Goose умеет писать программы и сам их запускает. Так он решает вопросы сложных автоматизаций, которые не получается выполнить имеющимися инструментами.
Пробовали ли вы использовать Goose? Или ваш AI-ассистент работает на базе другого фреймворка?
Я показывал его на эфире по «AI для бизнеса», после чего получил запрос о том, что неплохо бы написать инструкцию о том, как получить себе на компьютер такого же.
Собственно, инструкция:
1. Устанавливаем по гайду отсюда Goose Desktop. Лучше иметь на компьютере MacOS или Linux. Под Windows он работает только из-под wsl (но всё равно работает).
2. Из провайдеров выбираем OpenRouter. Так как он позволяет работать с любым другим провайдером через API.
3. Если ещё нет аккаунта в OpenRouter, то заводим его здесь.
4. Далее надо пополнить счёт. Хотя бы на $10. Это можно сделать картой (российские не принимают), через криптовалюту или выбрать продавца на plati.
5. Создаём API-ключ на специальной странице. Вводим его в настройках Goose для Openrouter в поле
OPENROUTER_API_KEY
. 6. Выбираем модель, с которой будет работать наш агент. Я рекомендую
anthropic/claude-3.7-sonnet
, так как в качестве AI-агента в связке с MCP она работает лучше всего.7. При добавлении модели в агента, сначала выбираем провайдера Openrouter, а в имя модели вставляем то, которое имеет формат company/model. В нашем случае это
anthropic/claude-3.7-sonnet
.8. У Goose есть свой стандартный список расширений (инструментов) для AI-агента, который находится тут. Их можно установить через кнопку "Install" прямо из браузера.
9. В окне с чатом в левом-нижнем углу нужно выбрать папку, в которой AI-агент будет работать. Чтобы он в системные папки не грузил свои документы.
10. Открываем чат с агентом и начинаем диалог.
Дополнительно:
1. Если завести аккаунт на https://tavily.com/ , то можно получить API-ключ (без ввода карточки) и использовать его с соответствующим инструментом для поиска. 1000 запросов в месяц на бесплатном тарифе.
2. По-умолчанию в Goose есть инструмент Memory. Он позволяет хранить данные в постоянной памяти. Также он умеет их распределять по категориям.
3. Goose умеет писать программы и сам их запускает. Так он решает вопросы сложных автоматизаций, которые не получается выполнить имеющимися инструментами.
Пробовали ли вы использовать Goose? Или ваш AI-ассистент работает на базе другого фреймворка?
2🔥11❤5👍5
Новый генератор изображений со своей "фишкой".
Имя ему Reve. Живёт тут.
Ворвался в топ Leaderboard на Artificial Analysis.
Я уже попробовал его в задачах по text-to-image генерации. Благо они дают достаточно бесплатных токенов за регистрацию.
Есть одно преимущество, которое у генератора не отнять: он детально и достаточно дотошно следует промпту. Из 4-х изображений цветика-семицветика он с первой попытки два сделал корректно. Это очень хороший результат. Recraft давал корректный результат примерно в 5% случаев. Да и то с ухищрениями и после нескольких доработок промпта.
Минусы я отметил следующие:
1. Качество всего до 1360px по большей стороне. По сравнению с Flux1.1-pro-ultra с его 2К очень слабо.
2. Детальное следование промпту – да. Но как будто бы Ideogram и Flux умеют самостоятельно добавлять в генерацию "жизни". В случае с Reve все детали нужно прописывать самостоятельно.
Вывод: инструмент 100% найдёт своего пользователя. Так как качество генерации на уровне с остальными топовыми моделями, а ещё и следование промпту лучше, чем у многих конкурентов.
Имя ему Reve. Живёт тут.
Ворвался в топ Leaderboard на Artificial Analysis.
Я уже попробовал его в задачах по text-to-image генерации. Благо они дают достаточно бесплатных токенов за регистрацию.
Есть одно преимущество, которое у генератора не отнять: он детально и достаточно дотошно следует промпту. Из 4-х изображений цветика-семицветика он с первой попытки два сделал корректно. Это очень хороший результат. Recraft давал корректный результат примерно в 5% случаев. Да и то с ухищрениями и после нескольких доработок промпта.
Минусы я отметил следующие:
1. Качество всего до 1360px по большей стороне. По сравнению с Flux1.1-pro-ultra с его 2К очень слабо.
2. Детальное следование промпту – да. Но как будто бы Ideogram и Flux умеют самостоятельно добавлять в генерацию "жизни". В случае с Reve все детали нужно прописывать самостоятельно.
Вывод: инструмент 100% найдёт своего пользователя. Так как качество генерации на уровне с остальными топовыми моделями, а ещё и следование промпту лучше, чем у многих конкурентов.
1❤5👍5🔥5