Korenev AI - GPT в тапочках🩴

🍪Типичные ошибки начинающего промпт-инженера

Вчера консультировал команду, которая занимается речевой аналитикой. Ребята столкнулись с типичной проблемой: на малых объемах данных все работает нормально, но при увеличении ллм начинает некорректно работать

1️⃣Посмотрел промпт и увидел типичную ошибку начинающих разработчиков, которую сам допускал неоднократно:
Слишком большой промпт с кучей подробностей, инструкций и множеством сущностей для классификации. Нужно было много элементов разложить по кучкам, но кучек слишком много, и ллм просто не справляется с такой нагрузкой.

Решение простое: разбить промпт на несколько, чтобы каждый из них выполнял лишь одну конкретную задачу. По моим оценкам этот промпт надо на разбить на 3-5 шагов.

2️⃣Что касается количества сущностей, сразу вспомнил свой случай с классификацией названий видеороликов на gpt3.5. Десять заголовков обрабатывалось очень качественно, а вот когда подавал 20 заголовков - система уже начинала скатываться в рандом.
Главное - опытным путем найти оптимальное количество данных, которое конкретная модель может нормально обработать.

3️⃣В своем проекте ребята модель взяли не самую топовую - gpt4o-mini. Я всегда рекомендую начинающим разработчикам: берите сначала мощную модель, не экономьте на этапе отладки. Отработайте на ней, добейтесь стабильного качества, а потом уже можно постепенно даунгрейдиться к более дешевым вариантам и смотреть, где качество начинает просаживаться. Вероятно, изначальные хотелки не будут работать даже на мощной модели.

4️⃣Еще посоветовал им внедрить LangFuse, чтобы собирать бенчмарки из своих же экспериментов и потом тестировать разные модели.

5️⃣Еще две типичных ошибки, которые я встречаю: отсутствие системного промпта и просьба выдать JSON прямо в теле промпта. Для JSON есть structured output - он работает намного лучше.

Интересно ваше мнение - что еще посоветовали бы начинающим разработчикам?

Please open Telegram to view this post

VIEW IN TELEGRAM

👍22❤5

2.18K views08:02