Сергей Булаев AI 🤖

CriticGPT: ИИ для поиска ошибок ИИ

OpenAI рассказала о новой модели CriticGPT, основанной на GPT-4, для выявления ошибок в коде, сгенерированном GPT-4.

Возможности CriticGPT:

🔶 Анализ кода, созданного ChatGPT и выявление неточностей

🔶 Написание критических замечаний к ответам ChatGPT

🔶 Помощь людям-тренерам в оценке выходных данных ИИ

🔶 Балансировка между агрессивным поиском проблем и точностью обнаружения

Ключевые факты:

Модель обучена с помощью RLHF (Усиление обучения с помощью людского фидбэка), как и ChatGPT, но на данных с намеренно внесенными ошибками. CriticGPT способна находить как искусственно внесенные, так и естественные ошибки ChatGPT. По мнению тренеров, критика CriticGPT лучше, чем критика ChatGPT в 63% случаев при работе с естественными ошибками.

Было обнаружено, что можно генерировать более длинные и всесторонние критические замечания, используя дополнительный поиск во время тестирования против модели вознаграждения критики. Этот поиск, называемый Принудительным выбором с использованием поиска по лучам (FSBS), позволяет балансировать агрессивность поиска проблем в коде и настраивать компромисс между точностью и полнотой обнаружения ошибок. В результате генерируются замечания, максимально полезные для RLHF. Подробнее в документе.

Ограничения CriticGPT включают возможные галлюцинации, сложность оценки длинных и комплексных задач, а также проблемы с обнаружением ошибок, распределенных по всему ответу.

OpenAI планирует интегрировать подобные CriticGPT модели в процесс обучения своих ИИ-систем и видит в этом подходе перспективу для создания более совершенных инструментов оценки сложных ИИ-систем.

Так то 63% не супер сильно отличается от 50…

@sergiobulaev - об AI и не только

653

2.54K views04:03