Forwarded from На хую vercheniye 🇮🇱🇺🇦
Forwarded from На хую vercheniye 🇮🇱🇺🇦
Forwarded from На хую vercheniye 🇮🇱🇺🇦
Для улучшения качества языковых моделей (LLM) придумали RLHF, обучение на основе обратной связи от человека. В результате применения этого подхода LLM научились лучше убеждать людей в правильности ответа. При этом качество самих ответов ухудшилось, но ошибки стали более труднообнаруживаемыми.
https://arxiv.org/abs/2409.12822
#ai #хуи
https://arxiv.org/abs/2409.12822
#ai #хуи