본문으로 건너뛰기

rlhf

인간 피드백 기반 강화학습

중급

인간의 선호도를 반영하여 AI 모델을 미세 조정하는 기법이다. 모델의 답변이 인간의 윤리나 의도에 부합하도록 유도하지만 외부적 제약에 가깝다는 비판도 존재한다.