인간 피드백 기반 강화학습
인간의 선호도를 반영하여 AI 모델을 미세 조정하는 기법이다. 모델의 답변이 인간의 윤리나 의도에 부합하도록 유도하지만 외부적 제약에 가깝다는 비판도 존재한다.