대조적 피드백
생성된 결과물들 사이의 차이점을 비교 분석하여 모델에게 전달하는 피드백 방식이다. 모델은 어떤 선택이 더 나은 결과를 초래했는지 학습하며 스스로의 로직을 정교화한다. 인간의 직접적인 가이드 없이도 고도화된 결과물을 도출하는 데 중요한 역할을 한다.