supervised-fine-tuning
지도 미세 조정
사전 학습된 모델을 특정 데이터셋과 정답 쌍을 사용하여 추가로 학습시켜 특정 작업에 최적화하는 과정이다. 강화학습을 적용하기 전 모델의 기초적인 행동 양식을 설정하는 단계로 자주 활용된다.
지도 미세 조정
사전 학습된 모델을 특정 데이터셋과 정답 쌍을 사용하여 추가로 학습시켜 특정 작업에 최적화하는 과정이다. 강화학습을 적용하기 전 모델의 기초적인 행동 양식을 설정하는 단계로 자주 활용된다.