본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
거부 미세 조정 (rejection-fine-tuning) 용어 설명 | AI Trends
rejection-fine-tuning
거부 미세 조정
고급
생성된 결과물 중 품질이 낮은 데이터를 제외하고 우수한 데이터만 선별하여 모델을 미세 조정하는 기법으로, 정책의 효율성과 안정성을 높인다.
비슷한 개념
rejection-sampling
refusal-calibration
online-finetuning
on-policy-fine-tuning
rft
refusal-behavior
raft
reinforcement-fine-tuning
← 용어 사전 전체 보기