본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
AI 피드백 기반 강화학습 (rlaif) 용어 설명 | AI Trends
rlaif
AI 피드백 기반 강화학습
중급
인간 대신 성능이 뛰어난 AI 모델이 다른 모델의 응답을 평가하고 피드백을 주어 학습시키는 방식으로, 비용 효율성과 확장성이 매우 높다.
비슷한 개념
rlhf
reward-modeling
group-based-rl
mbrl
contrastive-feedback
simulator-based-learning
ai-as-a-judge
rft
← 용어 사전 전체 보기