본문으로 건너뛰기
RLHF가 AI를 '진실'보다 '만족'에 최적화시키는 방식 | AI Trends