본문으로 건너뛰기
온폴리시 최적화 (on-policy-optimization) 용어 설명 | AI Trends