본문으로 건너뛰기
형식 선택 그룹 상대 정책 최적화 (fs-grpo) 용어 설명 | AI Trends