본문으로 건너뛰기
그룹 상대 정책 최적화 (grpo) 용어 설명 | AI Trends