본문으로 건너뛰기
F-GRPO: 통합 후보 생성 및 랭킹을 위한 Factorized Group-Relative Policy Optimization | AI Trends