본문으로 건너뛰기
Flash-GRPO: 한 단계 정책 최적화를 통한 비디오 확산의 효율적 정렬 | AI Trends