SDE-GRPO
Stochastic-Differential-Equation 기반 GRPO로 비디오 생성의 확률적 샘플링을 가능하게 하여 로그-확률 계산과 정책 경사 계산을 가능하게 한다.