본문으로 건너뛰기
자기 증류를 통한 강화학습: SDPO 논문 심층 분석 | AI Trends