OmniBoost
Qwen2.5-Omni-3B 베이스를 시작점으로 한 3단계 포스트 트레이닝 파이프라인으로, mixed bi-modal SFT, mixed-modality RLVR, self-distillation SFT를 순차적으로 적용하여 omni-modal 성능을 향상시키는 방법이다.