three-stage training
scalable pretraining, multi-view fine-tuning, optional personalization의 3단계로 구성된 학습 커리큘럼으로, unseen identities에 대한 일반화와 높은 재현 fidelity를 달성하는 방법이다.