카메라 인코더
프레임별 카메라 포즈(R, t)를 소형 MLP로 임베딩하여 Diffusion Transformer 내부 특징에 주입하는 모듈로, 서로 다른 데이터셋의 포즈 품질을 분리 처리하기 위해 데이터 타입별 전용 인코더를 사용한다.