플라톤적 표현 가설
서로 다른 감각 데이터(이미지, 텍스트 등)가 실제로는 하나의 객관적인 물리적 상태 공간의 서로 다른 투영이라는 가설이다. 이 가설에 기반하여 모델은 다양한 입력을 하나의 통합된 물리적 잠재 공간으로 정렬하는 것을 목표로 한다.