이산 멀티모달 토큰
텍스트, 이미지, 음성 등의 서로 다른 형태의 데이터를 공통된 불연속적 숫자 집합으로 변환한 단위입니다. 이를 통해 모델은 단일한 프레임워크 내에서 여러 매체를 동일한 방식으로 동시에 처리하고 생성할 수 있습니다.