멀티벡터 임베딩
단일 텍스트나 이미지를 하나의 벡터로 표현하는 대신 여러 개의 벡터(토큰)로 나누어 표현하는 방식이다. PDF 페이지의 시각적 레이아웃이나 표 정보를 보존하는 데 유리하며 검색 시 더 세밀한 매칭이 가능하다. ColBERT와 같은 후기 상호작용 모델에서 주로 사용되는 고성능 검색 기법이다.