multivector-embedding
멀티벡터 임베딩
단일 텍스트나 이미지를 하나의 벡터로 표현하는 대신 여러 개의 벡터(토큰)로 나누어 표현하는 방식이다. PDF 페이지의 시각적 레이아웃이나 표 정보를 보존하는 데 유리하며 검색 시 더 세밀한 매칭이 가능하다. ColBERT와 같은 후기 상호작용 모델에서 주로 사용되는 고성능 검색 기법이다.
멀티벡터 임베딩
단일 텍스트나 이미지를 하나의 벡터로 표현하는 대신 여러 개의 벡터(토큰)로 나누어 표현하는 방식이다. PDF 페이지의 시각적 레이아웃이나 표 정보를 보존하는 데 유리하며 검색 시 더 세밀한 매칭이 가능하다. ColBERT와 같은 후기 상호작용 모델에서 주로 사용되는 고성능 검색 기법이다.