지연 상호작용
쿼리와 문서의 토큰별 임베딩을 독립적으로 생성한 후, 검색 시점에 이들 간의 모든 쌍에 대해 유사도를 계산하는 방식이다. 단일 벡터 임베딩보다 계산량은 많지만 훨씬 정밀한 검색이 가능하다.
어텐션 기반 압축으로 멀티모달 검색 비용과 성능을 동시에 잡다
텍스트 추출 없이 PDF 레이아웃 그대로 검색하는 ColPali 구현 가이드