콜팔리
ColPali는 Vision Transformer 기반의 언어 모델을 활용하여 PDF 페이지를 텍스트 추출 없이 이미지 그대로 이해하고 검색하는 모델이다. 각 페이지의 시각적 특징을 멀티 벡터로 인코딩하여 레이아웃과 도표 정보를 보존하며, 이는 기존 텍스트 기반 RAG의 정보 손실 문제를 해결하는 핵심 기술이다.