곱 양자화
고차원 벡터를 여러 개의 하위 벡터로 분할하고 각 부분을 대표값(코드북)으로 치환하여 압축하는 기술이다. 768차원 벡터를 64배 이상 압축할 수 있어 10억 개 이상의 벡터 인덱스를 적은 메모리로 유지하면서 검색 성능을 확보하는 데 핵심적인 역할을 한다.