TL;DR
FaceFlash는 ArcFace로 만든 512차원 임베딩을 PCA로 축소하고 ITQ로 이진화해 64바이트 지문으로 저장하는 방식으로 인덱스 메모리를 대폭 절감했고 AVX-512의 VPOPCNTDQ 명령을 이용해 이진 코드를 빠르게 스캔한 뒤 상위 약 100개 후보에 대해 cosine 재정렬로 정확도를 회복했다. MS1MV2 데이터로 평가한 결과 100K/500K/1M 스케일에서 Recall@1 100%를 보고했고 인덱스 메모리는 각각 6.1MB, 30.5MB, 61MB로 HNSW 대비 약 48배 적은 메모리를 사용했으며 100K에서는 단일 쿼리 0.30ms, 배치 처리 27,661 QPS로 HNSW보다 더 빠르게 동작했다. 서브 500K에서는 모든 지표에서 우세했지만 1M을 넘어가면 HNSW의 O(log N) 특성상 단일 쿼리 지연에서 우세해지는 트레이드오프가 관찰되며 구현은 Rust SIMD 커널과 Python 바인딩으로 공개되어 재현과 검증이 가능하다.
섹션별 상세

언급된 도구
SIMD 커널을 포함한 핵심 검색 루틴 구현
바인딩을 통해 사용자 접근성 제공 및 통합
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.