어텐션 매칭
MIT 연구진이 개발한 KV 캐시 압축 기법으로, 어텐션 출력과 질량이라는 수학적 특성을 보존하며 메모리를 줄인다. 기존 학습 기반 방식보다 훨씬 빠르면서도 높은 정확도를 유지한다.