저차원 프로젝션
Retrieval Head의 연관도 예측을 위해 Q/K를 저차원 공간(r=16 등)으로 투영하는 방법으로, 이 저차원 근사로 상위 90%의 재현을 달성하되 전체 연산을 줄인다.