인덱스 공유
IndexShare는 희소 어텐션의 상위-토큰 인덱스를 다수의 레이어 그룹 간에 재사용하도록 설계된 기법으로, 각 레이어에서 중복 계산되는 토큰의 수를 줄이고, 그룹 간에 공유되는 인덱스 구조를 통해 긴 맥락에서의 추론 비용과 메모리 대역폭 사용을 감소시키는 것이 핵심이다.