GPU-내 인접 행렬
토큰 간 전이 후보를 top-k 형태로 GPU에 상주시키는 데이터 구조로, root-centered retrieval를 빠르게 수행하고 CPU-최근접 조회를 제거한다.