Sparse Tensor Core
NVIDIA의 Semi-structured sparsity를 지원하는 전용 실행 경로로, 2:4와 같은 패턴의 연산을 하드웨어 차원에서 가속하고 nnz를 절반으로 줄이되 기억접근 패턴을 규칙적으로 유지한다.