어텐션 계층별 관련성 전파
Transformer 구조에서 출력 스코어를 입력 방향으로 역전파하여 각 Attention 헤드와 MLP의 기여도를 계산하는 기법이다. 단순 Gradient 기반 방식보다 안정적이고 충실한 설명을 제공하여 모델 최적화의 타겟으로 적합하다.