희소 오토인코딩
모델의 복잡한 활성화 상태를 해석 가능한 소수의 특징으로 분해하여 표현하는 비지도 학습 기법이다. 모델 내부의 개념들이 어떻게 저장되고 처리되는지 명확하게 식별할 수 있게 하여 해석 가능성 연구의 핵심 도구로 쓰인다.