단일 의미 특징
하나의 신경망 유닛이나 방향이 오직 하나의 명확한 개념에만 반응하는 상태를 의미한다. SAE를 통해 추출된 이러한 특징들은 모델이 특정 결정을 내린 이유를 직관적으로 파악할 수 있게 한다.