신경 표상
모델이 학습한 데이터 속의 추상적인 개념(사랑, 공포 등)이 신경망 내부의 특정 뉴런 활성화 조합으로 저장된 형태를 말한다. 특정 입력값이 주어졌을 때 일정한 뉴런 그룹이 함께 반응하는 패턴을 통해 모델이 해당 개념을 어떻게 이해하고 분류하는지 확인할 수 있다.