활성화 언어화기
NLA의 핵심 모듈로, 모델 내부의 고차원 활성화 벡터를 입력받아 그 의미를 설명하는 자연어 텍스트를 생성한다. 강화학습을 통해 재구성 손실을 최소화하도록 훈련되어 모델이 특정 시점에 무엇을 '생각'하는지 텍스트로 출력한다.