기계론적 해석 가능성
AI 모델 내부의 뉴런과 연결 구조를 분석하여 특정 출력이나 행동이 발생하는 논리적 과정을 이해하려는 연구 분야이다. 모델의 블랙박스를 열어 안전성을 검증하는 핵심 기술이다.