어텐션 헤드
트랜스포머 모델 내에서 입력 데이터의 특정 부분 간 관계를 계산하는 구성 요소. 이 연구에서는 특정 어텐션 헤드가 패턴 매칭을 수행하며 인간의 추론 오류를 예측하는 핵심 기제로 작용함을 밝힘.