항등 매핑 편향
Transformer 모델이 입력받은 토큰을 출력에서 그대로 복사하려는 경향이다. 잔차 연결과 가중치 공유 구조에서 기인하며, 텍스트 수정 작업에서 정확한 부분을 보존하는 데 유리하다.