어텐션 가중치
Transformer 아키텍처에서 모델이 입력 데이터의 특정 부분에 집중하는 정도를 결정하는 메커니즘이다. 프롬프트 내의 불필요한 단어가 이 가중치를 점유하면 실제 핵심 로직에 할당될 자원이 분산되어 성능 저하를 초래한다.