완전 일치
모델의 출력이 정답과 토큰 단위까지 정확히 일치하는지를 측정하는 평가 지표이다. 부분 점수 없이 엄격한 정확도 판별이 필요한 코드 생성이나 논리 작업에서 주로 사용된다.
GPT-2 vs Hyena: 하이브리드 아키텍처가 성능 격차를 줄이는 방법