품질 평가
정답 번역문 없이 소스 문장과 생성된 번역문만 비교하여 번역의 품질을 점수화하는 기술이다. 병렬 데이터가 부족한 상황에서 유용하지만, 모델이 문장 반복이나 언어 혼동 같은 오류에 높은 점수를 주는 취약점이 존재한다.