METEOR
기계 번역 및 텍스트 요약 평가를 위한 지표로, 단순 단어 일치를 넘어 유의어 매칭과 어순을 고려합니다. ROUGE-L의 한계를 보완하기 위해 WordNet을 활용한 동의어 정렬과 정밀도·재현율의 조화 평균을 계산하여 인간의 평가와 더 높은 상관관계를 보입니다.