MNLI 벤치마크
MNLI는 다중 장르 자연어 추론 벤치마크로, 문장 간 관계 추론의 일반화 성능을 다양한 도메인에서 측정하는 표준 데이터셋이다. 모델의 판단 능력과 일반화 여부를 평가하는 핵심 지표로 활용된다.