본문으로 건너뛰기

glue-benchmark

GLUE 벤치마크

중급

자연어 이해(NLU) 모델의 성능을 평가하기 위한 9개의 다양한 언어 작업 데이터셋 모음이다. 질문 답변, 감정 분석, 문장 유사도 측정 등을 포함하며, 새로운 모델이나 기법의 범용적인 언어 처리 능력을 검증하는 표준 지표로 사용된다.