CrowS-Pairs
언어 모델의 사회적 편향을 측정하기 위한 벤치마크 데이터셋이다. 고정관념이 포함된 문장과 그렇지 않은 문장 쌍을 모델에게 제시하고 선택 확률을 비교하는 방식으로 작동한다. 모델의 공정성을 정량적으로 평가하는 데 필수적인 도구이다.