폴리글롯 벤치마크
다양한 프로그래밍 언어에 대한 코딩 능력을 측정하는 평가 지표이다. 모델이 여러 언어의 문법과 로직을 얼마나 정확하게 이해하고 생성하는지를 수치화하여 모델 간의 코딩 성능 순위를 결정하는 데 사용된다.