엘로 평점
상대적인 실력 차이를 수치화하는 방식으로, AI 모델 간의 승률을 기반으로 성능 순위를 매기는 지표이다. 챗봇 리더보드에서 모델의 실제 체감 성능을 객관적으로 비교하는 데 널리 쓰인다.