아레나 AI
LMSYS Chatbot Arena로 알려진 모델 성능 평가 리더보드이다. 실제 사용자들의 블라인드 테스트를 통해 Elo 점수를 산출하며 모델의 실질적인 대화 능력을 평가하는 업계 표준으로 통한다.