라이브코드벤치
실시간으로 업데이트되는 코딩 문제를 통해 LLM의 실제 코딩 능력을 평가하는 벤치마크 시스템이다. 학습 데이터 오염 문제를 방지하고 모델의 최신 문제 해결 능력을 측정한다.