익스플로잇 벤치
AI 모델의 사이버 보안 능력을 평가하는 벤치마크로, 소프트웨어 취약점을 찾아내고 이를 공격하는 코드를 생성하는 능력을 측정한다. 모델의 위험성을 판단하는 지표로 활용되며 높은 점수는 강력한 보안 위협이 될 수 있음을 시사한다.