패스앳원
모델이 생성한 첫 번째 결과물이 테스트를 통과할 확률을 나타내는 평가 지표이다. AI의 코드 생성이나 문제 해결 능력을 측정할 때 가장 기본적이면서도 엄격한 척도로 사용된다.