pass@k 지표
모델이 k개의 샘플을 생성했을 때 그중 하나라도 정답일 확률을 나타내는 지표로, 생성 모델의 탐색 능력과 정답 도달 가능성을 평가하는 데 사용된다.
DSDR: 이중 척도 다양성 정규화로 LLM 추론의 pass@k 성능 대폭 향상