Pass^k
동일한 작업에 대해 k번의 시도를 수행했을 때, 모든 시도가 성공할 확률을 나타내는 지표이다. 에이전트의 일관성과 신뢰성을 측정하는 데 사용되며, k값이 커질수록 확률은 0%에 수렴한다. 실무 환경에서 에이전트가 얼마나 안정적으로 동작하는지 검증하는 엄격한 기준으로 활용된다.