BridgeBench 벤치마크
BridgeBench는 모델의 여러 작업별 성능을 동일한 데이터·절차로 비교하기 위해 사용되는 벤치마크로서, 입력 문제를 각 모델에 투입해 0-100 점수로 정량화한 후 버전 간 차이를 계산하여 성능 변화를 평가하는 데 사용된다.