맨-휘트니 U 검정
두 집단의 표본이 동일한 분포에서 나왔는지 확인하는 비모수 통계 방법이다. 프롬프트 A/B 테스트에서 두 버전 간의 성능 차이가 통계적으로 유의미한지 검증하는 데 사용된다.