perturbation-testing
교란 테스트
실제 환경에서 자주 발생하는 작은 변형(페이지 스타일 변경, 줌, 텍스트 표현 변경 등)을 의도적으로 도입해 모델의 강건성을 검증하는 방법으로, 단순 벤치마크 점수와 실제 성능 괴리를 드러낸다.
교란 테스트
실제 환경에서 자주 발생하는 작은 변형(페이지 스타일 변경, 줌, 텍스트 표현 변경 등)을 의도적으로 도입해 모델의 강건성을 검증하는 방법으로, 단순 벤치마크 점수와 실제 성능 괴리를 드러낸다.