인터리브 테스팅
두 모델의 예측 결과를 하나의 리스트로 섞어서 사용자에게 보여주는 온라인 평가 기법이다. 사용자 그룹 간의 편향을 제거하고 동일한 컨텍스트 내에서 모델 간의 우열을 가장 직접적으로 비교할 수 있게 한다.