시각적 누출
다중 모달 질의에서 시각 입력만으로도 정답이 가능해 모델의 실제 omni-modal 이해를 왜곡하는 현상이다. 이 현상은 벤치마크의 원래 점수에 시각 정보의 강한 영향력을 남겨 두며, 시각적 편향 제거가 필요한 주된 이유를 제공한다.