웹보이저
AI 에이전트가 실제 웹 브라우저 환경에서 복잡한 명령을 얼마나 정확하게 수행하는지 측정하는 멀티모달 벤치마크이다. 컴퓨터 사용 능력을 평가하는 업계 표준 지표 중 하나이다.