본문으로 건너뛰기
WildClawBench: 실세계의 장기 에이전트 평가를 위한 벤치마크 | AI Trends