본문으로 건너뛰기
에이전트 평가: 대화 트레이스로 시뮬레이션을 대체하고 항목 수준 평가 데이터 공개가 필요하다 | AI Trends