추적 분석
에이전트가 수행한 모든 단계와 도구 호출, 의사결정 과정을 기록하고 분석하는 기법이다. 다단계 작업에서 어느 지점에서 오류가 발생하고 전파되었는지 파악하는 데 사용된다.
모델 변경 없이 코딩 에이전트 성능을 13.7% 끌어올린 하네스 엔지니어링의 비밀
벤치마크 점수가 전부는 아니다: 실전 AI 에이전트 성능을 측정하는 3대 핵심 지표