본문으로 건너뛰기

agentic-eval

에이전트 기반 평가

중급

AI 모델이 정적인 답변을 내놓는 대신, 실제 런타임 환경에서 도구를 사용하고 코드를 실행하며 문제를 해결하는 과정을 평가하는 방식입니다. 환경과의 상호작용이 필수적이므로 인프라 설정이 결과에 큰 영향을 미칩니다.