평가 및 트레이싱
AI 모델의 응답 품질을 정량적으로 측정(Evals)하고 실행 과정을 단계별로 기록하여 분석(Tracing)하는 과정이다. 프로덕션 환경에서 에이전트의 신뢰성을 확보하기 위한 필수적인 MLOps 요소이다.