평가 워크플로
AI 모델의 출력이 사전에 정의된 기준이나 정답과 일치하는지 검증하는 일련의 프로세스이다. 모델의 오류나 환각을 잡아내기 위해 자동화된 지표나 인간의 검토를 포함하며 시스템의 신뢰성을 확보하는 핵심 역할을 한다.