평가 파이프라인
생성된 프롬프트나 모델의 응답 품질을 정량적 또는 정성적으로 측정하기 위한 자동화된 절차이다. 프롬프트 변경이 실제 성능에 미치는 영향을 체계적으로 검증하는 데 필수적이다.