카나리 입력
시스템의 정상 작동 여부를 지속적으로 모니터링하기 위해 투입하는 대표적인 테스트 데이터셋이다. 에이전트의 출력을 기저선(Baseline)과 비교함으로써 모델 업데이트나 프롬프트 변경으로 인한 미세한 성능 저하를 조기에 감지하는 역할을 한다.