평가 루프
AI 모델의 출력을 지속적으로 테스트하고 검증하여 성능을 측정하고 개선하는 반복적인 프로세스이다. 코딩 에이전트에서는 생성된 코드의 정확성과 안전성을 보장하기 위해 필수적이다.
AI 에이전트에게도 '실패의 고통'을 기억하는 능력이 필요하다