평가 데이터셋
AI의 성능을 측정하기 위해 마련한 정답지 성격의 데이터 묶음이다. 과거의 우수한 코드 리뷰나 테스트 코드를 활용해 AI의 품질을 검증하는 기준이 된다.
"코드 리뷰가 3일에서 1일로?" AI 에이전트로 SDLC 생산성 극대화하는 법