DA-Code
DA-Code는 데이터 사이언스 워크플로우를 다루는 엔드-투-엔드 에이전트 평가 벤치마크로, 데이터 정리·탐색 분석·모형 작성 및 다중 파일 코드 실행을 포함하며, 샌드박스 환경에서 결과를 ground-truth와 비교해 평가한다.