SWE-chat
Claude Code와 같은 코딩 에이전트의 실제 작업 세션 트랜스크립트를 모아놓은 데이터셋이다. 에이전트와 사용자 간의 상호작용, 성공률, 코드 기여도 등을 분석하여 AI의 개발 역량을 평가하는 데 사용된다.