본문으로 건너뛰기
LongCLI-Bench: 명령줄 인터페이스에서의 장기적 에이전트 프로그래밍을 위한 기초 벤치마크 및 연구 | AI Trends