본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
소프트웨어 엔지니어링 벤치마크 (swe-benchmark) 용어 설명 | AI Trends
swe-benchmark
소프트웨어 엔지니어링 벤치마크
중급
AI 모델이 실제 소프트웨어 개발 과제를 얼마나 잘 수행하는지 측정하는 지표로, 코드 수정 및 버그 해결 능력을 평가한다.
비슷한 개념
swe-bench-verified
swe-bench
swe-bench-lite
benchmarks
swe-bench-pro
benchmarking
evals
cybersecurity-benchmarks
← 용어 사전 전체 보기