본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
소프트웨어 엔지니어링 벤치마크 (swe-bench-verified) 용어 설명 | AI Trends
swe-bench-verified
소프트웨어 엔지니어링 벤치마크
중급
실제 GitHub 이슈를 해결하는 능력을 통해 AI 모델의 실질적인 코딩 및 소프트웨어 개발 역량을 검증하는 지표이다.
비슷한 개념
swe-benchmark
swe-bench
swe-bench-lite
swe-bench-pro
benchmarks
benchmarking
cybersecurity-benchmarks
evals
← 용어 사전 전체 보기