본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

humaneval

휴먼이밸

입문

OpenAI가 공개한 Python 코드 생성 능력 평가용 벤치마크이다. 모델이 주어진 함수 설명과 시그니처를 보고 코드를 완성하는 능력을 측정하며, 코딩 관련 LLM의 성능을 판단하는 업계 표준 지표 중 하나로 쓰인다.

비슷한 개념

benchmarks a-code-llm-bench automated-benchmark benchmarking livecodebench polyglot-benchmark human-eval swe-benchmark

← 용어 사전 전체 보기