휴먼이밸
OpenAI가 공개한 Python 코드 생성 능력 평가용 벤치마크이다. 모델이 주어진 함수 설명과 시그니처를 보고 코드를 완성하는 능력을 측정하며, 코딩 관련 LLM의 성능을 판단하는 업계 표준 지표 중 하나로 쓰인다.