본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

hellaswag

헬라스왜그

중급

상식적 추론 능력을 측정하기 위한 벤치마크 데이터셋이다. 문장의 마지막 부분을 가장 자연스럽게 완성하는 보기를 고르는 방식으로 모델의 실질적인 문맥 이해도를 평가한다.

비슷한 개념

benchmark-dataset lm-eval benchmarking longbench longbench-v2 gaia-benchmark benchmarks mnli

← 용어 사전 전체 보기