본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티

홈 트렌딩 검색 커뮤니티 프로필

LLM 벤치마크 (llm-benchmark) 용어 설명 | AI Trends

llm-benchmark

LLM 벤치마크

중급

대형 언어 모델의 성능을 특정 기준에 따라 측정하고 비교하는 테스트 세트이다. 본문에서는 'Baldur's Gate' 게임 지식을 테스트하기 위해 'BaldurBench'라는 임의의 벤치마크를 생성하여 모델들을 비교했다.

비슷한 개념

benchmarks benchmarking llm-ranking longbench-v2 lm-eval evals benchmark textarena

← 용어 사전 전체 보기