atant-benchmark
ATANT 벤치마크
AI의 연속성(Continuity)을 평가하기 위한 프레임워크로, 250개의 이야기 코퍼스와 1,835개의 검증 질문을 통해 모델이 시간에 따른 상황 변화를 얼마나 정확히 재구성하는지 측정한다.
ATANT 벤치마크
AI의 연속성(Continuity)을 평가하기 위한 프레임워크로, 250개의 이야기 코퍼스와 1,835개의 검증 질문을 통해 모델이 시간에 따른 상황 변화를 얼마나 정확히 재구성하는지 측정한다.