ATANT 벤치마크
AI의 연속성(Continuity)을 평가하기 위한 프레임워크로, 250개의 이야기 코퍼스와 1,835개의 검증 질문을 통해 모델이 시간에 따른 상황 변화를 얼마나 정확히 재구성하는지 측정한다.