task-horizon
AI 모델이 단절 없이 자율적으로 수행할 수 있는 작업의 시간적 범위나 복잡도의 깊이를 의미한다. 짧은 응답을 넘어 수 시간 동안 지속되는 복잡한 워크플로우를 완수하는 능력을 측정하는 핵심 지표이다.
ML 연구 코드 버그 수정 성공률 50% 돌파한 Claude Opus