벤치마크 최적화
모델이 실제 성능보다 벤치마크 점수를 높이는 데 과도하게 최적화된 현상을 일컫는 용어이다. 본 영상에서는 DeepSeek V4가 지표상으로는 우수하나 실제 창의적 작업에서는 기대에 못 미치는 현상을 설명할 때 사용된다.