커리큘럼 붕괴
자기 대결 학습 과정에서 모델이 자신의 능력 범위 내에 있는 쉬운 작업만을 반복적으로 생성하고 해결하여, 더 이상 학습이 진전되지 않고 성능이 정체되는 현상이다. 학습 분포가 모델의 현재 실력에 맞춰 고착화되는 것이 핵심 문제이다.