템플릿 붕괴
강화학습 과정에서 모델의 추론이 겉보기에는 다양해 보이지만 실제로는 입력값과 상관없이 고정된 패턴(템플릿)으로 수렴하는 현상이다. 이는 기존의 엔트로피 지표로는 감지되지 않아 모델의 신뢰성을 저해하는 주요 원인이 된다.