시그마 보상
모델이 데이터 재구성(Reconstruction)에 낭비하는 파라미터를 의미한다. 이 수치가 0에 수렴할수록 네트워크 전체가 재구성이 아닌 순수 인지 작업에 집중할 수 있어, 훨씬 적은 파라미터로도 거대 모델 수준의 지능을 구현할 수 있다는 이론적 근거가 된다.