허브 마진화
심층 비전 트랜스포머(ViT)에서 레이어가 깊어질수록 특정 정보가 과도하게 섞이거나 소실되어 오히려 성능이 저하되는 현상이다. 모델 크기가 커질 때 견고성이 비단조적으로 변하는 원인으로 지목된다.