Representation Autoencoder
프리트레인된 Vision Transformer를 이미지 토크나이저로 고정하고 디코더만 학습시키는 방식으로, 프리트레인된 표현을 재활용하는 자동인코더 프레임워크의 변형이다.