MoVQGAN(movqgan)이란 무엇인가요?

Question

Accepted Answer

이미지를 이산적인 시각 토큰(Visual Token)으로 변환하고 다시 복원하는 신경망 구조이다. 고해상도 이미지를 효율적으로 처리할 수 있도록 설계되어 생성 모델의 토크나이저로 널리 사용된다.

movqgan