픽셀 임베딩
이미지의 원시 픽셀 데이터를 벡터 형태의 수치로 직접 변환하는 기술이다. 별도의 사전 학습된 시각 인코더 없이 모델이 이미지의 세부 정보를 직접 처리할 수 있게 하여 정보 손실을 최소화한다.