패치 임베딩
이미지를 작은 격자 단위(패치)로 나누고 이를 선형 변환을 통해 고차원 벡터로 투영하는 과정이다. ViT는 2D 이미지를 1D 시퀀스 데이터로 변환하여 Transformer의 입력 형식에 맞추기 위해 이 기법을 사용한다.