비전 파운데이션 모델
방대한 이미지 데이터로 사전 학습되어 다양한 시각 작업에 범용적으로 사용 가능한 대형 모델이다. DINOv2나 CLIP 등이 대표적이며, 강력한 시각적 특징 추출 능력을 갖추고 있어 다양한 하위 작업(Downstream Tasks)으로의 전이가 용이하다.