디노
자기지도 학습 기반의 Vision Transformer 모델로, 레이블 없이도 이미지 내 객체의 경계나 의미론적 특징을 매우 정교하게 추출한다. SLAM에서는 서로 다른 각도에서 찍힌 영상 간의 동일 지점을 찾는 특징 추출기로 활용된다.