비전 트랜스포머
자연어 처리의 트랜스포머 아키텍처를 이미지 처리에 적용한 모델이다. 대규모 데이터셋에서는 강력하지만 소규모 데이터셋에서는 CNN보다 성능이 떨어지는 경향이 있다.
DINOv3와 YOLOv12의 만남: 소규모 데이터셋에서도 강력한 객체 탐지
맥북으로 26분 만에 CIFAR-10 정복? 새로운 Wave Field 모델 등장