본문으로 건너뛰기

vit

비전 트랜스포머

중급

자연어 처리의 트랜스포머 아키텍처를 이미지 처리에 적용한 모델이다. 대규모 데이터셋에서는 강력하지만 소규모 데이터셋에서는 CNN보다 성능이 떨어지는 경향이 있다.