본문으로 건너뛰기

vit-b-16

비전 트랜스포머 베이스 16

중급

이미지를 16x16 크기의 패치로 나누어 트랜스포머 아키텍처로 처리하는 비전 모델이다. 베이스(Base) 규모의 파라미터를 가지며 이미지의 전역적인 문맥을 파악하는 데 유리하다. 다양한 컴퓨터 비전 작업에서 표준적인 벤치마크 모델로 널리 사용된다.