vit-b-16
비전 트랜스포머 베이스 16
이미지를 16x16 크기의 패치로 나누어 트랜스포머 아키텍처로 처리하는 비전 모델이다. 베이스(Base) 규모의 파라미터를 가지며 이미지의 전역적인 문맥을 파악하는 데 유리하다. 다양한 컴퓨터 비전 작업에서 표준적인 벤치마크 모델로 널리 사용된다.
비전 트랜스포머 베이스 16
이미지를 16x16 크기의 패치로 나누어 트랜스포머 아키텍처로 처리하는 비전 모델이다. 베이스(Base) 규모의 파라미터를 가지며 이미지의 전역적인 문맥을 파악하는 데 유리하다. 다양한 컴퓨터 비전 작업에서 표준적인 벤치마크 모델로 널리 사용된다.