vit-h
Vision Transformer 아키텍처 중 가장 큰 파라미터 규모를 가진 모델로, SAM에서 가장 높은 정밀도의 세그멘테이션 성능을 제공하는 체크포인트이다.
클릭 한 번으로 정교한 마스크 생성: SAM ViT-H 활용 가이드
SAM과 Python으로 구현하는 고성능 자동 이미지 세그멘테이션