추론 오프로딩
추론 오프로딩은 로컬 기기의 연산 성능이 부족할 때 부하가 큰 AI 모델의 추론 과정을 외부 서버나 클라우드 GPU로 보내 처리하는 방식이다. 이를 통해 사용자는 고가의 하드웨어 없이도 네트워크 연결을 통해 최신 고성능 AI 모델의 결과물을 로컬 인터페이스에서 실시간으로 확인할 수 있다.
저사양 VRAM에서도 SAM2 실행 가능? 하이브리드 아키텍처로 구현한 RotoAI