분산 추론
중앙화된 클라우드 대신 여러 독립 노드(예: 소비자 GPU, 엣지 노드)에서 모델 추론을 수행하는 구조다. 요청→분배→노드 추론→결과 집계로 동작하며, 검열 저항성·비용 분산·확장성 장점이 있지만 신뢰성·지연·정합성 관리가 과제다.