글로벌 교차 리전 추론
단일 리전의 자원 한계를 넘어 전 세계 여러 AWS 리전으로 추론 요청을 지능적으로 분산하여 처리하는 기술이다. 이를 통해 특정 지역의 트래픽 폭주 시에도 높은 가용성과 처리량을 유지할 수 있으며, 대규모 AI 애플리케이션의 확장성을 보장하는 핵심 인프라 역할을 한다.