핵심 요약
뉴질랜드 고객들이 현지 AWS 리전(ap-southeast-6)에서 Amazon Bedrock의 파운데이션 모델을 직접 사용할 수 있게 되었다. 오클랜드 리전을 소스 리전으로 설정하여 호주 내 리전(시드니, 멜버른) 또는 전 세계 리전의 추론 자원을 동적으로 활용하는 교차 리전 추론 기능을 지원한다. Anthropic Claude 4.5/4.6 시리즈 및 Amazon Nova 모델을 지원하며, 데이터 레지던시를 준수하는 지리적 라우팅과 성능을 극대화하는 글로벌 라우팅 옵션을 모두 제공한다. 이를 통해 뉴질랜드 현지에서 높은 처리량과 복원력을 갖춘 생성형 AI 애플리케이션 구축이 가능하다.
배경
AWS IAM 및 SCP 정책 구성 지식, Amazon Bedrock API(InvokeModel, Converse 등) 사용 경험, AWS 리전 및 서비스 할당량(Service Quotas) 개념 이해
대상 독자
뉴질랜드 및 호주 지역에서 Amazon Bedrock을 사용하여 AI 서비스를 구축하려는 클라우드 아키텍트 및 개발자
의미 / 영향
뉴질랜드 리전의 Bedrock 출시는 현지 기업들이 데이터 규제를 준수하면서도 최신 LLM을 낮은 지연 시간으로 사용할 수 있게 합니다. 특히 교차 리전 추론은 단일 리전의 자원 한계를 극복하게 하여 대규모 트래픽을 처리해야 하는 엔터프라이즈급 AI 서비스의 안정성을 크게 향상시킵니다.
섹션별 상세
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "AllowAuCrisInferenceProfile",
"Effect": "Allow",
"Action": [
"bedrock:InvokeModel",
"bedrock:InvokeModelWithResponseStream"
],
"Resource": "arn:aws:bedrock:ap-southeast-6::inference-profile/au.anthropic.claude-sonnet-4-6"
},
{
"Sid": "AllowFoundationModelViaAuCris",
"Effect": "Allow",
"Action": [
"bedrock:InvokeModel",
"bedrock:InvokeModelWithResponseStream"
],
"Resource": [
"arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-sonnet-4-6",
"arn:aws:bedrock:ap-southeast-4::foundation-model/anthropic.claude-sonnet-4-6",
"arn:aws:bedrock:ap-southeast-6::foundation-model/anthropic.claude-sonnet-4-6"
],
"Condition": {
"StringLike": {
"bedrock:InferenceProfileArn": "arn:aws:bedrock:ap-southeast-6::inference-profile/au.anthropic.claude-sonnet-4-6"
}
}
}
]
}오클랜드 리전에서 AU 지리적 교차 리전 프로필을 통해 Claude 모델을 호출하기 위한 IAM 정책 예시
{
"eventSource": "bedrock.amazonaws.com",
"eventName": "InvokeModel",
"awsRegion": "ap-southeast-6",
"requestParameters": {
"modelId": "au.anthropic.claude-sonnet-4-6"
},
"additionalEventData": {
"inferenceRegion": "ap-southeast-2"
}
}CloudTrail 로그를 통해 실제 추론이 수행된 리전(inferenceRegion)을 확인하는 방법
실무 Takeaway
- 뉴질랜드 기반 개발자는 모델 ID에 'au.' 또는 'global.' 접두사를 추가하는 것만으로 즉시 교차 리전 추론을 적용하여 API 처리량을 높일 수 있다.
- 데이터 보안이 중요한 기관은 AU 지리적 프로필을 사용하여 데이터를 ANZ 지역 네트워크 내에 유지하면서도 인접 리전의 인프라 자원을 공유할 수 있다.
- Claude 모델 사용 시 출력 토큰 가중치(5:1)를 고려하여 서비스 할당량 증설을 미리 요청해야 프로덕션 환경에서의 스로틀링을 방지할 수 있다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.