핵심 요약
Amazon Bedrock에서 기존 Nova 1 모델을 사용하는 개발자들은 더 넓은 컨텍스트 윈도우와 강화된 추론 능력이 필요하다. Amazon Nova 2 Lite는 100만 토큰의 컨텍스트와 'Extended Thinking', 내장 도구(웹 검색, 코드 인터프리터)를 도입하여 이를 해결한다. Nova 1 Lite/Pro/Premier 사용자 모두 Nova 2 Lite로의 전환을 통해 비용 효율성과 성능 향상을 동시에 꾀할 수 있다. 이 글은 API 변경 사항, 코드 예시, 새로운 기능 설정법 및 마이그레이션 체크리스트를 상세히 설명한다.
배경
AWS 계정 및 Amazon Bedrock 모델 액세스 권한, Python 및 Boto3 SDK 기초 지식, Converse API 사용 경험
대상 독자
Amazon Bedrock을 사용하여 LLM 애플리케이션을 개발 및 운영 중인 엔지니어 및 아키텍트
의미 / 영향
Nova 2 Lite의 출시는 고성능 추론 모델의 가격 장벽을 크게 낮추어, 중소규모 기업도 100만 토큰 규모의 RAG나 복잡한 에이전트 시스템을 경제적으로 구축할 수 있게 한다. 특히 내장된 웹 검색과 코드 실행 기능은 개발 복잡도를 획기적으로 줄여준다.
섹션별 상세
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
messages=[{'role': 'user', 'content': [{'text': 'Solve a complex math problem'}]}],
additionalModelRequestFields={
'reasoningConfig': {
'type': 'enabled',
'maxReasoningEffort': 'medium'
}
}
)reasoningConfig 파라미터를 사용하여 모델의 확장된 추론(Extended Thinking) 기능을 활성화하는 예시
tool_config = {
'tools': [{
'systemTool': {
'name': 'nova_grounding'
}
}]
}
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
messages=[{'role': 'user', 'content': [{'text': 'Latest news about AI'}]}],
toolConfig=tool_config
)nova_grounding 시스템 도구를 활성화하여 실시간 웹 검색 기능을 사용하는 예시
import boto3
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
system=[{'text': 'You are a helpful assistant'}],
messages=[{
'role': 'user',
'content': [{'text': 'Explain cloud computing in simple terms.'}]
}],
inferenceConfig={
'maxTokens': 1024,
'temperature': 0.7,
'topP': 0.9
}
)Amazon Bedrock Converse API를 사용하여 Nova 2 Lite 모델을 호출하는 기본 예시
실무 Takeaway
- Nova 1 Pro/Premier 사용자는 Nova 2 Lite로 전환하여 최대 7배 낮은 비용과 5배 빠른 추론 속도를 확보하면서도 더 높은 추론 성능을 얻을 수 있다.
- 복잡한 논리나 수학 문제가 포함된 워크플로우에는 reasoningConfig를 medium 또는 high로 설정하여 모델의 사고 과정을 강화하되, high 설정 시에는 inferenceConfig 블록을 제거해야 한다.
- 실시간 정보가 필요한 에이전트 구축 시 nova_grounding 도구를 활성화하여 최신 웹 데이터를 인용과 함께 응답에 포함시킬 수 있다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료