이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
Managed Agents는 Claude 플랫폼에서 장기 실행 에이전트를 안정적으로 구동하기 위한 호스팅 서비스이다. 기존에는 에이전트 실행 로직(Harness)과 실행 환경(Sandbox)이 단일 컨테이너에 결합되어 있어 장애 복구와 확장이 어려웠으나, 이를 세션, 하네스, 샌드박스로 가상화하여 분리했다. 이러한 디커플링을 통해 하네스가 실패해도 세션 로그를 통해 즉시 복구가 가능하며, 필요한 시점에만 샌드박스를 프로비저닝하여 초기 지연 시간을 대폭 줄였다. 실제 적용 결과 p95 TTFT가 90% 이상 감소하는 성능 향상을 확인했다. 이 아키텍처는 미래의 더 똑똑해질 모델과 다양한 실행 환경에 유연하게 대응할 수 있는 '메타 하네스' 역할을 수행한다.
의미 / 영향
에이전트 시스템이 단순한 스크립트 수준을 넘어 운영체제와 같은 추상화 계층을 갖추기 시작했음을 의미하며, 이는 대규모 엔터프라이즈 환경에서 AI 에이전트의 안정적 운영을 위한 표준 아키텍처가 될 가능성이 높다.
섹션별 상세
가상화를 통한 에이전트 구성 요소의 분리
운영체제가 하드웨어를 프로세스와 파일로 추상화한 것처럼, Managed Agents는 에이전트의 구성 요소를 세션, 하네스, 샌드박스로 가상화했다. 세션은 모든 사건의 추가 전용 로그를 담당하고, 하네스는 Claude 호출 및 도구 라우팅 루프를 관리하며, 샌드박스는 코드 실행 환경을 제공한다. 이러한 인터페이스 중심 설계는 내부 구현이 변경되더라도 상위 추상화 계층을 안정적으로 유지할 수 있게 한다. 이를 통해 특정 모델이나 환경에 종속되지 않는 유연한 시스템 구축이 가능해졌다.
- •세션(Session): 모든 발생 사건의 append-only 로그
- •하네스(Harness): Claude 호출 및 도구 호출 라우팅 루프
- •샌드박스(Sandbox): 코드 실행 및 파일 편집 환경
결합된 설계에서 발생하는 인프라 문제 해결
초기 설계에서는 모든 구성 요소를 단일 컨테이너에 배치했으나, 이는 컨테이너 실패 시 세션 데이터가 손실되는 '애완동물(Pets)' 문제를 야기했다. 장애 발생 시 내부 상태를 디버깅하기 어려웠고, 고객의 VPC 환경에 연결할 때 네트워크 피어링이나 하네스 직접 실행이 강제되는 제약이 있었다. 이를 해결하기 위해 '뇌(Claude와 하네스)'를 '손(샌드박스와 도구)' 및 '세션(로그)'으로부터 완전히 분리했다. 이제 하네스는 컨테이너 외부에서 표준화된 인터페이스를 통해 도구를 호출한다.
- •컨테이너 실패 시 세션이 손실되는 Pets-vs-Cattle 문제 발생
- •하네스와 샌드박스 분리로 execute(name, input) -> string 인터페이스 도입
- •장애 발생 시 provision({resources}) 명령으로 표준 레시피 기반 새 컨테이너 초기화 가능
보안 경계 강화 및 자격 증명 관리
기존의 결합된 설계에서는 Claude가 생성한 신뢰할 수 없는 코드가 자격 증명과 동일한 컨테이너에서 실행되어 프롬프트 인젝션 공격에 취약했다. 새로운 아키텍처에서는 자격 증명을 샌드박스 외부의 보안 저장소(Vault)에 보관하여 Claude가 직접 접근할 수 없도록 구조적으로 차단했다. Git 작업의 경우 초기화 시점에만 토큰을 사용하여 클론하고, 커스텀 도구는 MCP 프록시를 통해 세션 토큰으로 인증을 수행한다. 하네스는 어떠한 자격 증명 정보도 인지하지 못하도록 설계되어 보안성을 높였다.
- •샌드박스 내에서 자격 증명(Tokens) 접근을 구조적으로 차단
- •MCP(Model Context Protocol)를 통한 보안 프록시 기반 도구 호출 지원
- •OAuth 토큰은 보안 Vault에 저장되어 하네스에 노출되지 않음
컨텍스트 엔지니어링과 세션 로그 활용
장기 실행 작업은 모델의 컨텍스트 창을 초과하는 경우가 많으며, 기존의 압축(Compaction) 방식은 정보 손실의 위험이 있었다. Managed Agents는 세션 로그 자체를 컨텍스트 창 외부의 객체로 활용하여 필요할 때마다 특정 구간의 이벤트를 다시 읽어올 수 있게 한다. getEvents() 인터페이스를 통해 하네스는 과거 이벤트를 유연하게 조회하고 변환하여 모델에 전달할 수 있다. 이는 미래 모델의 요구사항에 맞춰 컨텍스트 관리 로직을 자유롭게 변경할 수 있는 기반이 된다.
- •getEvents() 인터페이스로 이벤트 스트림의 특정 위치 슬라이싱 조회 가능
- •세션 로그를 컨텍스트 창 외부의 영구 저장소로 활용
- •프롬프트 캐시 적중률 향상을 위한 하네스 차원의 컨텍스트 조직화 지원
성능 최적화 및 확장성 확보
뇌와 손을 분리함으로써 모든 세션이 컨테이너 프로비저닝을 기다릴 필요가 없어져 초기 지연 시간이 획기적으로 개선되었다. 샌드박스가 실제로 필요한 도구 호출 시점에만 컨테이너를 할당하므로, 단순 추론만 수행하는 세션은 즉시 응답이 가능하다. 이 아키텍처 도입 후 p50 TTFT는 약 60%, p95 TTFT는 90% 이상 감소하는 성과를 거두었다. 또한 하나의 뇌가 여러 개의 독립적인 샌드박스(손)를 제어하거나 뇌끼리 손을 전달하는 다중 에이전트 시나리오로의 확장이 용이해졌다.
- •p50 TTFT(Time-to-First-Token) 약 60% 감소
- •p95 TTFT 90% 이상 감소
- •상태가 없는(Stateless) 하네스를 다수 실행하여 수평적 확장 가능
실무 Takeaway
- 에이전트 아키텍처 설계 시 하네스(로직)와 샌드박스(환경)를 분리하면 시스템 복원력과 디버깅 효율을 극대화할 수 있다.
- 도구 호출 시점에만 실행 환경을 프로비저닝하는 지연 할당 방식을 통해 p95 TTFT를 최대 90%까지 단축 가능하다.
- 자격 증명을 실행 환경 외부의 Vault와 프록시로 격리함으로써 프롬프트 인젝션으로부터 보안 경계를 보호해야 한다.
- 세션 로그를 컨텍스트 창 외부의 영구 객체로 취급하여 모델의 컨텍스트 한계를 극복하고 유연한 재조회가 가능하다.
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
수집 2026. 04. 09.출처 타입 WEB
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.