Managed Agents 설계: 장기 실행 에이전트를 위한 하네스 디자인

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

Managed Agents는 Claude 플랫폼에서 장기 실행 에이전트를 안정적으로 구동하기 위한 호스팅 서비스이다. 기존에는 에이전트 실행 로직(Harness)과 실행 환경(Sandbox)이 단일 컨테이너에 결합되어 있어 장애 복구와 확장이 어려웠으나, 이를 세션, 하네스, 샌드박스로 가상화하여 분리했다. 이러한 디커플링을 통해 하네스가 실패해도 세션 로그를 통해 즉시 복구가 가능하며, 필요한 시점에만 샌드박스를 프로비저닝하여 초기 지연 시간을 대폭 줄였다. 실제 적용 결과 p95 TTFT가 90% 이상 감소하는 성능 향상을 확인했다. 이 아키텍처는 미래의 더 똑똑해질 모델과 다양한 실행 환경에 유연하게 대응할 수 있는 '메타 하네스' 역할을 수행한다.

의미 / 영향

에이전트 시스템이 단순한 스크립트 수준을 넘어 운영체제와 같은 추상화 계층을 갖추기 시작했음을 의미하며, 이는 대규모 엔터프라이즈 환경에서 AI 에이전트의 안정적 운영을 위한 표준 아키텍처가 될 가능성이 높다.

섹션별 상세

가상화를 통한 에이전트 구성 요소의 분리

운영체제가 하드웨어를 프로세스와 파일로 추상화한 것처럼, Managed Agents는 에이전트의 구성 요소를 세션, 하네스, 샌드박스로 가상화했다. 세션은 모든 사건의 추가 전용 로그를 담당하고, 하네스는 Claude 호출 및 도구 라우팅 루프를 관리하며, 샌드박스는 코드 실행 환경을 제공한다. 이러한 인터페이스 중심 설계는 내부 구현이 변경되더라도 상위 추상화 계층을 안정적으로 유지할 수 있게 한다. 이를 통해 특정 모델이나 환경에 종속되지 않는 유연한 시스템 구축이 가능해졌다.

Managed Agents의 4가지 핵심 구성 요소 다이어그램 — Diagram중앙의 하네스(Harness)를 중심으로 세션(Session), 도구/리소스(Tools/MCP), 샌드박스(Sandbox), 오케스트레이션(Orchestration)이 상호작용하는 구조를 보여준다. 각 컴포넌트 간의 화살표는 데이터 흐름과 제어권을 나타낸다.

각 컴포넌트별 인터페이스 정의 및 구현 예시 표 — InfographicSession, Orchestration, Harness, Sandbox 등 각 구성 요소가 가져야 할 의사코드 형태의 인터페이스와 이를 충족할 수 있는 기술 스택(Postgres, Cron job 등)을 상세히 나열한다.

결합된 설계에서 발생하는 인프라 문제 해결

초기 설계에서는 모든 구성 요소를 단일 컨테이너에 배치했으나, 이는 컨테이너 실패 시 세션 데이터가 손실되는 '애완동물(Pets)' 문제를 야기했다. 장애 발생 시 내부 상태를 디버깅하기 어려웠고, 고객의 VPC 환경에 연결할 때 네트워크 피어링이나 하네스 직접 실행이 강제되는 제약이 있었다. 이를 해결하기 위해 '뇌(Claude와 하네스)'를 '손(샌드박스와 도구)' 및 '세션(로그)'으로부터 완전히 분리했다. 이제 하네스는 컨테이너 외부에서 표준화된 인터페이스를 통해 도구를 호출한다.

세션과 하네스 간의 이벤트 통신 구조 — Diagram하네스가 세션으로부터 이벤트를 가져오고(getEvents) 새로운 이벤트를 발행(Events)하는 상호작용 과정을 시각화하여 상태 보존 방식을 설명한다.

보안 경계 강화 및 자격 증명 관리

기존의 결합된 설계에서는 Claude가 생성한 신뢰할 수 없는 코드가 자격 증명과 동일한 컨테이너에서 실행되어 프롬프트 인젝션 공격에 취약했다. 새로운 아키텍처에서는 자격 증명을 샌드박스 외부의 보안 저장소(Vault)에 보관하여 Claude가 직접 접근할 수 없도록 구조적으로 차단했다. Git 작업의 경우 초기화 시점에만 토큰을 사용하여 클론하고, 커스텀 도구는 MCP 프록시를 통해 세션 토큰으로 인증을 수행한다. 하네스는 어떠한 자격 증명 정보도 인지하지 못하도록 설계되어 보안성을 높였다.

컨텍스트 엔지니어링과 세션 로그 활용

장기 실행 작업은 모델의 컨텍스트 창을 초과하는 경우가 많으며, 기존의 압축(Compaction) 방식은 정보 손실의 위험이 있었다. Managed Agents는 세션 로그 자체를 컨텍스트 창 외부의 객체로 활용하여 필요할 때마다 특정 구간의 이벤트를 다시 읽어올 수 있게 한다. getEvents() 인터페이스를 통해 하네스는 과거 이벤트를 유연하게 조회하고 변환하여 모델에 전달할 수 있다. 이는 미래 모델의 요구사항에 맞춰 컨텍스트 관리 로직을 자유롭게 변경할 수 있는 기반이 된다.

성능 최적화 및 확장성 확보

뇌와 손을 분리함으로써 모든 세션이 컨테이너 프로비저닝을 기다릴 필요가 없어져 초기 지연 시간이 획기적으로 개선되었다. 샌드박스가 실제로 필요한 도구 호출 시점에만 컨테이너를 할당하므로, 단순 추론만 수행하는 세션은 즉시 응답이 가능하다. 이 아키텍처 도입 후 p50 TTFT는 약 60%, p95 TTFT는 90% 이상 감소하는 성과를 거두었다. 또한 하나의 뇌가 여러 개의 독립적인 샌드박스(손)를 제어하거나 뇌끼리 손을 전달하는 다중 에이전트 시나리오로의 확장이 용이해졌다.