LLM 에이전트의 외부화: 메모리, 스킬, 프로토콜 및 하네스 엔지니어링에 대한 통합 리뷰

이 논문은 LLM 에이전트의 발전 방향이 모델 자체의 파라미터를 키우는 것에서 메모리, 스킬, 프로토콜과 같은 외부 인프라를 구축하는 '하네스 엔지니어링'으로 전환되고 있음을 체계적으로 분석한다. 이는 개발자가 더 작고 효율적인 모델로도 복잡한 작업을 안정적으로 수행할 수 있는 시스템 설계 가이드를 제공한다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

왜 중요한가

관련 Figure

#2Chart
연구의 중심이 초기의 모델 파라미터(Weights) 중심에서 프롬프팅과 RAG(Context)를 거쳐, 현재는 도구 생태계와 멀티 에이전트 오케스트레이션(Harness)으로 이동하고 있음을 증명한다.
2022년부터 2026년까지 LLM 에이전트 커뮤니티의 연구 테마 변화를 보여주는 타임라인

핵심 기여

에이전트 설계의 핵심 원칙으로서 '외부화' 개념 정립

모델 내부의 인지적 부담을 외부의 메모리, 스킬, 프로토콜로 이전하여 시스템의 신뢰성과 제어 가능성을 높이는 '외부화(Externalization)'를 에이전트 설계의 핵심 논리로 정의했다.

메모리, 스킬, 프로토콜의 3대 외부화 차원 분석

상태를 유지하는 메모리, 절차적 전문성을 갖춘 스킬, 상호작용 규약을 정의하는 프로토콜이라는 세 가지 상호보완적 요소를 통해 에이전트 아키텍처를 구조화했다.

하네스 엔지니어링(Harness Engineering) 프레임워크 제안

외부화된 모듈들을 통합하고 실행을 제어하며 관찰 가능성을 제공하는 운영 환경인 '하네스'의 설계 차원(권한, 제어, 관찰)을 체계화했다.

파라미터 기반 역량과 외부화된 역량 간의 트레이드오프 분석

지식의 갱신 주기, 재사용성, 감사 가능성 등을 기준으로 어떤 기능을 모델 내부에 둘지 아니면 외부 인프라로 뺄지 결정하는 의사결정 프레임워크를 제공한다.

핵심 아이디어 이해하기

기존의 LLM 에이전트 연구는 더 큰 모델을 만들거나 더 나은 프롬프트를 작성하는 데 집중했다. 하지만 Transformer 기반 모델은 고정된 가중치(Weights) 내에 모든 지식을 담아야 하며, 컨텍스트 윈도우(Context Window)가 제한적이고 일시적이라는 근본적인 한계가 있다. 이는 복잡하고 긴 작업에서 모델이 이전 상태를 잊거나 절차를 무시하는 신뢰성 문제로 이어진다.

이 논문은 인간이 기억을 돕기 위해 메모지를 쓰고, 복잡한 계산을 위해 계산기를 사용하는 '인지적 인공물(Cognitive Artifacts)' 개념을 LLM에 도입한다. 모델이 모든 것을 머릿속(가중치)에서 해결하게 하는 대신, 외부 저장소(Memory)에서 정보를 찾고, 검증된 도구 세트(Skill)를 선택하며, 정해진 통신 규약(Protocol)에 따라 협업하게 함으로써 작업의 성격을 '회상(Recall)'에서 '재인(Recognition)'으로 바꾼다.

결과적으로 에이전트의 지능은 모델 단독의 능력이 아니라, 모델을 둘러싼 외부 환경인 '하네스(Harness)'와의 상호작용에서 발생한다. 이는 모델이 바뀌어도 시스템의 안정성을 유지할 수 있게 하며, 특정 도메인 지식을 모델 재학습 없이도 즉각적으로 업데이트할 수 있는 구조적 유연성을 제공한다.

관련 Figure

#1Diagram
인간이 언어, 문자, 인쇄, 컴퓨팅을 통해 지능을 외부화해온 과정이 LLM 에이전트가 가중치에서 컨텍스트를 거쳐 하네스로 진화하는 과정과 평행함을 보여준다. 에이전트의 신뢰성이 모델 자체가 아닌 외부 인프라(Memory, Skill, Protocol)를 통해 확보됨을 시각화한다.
인간의 인지 외부화 역사와 LLM 에이전트의 외부화 구조를 비교한 다이어그램

방법론

에이전트 아키텍처를 Weights, Context, Harness라는 세 가지 계층으로 구분하고 각 계층의 진화 과정을 분석한다. Weights 계층은 모델 파라미터에 지식을 압축하는 단계이며, Context 계층은 RAG나 Few-shot 프롬프팅을 통해 입력단에서 지식을 주입하는 단계이다. 마지막 Harness 계층은 모델 외부의 지속적인 인프라를 통해 에이전트의 행동을 규정한다.

메모리 외부화는 Working Context, Episodic Experience, Semantic Knowledge, Personalized Memory의 네 가지 차원으로 분류된다. 각 차원은 [원시 컨텍스트 입력 → 계층적 오케스트레이션(추출, 통합, 망각) 연산 수행 → 정제된 메모리 스냅샷 출력] 과정을 거쳐 모델의 인지 부하를 줄인다. 이는 운영체제의 메모리 관리 기법을 차용하여 고정된 컨텍스트 예산 내에서 효율을 극대화한다.

스킬 외부화는 단순한 도구 호출을 넘어 '절차적 전문성'을 패키징하는 과정이다. [전문가 정의 또는 실행 궤적 추출 입력 → 스킬 아티팩트(절차, 휴리스틱, 제약 조건) 구성 → 실행 바인딩 연산]을 통해 반복 가능한 워크플로우를 생성한다. 프로토콜 외부화는 [비정형 메시지 입력 → 스키마 기반 정규화 및 권한 체크 연산 → 구조화된 인터페이스 출력]을 통해 에이전트 간 또는 에이전트-도구 간의 상호작용을 결정론적으로 제어한다.

관련 Figure

#3Diagram
중앙의 하네스를 중심으로 메모리, 스킬, 프로토콜 모듈이 궤도를 돌며 상호작용하는 구조를 보여준다. 샌드박스, 관찰 가능성, 승인 루프 등의 운영 요소가 이러한 모듈들과 하네스 코어 사이의 상호작용을 중재함을 나타낸다.
하네스 기반 LLM 에이전트의 외부화 아키텍처

주요 결과

이 논문은 특정 모델의 벤치마크 점수보다는 시스템 설계 방식에 따른 정성적, 구조적 이점을 분석한다. 외부화된 시스템은 모델 가중치에만 의존할 때보다 지식 업데이트 속도가 즉각적이며, 파인튜닝 시 발생하는 '치명적 망각(Catastrophic Forgetting)' 위험 없이 새로운 기능을 추가할 수 있다.

또한, MCP(Model Context Protocol)와 같은 표준 프로토콜을 사용할 경우 도구 사용의 오류율이 감소하고 에이전트 간의 상호운용성이 크게 향상됨을 확인했다. 하네스 계층에서 샌드박싱과 실행 격리를 도입함으로써 에이전트의 예기치 못한 부작용을 방지하고 보안성을 높일 수 있는 구조적 기반을 마련했다.

향후 과제로 '자기 진화형 하네스(Self-Evolving Harnesses)'를 제시하며, 에이전트가 스스로 자신의 메모리 정책을 수정하거나 새로운 스킬을 생성하여 저장하는 루프를 통해 시스템 전체의 성능이 지속적으로 개선될 수 있음을 논의한다.

기술 상세

에이전트 하네스는 단순한 래퍼(Wrapper)가 아니라 인지 환경(Cognitive Environment)으로 정의된다. 하네스는 에이전트 루프와 제어 흐름, 샌드박싱 및 실행 격리, 인간의 개입 및 승인 게이트, 관찰 가능성 및 구조화된 피드백, 구성 및 정책 인코딩, 컨텍스트 예산 관리라는 6가지 분석 차원을 갖는다.

메모리 시스템은 단순 저장소가 아닌 '관리되는 상태 인프라'로 작동하며, Spatio-temporal 차원(OS 스타일의 핫/콜드 스왑)과 Cognitive-functional 차원(기능별 분리)에서 리소스를 분리한다. 스킬 시스템은 '실행 프리미티브'에서 '역량 패키지'로 진화하며, 명세(Specification), 발견(Discovery), 점진적 노출(Progressive Disclosure)의 단계를 거쳐 실행 컨텍스트에 로드된다.

프로토콜은 호출 문법(Invocation Grammar), 생명주기 시맨틱(Lifecycle Semantics), 권한 및 신뢰 경계(Permission Boundaries), 발견 메타데이터(Discovery Metadata)를 외부화하여 모델이 상호작용 방식을 매번 추론해야 하는 부담을 제거한다. 이러한 외부화 요소들은 서로 결합되어 '경험 증류(Memory to Skill)', '실행 기록(Skill to Memory)', '역량 호출(Skill to Protocol)' 등의 상호작용 맵을 형성한다.

관련 Figure

#7Diagram
메모리, 스킬, 프로토콜의 상세 내용과 함께 관찰 가능성, 제어, 권한이라는 세 가지 운영 표면의 구체적인 기능(샌드박싱, 비용 제한, 구조화된 로깅 등)을 정의한다.
하네스의 6가지 설계 차원과 세부 요소

한계점

외부화는 인프라 자체의 인지적 오버헤드를 발생시킨다. 모델이 작업을 수행하는 시간보다 메모리를 검색하고 프로토콜을 해석하는 데 더 많은 에너지를 쓸 수 있는 '인지적 과부하' 위험이 존재한다. 또한 외부화된 아티팩트(메모리 독살, 악성 스킬 주입 등)를 통한 새로운 보안 공격 표면이 생성될 수 있음을 명시했다.

실무 활용

기업용 LLM 에이전트 시스템을 설계할 때 모델 성능에만 의존하지 않고 신뢰성 있는 인프라를 구축하는 가이드라인으로 활용 가능하다.

복잡한 소프트웨어 엔지니어링 에이전트의 워크플로우 및 도구 인터페이스 표준화
장기적인 사용자 상호작용이 필요한 개인화 비서 서비스의 계층적 메모리 설계
다중 에이전트 협업 시스템에서의 통신 프로토콜 및 권한 관리 체계 구축
보안이 중요한 금융/의료 도메인 에이전트의 실행 격리 및 감사 로그 시스템 설계

코드 공개 여부: 비공개

키워드

LLM 에이전트(LLM Agent)외부화(Externalization)하네스 엔지니어링(Harness Engineering)인지적 인공물(Cognitive Artifacts)메모리 시스템(Memory Systems)에이전트 프로토콜(Agent Protocols)

LLM 에이전트의 외부화: 메모리, 스킬, 프로토콜 및 하네스 엔지니어링에 대한 통합 리뷰

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

왜 중요한가

관련 Figure

핵심 기여

에이전트 설계의 핵심 원칙으로서 '외부화' 개념 정립

메모리, 스킬, 프로토콜의 3대 외부화 차원 분석

하네스 엔지니어링(Harness Engineering) 프레임워크 제안

외부화된 모듈들을 통합하고 실행을 제어하며 관찰 가능성을 제공하는 운영 환경인 '하네스'의 설계 차원(권한, 제어, 관찰)을 체계화했다.

파라미터 기반 역량과 외부화된 역량 간의 트레이드오프 분석

핵심 아이디어 이해하기

관련 Figure

방법론

관련 Figure

주요 결과

기술 상세

관련 Figure

한계점

실무 활용

기업용 LLM 에이전트 시스템을 설계할 때 모델 성능에만 의존하지 않고 신뢰성 있는 인프라를 구축하는 가이드라인으로 활용 가능하다.

복잡한 소프트웨어 엔지니어링 에이전트의 워크플로우 및 도구 인터페이스 표준화
장기적인 사용자 상호작용이 필요한 개인화 비서 서비스의 계층적 메모리 설계
다중 에이전트 협업 시스템에서의 통신 프로토콜 및 권한 관리 체계 구축
보안이 중요한 금융/의료 도메인 에이전트의 실행 격리 및 감사 로그 시스템 설계

코드 공개 여부: 비공개

LLM 에이전트의 외부화: 메모리, 스킬, 프로토콜 및 하네스 엔지니어링에 대한 통합 리뷰

핵심 요약

왜 중요한가

핵심 기여

핵심 아이디어 이해하기

방법론

주요 결과

기술 상세

한계점

실무 활용

키워드

LLM 에이전트의 외부화: 메모리, 스킬, 프로토콜 및 하네스 엔지니어링에 대한 통합 리뷰

핵심 요약

왜 중요한가

핵심 기여

핵심 아이디어 이해하기

방법론

주요 결과

기술 상세

한계점

실무 활용

키워드

관련 토론

댓글

관련 피드

관련 토론

댓글

관련 피드