기억은 어디로 갔을까: Engram과 Claude를 함께 사용한 2주간의 기록

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

Claude Code의 기본 메모리 시스템인 MEMORY.md는 정적인 사실 저장에는 유용하지만, 결론에 도달하기까지의 추론 과정이나 기각된 대안 같은 동적인 맥락을 유지하는 데 한계가 있다. Weaviate는 이를 해결하기 위해 벡터 검색 기술을 기반으로 세션 간 맥락을 연결하는 메모리 제품인 Engram을 개발했다. 2주간의 실전 테스트 결과, Engram은 과거 의사결정의 배경을 복원하는 '의사결정 고고학' 작업에서 30% 빠른 속도와 높은 정확도를 보였다. 다만 모델이 스스로 도구를 호출하게 하는 방식은 지연 시간과 모델의 편향으로 인해 한계가 있으며, 인프라 레벨에서 자동으로 컨텍스트를 주입하는 방식이 더 효과적임이 확인됐다.

배경

벡터 데이터베이스 및 벡터 검색의 기본 개념, Claude Code 또는 유사한 LLM CLI 도구 사용 경험, MCP(Model Context Protocol)에 대한 이해

대상 독자

LLM 에이전트 및 코딩 보조 도구를 개발하거나 프로덕션에 도입하려는 엔지니어

의미 / 영향

이 아티클은 LLM의 컨텍스트 윈도우가 커지더라도 세션 간의 '추론 맥락'을 유지하기 위해서는 별도의 벡터 기반 메모리 인프라가 필수적임을 시사합니다. 특히 모델의 자율적 도구 호출보다는 시스템 수준의 자동 컨텍스트 주입이 에이전트의 성능과 사용자 경험을 동시에 잡을 수 있는 실질적인 해법임을 보여줍니다.

섹션별 상세

Claude Code의 기본 MEMORY.md 파일은 약 200라인의 수동 큐레이션된 컨텍스트만 수용 가능하여 복잡한 프로젝트의 전체 맥락을 담기에 부족하다. 이 파일은 안정적인 사실 위주로 저장되므로, 특정 결정이 내려진 이유나 당시 고려되었던 대안들과 같은 '추론 체인'은 유실되는 구조적 병목이 존재한다.

Engram은 Weaviate의 벡터 검색 엔진을 활용해 메모리를 주제별(통신 스타일, 도메인 맥락, 도구 선호도, 워크플로)로 구조화하여 저장한다. 이를 통해 세션이 시작될 때마다 과거의 관련 맥락을 '그라운딩'하여 불러옴으로써 사용자가 매번 배경 설명을 반복해야 하는 번거로움을 줄인다.

Native Memory와 Engram의 역할 분담을 보여주는 다이어그램 — Diagram정적인 사실을 담는 Native Memory(MEMORY.md)와 추론 체인, 기각된 대안 등을 담는 Engram의 계층 구조를 설명합니다. Engram이 '왜 결정이 내려졌는지'와 같은 동적인 맥락을 보완하는 역할을 함을 시각화합니다.

실전 평가에서 Engram은 수주 전의 제품 비전 문서를 검토할 때 단순한 사실 나열을 넘어 당시의 '프레이밍'과 문서 작성 의도를 정확히 복원해냈다. 특히 Engram이 없는 세션에서 발생한 가짜 URL 생성(할루시네이션) 현상을 Engram의 접지된 메모리 회수가 효과적으로 방지했다.

모델이 메모리 도구 사용 여부를 직접 결정하게 하는 방식은 계획 수립 단계에서 과거 데이터를 무시하고 현재 프롬프트에만 집중하는 모델의 편향 때문에 실패하기 쉽다. 또한 도구 호출로 인한 세션 시작 지연(최대 19초)과 전체적인 속도 저하(약 10%)가 사용자 경험의 장애물로 작용했다.

Engram의 세션 라이프사이클 및 저장/회수 시점을 나타낸 순환도 — Diagram세션 시작 시의 회수(Recall), 주요 순간의 저장(Triggered Saves), 정기적 저장, 세션 종료 시의 요약 저장 과정을 보여줍니다. 각 단계에서 메모리가 어떻게 관리되는지 기술적인 워크플로를 명시합니다.

향후 개선 방향은 모델의 판단에 의존하는 대신 세션 시작이나 사용자 프롬프트 전후에 인프라 단에서 자동으로 메모리를 주입하는 '결정론적 트리거' 방식으로 전환하는 것이다. 이는 Anthropic의 실험적 기능인 /dream과 유사한 방향성으로, 세션 종료 후 백그라운드에서 메모리를 정리하고 합성하는 파이프라인 구축을 포함한다.

실무 Takeaway

LLM 에이전트의 장기 기억을 위해선 정적 파일(MEMORY.md)과 동적 벡터 검색(Engram)을 병행하여 사실과 추론 과정을 분리 저장해야 한다.
에이전트가 스스로 메모리 도구를 호출하게 설계하면 비용과 지연 시간 때문에 호출을 기피하므로, 인프라 단에서 컨텍스트를 자동 주입하는 방식이 실무적으로 더 유리하다.
메모리 저장 시 2-4문장 단위의 집중된 정보로 파편화하여 저장하는 것이 긴 단락을 저장하는 것보다 검색 정확도와 모델의 파싱 효율을 높인다.

언급된 리소스

문서Engram Preview Sign up

DemoWeaviate Cloud (WCD) Free Trial