구글, 벡터 DB 없는 지속성 메모리 AI 에이전트 오픈소스 공개

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

구글의 시니어 AI 제품 매니저 Shubham Saboo가 에이전트 설계의 난제인 지속성 메모리 문제를 해결하기 위해 'Always On Memory Agent'를 오픈소스로 공개했다. 이 시스템은 전통적인 벡터 데이터베이스나 임베딩 없이 LLM이 직접 정보를 읽고 생각하며 SQLite에 구조화된 메모리를 저장하는 방식을 채택했다. 최신 저비용 모델인 Gemini 3.1 Flash-Lite를 기반으로 하여 24시간 가동되는 에이전트의 경제성을 확보했으며, 구글의 에이전트 개발 키트(ADK)를 활용해 구축되었다. 이는 에이전트가 단순한 프롬프트를 넘어 배포 가능한 소프트웨어 시스템으로 진화하고 있음을 보여주지만, 동시에 배경 메모리 통합에 따른 거버넌스와 컴플라이언스 이슈라는 새로운 과제를 던지고 있다.

배경

LLM 에이전트 기본 개념, RAG 및 벡터 검색에 대한 이해, SQL 데이터베이스 기초

대상 독자

엔터프라이즈 AI 에이전트 개발자 및 아키텍트

의미 / 영향

에이전트가 단순한 챗봇을 넘어 장기적인 문맥을 이해하는 소프트웨어 시스템으로 진화하고 있음을 시사한다. 특히 벡터 DB 없는 아키텍처는 인프라 단순화의 새로운 방향을 제시하지만, 기업 환경에서는 메모리 거버넌스가 기술적 성능만큼이나 중요한 도입 장벽이 될 것이다.

섹션별 상세

구글은 MIT 라이선스로 상업적 이용이 가능한 'Always On Memory Agent'를 GitHub에 공개했다. 이 프로젝트는 2025년 출시된 구글의 에이전트 개발 키트(ADK)와 2026년 3월 발표된 초고속 저비용 모델 Gemini 3.1 Flash-Lite를 기반으로 한다. 텍스트, 이미지, 오디오, 비디오, PDF 등 다양한 입력을 지속적으로 수집하고 배경에서 이를 통합하여 나중에 검색할 수 있는 실무적인 참조 구현체 역할을 한다.

이 에이전트의 핵심 차별점은 벡터 데이터베이스와 임베딩을 전혀 사용하지 않는다는 점이다. 대신 LLM이 직접 데이터를 분석하여 SQLite에 구조화된 형태로 저장하며, 기본적으로 30분마다 메모리 통합(Consolidation) 작업을 수행한다. 이러한 설계는 임베딩 파이프라인과 인덱싱 동기화 등 전통적인 검색 스택의 운영 복잡성을 줄여주며, 성능의 초점을 벡터 검색 오버헤드에서 모델의 추론 지연 시간과 메모리 압축 로직으로 전환시킨다.

Gemini 3.1 Flash-Lite는 24시간 상주하는 메모리 에이전트의 경제적 타당성을 제공한다. 100만 입력 토큰당 0.25달러, 출력 토큰당 1.50달러의 저렴한 가격으로 책정되었으며, Gemini 2.5 Flash 대비 첫 토큰 생성 속도가 2.5배 빠르고 출력 속도는 45% 향상되었다. 이러한 고속·저비용 특성은 주기적으로 메모리를 재판독하고 통합해야 하는 상시 가동 서비스에 필수적인 요소다.

업계 전문가들은 지속성 메모리 도입에 따른 거버넌스와 안전성 문제를 지적하고 있다. 에이전트가 배경에서 메모리를 통합하고 교차 참조하는 과정에서 결정론적 경계가 모호해질 경우 컴플라이언스 위반이나 '메모리 드리프트(Drift)' 현상이 발생할 수 있다는 우려다. 누가 메모리를 쓸 수 있는지, 보존 및 삭제 정책은 무엇인지, 그리고 에이전트가 학습한 내용을 어떻게 감사(Audit)할 것인지가 엔터프라이즈 도입의 핵심 쟁점이 될 전망이다.

실무 Takeaway

소규모 또는 중간 규모의 메모리가 필요한 에이전트 구축 시, 벡터 DB 대신 LLM과 구조화된 SQL 저장소를 결합하여 인프라 복잡성과 비용을 낮출 수 있다.
Gemini 3.1 Flash-Lite와 같은 고속·저비용 모델을 활용하면 배경에서 지속적으로 데이터를 처리하고 메모리를 관리하는 'Always On' 아키텍처의 운영비를 최적화할 수 있다.
지속성 메모리를 갖춘 에이전트를 프로덕션에 도입할 때는 메모리 보존 기간, 데이터 격리, 감사 로그 등 거버넌스 프레임워크를 우선적으로 설계해야 한다.

언급된 리소스

GitHubAlways On Memory Agent GitHub Repository