가중치 수정 없이 로컬 LLM에 영구적 기억과 개성을 부여하는 적응형 상태 시스템 구축기

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

SQLite와 ChromaDB를 활용한 3단계 메모리 아키텍처를 통해 로컬 LLM에 파인튜닝 없이도 지속적인 정체성과 학습된 선호도를 부여하는 시스템을 구현했다.

배경

저자는 Ollama에서 실행되는 Qwen-3-4B 모델에 모델 가중치를 수정하지 않고도 영구적인 기억, 학습된 선호도, 행동 규칙을 부여하는 '적응형 상태 시스템(Adaptive State System)'을 구축하여 공유했다. 21회의 실시간 대화 테스트를 통해 모델이 스스로 정한 정체성을 유지하고 사용자의 이름을 기억하며 학습된 규칙에 따라 반응하는 것을 확인했다.

의미 / 영향

이 프로젝트는 대규모 모델이나 파인튜닝 없이도 정교한 상태 관리 아키텍처를 통해 LLM의 페르소나와 기억을 제어할 수 있음을 입증했다. 특히 로컬 환경의 소형 모델을 실무 수준의 에이전트로 활용하려는 개발자들에게 구체적인 메모리 분리 및 격리 전략을 제시한다.

커뮤니티 반응

작성자의 구체적인 아키텍처 접근 방식과 소형 모델의 한계를 시스템 설계로 극복한 점에 대해 긍정적인 반응이 나타났다. 특히 Ollama의 기본 컨텍스트 기능을 대체한 검색 기반 메모리 전략이 실무적인 해결책으로 평가받았다.

합의점 vs 논쟁점

합의점

소형 모델에서도 적절한 프롬프트 주입과 외부 메모리 관리를 통해 복잡한 페르소나 유지가 가능하다.
LLM의 기본 컨텍스트 스레딩은 장기적인 제어와 정보 격리 측면에서 한계가 명확하다.

실용적 조언

Ollama의 기본 컨텍스트 스레딩 대신 벡터 DB 검색 기반 메모리를 사용하여 정보 혼선을 방지하라.
특정 규칙을 적용할 때는 시스템 프롬프트에서 다른 모든 지침을 제거하여 모델의 집중도를 높여라.
사용자 이름 등 엔티티 추출 시 불용어 필터와 글자 수 제한을 두어 오탐지를 줄여라.

섹션별 상세

메모리 아키텍처를 선호도(Preferences), 증거(Evidence), 규칙(Rules)의 세 가지 클래스로 분리하여 관리한다. 선호도는 SQLite에 저장되어 모든 프롬프트에 [ADAPTIVE STATE] 블록으로 주입되며, 증거는 ChromaDB에서 코사인 유사도와 최신성 가중치를 기반으로 검색된다. 행동 규칙은 특정 조건 발생 시 시스템 프롬프트를 완전히 교체하여 모델의 순응도를 극대화하는 방식을 취한다.

기존 LLM의 컨텍스트 스레딩 방식이 제어 가능한 기억 형성을 방해한다는 점을 발견하고 이를 완전히 제거했다. Ollama의 기본 컨텍스트 기능을 사용하면 서로 다른 주제 간에 정보가 섞이는 '블리드(Bleed)' 현상이 발생하기 때문이다. 대신 증거 검색 방식을 도입하여 필터링, 가중치 부여, 감사(Audit)가 가능한 연속성을 확보함으로써 대화의 일관성을 높였다.

행동 규칙(Rules) 실행 시에는 다른 모든 컨텍스트를 차단하는 '전체 격리' 전략을 사용한다. 예를 들어 농담 규칙이 발동될 때 선호도나 도구 사용 지침을 모두 제거하지 않으면, 모델이 단순히 농담을 던지는 대신 도움이 되려는 부가 설명을 덧붙이는 문제가 발생하기 때문이다. 이를 통해 모델이 지시사항에만 집중하도록 강제하여 의도한 출력을 얻어냈다.

Go 언어로 작성된 컨트롤러가 128차원 상태 벡터를 관리하며 신호 기반 학습과 게이트 업데이트를 수행한다. 모델은 원시 벡터를 직접 보는 대신 적응 크기에 따라 가중치가 부여된 사람이 읽을 수 있는 텍스트 형태의 선호도를 전달받는다. 또한 정체성 감지 로직의 오류를 해결하기 위해 불용어 필터와 문장 부호 가드 등을 도입하여 시스템의 견고함을 확보했다.

실무 Takeaway

모델 가중치를 건드리지 않고도 외부 아키텍처 설계만으로 소형 모델(4B)에 강력한 개성과 기억을 부여할 수 있다.
컨텍스트 스레딩 대신 검색 기반 메모리 시스템을 사용해야 정보 오염을 방지하고 정밀한 제어가 가능하다.
특정 행동 규칙을 강제할 때는 모델이 혼란을 겪지 않도록 관련 없는 모든 컨텍스트를 제거하는 격리가 필수적이다.
Go 컨트롤러와 벡터 기반 상태 관리를 통해 결정론적 재생(Deterministic Replay)이 가능한 안정적인 시스템 구축이 가능하다.

언급된 도구

Ollama추천

로컬 LLM 실행 및 추론 엔진

ChromaDB추천

벡터 임베딩 저장 및 유사도 검색을 통한 메모리 구현

SQLite추천

사용자 선호도 및 행동 규칙의 영구 저장

언급된 리소스

GitHubadaptive-state GitHub Repository