왜 중요한가
기존 AI 에이전트 프레임워크가 특정 통신 방식이나 고정된 도구 세트에 갇혀 유연성이 떨어지는 문제를 해결한다. 생물학적 줄기세포의 분화 과정을 모방하여 사용자 성향을 실시간 학습하고 스스로 기술을 습득하며, 커머스와 결제 등 다양한 산업 표준 프로토콜을 동시에 지원하는 범용 아키텍처를 제시한다.
핵심 기여
5종의 상호운용성 프로토콜 통합 지원
A2A(에이전트 간 통신), AG-UI(스트리밍 UI), A2UI(동적 UI 구성)와 더불어 자체 제안한 UCP(범용 커머스), AP2(에이전트 결제) 프로토콜을 단일 게이트웨이에서 구현한다.
다차원 사용자 프로파일링 시스템(Caller Profiler)
사용자의 행동을 4개 카테고리, 20개 이상의 차원에서 지수 이동 평균(EMA)을 통해 실시간으로 학습하고 추론 깊이나 창의성 등 10가지 동작 파라미터를 자동으로 조정한다.
생물학적 영감을 얻은 기술 습득 시스템
반복되는 상호작용 패턴을 '줄기세포 분화' 모델에 따라 Progenitor, Committed, Mature 단계로 성숙시켜 재사용 가능한 기술로 결정화하며, 실패 시 제거(Apoptosis)하는 메커니즘을 갖춘다.
MCP 기반의 도구 통합 및 외부화
Model Context Protocol(MCP)을 기본 채택하여 에이전트의 추론 로직과 도메인 지식을 분리하고, 런타임에 외부 역량을 동적으로 획득하는 구조를 확립한다.
핵심 아이디어 이해하기
기존 에이전트 프레임워크는 설계 단계에서 특정 통신 규격이나 고정된 사용자 모델에 고착(Architectural Lock-in)되는 한계가 있다. 이는 다양한 비즈니스 환경에서 에이전트 간 협업이나 동적인 도구 사용을 방해하며, 사용자의 변화하는 선호도를 반영하지 못해 성능 저하를 초래한다. STEM Agent는 생물학적 줄기세포의 '다분화능(Pluripotency)' 개념을 도입하여 이 문제를 해결한다.
에이전트의 핵심(Core)은 미분화 상태로 유지되다가, 요청이 들어오면 필요한 프로토콜 핸들러, 도구 바인딩, 메모리 유형으로 즉시 분화하여 대응한다. 이는 마치 하나의 세포가 상황에 따라 심장 세포나 신경 세포로 변하는 것과 같은 원리다. 이 과정에서 에이전트는 사용자와의 대화 데이터를 임베딩 공간에 저장하고, 반복되는 패턴이 발견되면 이를 '기술(Skill)'로 결정화한다.
초기 단계의 기술은 검증을 거쳐 성숙해지며, 성숙한 기술은 복잡한 추론 과정을 생략하고 즉시 실행 계획으로 변환되어 응답 속도와 정확도를 동시에 높인다. 결과적으로 단일 모델이 고정된 방식으로 작동하는 것이 아니라, 사용자와 환경에 맞춰 스스로의 구조와 능력을 최적화하는 유연한 시스템을 구축한다.
방법론
전체 아키텍처는 5개 레이어로 구성된다. Layer 1(Caller)에서 요청이 들어오면 Layer 2(Gateway)가 5가지 프로토콜 중 적절한 핸들러를 할당한다. 핵심인 Layer 3(Agent Core)은 8단계 인지 파이프라인(Perceive → Adapt → Skill Match → Reason → Plan → Execute → Learn → Format)을 거쳐 요청을 처리한다.
사용자 프로파일링은 지수 이동 평균(EMA)을 사용한다. 현재 프로파일 값 v_t와 새로운 신호 s_t가 주어질 때 v_{t+1} = (1 - alpha) * v_t + alpha * s_t를 계산한다. 여기서 학습률 alpha를 0.1로 설정하여 급격한 변화를 억제하면서도 새로운 선호도를 점진적으로 반영한다. 계산된 값은 추론 깊이, 창의성 등 10가지 파라미터를 조정하는 입력값이 된다.
기술 습득(Skills Acquisition)은 에피소드 패턴의 빈도를 측정하여 수행된다. 3회 이상의 성공적인 활성화와 0.6 이상의 성공률을 보이면 'Committed' 상태로 격상되어 추론(Reasoning) 단계를 건너뛰고 바로 계획(Planning) 단계로 진입하는 숏컷(Short-circuit)을 형성한다. 반면 10회 이상 활성화 후 성공률이 0.3 미만이면 해당 기술을 삭제(Apoptosis)한다.
주요 결과
Vitest를 이용한 413개의 테스트 스위트에서 100% 통과율을 기록했다. 전체 테스트 실행 시간은 2.92초 미만으로, 5개 레이어 전체에 걸친 컴포넌트 통합과 프로토콜 핸들러의 동작 안정성을 입증했다.
기존 프레임워크(AutoGen, MetaGPT, CrewAI, LangChain)와의 비교 분석 결과, STEM Agent만이 유일하게 표준화된 상호운용성 프로토콜 3종 이상 지원, 사용자별 자가 적응 동작, 4종의 고도화된 메모리 시스템, 창발적 기술 습득 기능을 모두 갖춘 것으로 나타났다. 특히 커머스 전용 프로토콜인 UCP와 AP2를 통해 실제 비즈니스 트랜잭션 대응 능력을 확보했다.
실무 활용
다양한 통신 규격이 혼재된 기업용 에이전트 환경이나, 실시간 결제 및 커머스 기능이 필요한 자율 에이전트 시스템 구축에 즉시 활용 가능하다.
- 에이전트 간 자동 협업 및 결제가 필요한 분산 커머스 시스템
- 사용자의 업무 스타일을 실시간 학습하여 응답 톤과 추론 깊이를 조절하는 개인 비서
- MCP를 통해 다양한 외부 도구와 데이터베이스를 동적으로 연결하는 엔터프라이즈 워크플로 자동화
기술 상세
인지 파이프라인의 PERCEIVE 단계는 의도를 10개 카테고리로 분류하고, 단어 수와 엔티티 밀도를 기반으로 복잡도를 3단계(Simple, Medium, Complex)로 추정한다. ADAPT 단계에서는 학습된 사용자 프로필을 로드하여 reasoning_depth, creativity, verbosity 등 10가지 행동 파라미터를 동적으로 튜닝한다.
메모리 시스템은 4가지 유형을 통합 관리한다. Episodic(pgvector 기반 벡터 검색), Semantic(지식 그래프 형태의 트리플 저장), Procedural(성공적인 전략 및 도구 사용 패턴), User Context(세션 이력 및 GDPR 준수 프로필)가 상호 보완적으로 작동하며, 메모리 매니저가 이들의 통합 및 정제(Pruning, Deduplication)를 담당한다.
추론 전략 선택(Strategy Selector)은 결정론적 규칙을 따른다. 도구 사용이 필요한 작업은 ReAct, 복잡한 작업은 Reflexion, 분석이나 창의적 요청은 Internal Debate를 사용하며, 그 외 기본값으로 Chain-of-Thought를 할당하여 작업 특성에 최적화된 연산 자원을 배분한다.
게이트웨이 아키텍처는 Express.js 5를 기반으로 구축되었으며, 각 프로토콜 핸들러는 플러그형 createRouter() 패턴을 통해 독립적으로 마운트된다. 이는 새로운 통신 규격이 등장했을 때 기존 코어 로직의 수정 없이 핸들러만 추가하여 확장할 수 있는 구조적 유연성을 제공한다.
한계점
엔드-투-엔드 벤치마크(예: MAFBench) 평가나 사용자 연구가 포함되지 않았으며, EMA 기반 프로파일러는 비정상적이거나 다중 모드(multi-modal)인 선호도 분포를 포착하기 어렵다. 또한 UCP와 AP2 프로토콜은 아직 외부 채택 사례가 부족하고 공식적인 위협 모델링이 미비하다.
키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.