누스 리서치, 스스로 학습하고 성장하는 오픈소스 '헤르메스 에이전트' 공개

핵심 요약

기존 LLM 에이전트는 대화 세션이 종료되면 상태를 잊어버리는 일시적 에이전트의 한계를 가졌다. 누스 리서치는 이를 해결하기 위해 메모리 계층 구조와 지속적인 머신 접근 권한을 갖춘 헤르메스 에이전트를 출시했다. 이 시스템은 복잡한 작업을 수행한 후 스킬 문서를 생성하여 지식을 영구 저장하고, 도커나 SSH 등 다양한 환경에서 독립적으로 작업을 수행한다. 결과적으로 사용자와 함께 성장하며 실제 워크스테이션을 관리할 수 있는 진정한 협업 도구의 형태를 지향한다.

배경

Llama 3.1 모델 아키텍처 이해, ReAct(Reasoning and Acting) 루프 개념, Docker 및 SSH 기반 서버 관리 지식

대상 독자

자율 에이전트를 프로덕션에 도입하거나 인프라 관리를 자동화하려는 AI 엔지니어

의미 / 영향

이 기술은 에이전트가 일회성 비서에서 지속적으로 지식을 축적하는 팀원으로 진화하는 계기가 된다. 특히 오픈소스 모델인 Hermes-3를 기반으로 하여 기업들이 자체 인프라 내에서 보안이 유지되는 자율 에이전트 시스템을 구축하는 데 기여할 것이다.

섹션별 상세

헤르메스 에이전트는 단순한 컨텍스트 윈도우 확장을 넘어 절차적 학습을 모방한 다단계 메모리 시스템을 사용한다. 복잡한 디버깅이나 데이터 파이프라인 최적화 작업을 완료하면 그 경험을 agentskills.io 표준에 맞춘 마크다운 형태의 스킬 문서로 요약하여 저장한다. 이후 유사한 작업이 주어지면 에이전트는 자신의 라이브러리를 검색하여 과거의 성공적인 단계를 재현함으로써 처음부터 다시 시작하지 않고 효율적으로 업무를 처리한다.

대부분의 AI 에이전트가 샌드박스 내에서 코드만 작성하는 것과 달리, 헤르메스 에이전트는 실제 환경과의 실행 격차를 해소하기 위해 5가지 백엔드를 지원한다. 로컬 호스트, 도커 컨테이너, SSH 원격 서버, 싱귤래리티(Singularity), 모달(Modal) 서버리스 환경에 직접 접근하여 독립적으로 작업을 수행한다. 이를 통해 사용자가 로그아웃한 상태에서도 원격 서버에서 장시간 소요되는 데이터 분석을 수행하고 터미널 상태를 유지하며 파일 시스템 변경 사항을 추적한다.

에이전트의 두뇌는 Llama 3.1을 기반으로 한 헤르메스-3(Hermes-3) 모델이며, 이는 아트로포스(Atropos) 강화학습 프레임워크로 훈련되었다. 관찰, 추론, 행동으로 이어지는 ReAct 루프를 정교하게 구현하여 도구 호출의 정확도와 장기 계획 능력을 극대화했다. 이러한 설계 덕분에 에이전트는 다단계 배포 과정에서도 목표를 잃지 않고 높은 조종 가능성(Steerability)을 유지하며 복잡한 추론을 수행한다.

기술적인 CLI 환경에만 국한되지 않고 텔레그램, 디스코드, 슬랙, 왓츠앱 등 기존 통신 플랫폼과 통합되는 헤르메스 게이트웨이를 제공한다. 엔지니어는 워크스테이션에서 작업을 시작한 뒤 이동 중에 텔레그램으로 작업 완료 알림을 받거나 추가 지시를 음성 메모로 전달할 수 있다. 에이전트는 전달받은 음성을 처리하여 지속적인 실행 환경 내에서 즉각적으로 명령을 수행하는 유연한 피드백 루프를 형성한다.

실무 Takeaway

agentskills.io 표준을 활용한 스킬 문서화로 에이전트의 지식을 영구적으로 자산화하고 재사용할 수 있다.
SSH 및 Docker 백엔드 지원을 통해 에이전트가 단순 챗봇을 넘어 실제 인프라를 관리하는 운영 도구로 기능한다.
강화학습(RL)으로 튜닝된 Hermes-3 모델을 사용하여 복잡한 도구 호출과 장기적 계획 수립의 신뢰성을 확보했다.

언급된 리소스

GitHubHermes Agent GitHub Repository

문서agentskills.io Standard