이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.
핵심 요약
사용자가 신뢰할 수 있는 에이전트를 만들기 위해서는 블랙박스 형태의 코드 생성보다 투명한 도구 사용(엑셀 수식 등)이 중요하며, 잠재 공간 통신과 같은 기법으로 에이전트의 효율성을 극대화할 수 있다.
배경
핀테크 기업 Ramp의 연구 조직인 Ramp Labs가 개발한 AI 기반 스프레드시트 편집기 Ramp Sheets의 개발 여정과 최신 AI 실험들을 다룹니다.
대상 독자
AI 에이전트 시스템을 설계하는 엔지니어, LLM의 내부 작동 원리를 활용하려는 연구자, 핀테크 AI 도입 사례에 관심 있는 기획자
의미 / 영향
Ramp의 사례는 단순한 챗봇을 넘어 실무 소프트웨어를 직접 조작하는 에이전트의 설계 표준을 제시한다. 특히 모델의 내부 상태인 KV 캐시나 활성화 벡터를 직접 조작하는 실험적 접근은 향후 더 빠르고 저렴한 에이전트 시스템 구축의 핵심 기술이 될 것이다. 이는 기업들이 범용 LLM을 자사 서비스에 맞게 고도화하는 방식에 큰 변화를 가져올 것으로 예상된다.
챕터별 상세
01:13
Ramp Sheets의 기원과 프로세스 마이닝
Ramp Sheets는 원래 회계사들의 업무 영상을 분석해 마르코프 다이어그램으로 시각화하는 내부 프로세스 마이닝 도구에서 시작되었다. Loom 영상을 입력받아 텍스트 요약과 Graphviz 기반의 DAG(유향 비순환 그래프)를 출력하는 파이프라인을 구축했다. 초기에는 업무 자동화를 목표로 했으나, 영상 분석 결과 대부분의 업무가 스프레드시트 내에서 이루어진다는 점을 발견하고 에이전트 기반 편집기로 방향을 전환했다.
04:28
재무 전문가들이 코드 생성을 거부한 이유
초기에는 Python 코드를 생성해 업무를 자동화하려 했으나 재무 전문가들은 이를 '블랙박스'로 느끼며 신뢰하지 않았다. 재무 업무는 오류의 대가가 매우 크기 때문에 사용자가 직접 검증할 수 있는 투명성이 필수적이다. 이에 따라 Ramp는 에이전트가 Python 코드 대신 사용자가 익숙한 엑셀 수식을 직접 작성하고 수정하도록 아키텍처를 설계했다. 결과적으로 사용자는 에이전트가 수행한 계산 과정을 수식으로 즉시 확인하고 신뢰할 수 있게 되었다.
12:41
Ramp Sheets의 내부 아키텍처와 도구 설계
에이전트는 샌드박스 환경 내부에 갇혀 있는 것이 아니라, 외부에서 샌드박스 내의 SpreadJS 라이브러리와 상호작용하는 구조를 취한다. 에이전트에게는 '범위 읽기', '범위 설정', '서식 지정' 등 약 10여 개의 전용 도구가 제공된다. Python 코드는 엑셀 수식으로 해결 불가능한 복잡한 데이터 정제 작업 시에만 예외적으로 사용되는 '탈출구' 역할을 한다. 이러한 구조는 에이전트의 행동을 제어하기 용이하게 만들며 컨텍스트 오염을 방지한다.
15:47
Anthropic 모델의 에이전트 성능 우위
Ramp는 다양한 모델을 테스트한 결과 Anthropic의 Claude 제품군이 스프레드시트 조작 에이전트 역할에 가장 적합하다는 점을 확인했다. Claude 모델들은 복잡한 엑셀 작업을 단계별 액션으로 분해하는 RL(강화학습)이 잘 되어 있어 정확도가 높았다. 특히 엑셀 수식 간의 관계를 파악하고 논리적으로 추론하는 능력이 타 모델 대비 뛰어났다. 현재는 OpenAI의 최신 모델들도 추격 중이지만 초기 출시 당시에는 Claude의 성능이 압도적이었다.
23:40
Inspect: 자가 모니터링 코딩 에이전트
Ramp는 Inspect라는 내부 코딩 에이전트를 개발하여 시스템을 실시간으로 감시하고 개선한다. Inspect는 새로운 PR이 생성되거나 주기적인 크론 작업 시 코드베이스를 훑으며 누락된 모니터링 지표나 알람을 찾아낸다. 에이전트가 유효하다고 판단한 개선 사항은 Slack으로 알림을 보내거나 직접 GitHub PR을 생성하여 수정한다. 이 루프를 통해 사람이 일일이 챙기기 어려운 미세한 버그나 성능 저하 요인을 자동으로 관리한다.
31:16
Latent Briefing: KV 캐시를 통한 에이전트 간 통신
멀티 에이전트 시스템에서 토큰 소모를 줄이고 효율성을 높이기 위해 KV 캐시를 직접 공유하는 실험을 진행했다. 하위 에이전트들이 텍스트 메시지를 주고받는 대신, 잠재 공간(Latent Space)에서 압축된 KV 캐시 데이터를 직접 전달하도록 설계했다. 이 방식은 동일한 정확도를 유지하면서도 토큰 사용량을 획기적으로 줄이거나, 동일 토큰 대비 정확도를 높이는 결과를 보였다. 오픈 가중치 모델인 Gemma 등을 활용해 커널 수준에서 캐시를 조작하는 방식으로 구현되었다.
35:13
스티어링 벡터를 이용한 모델 제어 실험
특정 개념에 집착하는 모델을 만들기 위해 대조 쌍(Contrastive Pairs)을 활용한 스티어링 벡터 기법을 적용했다. 약 80개의 대조적인 텍스트 쌍을 모델에 통과시켜 특정 개념(예: '지프차')과 관련된 레이어 활성화 차이를 추출하여 벡터화했다. 추론 시 이 벡터를 모델의 중간 레이어 활성화 값에 더해줌으로써 모델이 모든 질문에 해당 개념을 섞어서 답변하도록 유도했다. 이 실험은 모델을 재학습시키지 않고도 내부 표현을 조작해 행동을 변경할 수 있음을 입증했다.
실무 Takeaway
- 도메인 전문가용 AI 도구 설계 시, 결과물뿐만 아니라 과정의 투명성(예: 엑셀 수식 노출)을 확보해야 사용자 신뢰를 얻을 수 있다.
- 에이전트를 샌드박스 내부에 두는 것보다 외부에서 샌드박스 API를 호출하는 구조가 컨텍스트 관리와 보안 측면에서 유리하다.
- 멀티 에이전트 시스템의 비용 효율성을 높이기 위해 텍스트 통신 대신 KV 캐시를 직접 공유하는 잠재 공간 통신 기법을 고려할 수 있다.
- 스티어링 벡터를 활용하면 모델의 가중치를 수정하지 않고도 특정 페르소나나 지식에 편향된 답변을 하도록 정밀하게 제어 가능하다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
원문 발행 2026. 05. 07.수집 2026. 05. 07.출처 타입 YOUTUBE
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.