Clarm: Vespa Cloud를 활용한 개발자 대상 에이전트형 AI 영업 플랫폼 구축 사례

핵심 요약

오픈소스 소프트웨어(OSS) 기업들은 많은 GitHub 스타를 보유하고도 이를 실제 매출로 전환하는 데 어려움을 겪는다. Clarm은 이 문제를 해결하기 위해 Vespa Cloud를 도입하여 텍스트, 벡터, 구조화된 검색을 통합한 하이브리드 검색 엔진을 구축했다. 이를 통해 수백만 개의 GitHub 데이터 포인트를 실시간으로 분석하고, 환각 현상 없는(Zero-hallucination) AI 응답을 제공하며 리드 생성 및 고객 지원을 자동화한다. 결과적으로 Clarm은 단 하루 만에 프로덕션 환경을 구축하고 고객사의 매출 성장을 견인하고 있다.

배경

RAG(Retrieval-Augmented Generation) 개념, 벡터 검색 및 하이브리드 검색 기초, GitHub API 및 데이터 구조 이해

대상 독자

AI 기반 B2B 솔루션 개발자 및 OSS 수익화를 고민하는 창업자

의미 / 영향

이 사례는 RAG 시스템에서 단순 벡터 검색의 한계를 지적하며, 정교한 랭킹과 하이브리드 검색이 실질적인 비즈니스 가치를 창출하는 핵심임을 보여준다. 특히 스타트업이 관리형 인프라를 통해 기술적 우위를 빠르게 확보하는 전략을 제시한다.

섹션별 상세

오픈소스 소프트웨어 기업의 수익화 문제를 해결하기 위해 AI 기반 영업 인프라를 구축했다. 대다수 오픈소스 창업자들은 제품 개발에 집중하느라 마케팅과 영업 기회 발굴에 소홀해지는 경향이 있다. Clarm은 GitHub 리포지토리 데이터를 분석하고 웹사이트 방문, 커밋, 이슈 등의 신호를 결합하여 잠재적인 기업 고객을 식별하고 랭킹을 매긴다. 이를 통해 커뮤니티의 관심도를 실제 비즈니스 기회로 전환하는 인프라를 제공한다.

정확하고 설명 가능한 검색 및 검색(Retrieval) 시스템을 위해 Vespa를 도입했다. Clarm은 단순한 LLM 답변 생성이 아니라, 신뢰할 수 있는 정보를 찾는 검색 과정이 핵심 문제임을 인식했다. 기존의 벡터 전용 데이터베이스나 Elasticsearch로는 하이브리드 검색과 복잡한 멀티 시그널 리드 스코어링을 통합 처리하기 어려웠다. Vespa는 검색 엔진에서 벡터 시스템으로 진화한 구조를 갖추고 있어 랭킹과 텐서 연산이 내장되어 정확한 결과를 즉시 제공한다.

Y Combinator 배치 기간 중 단 하루 만에 Vespa Cloud를 프로덕션에 배포하는 성과를 거두었다. 로컬 개발을 위한 Docker 이미지와 Vespa Cloud의 자동 스케일링 기능 덕분에 소규모 엔지니어링 팀이 인프라 운영 대신 제품 기능 개발에 집중할 수 있었다. 이는 데모 데이를 앞둔 스타트업에게 치명적인 시간적 이점을 제공했으며, 통합 검색 파이프라인을 통해 시스템 복잡성을 획기적으로 낮췄다.

Vespa의 통합 검색 파이프라인과 실시간 인덱싱 기능을 핵심적으로 활용한다. 텍스트 검색, 벡터 유사도, 구조화된 필터를 단일 쿼리 엔드포인트에서 처리하여 여러 데이터베이스를 오케스트레이션할 필요가 없다. 또한 내장된 텐서 연산을 통해 별도의 레이어 없이도 정교한 리드 스코어링 모델을 구현했다. 실시간 인덱싱은 GitHub 이벤트와 사용자 상호작용을 즉시 검색 결과에 반영하여 최신 상태의 AI 응답을 보장한다.