핵심 요약
공공 데이터의 파편화와 복잡성으로 인해 일반인이 정부나 기업의 활동을 추적하는 것은 매우 어렵다. OpenPlanter는 이러한 문제를 해결하기 위해 대형 언어 모델(LLM) 기반의 재귀적 조사 에이전트를 도입했다. 이 시스템은 복잡한 목표를 하위 작업으로 분할하고 여러 에이전트를 병렬로 실행하여 다양한 형식의 데이터를 통합 분석한다. 이를 통해 사용자는 캠페인 자금 기록, 정부 계약, 로비 공개 자료 등에서 이상 징후와 숨겨진 연결 고리를 효과적으로 찾아낼 수 있다.
배경
Python 3.10+, Docker, LLM API Keys (OpenAI, Anthropic 등)
대상 독자
데이터 저널리스트, 시민 조사관, AI 에이전트 개발자
의미 / 영향
AI 에이전트가 단순 비서 역할을 넘어 사회적 감시와 데이터 포렌식이라는 전문 영역으로 확장되고 있음을 보여준다. 특히 재귀적 구조는 복잡한 추론이 필요한 도메인에서 에이전트의 성능을 비약적으로 높일 수 있는 핵심 설계 패턴으로 자리 잡을 것이다.
섹션별 상세
OpenPlanter는 단일 요청 처리의 한계를 넘어 최대 4단계 깊이의 재귀적 구조를 가진다. 메인 에이전트가 하위 에이전트를 생성하고, 이들이 다시 하위 에이전트를 생성하여 대규모 데이터셋의 엔티티 해결과 데이터 링크 작업을 병렬로 수행한다. 이 방식은 단일 컨텍스트 윈도우를 초과하는 대규모 조사 작업을 가능하게 하며 모든 발견 사항에 대한 증거 체인을 구축한다.
CSV, JSON, PDF 등 서로 다른 형식으로 흩어져 있는 공공 기록을 LLM을 통해 통합 처리한다. 서로 다른 기록에서 동일한 인물이나 기업을 식별하는 엔티티 해결(Entity Resolution) 과정을 거친 후, 확률적 모델을 사용하여 이상 징후를 탐색한다. 예를 들어 특정 로비 이벤트 이후 특정 기업의 계약 수주가 급증하는 패턴 등을 인간의 개입 없이 포착할 수 있다.
Python 3.10 이상을 기반으로 하며 GPT-5.2, Claude Opus 4-6 등 최첨단 프론티어 모델을 지원한다. 고속 추론을 위해 Cerebras의 Qwen 모델을 사용하고 웹 검색에는 Exa, 고정밀 임베딩에는 Voyage를 활용하는 멀티 모델 전략을 채택했다. 각 하위 작업의 특성에 가장 적합한 모델을 선택하여 전체 시스템의 효율성과 정확도를 극대화한다.
단순한 채팅을 넘어 실제 환경과 상호작용할 수 있는 19개의 전문 도구를 갖추고 있다. 파일 입출력, 셸 실행(run_shell), 웹 검색, 논리적 계획 도구 등이 포함되며, 특히 에이전트가 직접 파이썬 스크립트를 작성하고 실행하여 데이터를 분석할 수 있다. 모든 작업은 수용 기준(Acceptance Criteria)을 통해 검증된 후 다음 단계로 진행된다.
실무 Takeaway
- 재귀적 에이전트 구조를 활용하여 복잡하고 방대한 조사 업무를 자동화하고 병렬 처리할 수 있다.
- 파편화된 공공 데이터를 엔티티 해결 기법으로 연결하여 숨겨진 권력 관계나 부패 징후를 포착하는 데 유용하다.
- Docker 기반의 격리된 환경에서 셸 명령을 실행함으로써 보안을 유지하면서도 강력한 데이터 분석 능력을 제공한다.
언급된 리소스
GitHubOpenPlanter Repository
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료