핵심 요약
기존 AI 에이전트는 모든 정보를 텍스트로 변환해야 했기에 시계열이나 표 데이터 같은 복잡한 과학 데이터를 처리할 때 정보 손실과 비효율이 발생했다. Eywa는 전문 과학 모델을 언어 모델의 추론 루프에 직접 연결하여 텍스트 변환 없이도 정밀한 과학적 의사결정을 가능하게 한다.
왜 중요한가
기존 AI 에이전트는 모든 정보를 텍스트로 변환해야 했기에 시계열이나 표 데이터 같은 복잡한 과학 데이터를 처리할 때 정보 손실과 비효율이 발생했다. Eywa는 전문 과학 모델을 언어 모델의 추론 루프에 직접 연결하여 텍스트 변환 없이도 정밀한 과학적 의사결정을 가능하게 한다.
핵심 기여
Eywa 프레임워크 제안
언어 모델의 추론 능력과 도메인 특화 파운데이션 모델의 전문성을 결합한 이종 에이전트 협업 프레임워크를 구축했다.
Tsaheylu 인터페이스 설계
LLM과 전문 모델 간의 양방향 통신을 위한 인터페이스를 설계하여, LLM이 전문 모델을 설정하고 그 결과를 다시 언어적 추론에 통합할 수 있게 했다.
EywaOrchestra 동적 오케스트레이션
작업의 특성에 따라 단일 에이전트, 다중 에이전트, 또는 전문 모델의 조합을 실시간으로 선택하고 배치하는 플래너 기반 조정 메커니즘을 도입했다.
EywaBench 벤치마크 구축
물리, 생명, 사회 과학을 아우르는 9개 하위 도메인과 3가지 데이터 모달리티를 포함하는 대규모 과학 에이전트 평가 지표를 제안했다.
핵심 아이디어 이해하기
기존의 LLM 에이전트는 모든 비언어적 데이터를 텍스트로 직렬화(Serialization)하여 입력받는다. 하지만 이 과정에서 데이터의 구조적 특징이나 정밀한 수치 정보가 누락되는 '정보 병목 현상'이 발생하며, 이는 과학적 추론의 정확도를 떨어뜨리는 원인이 된다.
Eywa는 이 문제를 해결하기 위해 LLM을 '두뇌'로, 전문 과학 모델을 '전문가'로 활용하는 구조를 취한다. LLM이 텍스트로 된 지시사항을 이해하고 계획을 세우면, 실제 수치 계산이나 패턴 분석은 해당 분야에 최적화된 전문 모델(예: 시계열 예측 모델 Chronos)에게 맡긴다. 이때 두 모델은 Tsaheylu라는 전용 인터페이스를 통해 데이터를 주고받는다.
결과적으로 LLM은 복잡한 수치를 일일이 텍스트로 읽고 해석할 필요가 없어져 토큰 소모량이 줄어들고, 전문 모델은 자신의 강점인 정밀한 예측을 수행함으로써 전체 시스템의 과학적 문제 해결 능력이 극대화된다. 이는 마치 숙련된 지휘자가 각 악기 전문가들의 연주를 조율하여 교향곡을 완성하는 것과 같다.
관련 Figure

EywaAgent, EywaMAS, EywaOrchestra의 개념을 직관적으로 전달한다. 전문 모델을 생명체에, LLM을 나비족에 비유하여 이들의 신경 결합(Tsaheylu)과 조율 과정을 시각화했다.
영화 아바타의 판도라 생태계 비유를 통해 Eywa의 세 가지 구성 요소를 설명하는 다이어그램이다.
방법론
Eywa 프레임워크는 세 가지 계층으로 구성된다. 첫째, EywaAgent는 단일 LLM과 전문 모델(FM)을 Tsaheylu 인터페이스로 연결한 기본 단위이다. 둘째, EywaMAS는 여러 EywaAgent와 일반 LLM 에이전트가 협업하는 다중 에이전트 시스템이다. 셋째, EywaOrchestra는 중앙 플래너가 작업에 가장 적합한 에이전트 구성과 통신 구조를 동적으로 결정한다.
Tsaheylu 인터페이스는 쿼리 컴파일러(Query Compiler)와 응답 어댑터(Response Adapter)로 작동한다. 쿼리 컴파일러는 LLM의 상태 S를 입력받아 전문 모델이 이해할 수 있는 구조화된 호출 값 Uk를 생성한다. 전문 모델 Fk가 연산을 수행하여 출력 Ok를 내놓으면, 응답 어댑터는 이를 다시 LLM이 추론에 활용할 수 있는 텍스트 호환 형태 Zk로 변환한다. [상태 S → 쿼리 컴파일러 → 호출 Uk → 전문 모델 연산 → 출력 Ok → 응답 어댑터 → 텍스트 컨텍스트 Zk] 순으로 데이터가 흐르며 전문 지식이 언어 루프에 통합된다.
주요 결과
EywaBench 실험 결과, EywaAgent는 단일 LLM 에이전트 대비 유틸리티 점수가 약 7% 향상되었으며 토큰 사용량은 약 30% 절감되었다. 특히 물리 과학 도메인에서 시계열 데이터 처리 시 성능 향상이 두드러졌다.
EywaOrchestra는 고정된 다중 에이전트 구조보다 효율적인 자원 배분을 보여주었다. 복잡한 작업에는 다중 에이전트를 배치하고 단순한 작업에는 단일 에이전트를 할당함으로써, 성능은 유지하면서도 전체적인 추론 비용과 지연 시간을 최적화했다. 모든 실험군에서 Eywa 기반 모델들은 파레토 프런티어(Pareto Frontier)의 바깥쪽으로 이동하며 비용 대비 성능의 우월성을 입증했다.
관련 Figure

Eywa 기반 모델들이 기존 언어 전용 에이전트보다 적은 토큰을 사용하면서도 더 높은 유틸리티를 달성함을 보여준다. 특히 물리, 생명, 사회 과학 전 분야에서 일관된 성능 향상을 입증한다.
Eywa의 성능과 토큰 소모량, 실행 시간을 기존 에이전트 시스템과 비교한 그래프 및 레이더 차트이다.

모든 도메인에서 Eywa 변체들이 파레토 최적선에 위치하거나 근접해 있음을 보여준다. 이는 효율성과 정확도 사이의 최적의 균형점을 찾았음을 의미한다.
9개 과학 도메인별로 유틸리티와 토큰 소모량의 상관관계를 나타낸 파레토 프런티어 분석 결과이다.
기술 상세
Eywa의 핵심은 언어 인터페이스 병목 현상을 수학적으로 정의하고 이를 해소한 데 있다. 논문은 데이터 처리 부등식(Data Processing Inequality)을 통해 텍스트 직렬화 과정에서 발생하는 정보 손실이 불가피함을 증명하고, 전문 모델에 직접 접근하는 방식이 이론적으로 더 낮은 위험(Risk)을 가짐을 보였다.
구현 측면에서는 Anthropic의 Model Context Protocol(MCP)을 채택하여 확장성을 확보했다. 각 전문 모델은 독립적인 MCP 서버로 배포되며, EywaAgent는 이를 원격 서비스로 호출한다. 이러한 모듈식 구조 덕분에 새로운 과학 모델이 출시될 때마다 시스템 전체를 재학습시킬 필요 없이 플러그 앤 플레이 방식으로 기능을 추가할 수 있다.
관련 Figure

Eywa 프레임워크가 다양한 하이퍼파라미터 설정에서도 안정적인 성능을 유지함을 보여준다. 특정 설정에 치우치지 않는 견고함을 입증하는 지표이다.
LLM 샘플링 온도와 전문 모델 온도가 전체 유틸리티에 미치는 영향을 분석한 그래프이다.
한계점
Eywa의 성능은 기반이 되는 LLM의 계획 수립 능력과 통합된 전문 모델의 예측 품질에 크게 의존한다. 또한, 현재 벤치마크인 EywaBench가 모든 과학 분야를 포괄하지는 못하며, 이종 모델 간의 통신 오버헤드로 인한 계산 비용 증가가 발생할 수 있다.
실무 활용
과학 연구 자동화, 금융 시계열 분석, 복잡한 표 데이터 기반 의사결정 시스템 등에 즉시 적용 가능하다. 특히 전문 모델을 도구(Tool)로 사용하는 것을 넘어 에이전트의 핵심 추론 엔진으로 통합하려는 기업에 유용하다.
- 금융 시장의 시계열 데이터를 분석하여 향후 주가 변동을 예측하는 에이전트
- 신약 개발 과정에서 분자 구조 데이터를 전문 모델로 분석하고 LLM으로 보고서를 작성하는 워크플로
- 에너지 수요 예측 및 인프라 관리 자동화 시스템
코드 공개 여부: 공개
코드 저장소 보기관련 Figure

Detailed, CoT, ReAct 등 다양한 프롬프트 전략 중 ReAct 방식이 가장 높은 성능을 보임을 나타낸다. 이는 에이전트의 자율적 도구 호출 능력이 중요함을 시사한다.
프롬프트 디자인 방식에 따른 Eywa 모델들의 성능 변화를 비교한 차트이다.
키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.