핵심 요약
현재의 트랜스포머 기반 LLM은 메모리와 에너지 효율성 측면에서 한계에 직면해 있다. Pathway는 뇌의 뉴런과 시냅스 구조를 모방하여 지속적 학습과 무한한 컨텍스트를 지원하는 포스트 트랜스포머 모델 'Baby Dragon Hatchling'을 개발했다. 한편, Mary Technology는 이러한 AI 기술을 법률 분야에 적용하여 방대한 증거 문서에서 객관적인 사실 관계를 추출하고 관리하는 시스템을 구축했다. 이들은 AI의 신뢰성을 높이기 위해 '신뢰 도구(Confidence Tooling)'와 '사실 계층(Fact Layer)'이라는 독자적인 접근 방식을 제안한다.
배경
트랜스포머 아키텍처에 대한 기본 이해, RAG(검색 증강 생성) 시스템의 개념, 신경과학 기반의 머신러닝 기초 지식
대상 독자
차세대 AI 아키텍처 연구자 및 법률/규제 산업용 AI 솔루션 개발자
의미 / 영향
트랜스포머 아키텍처의 물리적 한계를 넘어서는 새로운 모델의 등장은 AI의 운영 비용을 낮추고 장기 추론 능력을 비약적으로 향상시킬 것이다. 특히 법률 기술 분야에서의 성공적인 적용 사례는 AI가 전문직의 업무를 보조하는 도구로서 신뢰를 쌓아가는 과정을 보여준다.
섹션별 상세
Pathway는 트랜스포머의 한계를 극복하기 위해 뇌의 생물학적 원리를 차용한 'Baby Dragon Hatchling(BDH)' 아키텍처를 공개했다. 이 모델은 헤브 학습(Hebbian Learning) 원리를 적용하여 시냅스 연결을 통해 정보를 저장하며, 이를 통해 모델 자체가 거대한 메모리 역할을 수행한다. 기존 트랜스포머와 달리 희소(Sparse) 구조를 가져 계산 효율성이 높으며, GPU 환경에서도 최적화된 성능을 발휘한다.
BDH 모델은 '지속적 학습(Continual Learning)'과 '추론(Reasoning)'에 특화되어 있어 한 번의 경험으로도 지식을 습득할 수 있다. 이는 수만 번의 데이터를 학습해야 하는 기존 LLM의 비효율성을 개선하며, 기업의 적은 데이터로도 효과적인 미세 조정을 가능하게 한다. 또한, 컨텍스트 윈도우의 제한이 거의 없어 장기적인 작업 수행 시 발생하는 환각 현상을 획기적으로 줄일 수 있다.
Mary Technology는 법률 소송 과정에서 발생하는 수만 페이지의 증거 문서를 분석하기 위해 AI 기반의 '사실 관리 시스템'을 운영한다. 단순히 문서를 벡터화하는 기존 RAG 방식에서 벗어나, LLM을 통해 객관적인 '사실 계층(Fact Layer)'을 먼저 생성한 뒤 이를 기반으로 질문에 답변한다. 이 과정에서 AI가 판단을 내리기보다 변호사가 원본 소스를 즉시 확인할 수 있도록 돕는 데 집중한다.
법률 분야의 특수성을 고려하여 데이터 주권과 보안을 최우선으로 하며, 고객의 비공개 데이터를 모델 학습에 사용하지 않는 원칙을 고수한다. 대신 공공 판례 데이터를 활용해 합성 데이터(Synthetic Data)를 생성하여 모델을 고도화하는 기술적 도전을 이어가고 있다. 또한 '추론 근거(Relevance Rationale)'와 '추론된 날짜(Inferred Dates)' 기능을 통해 AI 출력값에 대한 사용자의 신뢰를 확보한다.
실무 Takeaway
- 트랜스포머 이후의 아키텍처는 뇌의 희소 연결 구조를 모방하여 에너지 효율과 메모리 용량을 극대화하는 방향으로 진화하고 있다.
- 법률과 같이 높은 신뢰도가 필요한 분야에서는 AI의 직접적인 해석보다는 원본 소스와의 연결성을 보장하는 '사실 계층' 구조가 실무적으로 더 유용하다.
- 합성 데이터 생성 기술은 개인정보 보호와 데이터 보안이 엄격한 산업군에서 AI 모델을 학습시키기 위한 핵심적인 전략으로 자리 잡고 있다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료