FOOM.md: 모델 고유의 계산 매체를 통한 추론 가속화 연구 청사진

핵심 요약

모델이 자연어인 영어가 아닌 학습된 압축 중간 표현(IR) 내에서 직접 추론하도록 훈련하여 계산 효율과 성능을 극대화하는 5가지 오픈 소스 연구 아키텍처를 제안한다.

배경

작성자가 2년 동안 연구한 'FOOM.md'라는 오픈 리서치 청사진을 공개했다. 모델이 자연어(영어)가 아닌 자체적인 압축 중간 표현(IR)을 통해 추론하도록 만드는 5가지 아키텍처와 훈련 방법론을 다룬다.

의미 / 영향

이 연구는 LLM이 인간의 언어에 의존하지 않고 자체적인 최적화된 논리 체계를 구축할 수 있음을 시사한다. 특히 로컬 모델 커뮤니티에서 GRPO를 활용해 압축 루프를 실험해볼 수 있는 구체적인 경로를 제시했다는 점에서 실무적 가치가 크다.

커뮤니티 반응

작성자의 깊이 있는 연구와 구체적인 아키텍처 제시에 대해 커뮤니티는 매우 높은 관심을 보였다. 특히 로컬 모델 수준에서 즉시 테스트 가능한 실험 루프를 제공한 점이 긍정적으로 평가받았다.

주요 논점

01찬성다수

자연어는 추론을 위한 최적의 매체가 아니며 모델 고유의 IR을 개발하는 것이 성능 향상의 열쇠이다.

합의점 vs 논쟁점

합의점

현재의 LLM 추론 방식에는 언어적 한계로 인한 비효율이 존재한다.
강화학습을 통한 모델 내부 표현의 최적화 가능성이 높다.

실용적 조언

로컬 모델 커뮤니티는 Thauten 1단계 압축 루프를 통해 GRPO 기반의 압축-재구성-검증 실험을 즉시 시작할 수 있다.
오픈 모델에 이산 병목(VQ 레이어 등)을 추가하고 IR 길이 대비 재구성 충실도를 측정하여 성능을 검증하라.

전문가 의견

모델이 영어로 추론하는 것은 트랜스포머의 네이티브 계산 매체가 아니기에 발생하는 근본적인 병목 현상이다.

언급된 도구

FOOM.md추천링크

AI 추론 아키텍처 연구 청사진 및 문서

GRPO추천

강화학습 기반 모델 최적화 알고리즘

섹션별 상세

Thauten(컨텍스트 컴파일러) 아키텍처는 모델이 텍스트를 학습된 이산 중간 표현(IR)으로 압축하도록 강화학습(RL)을 통해 훈련하는 방식이다. 짧은 표현으로도 원문을 충실히 재구성할 때 보상을 주며, 최종적으로 모델이 영어 대신 이 압축된 기호 체계 안에서 추론하도록 유도한다. 이는 단순히 짧은 생각의 사슬(CoT)을 만드는 것이 아니라 모델이 압축 압력 하에서 스스로 고유한 표기법을 발견하게 만드는 과정이다. 검증 단계에서는 압축된 흔적이 다시 복원되어 작업 체크를 통과해야만 실제적인 것으로 간주된다.

Mesaton(컨텍스트 피지컬스)은 확산(Diffusion) 스타일의 컨텍스트 편집 기술로, 정밀한 동결 및 변이 제어를 통해 문맥을 수정한다. 가변 엔트로피(Varentropy) 기반 검색을 결합하여 추론 과정에서의 탐색 효율을 높이는 것이 핵심이다. 이를 통해 모델은 문맥의 특정 부분을 고정하거나 변화시키면서 최적의 추론 경로를 찾아낼 수 있다. 이는 기존의 순차적인 텍스트 생성 방식보다 훨씬 유연한 정보 처리 구조를 제공한다.

SAGE(공간 추론)는 신경 세포 자동자(Neural Cellular Automata)를 활용하여 기하학적 세계 상태를 표현하는 기질을 구축한다. 이를 통해 모델이 단순 텍스트 나열을 넘어 공간적인 관계와 구조를 이해하고 추론할 수 있는 기반을 제공한다. 텍스트 기반의 1차원적 추론에서 벗어나 다차원적인 공간 정보를 처리할 수 있는 능력을 부여하는 것이 목표이다. 이는 물리적 세계 모델링이나 복잡한 구조적 문제 해결에 필수적인 요소로 작용한다.

Bytevibe와 Q*는 각각 토크나이저 부트스트랩과 에피스테믹 컴파일러 역할을 수행한다. Bytevibe는 다중 그리드 방법을 사용하여 기존 토큰 모델을 처음부터 다시 학습시키지 않고도 바이트 네이티브 모델로 전환하는 기술이다. Q*는 이벤트 로그에 대한 문법 유도와 증명 기반 삭제를 통해 모델의 지식을 정제하고 논리적 일관성을 확보한다. 이러한 구성 요소들은 모델이 더 낮은 수준의 데이터에서 직접 학습하고 논리적 무결성을 유지하도록 돕는다.

실무 Takeaway

모델이 자연어(영어)로 추론하는 것은 트랜스포머 아키텍처의 네이티브 계산 매체가 아니기에 발생하는 병목 현상이다.
RL(특히 GRPO)을 활용해 압축, 재구성, 검증의 루프를 구축함으로써 모델 스스로 효율적인 내부 표기법을 발견하게 할 수 있다.
제안된 5가지 아키텍처는 하나의 통합된 추론 루프로 연결되며 모든 연구 내용은 오픈 소스로 공개됐다.

언급된 리소스

문서FOOM.md 공식 사이트

문서Raw Markdown 데이터