TL;DR
자연어만으로는 현실 세계의 복잡한 문제 공간을 포착하기에 한계가 있다. 본 논문은 언어 표현 디자인을 통해 내부 스키마를 형성하고 지식을 활성화·구성하는 방식이 LLM의 성능과 일반화 능력을 크게 확장할 수 있음을 주장한다. Level 0(자연어)에서 Level 3(과학적 형식화·월드 모델링)까지의 스키마 설계 축을 제시하고, 이를 검증하는 실험 및 도메인 로드맵을 제시한다.
왜 중요한가
자연어만으로는 현실 세계의 복잡한 문제 공간을 포착하기에 한계가 있다. 본 논문은 언어 표현 디자인을 통해 내부 스키마를 형성하고 지식을 활성화·구성하는 방식이 LLM의 성능과 일반화 능력을 크게 확장할 수 있음을 주장한다. Level 0(자연어)에서 Level 3(과학적 형식화·월드 모델링)까지의 스키마 설계 축을 제시하고, 이를 검증하는 실험 및 도메인 로드맵을 제시한다.
핵심 기여
언어 설계와 스키마 정렬의 공식화
질문-응답 문제를 언어 공간 L로 매핑하고 LLLM의 π 맵핑을 통해 목적 함수 f에 대한 근사화를 최적화하는 언어 설계 문제를 제시한다. PROMPT 엔지니어링도 Q를 Q로 매핑하는 하나의 입력 변형으로 해석된다.
스키마 형성 관점의 통합 프레임워크
레벨 0~3의 축으로 구성된 언어 표현 설계를 통해 점진적으로 richer한 내부 스키마를 유도하는 unified analytical framework를 제안한다.
실증적 근거와 진단 지표 제시
다양한 언어 표현(L1~L15)에 대한 논리 회로 시뮬레이션 실험으로 성능 차이가 크며, 내부 스키마 활성화/구조화를 정량화하는 Knowledge Activation Index(KAI)와 Knowledge Organization Index(KOI)를 제시한다.
논리 회로 실험을 통한 대표성 분석
Canonical Boolean Expression이 100% 정확도 등 최상위 성능을 보이고, NL 및 비선형 표현은 토큰 비용과 시간 면에서 비효율적이라는 점을 확인한다. 2모델에서 재현 가능한 실험으로 결과의 일관성을 확인한다.
미래 로드맵과 개방 문제 제시
Phase 1(Systematic Design), Phase 2(Representation-Aware Alignment), Phase 3(Mechanistic Foundations), Phase 4( Autonomous Construction)로 구성된 4단계 로드맵과 Q1~Q3의 핵심 연구 질문을 제시한다.
핵심 아이디어 이해하기
- schema는 지식 활성화와 구성의 내부 프레임워크다. 언어 표현은 이 스키마를 유도하는 매개로 작동하며, L(질문)과 L(a) 간의 맵핑에서 스키마를 설계하는 것이 핵심이다. 2) 파라미터 규모 증가나 도구 확장만으로는 한계에 도달하므로, Level 0에서 Level 3까지의 점진적 언어 표현 설계를 통해 더 rich한 내부 구조를 만들 필요가 있다. 3) 실험은 서로 다른 표현 형식이 동일 문제에 대해 서로 다른 내부 활성화와 해결 경로를 유도함을 보여주고, 이를 통해 성능과 계산 비용 모두에 큰 차이가 생김을 확인한다.
관련 Figure

스키마 설계가 언어 표현의 설계가 세계 이해를 확장하는 방향임을 직관적으로 제시한다.
Figure 1: 언어 표현 설계의 프런티어를 보여주는 도식; 자연어(baseline) 대비 더 강한 스키마 설계의 방향을 시각화.

레벨 간 진전이 성능 향상으로 연결되며, Language Design의 효과를 강조한다.
Figure 2: 성능 확장과 능력 확장에 대한 레이아웃; Level 0-3에 따른 프런티어의 확장을 도식화.
방법론
문제 설정: Q(질문 공간)와 A(응답 공간), f(목표 매핑)가 주어지며, 모든 가능한 언어 L에 대해 q와 a를 L(q), L(a)로 표현한다. π는 LLM의 맵핑으로, L−1πL이 F를 근사하도록 구성한다. (1) Language Design: argminL d(f, L−1πL)로 표현 설계를 최적화한다. (2) Prompt Engineering: g ∈ G를 통해 입력 질문을 변형하여 d(f, L−1πLg)를 최소화한다. (3) 3.5 Assumption: S를 스키마 공간으로 두고, πa: S→A, πs: Q→S를 도입해 언어에 따른 스키마 차이를 KL 기반으로 정의한다. (4) Proposition 3.6: d(f, f̂L) 경계는 SM(L) = DKL(sfL ∥ sfLπ)으로 연결되며, 스키마 불일치가 예측 오차를 결정하는 근본 요인임을 보인다. (5) Level 0-3 설계는 Ambiguity Elimination(Level 1), Logical Constraints(Level 2), Scientific Formalization/World Modeling(Level 3)으로 구성된다. 실험은 logic circuit 문제를 통해 15개의 표현 형식의 차이를 통제된 환경에서 분석한다.
관련 Figure

실험 외부 도메인에서의 활용 가능성을 보여주며 methodology의 확장 가능성을 시사한다.
Figure 3: 다양한 도메인에 대한 실용적 언어 표현 설계 프레임워크의 예시.

단일 프레임워크에서 언어 설계와 스키마 매핑의 관계를 수식적으로 표현한다.
Figure 4: Schema Shaping Objective를 포함한 언어-설계의 수학적 프레임워크 다이어그램.
주요 결과
4.3 Experimental Results 요약: 15가지 언어 표현 중 Canonical Boolean Expression(CBE)이 가장 높은 정확도와 효율성을 보였다(예: Table 1, CBE 100% 정확도, 32–42 초 프롬트 시간 등). NL은 폭넓은 적응성을 보이나 토큰 소비가 크다. Graph Adjacency Notation은 성능은 좋으나 효율이 떨어진다. Petri Net 등 일부 표현은 성능이 저하된다. KAI/KOI 지표는 표현 형식에 따라 활성화 강도와 구조적 일관성이 달라짐을 보여주며, representations에 따른 내부 기하가 서로 구분되는 것을 확인한다. 4.3.3은 GPT-5-chat과 Qwen3-32B를 이용한 다중 모델에서 결과의 일관성을 확인한다. 4.4 Representations Induce Disjoint Internal Geometries: t-SNE 시각화에서 각 surface 형식은 서로 다른 내부 하위공간으로 분리되며, 이는 표현 형식이 논리적 문제 해결에 결정적 역할을 함을 시사한다.
관련 Figure

다양한 표현 형식이 정확도와 계산 비용에 미치는 영향을 비교한다.
Figure 5: 다차원 평가(Accuracy, Time, Tokens) 및 다양한 표현 형식의 영향 시각화.

surface 형식 간의 내부 공간이 독립적으로 형성되며, 표현 설계가 내부 스키마를 어떻게 재구성하는지 시각적으로 확인한다.
Figure 6: 15 표현 형식의 내부 스키마 차이를 보여주는 t-SNE 시각화(Last-Layer Hidden States).
기술 상세
- 전체 아키텍처: Language Design를 통해 Q→S→A의 흐름을 정의하고, LLLM은 L(q)→L(a)로 작동한다. 2) 핵심 수식/기반: d(f, L−1πaπsL) ≤ ϵ, SM(L)=DKL(sfL ∥ sfLπ). Fisher-Rao 거리와 KL발생 관계를 통해 언어 표현과 예측 오차의 상관관계를 이론화한다. 3) 레벨 구분: Level 0-2는 Ambiguity Elimination 및 Logical Constraints를 통해 해석 안정성을 강화하고, Level 3은 Scientific Formalization과 World Modeling으로 고차원 도메인 지식의 형식을 도입한다. 4) 실험 설계: 100개의 문제 집합 Q에 대해 15개 표현(L1~L15)을 자동으로 생성하고, KAI/KOI를 통해 내부 스키마 활성화/구조화를 측정한다. 5) 성능/효율성 분석: 정확도, 프롬트 길이(token), 평균 응답 시간 등을 다각도로 비교하며, 표현 형식이 내부 스키마에 미치는 영향을 정량화한다.
실무 활용
언어 표현 설계는 LLM의 추론 품질과 해석 가능성을 높이는 새로운 엔진으로 작용한다. 이는 파라미터 증가나 도구 의존 없이도 내부 스키마를 재구성해 문제 해결 능력을 확장할 수 있는 방향이다.
- LLM 기반 연구 도구에서 문제 형식의 최적 표현 설계
- 교육용 LLM 시스템에서 학생의 사고 흐름을 강화하는 정형화된 표기 도입
코드 공개 여부: 미확인
키워드
추가 이미지 분석

표현 형식이 내부 어텐션 패턴과 스키마 활성화에 차이를 만든다는 기운을 구체적으로 보여준다.
Figure 7-9: Layer별 Attention Pattern 분석; 다양한 표현 형식에 따른 머리(head)별 주의 분포 차이.

표현 형식별 내부 기하의 구분성과 스키마 재구성의 깊이를 보여준다.
Figure 8-12: Attention 헤드의 분포 차이를 층별로 시각화한 추가 도식들.
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.