핵심 요약
교사가 전문적인 코딩 지식 없이도 정적인 교과서 내용을 학생이 직접 조작할 수 있는 대화형 시뮬레이션으로 변환할 수 있게 돕는다. 기존 AI 도구들이 단순히 정적인 웹페이지를 만드는 데 그쳤던 한계를 극복하고, 교육적 정확성과 빠른 수정 속도를 동시에 확보했다.
왜 중요한가
교사가 전문적인 코딩 지식 없이도 정적인 교과서 내용을 학생이 직접 조작할 수 있는 대화형 시뮬레이션으로 변환할 수 있게 돕는다. 기존 AI 도구들이 단순히 정적인 웹페이지를 만드는 데 그쳤던 한계를 극복하고, 교육적 정확성과 빠른 수정 속도를 동시에 확보했다.
핵심 기여
구조화된 지식 분석 프레임워크
최대 50페이지 분량의 PDF나 PPT에서 핵심 개념, 학습 목표, 절차적 지식을 추출하여 교육적 엄밀성을 유지하는 멀티모달 이해 기술을 적용했다.
2단계 생성-검증-최적화 파이프라인
내용의 정확성을 보장하는 1단계 생성과 시각적 완성도를 높이는 2단계 최적화를 분리하여 '정확하지만 보기 흉한' 혹은 '예쁘지만 틀린' 결과물이 나오는 문제를 해결했다.
Click-to-Locate 및 Unified Diff 기반 편집
사용자가 UI 요소를 클릭하고 자연어로 수정을 요청하면 전체를 다시 생성하지 않고 변경된 코드만 패치하는 방식으로 수정 시간을 200초 이상에서 10초 미만으로 단축했다.
관련 Figure

문서 탐색(A), 시뮬레이션 생성(B), 그리고 클릭 기반 편집(C) 과정을 보여준다. 특히 (C)에서 특정 요소를 클릭해 자연어로 색상을 변경하는 'Click-to-Locate' 기능의 직관성을 확인할 수 있다.
MAIC-UI의 전체 인터페이스와 렌즈 초점 거리 시뮬레이션 생성 및 편집 과정
핵심 아이디어 이해하기
기존의 LLM 기반 코드 생성은 전체 파일을 매번 새로 작성해야 하므로 수정 시 대기 시간이 길고, 이 과정에서 이전의 정상적인 코드까지 망가지는 불안정성이 있었다. MAIC-UI는 이를 해결하기 위해 소프트웨어 공학의 버전 관리 개념인 Diff(차이점) 메커니즘을 도입했다.
먼저 교과서의 텍스트와 이미지를 Embedding 공간에서 분석하여 '절차적 지식'을 추출하고, 이를 시뮬레이션의 상태 값과 연결한다. 사용자가 특정 UI 요소를 클릭하면 시스템은 해당 요소에 대응하는 DOM 구조와 코드를 즉시 식별한다.
수정 요청 시 LLM은 전체 코드가 아닌 변경이 필요한 부분에 대한 'Patch' 코드만 생성하며, Unified Diff 형식을 통해 기존 코드 구조를 유지하면서 특정 라인만 교체한다. 결과적으로 사용자는 마치 종이에 스케치하듯 실시간으로 교육 자료를 다듬을 수 있게 된다.
방법론
MAIC-UI는 멀티모달 분석, 2단계 생성, 그리고 증분 편집의 세 단계로 구성된다. 분석 단계에서는 Vision-Language Model을 사용하여 문서 이미지에서 Main Topics, Key Concepts, Procedural Concepts 등 6가지 핵심 필드를 추출한다.
생성 단계는 Stage 1(Content-Aligned)에서 HTML/JavaScript 로직을 구성하고, Stage 2(Visual Polish)에서 테마 색상과 애니메이션을 적용한다. 각 단계 직후에는 HTML Validator가 [생성된 코드 → 구문 분석 → 오류 감지] 과정을 거쳐 실행 가능한 코드인지 검증하며, 실패 시 피드백을 AI에게 다시 전달하여 자가 수정을 유도한다.
편집 단계에서는 Click-to-Locate 모듈이 사용자의 클릭 이벤트에서 XPath와 CSS Selector를 추출한다. [클릭 위치 + 자연어 명령 + 전체 컨텍스트]를 입력으로 받아 AI가 Unified Diff 형식의 출력을 내놓으면, 시스템은 이를 기존 소스에 적용하여 10초 이내에 화면을 갱신한다.
관련 Figure

교사가 입력한 구조화된 개념(A)이 어떻게 실제 조작 가능한 시뮬레이션 UI(B)로 변환되는지 보여준다. 우측의 과학적 원리 설명과 하단의 제어 슬라이더가 연동되는 구조를 확인할 수 있다.
뉴턴의 제1법칙(관성) 시뮬레이션 생성 사례
주요 결과
40명의 참가자를 대상으로 한 실험에서 MAIC-UI는 직접적인 Text-to-HTML 방식 대비 편집 반복 횟수를 7.0회에서 4.9회로 줄였으며, 시스템 학습 용이성과 제어 가능성 점수를 유의미하게 높였다.
3개월간 53명의 고등학생을 대상으로 진행한 실제 수업 적용 결과, MAIC-UI를 활용한 실험 집단은 STEM 과목 점수가 9.21점 상승한 반면, 전통적 수업을 받은 통제 집단은 2.32점 하락했다. 특히 성적 하위 25% 학생들의 점수 향상 폭이 더 크고 성적 편차가 줄어드는 등 교육 격차 해소 효과가 확인됐다.
관련 Figure

MAIC-UI를 도입한 C1 학급이 다른 학급들에 비해 STEM 과목에서 압도적인 점수 향상(9.2점)을 기록했음을 보여준다. 이는 대화형 콘텐츠가 실제 학습 성과로 이어짐을 입증한다.
실험 집단(C1)과 통제 집단 간의 STEM 및 인문 과목 성적 향상도 비교 차트
기술 상세
MAIC-UI의 아키텍처는 React 18 프론트엔드와 FastAPI 백엔드로 구성된다. 멀티모달 분석에는 GLM-4.6V를, 텍스트 및 코드 생성에는 GLM-4.7 모델을 사용하며 각각의 온도(temperature) 설정을 0.2와 0.3으로 최적화하여 일관성을 확보했다.
핵심 기술인 Unified Diff 프로세싱은 Python의 difflib을 활용하여 구현되었으며, AI가 생성한 패치를 기존 코드에 적용할 때 발생할 수 있는 미세한 스타일 차이를 극복하기 위해 Fuzzy Context Matching 기법을 적용했다. 이를 통해 패치 적용 성공률을 높이고 전체 재생성 대비 토큰 사용량을 약 90% 절감했다.
한계점
현재 시스템은 단일 페이지 시뮬레이션 생성에 집중하고 있어 긴 서사나 순차적인 여러 페이지의 교과 과정을 구성하는 데 한계가 있다. 또한 Vision-Language Model이 복잡한 전문 도표나 특수 기호를 오독할 가능성이 여전히 존재한다.
실무 활용
교사가 직접 프로그래밍 없이 교과서 PDF를 대화형 학습 도구로 변환하고 실시간으로 수정할 수 있는 웹 기반 저작 도구로 활용 가능하다.
- 물리 법칙(렌즈의 초점, 뉴턴의 법칙 등)을 직접 변수를 조절하며 실험하는 시뮬레이션 제작
- 수학적 개념이나 화학 반응 과정을 단계별 애니메이션으로 시각화
- 기존 PDF 교안을 학생 개개인의 수준에 맞춘 맞춤형 대화형 콘텐츠로 변환
코드 공개 여부: 공개
코드 저장소 보기키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.