Vault: ESP32-S3와 로컬 LLM으로 구축한 텍스트 중심 핸드헬드 AI 터미널

ESP32-S3와 전자종이 디스플레이를 활용해 로컬 120B 모델과 연동되는 텍스트 기반 AI 핸드헬드 기기 Vault의 설계와 구현 과정을 다룬다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

Vault는 ESP32-S3 마이크로컨트롤러를 기반으로 구축된 텍스트 중심의 핸드헬드 AI 터미널로, OLED와 전자종이 디스플레이를 결합해 독특한 사용자 경험을 제공한다. 기기 자체에서 추론을 수행하는 대신 NVIDIA TensorRT-LLM으로 가속화된 로컬 서버의 120B 파라미터 모델과 통신하여 복잡한 에이전트 작업을 처리한다. 사용자는 슬래시 명령어를 통해 쉘, 어시스트, 컨트롤, RPG 모드를 자유롭게 전환할 수 있으며, 특히 OpenClaw 에이전트의 실시간 사고 과정이 전자종이에 시각화되는 것이 특징이다. 하드웨어의 전력 효율성과 로컬 AI의 강력한 성능을 결합함으로써 개인화된 자율 에이전트를 휴대 가능한 형태로 구현하는 데 성공했다.

챕터별 상세

00:00

Vault 프로젝트의 철학과 디자인

Vault는 단순한 알림 기기가 아닌 평온함을 주는 텍스트 중심 기기를 지향한다. OLED는 빠른 반응이 필요한 '라이브' 정보를, 전자종이는 정적인 '콘텐츠'를 담당하도록 설계했다. 사용자는 화려한 그래픽 대신 텍스트를 통해 AI와 깊이 있게 상호작용하며 집중력을 유지할 수 있다. 이러한 디자인은 디지털 기기가 주는 산만함을 최소화하고 AI와의 대화에 집중하게 만든다.

03:00

하드웨어 구성: ESP32-S3와 듀얼 디스플레이

핵심 하드웨어는 단일 ESP32-S3 마이크로컨트롤러와 배터리 셀 하나로 구성된다. 발광형 OLED와 전력이 없어도 화면이 유지되는 이중 안정성 전자종이를 동시에 구동하는 것이 기술적 도전이었다. 저전력 설계를 위해 디스플레이 갱신 주기를 최적화하고 텍스트 렌더링 효율을 극대화했다. 기기는 콤팩트한 폼팩터를 유지하면서도 두 가지 디스플레이의 장점을 결합했다.

ESP32-S3는 저전력 IoT 기기에 널리 쓰이는 칩셋으로, 제한된 자원 내에서 효율적인 제어가 필수적이다.

07:00

시스템 아키텍처: 펌웨어와 백엔드의 통신

기기의 펌웨어는 의존성이 없는 Python 백엔드와 통신하는 구조를 가진다. 펌웨어는 사용자 입력을 수집하고 디스플레이를 제어하는 역할에 집중하며, 복잡한 로직은 백엔드에서 처리한다. 백엔드는 로컬 모델, 에이전트, 게임 엔진으로 요청을 전달하고 결과를 기기로 다시 보낸다. 이러한 분리된 아키텍처를 통해 하드웨어 제약을 극복하고 강력한 AI 기능을 구현했다.

11:00

로컬 추론 엔진: NVIDIA TensorRT-LLM 활용

추론은 기기 내부가 아닌 NVIDIA TensorRT-LLM으로 가속화된 로컬 서버에서 수행된다. gpt-oss:120b 모델을 사용하여 복잡한 추론과 에이전트 작업을 처리하며, 기기는 Wi-Fi를 통해 결과를 수신한다. 이를 통해 핸드헬드 기기의 전력 소모를 줄이면서도 고성능 LLM의 지능을 활용할 수 있게 되었다. 로컬 서버 구동 방식은 데이터 프라이버시와 응답 속도를 동시에 확보한다.

120B 모델은 파라미터가 1,200억 개에 달하는 거대 모델로, 고성능 GPU 서버에서의 가속화가 필수적이다.

15:00

네 가지 작동 모드와 슬래시 명령어

사용자는 단일 슬래시 명령어를 통해 쉘(Shell), 어시스트(Assist), 컨트롤(Control), RPG 모드 사이를 전환한다. 쉘 모드는 시스템 명령을, 어시스트는 일반적인 대화를, 컨트롤은 외부 장치 제어를 담당한다. RPG 모드는 LLM 네이티브 게임 엔진을 통해 사용자에게 몰입감 있는 서사 경험을 제공한다. 각 모드는 텍스트 인터페이스를 통해 직관적으로 조작 가능하다.

19:00

OpenClaw 에이전트와 실시간 사고 과정 시각화

Vault는 자율 에이전트인 OpenClaw를 구동하여 복잡한 도구 사용 작업을 수행한다. 에이전트가 문제를 해결하기 위해 생각하고 도구를 호출하는 과정이 전자종이 디스플레이에 실시간으로 표시된다. 사용자는 AI가 결과만 내놓는 것이 아니라 어떤 논리적 단계를 거치는지 투명하게 확인할 수 있다. 이는 AI의 작동 방식에 대한 신뢰도를 높이고 사용자 경험을 풍부하게 만든다.

22:00

LLM 네이티브 RPG 게임 엔진 설계

기기에 탑재된 RPG 모드는 기존의 체력(HP)이나 주사위 굴리기 대신 서사 상태(Narrative State)를 추적한다. LLM이 게임 마스터 역할을 하며 사용자의 선택에 따라 실시간으로 이야기를 생성하고 세계관의 일관성을 유지한다. 모든 게임 데이터는 텍스트 형태로 관리되며, 모델의 추론 능력을 활용해 고정된 시나리오가 없는 무한한 모험을 가능하게 한다. 이는 LLM이 게임 디자인의 핵심 메커니즘으로 작동하는 사례이다.

언급된 리소스

GitHubLech Kalinowski GitHub

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 06. 29.수집 2026. 06. 29.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.