Claude Code로 Moebius 0.2B 이미지 인페인팅을 브라우저에서 포팅하기

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

Moebius 0.2B를 클라이언트 브라우저에서 구동하기 위한 포팅 experiment를 다룬다. 온닉스(ONNX)로 PyTorch 모델을 내보내고 WebGPU 기반 ONNX Runtime Web에서 실행하는 흐름을 Claude Code를 활용해 탐색했다. 가중치 약 1.3GB 규모의 모델 파일은 CacheStorage API를 활용한 캐시로 재다운로드를 줄이고, Chrome/Firefox/Safari에서 동작 가능한 수준으로 검증됐다. 이 포팅은 브라우저 기반 ML 데모의 가능성을 보여주지만 대역폭, 캐시 전략, 모델 가용성 같은 현실적 제약도 수반한다.

섹션별 상세

Moebius 0.2B를 브라우저에서 실행하기 위한 포팅 목표를 설정하고 PyTorch에서 ONNX로의 내보내기 및 WebGPU를 활용한 클라이언트-사이드 실행으로 전환하는 흐름을 구체화했다. 이 과정에서 ONNX로의 내보기, WebGPU/ONNX Runtime Web의 실행 경로, 프런트엔드 배포의 제약을 확인했다.

Claude Code를 활용한 에이전트 기반 연구 흐름으로 포팅 프로젝트를 추진하며 Regular Claude 대화, 저장소 관리, 연구 노트 작성, 계획 업데이트를 반복하며 협업적 탐색의 방향을 잡았다. 에이전트가 문제를 ' muse on X' 형태로 고민하도록 지시하고, 코드 저장소를 초기화하고 커밋 로그를 남기는 방식으로 진행했다.

가중치 약 1.3GB 규모의 모델 파일은 CacheStorage API를 통해 브라우저 캐싱이 가능했고, Hugging Face에 가중치를 배포하며 GitHub Pages를 통해 프런트엔드 데모를 호스팅했다. Chrome/Firefox/Safari에서의 실행 가능성을 확인했고, 이는 클라이언트 사이드 ML 데모의 실현 가능성을 보여주지만 네트워크 대역폭과 캐시 전략의 제약도 시사한다.