Mercury Edit 2 출시: 코딩 워크플로를 위한 초고속 확산 기반 LLM

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

Mercury Edit 2는 코딩 중 다음 편집을 예측하는 데 특화된 확산 기반 언어 모델(dLLM)이다. 기존의 순차적 토큰 생성 방식과 달리 확산 프로세스를 통해 토큰을 병렬로 생성하여 개발자가 인지하지 못할 수준의 낮은 지연 시간을 구현했다. 고품질 편집 데이터셋과 KTO 강화학습을 통해 사용자 선호도를 반영하고 불필요한 제안을 줄였다. 내부 벤치마크 결과 기존 모델 대비 수락률이 48% 향상되었으며, Zed 에디터 등 주요 도구에 즉시 통합 가능하다.

배경

LLM 추론 방식(Autoregressive vs Diffusion)에 대한 기본 이해, Zed 에디터 또는 API 연동을 위한 개발 환경, 강화학습(RLHF, KTO)의 개념적 지식

대상 독자

실시간 코드 완성 및 편집 보조 도구를 사용하는 소프트웨어 개발자 및 MLOps 엔지니어

의미 / 영향

확산 모델을 언어 모델에 적용하여 속도 문제를 해결함으로써, LLM이 단순한 챗봇을 넘어 실시간 상호작용이 필요한 전문 도구 영역으로 확장되는 계기가 될 것이다. 특히 코딩 에이전트 분야에서 지연 시간 단축은 사용자 생산성에 직결되는 핵심 요소로 작용할 전망이다.

섹션별 상세

Mercury Edit 2는 지연 시간에 민감한 '다음 편집 예측' 작업을 위해 설계된 확산 기반 LLM이다. 토큰을 하나씩 생성하는 기존 방식 대신 확산 모델의 특성을 활용해 병렬로 생성함으로써 추론 속도를 획기적으로 높였다. 이를 통해 개발자가 코드를 작성하는 흐름을 방해하지 않고 실시간으로 제안을 제공하는 것이 가능하다.

모델 학습을 위해 다양한 프로그래밍 언어와 시나리오를 포함한 고품질 편집 데이터셋을 구축하여 활용했다. 단순히 다음 토큰을 맞추는 것이 아니라 편집 이력과 코드베이스 컨텍스트를 해석해 정확한 수정 사항을 제안하도록 훈련했다. 초기 모델이 너무 잦거나 긴 편집을 제안하는 문제를 해결하기 위해 실제 사용자 피드백 데이터를 수집하여 보완했다.

수집된 인간 선호도 데이터를 바탕으로 KTO라는 비쌍체 강화학습 기법을 적용해 모델을 정렬했다. 이 과정을 통해 모델은 사용자가 실제로 수락할 가능성이 높은 유용한 제안만 선택적으로 출력하도록 최적화됐다. 그 결과 모델의 편집 수락률은 48% 증가했고, 불필요한 노출은 27% 감소하여 사용자 경험이 대폭 개선됐다.

Mercury Edit 1과 2의 수락률 및 노출률 비교 막대 그래프 — ChartMercury Edit 2가 이전 버전 대비 수락률은 28% 증가하고, 불필요한 노출률은 21% 감소했음을 보여준다. 이는 모델이 더 정확하고 선별적인 제안을 수행하게 되었음을 의미한다.

품질과 속도를 검증하기 위해 Instinct, FIM, NEP 등 공개 벤치마크와 내부 테스트 세트를 사용해 성능을 측정했다. Mercury Edit 2는 변수명 변경, 리팩터링, 기능 구현 등 다양한 시나리오에서 기존의 속도 최적화 모델들보다 우수한 성능을 보였다. 특히 엔드투엔드 지연 시간 측면에서 타사 모델 대비 압도적인 우위를 점하며 실시간 코딩 보조에 최적화됐음을 입증했다.

주요 모델별 품질 대비 엔드투엔드 지연 시간 산점도 — ChartMercury Coder가 250ms 미만의 매우 낮은 지연 시간과 80%에 육박하는 높은 품질을 동시에 달성하여 GPT-5.4 Nano, Gemini 3.1 Flash Live 등 타사 모델을 압도하는 성능을 보여준다.

실무 Takeaway

확산 기반 아키텍처(dLLM)를 채택하여 토큰을 병렬 생성함으로써 코딩 에이전트의 반응 속도를 실시간 수준으로 단축할 수 있다.
KTO 강화학습을 통해 모델의 선택성을 높임으로써 개발자의 집중력을 흐트러뜨리는 무분별한 코드 제안을 효과적으로 억제했다.
Zed 에디터와 같은 도구에서 Mercury Edit 2를 활용하면 리팩터링이나 기능 구현 시 탭 키 하나로 복잡한 편집을 즉시 완료할 수 있다.

언급된 리소스

API DocsInception Platform