확산 프로세스
데이터에 노이즈를 점진적으로 추가했다가 다시 제거하는 과정을 통해 데이터를 생성하는 기법이다. 주로 이미지 생성에 쓰였으나 Mercury 2는 이를 텍스트 생성에 적용했다.
GPT-4o보다 5배 빠르고 환각은 제로? 디퓨전 기반 추론 모델의 충격적 성능