병렬 디코딩
토큰을 하나씩 순서대로 생성하지 않고, 여러 토큰을 동시에 생성하여 추론 속도를 높이는 기술이다.
OCR 추론 속도 3배 향상: 확산 모델로 구현한 병렬 텍스트 추출 기술