자기회귀 디코딩
이전 단계에서 생성된 토큰을 다음 단계의 입력으로 사용하여 순차적으로 데이터를 생성하는 방식이다. 정확도가 높지만 문장이 길어질수록 속도가 느려지는 단점이 있다.
초당 1,000토큰 돌파! 디퓨전 기술로 LLM 추론 속도 5배 높인 Mercury 2 출시
OCR 추론 속도 3배 향상: 확산 모델로 구현한 병렬 텍스트 추출 기술