프롬프트 처리(prompt-processing)이란 무엇인가요?

Question

Accepted Answer

모델이 입력을 받아 이해하고 다음 토큰을 생성하기 위해 준비하는 초기 계산 단계다. 컨텍스트가 길어질수록 이 단계의 연산량이 기하급수적으로 늘어나 전체 추론 속도를 늦추는 원인이 된다.

prompt-processing