프롬프트 처리
모델이 입력을 받아 이해하고 다음 토큰을 생성하기 위해 준비하는 초기 계산 단계다. 컨텍스트가 길어질수록 이 단계의 연산량이 기하급수적으로 늘어나 전체 추론 속도를 늦추는 원인이 된다.