분리형 파이프라인
AI 추론의 Pre-fill 단계와 Decode 단계를 서로 다른 하드웨어 가속기에 할당하여 처리하는 구조이다. 각 단계에 최적화된 자원을 배분함으로써 효율성과 성능을 극대화한다.