에이전틱 추론
AI 에이전트가 복잡한 작업을 수행하기 위해 여러 단계의 추론과 도구 사용을 반복하는 과정입니다. 이 과정에서 이전 대화 맥락인 KV 캐시를 빈번하게 불러와야 하므로 I/O 성능이 매우 중요합니다.
유휴 대역폭 활용하는 DualPath로 LLM 추론 성능 2배 향상