Groq 가속기
행렬 연산 중심의 대규모 추론을 위해 설계된 하드웨어 가속기로, 모델 병렬 처리와 낮은 레이턴시를 목표로 하며 대형 음성·언어 모델을 실시간에 가깝게 서빙하는 데 사용된다.