본문으로 건너뛰기
Taalas, Llama 3.1 8B 모델을 초당 17,000 토큰 속도로 구동하는 전용 하드웨어 발표 | AI Trends