본문으로 건너뛰기
Taalas HC1, Llama 3.1 8B 모델에서 초당 16,960 토큰 추론 성능 달성 | AI Trends