blackwell-architecture
NVIDIA의 차세대 GPU 아키텍처로, FP4와 같은 초저정밀도 연산을 지원하는 텐서 코어와 높은 대역폭의 메모리 구조를 갖추고 있다. 대규모 언어 모델의 학습과 추론에 최적화된 하드웨어이다.
Together AI, 오픈소스 LLM 추론 속도 최대 2배 향상