rdma
CPU의 개입 없이 한 컴퓨터의 메모리에서 다른 컴퓨터의 메모리로 데이터를 직접 전송하는 기술로, 분산 학습 시 GPU 간 통신 지연을 최소화하는 데 필수적입니다.
Together AI의 CPD: 긴 컨텍스트 추론 처리량 40% 향상
Together AI에서 PyTorch RL 파이프라인을 더 빠르고 유연하게 실행하세요