numa
멀티 프로세서 환경에서 각 프로세서가 자신에게 물리적으로 가까운 메모리에 접근할 때 더 빠른 속도를 내는 메모리 설계 방식이다. AMD GPU의 NPS 모드에서 메모리 지역성을 최적화하는 데 사용된다.
지표는 정상인데 학습은 중단? GPU 클러스터 유령 장애 해결법
AMD GPU 최적화로 LLM 추론 성능 2배 높이고 비용은 절반으로
AMD MI325X와 vLLM 최적화로 추론 처리량 2배 높이고 비용은 절반으로
AMD MI300X GPU 1대를 8대로 쪼개 쓰는 법: ClearML의 파티셔닝 기술