레이 트레인
Ray 프레임워크 상에서 분산 학습을 오케스트레이션하는 라이브러리이다. PyTorch, DeepSpeed 등의 학습 로직을 클러스터 환경으로 확장하고 체크포인트 관리 및 장애 복구를 자동화한다.