본문으로 건너뛰기
MegaTrain: 단일 GPU에서 100B+ 파라미터 대형 언어 모델의 전정밀도 학습 구현 | AI Trends