본문으로 건너뛰기
완전 샤딩 데이터 병렬 처리 (fsdp) 용어 설명 | AI Trends