데이터 버전 관리
Git과 유사한 방식으로 대용량 데이터셋과 머신러닝 모델의 버전을 관리하는 오픈소스 도구이다. 코드와 데이터를 연결하여 파이프라인의 각 단계를 추적하고 재현 가능한 실험 환경을 제공한다.