결함 허용 학습
대규모 분산 학습 도중 일부 노드나 하드웨어에 장애가 발생하더라도 전체 학습 프로세스가 중단되지 않고 자동으로 복구되어 계속 진행될 수 있도록 설계된 시스템 구조이다.