아파치 스파크
대용량 데이터 처리를 위한 오픈소스 분산 컴퓨팅 프레임워크로, 여러 대의 컴퓨터를 연결해 데이터를 병렬로 분석한다. 최근에는 GPU 가속 라이브러리와 결합하여 기존 CPU 기반 처리의 한계를 극복하고 대규모 데이터 전처리 및 분석 속도를 획기적으로 높이는 방향으로 진화하고 있다.