random-access
데이터의 물리적 위치와 상관없이 임의의 위치에 있는 데이터를 즉각적으로 읽거나 쓰는 방식이다. 순차적 스캔에 최적화된 기존 포맷과 달리, AI 학습 시 셔플링이나 RAG의 특정 행 추출에 필수적이다. I/O 병목을 줄여 GPU 연산 자원의 활용도를 극대화하는 성능 지표이다.
데이터의 물리적 위치와 상관없이 임의의 위치에 있는 데이터를 즉각적으로 읽거나 쓰는 방식이다. 순차적 스캔에 최적화된 기존 포맷과 달리, AI 학습 시 셔플링이나 RAG의 특정 행 추출에 필수적이다. I/O 병목을 줄여 GPU 연산 자원의 활용도를 극대화하는 성능 지표이다.