원격 프로시저 호출
네트워크를 통해 다른 컴퓨터의 프로그램을 실행하는 기술이다. llama.cpp에서는 여러 대의 PC에 모델 레이어를 분산 배치하고 하나의 통합된 추론 엔진처럼 작동하게 만드는 데 사용된다.
AMD AI PC 4대로 1조 파라미터 LLM 돌리기: 로컬 분산 추론 가이드