확률적 최적화
시스템의 출력이나 피드백에 무작위적인 노이즈가 포함된 환경에서 최적의 파라미터를 찾는 기법이다. LLM 에이전트처럼 실행 시마다 결과가 달라지는 경우 단일 결과가 아닌 여러 번의 샘플링을 통해 통계적으로 접근해야 하며, POLCA는 이를 위해 우선순위 큐를 활용해 데이터를 축적한다.