parallel-sampling
동일한 입력에 대해 LLM이 여러 개의 서로 다른 답변 후보를 동시에 생성하게 하는 방식이다. 생성된 여러 결과 중 가장 우수한 것을 선택함으로써 단일 생성 시보다 정확도를 높일 수 있다.
AI 에이전트의 실수, '타임머신'으로 되돌린다: Replit의 Bottomless Storage