비결정성
동일한 입력에 대해 항상 같은 결과가 나오지 않는 성질이다. LLM은 확률적으로 다음 토큰을 생성하므로 결과가 매번 달라질 수 있어 전통적인 소프트웨어 테스트 방식 적용이 어렵다. 이는 AI 시스템의 신뢰성을 측정하고 보장하는 데 있어 가장 큰 기술적 장벽으로 작용한다.