readiness-probe
컨테이너가 실행 중인지뿐만 아니라, 실제로 트래픽을 처리할 준비(예: 모델 로딩 완료)가 되었는지 확인하는 메커니즘이다. 이를 통해 불완전한 상태의 포드에 요청이 가는 것을 방지한다.
10GB 모델 빌드 45분에서 5분으로 단축하는 MLOps 전략