TL;DR
Kubernetes v1.35 'Timbernetes'는 6년의 개발 끝에 Pod 재시작 없이 리소스를 조정하는 In-Place Pod Resource Resize 기능을 정식 버전으로 출시했다. 이번 릴리즈는 AI/ML 분산 학습 시 발생하는 자원 데드락을 방지하기 위해 Gang Scheduling을 Alpha 단계로 도입하며 AI 인프라로서의 기능을 강화했다. 또한 OCI Image Volume의 GA 전환과 네트워크 최적화를 위한 PreferSameNode 설정 추가를 통해 대규모 데이터 처리와 비용 절감의 기반을 마련했다. 전반적으로 기술 부채를 정리하고 AI와 클라우드 네이티브 생태계의 성숙도를 높이는 데 집중한 업데이트이다.
배경
Kubernetes 기본 아키텍처 및 Pod 생명주기에 대한 이해, YAML 기반의 리소스 매니페스트 작성 능력, cgroup v1/v2 및 컨테이너 런타임(containerd)에 대한 기초 지식
대상 독자
Kubernetes 클러스터 운영자, AI/ML 인프라 엔지니어, 클라우드 네이티브 개발자
의미 / 영향
이번 업데이트는 Kubernetes가 단순한 컨테이너 오케스트레이터를 넘어 AI/ML 워크로드를 위한 성숙한 플랫폼으로 진화했음을 보여줍니다. 특히 6년 만에 안정화된 리소스 동적 할당 기능은 엔터프라이즈 급 서비스의 무중단 운영 수준을 한 단계 높일 것으로 기대됩니다.
섹션별 상세
apiVersion: v1
kind: Pod
metadata:
name: dynamic-app
spec:
containers:
- name: heavy-worker
image: my-app:latest
resources:
limits:
cpu: "1"
memory: "1Gi"
requests:
cpu: "0.5"
memory: "512Mi"
# 리소스 변경 시 재시작하지 않도록 설정
resizePolicy:
- resourceName: cpu
restartPolicy: NotRequired
- resourceName: memory
restartPolicy: NotRequiredPod 재시작 없이 CPU와 메모리 리소스를 동적으로 변경하기 위한 resizePolicy 설정 예시
kubectl patch pod my-app --type='json' \
-p='[{ "op": "replace", "path": "/spec/containers/0/resources/requests/cpu", "value": "500m" },
{ "op": "replace", "path": "/spec/containers/0/resources/limits/cpu", "value": "1000m" }]'실행 중인 Pod의 CPU 할당량을 kubectl patch 명령어로 실시간 수정하는 방법
spec:
containers:
- name: ai-inference-app
image: my-app:v1.0
volumeMounts:
- name: model-weights
mountPath: /models
volumes:
- name: model-weights
image:
reference: my-registry/llm-model:v2.0 # OCI 이미지를 볼륨으로 사용OCI 레지스트리의 모델 가중치 이미지를 Pod 볼륨으로 직접 마운트하는 설정
이미지 분석

세계수(Yggdrasil)를 형상화한 로고로, 안정기에 접어든 쿠버네티스 생태계의 견고함을 상징합니다. 로고 속 다람쥐 캐릭터들은 각각 Triager, Reviewer, Release Crew를 의미하며 오픈소스 기여자들의 역할을 묘사합니다.
Kubernetes v1.35 Timbernetes 공식 릴리즈 로고
실무 Takeaway
- 서비스 중단에 민감한 스테이트풀 애플리케이션이나 AI 워크로드에 In-Place Resize를 적용하여 재시작 없이 리소스를 최적화할 수 있다.
- GPU 자원 낭비가 심한 대규모 분산 학습 환경에서 Gang Scheduling을 활용해 자원 데드락 문제를 해결하고 인프라 가동률을 높일 수 있다.
- 네트워크 비용이 높은 클라우드 환경에서는 PreferSameNode 설정을 활성화하여 노드 간 트래픽을 최소화하고 응답 속도를 개선해야 한다.
언급된 리소스
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.