Pod LifeCycle
파드 라이프사이클
이 페이지는 파드의 라이프사이클을 설명한다.
파드의 단계(phase)
파드의 status
필드는 phase
필드를 포함하는 PodStatus 오브젝트로 정의된다.
파드의 phase는 파드가 라이프사이클 중 어느 단계에 해당하는지 표현하는 간단한 고수준의 요약이다. Phase는 컨테이너나 파드의 관측 정보에 대한 포괄적인 롤업이나, 포괄적인 상태 머신을 표현하도록 의도되지는 않았다.
파드 phase 값에서 숫자와 의미는 엄격하게 지켜진다. 여기에 문서화된 내용 이외에는, 파드와 파드에 주어진 phase
값에 대해서 어떤 사항도 가정되어서는 안 된다.
phase
에 가능한 값은 다음과 같다.
값 | 의미 |
| 파드가 쿠버네티스 시스템에 의해서 승인되었지만, 파드를 위한 하나 또는 하나 이상의 컨테이너 이미지 생성이 아직 완료되지 않았다. 여기에는 스케줄되기 이전까지의 시간 뿐만 아니라 오래 걸릴 수 있는 네트워크를 통한 이미지 다운로드 시간도 포함된다. |
| 파드가 한 노드에 결합되었고, 모든 컨테이너들의 생성이 완료되었다. 적어도 하나의 컨테이너가 동작 중이거나, 시작 또는 재시작 중에 있다. |
| 파드에 있는 모든 컨테이너들이 성공으로 종료되었고, 재시작되지 않을 것이다. |
| 파드에 있는 모든 컨테이너들이 종료되었고, 적어도 하나 이상의 컨테이너가 실패로 종료되었다. 즉, 해당 컨테이너는 non-zero 상태로 빠져나왔거나(exited) 시스템에 의해서 종료(terminated)되었다. |
| 어떤 이유에 의해서 파드의 상태를 얻을 수 없다. 일반적으로 파드 호스트와의 통신 오류에 의해서 발생한다. |
파드의 조건(condition)
파드는 하나의 PodStatus를 가지며, 그것은 파드가 통과했거나 통과하지 못한 조건에 대한 PodConditions 배열을 가진다. PodCondition 배열의 각 요소는 다음 여섯 가지 필드를 가질 수 있다.
lastProbeTime
필드는 파드의 조건이 마지막으로 조사된 시점의 타임스탬프를 제공한다.lastTransitionTime
필드는 파드가 마지막으로 한 상태에서 다른 상태로 전환된 시점의 타임스탬프를 제공한다.message
필드는 전환에 대한 세부 정보를 표시한, 사람이 읽을 수 있는 메시지이다.reason
필드는 마지막으로 발생한 전환의 이유다. 이유는 유일하게, 한 단어로, 카멜 표기법(CamelCase)으로 표기된다.status
필드는True
", "False
", 그리고 "Unknown
"으로 지정될 수 있는 문자열이다.type
필드는 다음과 같은 가능한 값들의 문자열이다.PodScheduled
: 파드가 하나의 노드로 스케줄 완료되었음.Ready
: 파드는 요청들을 수행할 수 있으며 모든 매칭 서비스들의 로드밸런싱 풀에 추가되어야 함.Initialized
: 모든 초기화 컨테이너가 성공적으로 시작 완료되었음.ContainersReady
: 파드 내의 모든 컨테이너가 준비 상태임.
컨테이너 프로브(probe)
프로브는 컨테이너에서 kubelet에 의해 주기적으로 수행되는 진단(diagnostic)이다. 진단을 수행하기 위해서, kubelet은 컨테이너에 의해서 구현된 핸들러를 호출한다. 핸들러에는 다음과 같이 세 가지 타입이 있다.
ExecAction 은 컨테이너 내에서 지정된 명령어를 실행한다. 명령어가 상태 코드 0으로 종료되면 진단이 성공한 것으로 간주한다.
TCPSocketAction 은 지정된 포트에서 컨테이너의 IP주소에 대해 TCP 검사를 수행한다. 포트가 활성화되어 있다면 진단이 성공한 것으로 간주한다.
HTTPGetAction 은 지정한 포트 및 경로에서 컨테이너의 IP주소에 대한 HTTP Get 요청을 수행한다. 응답의 상태 코드가 200보다 크고 400보다 작으면 진단이 성공한 것으로 간주한다.
각 probe는 다음 세 가지 결과 중 하나를 가진다.
Success: 컨테이너가 진단을 통과함.
Failure: 컨테이너가 진단에 실패함.
Unknown: 진단 자체가 실패하였으므로 아무런 액션도 수행되면 안됨.
kubelet은 실행 중인 컨테이너들에 대해서 선택적으로 세 가지 종류의 프로브를 수행하고 그에 반응할 수 있다.
livenessProbe
: 컨테이너가 동작 중인지 여부를 나타낸다. 만약 활성 프로브(liveness probe)에 실패한다면, kubelet은 컨테이너를 죽이고, 해당 컨테이너는 재시작 정책의 대상이 된다. 만약 컨테이너가 활성 프로브를 제공하지 않는 경우, 기본 상태는Success
이다.readinessProbe
: 컨테이너가 요청을 처리할 준비가 되었는지 여부를 나타낸다. 만약 준비성 프로브(readiness probe)가 실패한다면, 엔드포인트 컨트롤러는 파드에 연관된 모든 서비스들의 엔드포인트에서 파드의 IP주소를 제거한다. 준비성 프로브의 초기 지연 이전의 기본 상태는Failure
이다. 만약 컨테이너가 준비성 프로브를 지원하지 않는다면, 기본 상태는Success
이다.startupProbe
: 컨테이너 내의 애플리케이션이 시작되었는지를 나타낸다. 스타트업 프로브(startup probe)가 주어진 경우, 성공할 때 까지 다른 나머지 프로브는 활성화 되지 않는다. 만약 스타트업 프로브가 실패하면, kubelet이 컨테이너를 죽이고, 컨테이너는 재시작 정책에 따라 처리된다. 컨테이너에 스타트업 프로브가 없는 경우, 기본 상태는Success
이다.
언제 활성 프로브를 사용해야 하는가?
FEATURE STATE: Kubernetes v1.0 [stable]
만약 컨테이너 속 프로세스가 어떠한 이슈에 직면하거나 건강하지 못한 상태(unhealthy)가 되는 등 프로세스 자체의 문제로 중단될 수 있더라도, 활성 프로브가 반드시 필요한 것은 아니다. 그 경우에는 kubelet이 파드의 restartPolicy
에 따라서 올바른 대처를 자동적으로 수행할 것이다.
프로브가 실패한 후 컨테이너가 종료되거나 재시작되길 원한다면, 활성 프로브를 지정하고, restartPolicy
를 항상(Always) 또는 실패 시(OnFailure)로 지정한다.
언제 준비성 프로브를 사용해야 하는가?
FEATURE STATE: Kubernetes v1.0 [stable]
프로브가 성공한 경우에만 파드에 트래픽 전송을 시작하려고 한다면, 준비성 프로브를 지정하길 바란다. 이 경우에서는, 준비성 프로브가 활성 프로브와 유사해 보일 수도 있지만, 스팩에 준비성 프로브가 존재한다는 것은 파드가 트래픽을 받지 않는 상태에서 시작되고 프로브가 성공하기 시작한 이후에만 트래픽을 받는다는 뜻이다. 만약 컨테이너가 대량의 데이터, 설정 파일들, 또는 시동 중 마그레이션을 처리해야 한다면, 준비성 프로브를 지정하길 바란다.
만약 당신의 컨테이너가 유지 관리를 위해서 자체 중단되게 하려면, 준비성 프로브를 지정하길 바란다. 준비성 프로브는 활성 프로브와는 다르게 준비성에 특정된 엔드포인트를 확인한다.
파드가 삭제될 때 단지 요청들이 흘려 보낼(drain) 목적으로, 준비성 프로브가 필요하지는 않다는 점을 유념해야한다. 삭제 시에, 파드는 프로브의 존재 여부와 무관하게 자동으로 스스로를 준비되지 않은 상태(unready)로 변경한다. 파드는 파드 내의 모든 컨테이너들이 중지될 때까지 준비되지 않은 상태로 남아있는다.
언제 스타트업 프로브를 사용해야 하는가?
FEATURE STATE: Kubernetes v1.16 [alpha]
컨테이너가 보통 initialDelaySeconds + failureThreshold × periodSeconds
이후에 기동된다면, 스타트업 프로브가 활성화 프로브와 같은 엔드포인트를 체크하도록 명시해야 한다. periodSeconds
의 기본 값은 30s 이다. 이 때 컨테이너가 활성화 프로브의 기본 값 변경 없이 기동되도록 하려면 failureThreshold
를 충분히 높게 설정해주어야 한다. 그래야 데드락(deadlocks)을 방지하는데 도움이 된다.
활성, 준비성 및 스타트업 프로브를 설정하는 방법에 대한 추가적인 정보는, 활성, 준비성 및 스타트업 프로브 설정하기를 참조하면 된다.
파드 및 컨테이너 상태
파드 및 컨테이너 상태에 대한 자세한 정보는, PodStatus 및 ContainerStatus를 참조하면 된다. 파드의 상태로서 보고되는 정보는 현재의 ContainerState에 의존적이라는 점에 유의하길 바란다.
컨테이너 상태
일단 스케줄러가 파드를 노드에 할당하면, kubelet이 컨테이너 런타임으로 컨테이너를 만들기 시작한다. 컨테이너에 세 가지 상태가 있는데, Waiting, Running, 그리고 Terminated이다. 컨테이너의 상태를 체크하려면 kubectl describe pod [POD_NAME]
명령을 사용할 수 있다. 상태는 파드 안에 있는 컨테이너 각각에 대해 출력된다.
Waiting
: 컨테이너의 기본 상태이다. 컨테이너가 Running 이나 Terminated 상태가 아닌 경우, Waiting 상태이다. Waiting 상태의 컨테이너는 이미지를 내려받거나(pull), 시크릿을 적용하는 등의 필요한 오퍼레이션이 수행 중인 상태이다. 이 상태와 더불어서, 더 자세한 정보를 제공하기 위해 상태에 대한 메시지와 이유가 출력된다.Running
: 컨테이너가 이슈 없이 구동된다는 뜻이다.postStart
훅(있는 경우)은 컨테이너가 Running 상태가 되기 전에 실행된다. 이 상태는 컨테이너가 언제 Running 상태에 돌입한 시간도 함께 출력된다.Terminated
: 컨테이너가 실행이 완료되어 구동을 멈추었다는 뜻이다. 컨테이너가 성공적으로 작업을 완료했을 때나 어떤 이유에서 실패했을 때 이 상태가 된다. 원인과 종료 코드(exit code)가 컨테이너의 시작과 종료 시간과 함께 무조건 출력된다. 컨테이너가 Terminated 상태가 되기 전에,preStop
훅이 (존재한다면) 실행된다.
파드의 준비성(readiness)
FEATURE STATE: Kubernetes v1.14 [stable]
애플리케이션은 추가 피드백 또는 신호를 PodStatus: Pod readiness 와 같이 주입할 수 있다. 이를 사용하기 위해, 파드의 준비성을 평가하기 위한 추가적인 조건들을 PodSpec
내의 ReadinessGate
필드를 통해서 지정할 수 있다.
준비성 게이트는 파드에 대한 status.condition
필드의 현재 상태에 따라 결정된다. 만약 쿠버네티스가 status.conditions
필드에서 해당하는 조건을 찾지 못한다면, 그 조건의 상태는 기본 값인 "False
"가 된다. 아래는 한 예제를 보여준다.
여기 예제가 있다.
추가하는 파드 상태에는 쿠버네티스 레이블 키 포맷을 충족하는 이름이 있어야 한다.
파드 준비성 상태
kubectl patch
명령어는 아직 오브젝트 상태 패치(patching)를 지원하지 않는다. 이러한 status.conditions
을 파드에 설정하려면 애플리케이션과 오퍼레이터의 PATCH
액션을 필요로 한다. 쿠버네티스 클라이언트 라이브러리를 사용해서 파드 준비성에 대한 사용자 지정 파드 조건을 설정하는 코드를 작성할 수 있다.
사용자 지정 조건을 사용하는 파드의 경우, 다음 두 조건이 모두 적용되는 경우에 만 해당 파드가 준비된 것으로 평가된다.
파드 내의 모든 컨테이너들이 준비 상태이다.
ReadinessGates
에 지정된 모든 조건들이True
이다.
파드의 컨테이너가 Ready 이나 적어도 한 개의 사용자 지정 조건이 빠졌거나 False
이면, Kubelet은 파드의 상태를 ContainerReady
로 설정한다.
재시작 정책
PodSpec은 항상(Always), 실패 시(OnFailure), 절대 안 함(Never) 값으로 설정 가능한 restartPolicy
필드를 가지고 있다. 기본 값은 항상(Always)이다. restartPolicy
는 파드 내의 모든 컨테이너들에 적용된다. restartPolicy
는 같은 노드에 있는 kubelet에 의한 컨테이너들의 재시작에만 관련되어 있다. kubelet에 의해서 재시작되는 종료된 컨테이너는 5분으로 제한된 지수 백-오프 지연(10초, 20초, 40초 ...)을 기준으로 재시작되며, 10분의 성공적 실행 후에 재설정된다. 파드 문서에서 의논된 바와 같이, 파드는 일단 한 노드에 바운드되고 나면, 다른 노드에 다시 바운드되지 않는다.
파드의 일생(lifetime)
일반적으로, 파드는 사람 혹은 컨트롤러의 프로세스가 명시적으로 파드를 삭제할 때까지 남아 있다. 컨트롤 플레인은 파드의 수가 설정된 임계치(kube-controller-manager에서 terminated-pod-gc-threshold
에 의해 결정)를 초과할 때, 종료된 파드들(Succeeded
또는 Failed
단계)을 정리한다. 이로써 시간이 지남에 따라 파드들이 생성 및 종료되며 발생하는 리소스 누수를 피할 수 있다.
파드에는 다음과 같은 다양한 종류의 리소스가 있다.
예를 들어 웹 서버와 같이 종료되지 않을 것으로 예상되는 파드용 디플로이먼트(Deployment), 레플리카셋(ReplicaSet) 또는 스테이트풀셋(StatefulSet)을 사용한다.
배치 연산과 같이, 종료가 예상되는 파드를 위해서는 잡(Job)을 사용하길 바란다. 잡은
restartPolicy
가 실패 시(OnFailure) 또는 절대 안 함(Never)으로 지정된 경우에 적합하다.적합한 노드 당 하나씩 실행해야 하는 파드에는 데몬셋(DaemonSet)을 사용한다.
모든 워크로드 리소스에는 파드명세가 포함된다. 사용자가 직접적으로 파드를 생성하는 것보다 적절한 워크로드 리소스를 생성하고 리소스 컨트롤러가 사용자를 위한 파드를 생성하도록 하는 것을 권장한다.
만약 노드가 죽거나 다른 클러스터의 다른 노드들로부터 연결이 끊기면, 쿠버네티스는 잃어버린 노드에 있는 모든 파드의 phase
를 실패된(Failed)으로 설정하는 정책을 적용한다.
예제
고급 활성 프로브 예제
활성 프로브는 kubelet에 의해서 실행된다. 따라서 모든 요청은 kubelet 네트워크 네임스페이스에서 이루어진다.
상태 예제
파드가 동작 중이고 하나의 컨테이너를 가지고 있다. 컨테이너는 성공으로 종료됐다.
완료 이벤트를 기록한다.
만약
restartPolicy
가 :항상(Always)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.실패 시(OnFailure)이면: 파드의
phase
는 Succeeded가 된다.절대 안 함(Never)이면: 파드의
phase
는 Succeeded가 된다.
파드가 동작 중이고 하나의 컨테이너를 가지고 있다. 컨테이너는 실패로 종료됐다.
실패 이벤트를 기록한다.
만약
restartPolicy
가 :항상(Always)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.실패 시(OnFailure)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.절대 안 함(Never)이면: 파드의
phase
는 Failed가 된다.
파드가 동작 중이고 두 개의 컨테이너를 가지고 있다. 컨테이너 1이 실패로 종료됐다.
실패 이벤트를 기록한다.
만약
restartPolicy
가 :항상(Always)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.실패 시(OnFailure)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.절대 안 함(Never)이면: 컨테이너는 재시작되지 않고, 파드의
phase
는 Running으로 유지된다.
만약 컨테이너 1이 동작 중이 아니고, 컨테이너 2가 종료됐다면 :
실패 이벤트를 기록한다.
만약
restartPolicy
가 :항상(Always)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.실패 시(OnFailure)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.절대 안 함(Never)이면: 파드의
phase
는 Failed가 된다.
파드는 동작 중이고 하나의 컨테이너를 가지고 있다. 컨테이너의 메모리가 부족하다.
컨테이너는 실패로 종료된다.
메모리 부족(OOM) 이벤트를 기록한다.
만약
restartPolicy
가 :항상(Always)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.실패 시(OnFailure)이면: 컨테이너는 재시작되고, 파드의
phase
는 Running으로 유지된다.절대 안 함(Never)이면: 로그 실패 이벤트가 발생되고, 파드의
phase
는 Failed가 된다.
파드 동작 중에, 디스크가 죽었다.
모든 컨테이너들을 죽인다.
적절한 이벤트를 기록한다.
파드의
phase
는 Failed가 된다.만약 컨트롤러로 실행되었다면, 파드는 어딘가에서 재생성된다.
파드 동작 중에, 파드가 있는 노드가 세그먼티드 아웃되었다.
노드 컨트롤러가 타임아웃을 기다린다.
노드 컨트롤러가 파드의
phase
를 Failed로 설정한다.만약 컨트롤러로 실행되었다면, 파드는 어딘가에서 재생성된다.
Last updated