본문 바로가기

Compute

[Tip] EC2 재부팅하면서 Instance health check failed 발생 시 조치 순서에 대해서 알아보기

반응형

안녕하세요 서후아빠입니다. ^_^

이번 세션은 EC2를 재부팅만 했는데 오류가 발생한 상황입니다. 이런 경우 아래의 순서대로 디버깅 과정을 가지면 좋을 것 같습니다.


Instance State Failure 시간 확인

EC2 > Instance > 오류가 발생한 인스턴스 선택 > monitoring (tab) > Health check failed(Instance)(count)

Health check failed(Instance)(count) : 개별 인스턴스에 대한 소프트웨어 및 네트워크 구성 오류가 발생할 때 기록되며 일반적으로 EC2 인스턴스의 OS 수준에서 문제가 발생할 때 식별됩니다.

확인된 시간에 작업 이력을 확인하여 EC2 재부팅 실패에 영향을 주는 작업이 있는지 검토하여 작업 원복을 한다.

Instance 스크린샷 확인

EC2 > Instance > 오류가 발생한 인스턴스 선택 > work > Monitoring and troubleshooting > Get an instance screenshot

스크린샷은 인스턴스가 부팅되면서 멈춘 상태의 화면을 캡쳐한 부분이므로 스크린샷에서 확인된 인스턴스 로그를 보고 분석을 진행합니다.

Instance 시스템 로그 확인

EC2 > Instance > select the instance > work > Monitoring and troubleshooting > Get system log

리눅스의 경우 /var/log/messages를 확인하는 부분으로 로그를 보고 분석을 진행합니다.

AWS Support Case 지원 가능한 경우

이전단계에서 분석이 완료되지 않으면 AWS 기술지원을 요청합니다.

Basic Plan 계약은 OS 커스터마이징이 없는 경우만 AWS에서 지원을 받을 수 있습니다. 만약 OS를 변경하였다면  support plan을 업그레이드해야 합니다.

Support Plan 참고 URL : https://us-east-1.console.aws.amazon.com/support/plans/home#/

AWS Support Case 지원이 불가능한 경우 

ELB에 연결된 다른 EC2에서 AMI 생성 : EC2 > Instance > select the instance(EC2 Attached to ELB) > work > Images and Templates > image creation

생성한 AMI로 신규 EC2 생성하여 ELB에 연결 : EC2 > AMI >  select the AMI(EC2 Attached to ELB) > Launching an Instance with an AMI 

ELB에 연결된 EC2 외 기존에 별도로 저장해 놓은 스냅샷이나 AMI를 이용하여 인스턴스를 생성해도 됩니다. 
반응형