Senior AWS Cloud Engineer 면접 질문과 답변

Milad Bonakdar
작성자
AWS 아키텍처, 네트워킹, Auto Scaling, Lambda, 비용 최적화, IAM 보안, RDS, 프로덕션 트러블슈팅을 다루는 Senior AWS Cloud Engineer 면접 질문으로 준비하세요.
소개
Senior AWS Cloud Engineer 면접은 서비스를 얼마나 많이 아는지보다 프로덕션 환경에서 어떤 판단을 내리는지를 봅니다. 아키텍처 선택 이유, 보안 모델, 비용 영향, 장애 복구 계획, 배포 후 운영 방식을 구체적으로 설명할 수 있어야 합니다.
이 가이드는 아키텍처, 네트워킹, 컴퓨팅, 비용 최적화, IAM 보안, 데이터베이스, 모니터링, 트러블슈팅을 다루는 시니어 수준의 AWS 면접 질문과 실무형 답변을 제공합니다.
아키텍처 및 설계
1. AWS에서 고가용성 다계층 웹 애플리케이션을 설계하세요.
답변: 프로덕션 준비가 완료된 다계층 아키텍처에는 이중화, 확장성 및 보안이 필요합니다.
주요 구성 요소:
1. DNS 및 CDN:
2. 로드 밸런싱 및 자동 확장:
3. 데이터베이스 및 캐싱:
- 고가용성을 위한 RDS Multi-AZ
- 읽기 확장용 읽기 전용 복제본
- 세션/데이터 캐싱용 ElastiCache
설계 원칙:
- 여러 AZ에 배포
- 가능한 경우 관리형 서비스 사용
- 자동 확장 구현
- 보안 그룹으로 계층 분리
- 정적 콘텐츠에는 S3 사용
희소성: 매우 흔함 난이도: 어려움
2. VPC 피어링에 대해 설명하고 언제 사용하는지 설명하세요.
답변: VPC 피어링은 AWS 네트워크를 사용하여 두 VPC를 비공개로 연결합니다.
특징:
- 비공개 연결 (인터넷 없음)
- 단일 실패 지점 없음
- 대역폭 병목 현상 없음
- 교차 리전 피어링 지원
- 비전이적 (A↔B, B↔C가 A↔C를 의미하지 않음)
사용 사례:
- 프로덕션 및 관리 VPC 연결
- VPC 간에 리소스 공유
- 다중 계정 아키텍처
- 하이브리드 클라우드 연결
대안:
- Transit Gateway: 허브 앤 스포크, 전이적 라우팅
- PrivateLink: 서비스 간 연결
- VPN: 암호화된 연결
희소성: 흔함 난이도: 중간
고급 컴퓨팅
3. Auto Scaling은 어떻게 작동하며 어떻게 최적화합니까?
답변: Auto Scaling은 수요에 따라 용량을 자동으로 조정합니다.
확장 정책:
1. 대상 추적:
2. 단계별 확장:
3. 예약된 확장:
최적화 전략:
- 알려진 패턴에는 예측 확장 사용
- 적절한 쿨다운 기간 설정
- 확장 메트릭 모니터링
- 혼합 인스턴스 유형 사용
- 정상적인 종료를 위한 수명 주기 후크 구현
희소성: 매우 흔함 난이도: 중간-어려움
서버리스 및 고급 서비스
4. Lambda와 EC2는 언제 사용합니까?
답변: 워크로드 특성에 따라 선택하세요.
다음의 경우 Lambda 사용:
- 이벤트 기반 워크로드
- 짧게 실행되는 작업 (15분 미만)
- 가변적/예측 불가능한 트래픽
- 서버 관리가 필요 없는 경우
- 간헐적인 사용에 대한 비용 최적화
다음의 경우 EC2 사용:
- 오래 실행되는 프로세스
- 전체 OS 제어 필요
- 특정 소프트웨어 요구 사항
- 일관된 높은 로드
- 상태 저장 애플리케이션
Lambda 예제:
비용 비교:
- Lambda: 요청당 + 기간별 요금
- EC2: 가동 시간 요금 (유휴 상태인 경우에도)
희소성: 흔함 난이도: 중간
비용 최적화
5. AWS 비용을 어떻게 최적화합니까?
답변: 시니어다운 답변은 비용 최적화를 일회성 정리가 아니라 지속적인 운영 프로세스로 설명해야 합니다.
전략:
1. 적정 규모 조정:
2. 예약 인스턴스 및 Savings Plans:
- 1년 또는 3년 약정
- 온디맨드 대비 최대 72% 절감
- Cost Explorer 권장 사항, 기존 커밋먼트, 예정된 로드맵 변경을 확인한 뒤 안정적인 컴퓨팅 사용량에 적용
3. 스팟 인스턴스:
4. S3 수명 주기 정책:
5. Auto Scaling:
- 근무 시간 외에는 규모 축소
- 예측 확장 사용
6. 모니터링:
- AWS Cost Explorer
- 예산 경고
- 비용 할당을 위한 리소스 태그 지정
희소성: 매우 흔함 난이도: 중간
보안 및 규정 준수
6. AWS에서 심층 방어를 어떻게 구현합니까?
답변: 시니어 답변은 각 계층에서 예방 통제, 탐지, 빠른 대응을 함께 설명해야 합니다.
계층:
1. 네트워크 보안:
2. ID 및 액세스:
- 사용자와 워크로드에는 페더레이션과 임시 자격 증명을 우선 적용
- 장기 자격 증명이나 루트 자격 증명이 남아 있다면 MFA 요구
- 최소 권한을 부여하고 사용하지 않는 권한을 정기적으로 검토
- IAM Access Analyzer로 정책을 검증하고 공개, 크로스 계정, 미사용 액세스를 확인
3. 데이터 보호:
- 저장 시 암호화 (KMS)
- 전송 중 암호화 (TLS)
- S3 버킷 정책
- RDS 암호화
4. 모니터링 및 로깅:
5. 규정 준수:
- 규정 준수 모니터링을 위한 AWS Config
- 중앙 집중식 결과를 위한 Security Hub
- 위협 탐지를 위한 GuardDuty
희소성: 매우 흔함 난이도: 어려움
데이터베이스 서비스
7. RDS Multi-AZ와 읽기 전용 복제본을 설명하고 각각 언제 사용하는지 설명하세요.
답변: 둘 다 이중화를 제공하지만 다른 용도로 사용됩니다.
Multi-AZ 배포:
- 목적: 고가용성 및 재해 복구
- 다른 AZ의 대기 상태로 동기 복제
- 자동 장애 조치 (1-2분)
- 장애 조치 후 동일한 엔드포인트
- 표준 RDS Multi-AZ DB 인스턴스는 standby에서 읽기를 처리하지 않습니다. Multi-AZ DB 클러스터는 읽기 가능한 standby를 제공할 수 있으므로 정확한 RDS 토폴로지를 확인해야 합니다
- standby 용량과 스토리지 비용이 추가되므로 복구 요구사항과 비교해 판단
읽기 전용 복제본:
- 목적: 읽기 작업 확장
- 비동기 복제
- 여러 복제본 가능 (Aurora의 경우 최대 15개)
- 각 복제본에 대한 다른 엔드포인트
- 다른 리전에 있을 수 있음
- 독립 실행형 DB로 승격 가능
비교 테이블:
모범 사례: 둘 다 함께 사용
- 고가용성을 위한 Multi-AZ
- 읽기 확장을 위한 읽기 전용 복제본
희소성: 매우 흔함 난이도: 중간-어려움
8. 최소한의 가동 중지 시간으로 데이터베이스 마이그레이션을 어떻게 구현합니까?
답변: 프로덕션 시스템을 위한 데이터베이스 마이그레이션 전략:
전략 1: AWS DMS (Database Migration Service)
마이그레이션 단계:
1. 전체 로드:
- 기존 데이터 복사
- 시간이 오래 걸릴 수 있음 (몇 시간/며칠)
- 애플리케이션은 여전히 소스 사용
2. CDC (Change Data Capture):
- 진행 중인 변경 사항 복제
- 대상을 동기화된 상태로 유지
- 최소 지연 (초)
3. 전환:
전략 2: Blue-Green 배포
가동 중지 시간 비교:
- DMS: 1분 미만 (전환만)
- Blue-Green: 30초 미만 (DNS 전환)
- 기존 덤프/복원: 몇 시간에서 며칠
희소성: 흔함 난이도: 어려움
모니터링 및 문제 해결
9. 높은 AWS 비용 문제를 어떻게 해결합니까?
답변: 비용 최적화에는 체계적인 분석이 필요합니다.
조사 단계:
1. Cost Explorer 사용:
2. 비용 이상 징후 식별:
3. 리소스 정리 스크립트:
4. 비용 경고 설정:
빠른 승리:
- 연결되지 않은 EBS 볼륨 삭제
- 유휴 EC2 인스턴스 중지/종료
- S3 Intelligent-Tiering 사용
- S3 수명 주기 정책 활성화
- 중요하지 않은 워크로드에 스팟 인스턴스 사용
- 과도하게 프로비저닝된 인스턴스의 규모 적정 조정
희소성: 매우 흔함 난이도: 중간
고급 네트워킹
10. AWS Transit Gateway와 사용 사례를 설명하세요.
답변: Transit Gateway는 네트워크 아키텍처를 단순화하는 허브 앤 스포크 네트워크 토폴로지 서비스입니다.
Transit Gateway가 없는 경우:
문제: N² 연결 (메시 토폴로지)
Transit Gateway가 있는 경우:
해결 방법: 허브 앤 스포크 (N 연결)
주요 기능:
- 전이적 라우팅: A→TGW→B→TGW→C 작동
- 중앙 집중식 관리
- 최대 5,000개의 VPC 지원
- 교차 리전 피어링
- 트래픽 제어를 위한 라우팅 테이블
설정:
사용 사례:
1. 다중 VPC 아키텍처:
2. 네트워크 분할:
3. 다중 리전 연결:
비용 고려 사항:
- 연결과 데이터 처리에는 비용이 발생하므로 중앙화 전에 트래픽을 추정
- 중앙 집중식 inspection, NAT, 교차 리전 라우팅은 비용을 빠르게 바꿀 수 있음
- Transit Gateway, 피어링, PrivateLink 중 선택하기 전에 최신 리전별 가격을 확인
대안:
- VPC 피어링: VPC가 적은 경우 더 간단하고 저렴함
- PrivateLink: 서비스 간 연결
- VPN: 직접 연결
희소성: 흔함 난이도: 어려움
결론
AWS 클라우드 수석 엔지니어 면접에는 깊은 기술 지식과 실무 경험이 필요합니다. 다음 사항에 집중하세요.
- 아키텍처: 다계층 설계, 고가용성, 재해 복구
- 고급 네트워킹: VPC 피어링, Transit Gateway, PrivateLink
- 컴퓨팅: Auto Scaling 최적화, Lambda vs EC2 결정
- 비용 최적화: 규모 적정 조정, 예약 인스턴스, 수명 주기 정책
- 보안: 심층 방어, IAM 모범 사례, 암호화
- 운영 우수성: 모니터링, 로깅, 자동화
각 답변에는 프로덕션 사례를 붙이세요. 어떤 트레이드오프를 선택했는지, 어떤 장애 모드를 대비했는지, 어떤 지표를 모니터링했는지, 다음에 무엇을 개선할지까지 설명하는 것이 좋습니다.


