선임 시스템 관리자 면접 질문과 답변

Milad Bonakdar
작성자
Linux, Windows, Active Directory, 자동화, 보안 강화, 모니터링, 백업, 장애 대응을 다루는 실무형 선임 sysadmin 면접 질문으로 준비하세요.
소개
선임 시스템 관리자 면접은 장애 진단, Linux 및 Windows 환경 보안, 반복 작업 자동화, 복구 계획, 기술적 판단 설명처럼 압박 속에서도 인프라를 안정적으로 운영하는 능력을 주로 평가합니다.
이 가이드를 통해 실무 경험과 선임 수준의 판단력을 보여주는 답변을 준비하세요. 각 주제에서 기술적 단계만 말하지 말고 위험 감소, 가용성, 접근 제어, 문서화, 인시던트 커뮤니케이션과 연결해 설명하는 것이 좋습니다.
가상화 & 클라우드
1. Type 1과 Type 2 하이퍼바이저의 차이점을 설명하십시오.
답변:
Type 1 (베어 메탈):
- 하드웨어에서 직접 실행
- 더 나은 성능
- 예시: VMware ESXi, Hyper-V, KVM
Type 2 (호스트형):
- 호스트 OS에서 실행
- 설정이 더 쉬움
- 예시: VMware Workstation, VirtualBox
KVM 관리:
빈도: 흔함 난이도: 중간
2. 고가용성 클러스터를 어떻게 설계합니까?
답변: **고가용성 (HA)**은 장애 발생 시에도 서비스가 계속 접근 가능하도록 보장합니다.
클러스터 유형:
Active-Passive 클러스터:
- 하나의 노드가 활성, 나머지는 대기
- 장애 발생 시 자동 페일오버
- 낮은 리소스 사용률
Active-Active 클러스터:
- 모든 노드가 트래픽을 처리
- 더 나은 리소스 사용률
- 더 복잡한 구성
Pacemaker + Corosync 설정:
Keepalived (간단한 HA):
데이터베이스 복제 (MySQL):
상태 점검:
페일오버 테스트:
빈도: 흔함 난이도: 어려움
자동화 & 스크립팅
3. 시스템 관리 작업을 어떻게 자동화합니까?
답변: 자동화는 고된 작업을 줄이고 일관성을 향상시킵니다.
Bash 스크립팅:
Ansible Playbook:
빈도: 매우 흔함 난이도: 중간-어려움
4. 수백 대의 서버에 걸쳐 구성을 어떻게 관리합니까?
답변: 규모에 따른 구성 관리는 자동화 및 일관성을 필요로 합니다.
도구 비교:
규모에 따른 Ansible:
동적 인벤토리:
Infrastructure as Code 모범 사례:
1. 버전 관리:
2. 테스팅:
3. 비밀 관리:
4. 멱등성:
병렬 실행:
빈도: 흔함 난이도: 중간-어려움
재해 복구
5. 재해 복구 계획을 어떻게 설계합니까?
답변: 포괄적인 DR 전략:
주요 지표:
- RTO (복구 시간 목표): 최대 허용 다운타임
- RPO (복구 시점 목표): 최대 허용 데이터 손실
DR 전략:
1. 백업 전략:
2. 데이터베이스 복제:
3. 문서화:
- 복구 절차
- 연락처 목록
- 시스템 다이어그램
- 구성 백업
빈도: 매우 흔함 난이도: 어려움
보안 강화
6. Linux 서버를 어떻게 강화합니까?
답변: 다계층 보안 접근 방식:
1. 시스템 업데이트:
2. SSH 강화:
3. 방화벽 구성:
4. 침입 탐지:
5. 감사 로깅:
빈도: 매우 흔함 난이도: 어려움
성능 최적화
7. 서버 성능을 어떻게 최적화합니까?
답변: 체계적인 성능 튜닝:
1. 병목 현상 식별:
2. 서비스 최적화:
3. 커널 튜닝:
4. 모니터링 및 경고:
빈도: 흔함 난이도: 중간-어려움
8. 포괄적인 모니터링 및 경고 솔루션을 어떻게 설계합니까?
답변: 효과적인 모니터링은 장애를 예방하고 신속한 사고 대응을 가능하게 합니다.
모니터링 스택 아키텍처:
Prometheus 설정:
경고 규칙:
Alertmanager 구성:
Grafana 대시보드:
SLO/SLA/SLI 개념:
SLI (서비스 수준 지표):
- 서비스 수준의 정량적 측정
- 예시: 가동 시간 %, 대기 시간, 오류율
SLO (서비스 수준 목표):
- SLI의 목표 값
- 예시: 99.9% 가동 시간, p95 대기 시간 < 200ms
SLA (서비스 수준 계약):
- 결과가 포함된 계약
- 예시: 99.9% 가동 시간 또는 고객 환불
경고 피로 방지:
-
의미 있는 경고:
- 원인이 아닌 증상에 대한 경고
- 모든 경고는 실행 가능해야 함
- 시끄러운 경고 제거
-
경고 그룹화:
- 관련 경고 그룹화
- 억제 규칙 사용
- 적절한 임계값 설정
-
에스컬레이션:
- 경고 → 팀 채팅
- 위험 → PagerDuty
- 당직 교대 사용
빈도: 흔함 난이도: 어려움
엔터프라이즈 인프라
9. 대규모 Windows 환경을 어떻게 관리합니까?
답변: 중앙 집중식 관리 전략:
그룹 정책 관리:
WSUS (Windows 업데이트):
PowerShell 원격:
빈도: 흔함 난이도: 어려움
결론
선임 시스템 관리자 면접에서는 실무적이고 시나리오 기반인 답변이 좋은 평가를 받습니다. 변경 전에 진단하는 방식, 안전한 자동화, 권한 있는 접근 보호, 복구 테스트, 인프라 장애 시 명확한 커뮤니케이션을 보여주세요.
- 가상화: 하이퍼바이저, 리소스 관리, 마이그레이션
- 고가용성: 클러스터링, 페일오버, 복제
- 자동화: 스크립팅, 구성 관리, 오케스트레이션
- 구성 관리: Ansible, Puppet, 대규모 IaC
- 재해 복구: 백업 전략, 복제, 테스팅
- 보안: 강화, 규정 준수, 모니터링
- 성능: 최적화, 용량 계획, 문제 해결
- 모니터링: Prometheus, Grafana, 경고, SLO/SLA
- 엔터프라이즈 관리: AD, GPO, 중앙 집중식 관리
각 답변을 짧은 이야기로 연습하세요. 환경, 위험, 진단 단계, 수정, 검증, 그리고 같은 문제가 반복되지 않도록 바꾼 점을 순서대로 설명하면 좋습니다.


