Questions d’entretien Senior AWS Cloud Engineer

Milad Bonakdar
Auteur
Préparez un entretien senior AWS Cloud Engineer avec des questions concrètes sur l’architecture, le réseau, Auto Scaling, Lambda, l’optimisation des coûts, IAM, RDS et le dépannage.
Introduction
Un entretien senior AWS Cloud Engineer évalue surtout votre manière de prendre des décisions de production, pas votre capacité à citer des services. Vous devez pouvoir expliquer une architecture, défendre le modèle de sécurité, estimer l’impact sur les coûts, prévoir les pannes et montrer comment vous exploiteriez le système après la mise en ligne.
Ce guide rassemble des questions d’entretien AWS de niveau senior avec des réponses pratiques sur l’architecture, le réseau, le compute, l’optimisation des coûts, la sécurité IAM, les bases de données, le monitoring et le dépannage.
Architecture & Conception
1. Concevez une application web multi-tiers hautement disponible sur AWS.
Réponse : Une architecture multi-tiers prête pour la production nécessite la redondance, l'évolutivité et la sécurité :
Composants clés :
1. DNS & CDN :
2. Équilibrage de charge et Auto Scaling :
3. Base de données et mise en cache :
- RDS Multi-AZ pour une haute disponibilité
- Réplicas en lecture pour la mise à l'échelle de la lecture
- ElastiCache pour la mise en cache des sessions/données
Principes de conception :
- Déployer sur plusieurs AZ
- Utiliser des services gérés lorsque possible
- Mettre en œuvre l'auto-scaling
- Séparer les niveaux avec des groupes de sécurité
- Utiliser S3 pour le contenu statique
Fréquence : Très courant Difficulté : Difficile
2. Expliquez VPC Peering et quand l'utiliser.
Réponse : VPC Peering connecte deux VPC de manière privée en utilisant le réseau AWS.
Caractéristiques :
- Connectivité privée (pas d'internet)
- Pas de point de défaillance unique
- Pas de goulot d'étranglement de bande passante
- Prend en charge le peering inter-régions
- Non transitif (A↔B, B↔C ne signifie pas A↔C)
Cas d'utilisation :
- Connecter les VPC de production et de gestion
- Partager des ressources entre les VPC
- Architectures multi-comptes
- Connectivité cloud hybride
Alternatives :
- Transit Gateway : Topologie en étoile, routage transitif
- PrivateLink : Connectivité service à service
- VPN : Connectivité chiffrée
Fréquence : Courant Difficulté : Moyen
Calcul Avancé
3. Comment fonctionne Auto Scaling et comment l'optimiser ?
Réponse : Auto Scaling ajuste automatiquement la capacité en fonction de la demande.
Politiques de mise à l'échelle :
1. Suivi de cible :
2. Mise à l'échelle par étapes :
3. Mise à l'échelle planifiée :
Stratégies d'optimisation :
- Utiliser la mise à l'échelle prédictive pour les schémas connus
- Définir des périodes de refroidissement appropriées
- Surveiller les métriques de mise à l'échelle
- Utiliser des types d'instance mixtes
- Mettre en œuvre des hooks de cycle de vie pour un arrêt en douceur
Fréquence : Très courant Difficulté : Moyen-Difficile
Serverless & Services Avancés
4. Quand utiliseriez-vous Lambda vs EC2 ?
Réponse : Choisir en fonction des caractéristiques de la charge de travail :
Utiliser Lambda lorsque :
- Charges de travail événementielles
- Tâches de courte durée (< 15 minutes)
- Trafic variable/imprévisible
- Vouloir zéro gestion de serveur
- Optimisation des coûts pour une utilisation sporadique
Utiliser EC2 lorsque :
- Processus de longue durée
- Besoin d'un contrôle total de l'OS
- Exigences logicielles spécifiques
- Charge élevée constante
- Applications avec état
Exemple Lambda :
Comparaison des coûts :
- Lambda : Paiement par requête + durée
- EC2 : Paiement pour le temps de disponibilité (même si inactif)
Fréquence : Courant Difficulté : Moyen
Optimisation des Coûts
5. Comment optimiser les coûts AWS ?
Réponse : Une bonne réponse senior présente l’optimisation des coûts comme un processus d’exploitation continu, pas comme un nettoyage ponctuel :
Stratégies :
1. Dimensionnement correct :
2. Instances réservées et plans d'épargne :
- Engagements de 1 an ou 3 ans
- Jusqu'à 72 % d'économies par rapport à la demande
- Les utiliser pour du compute stable après avoir vérifié les recommandations Cost Explorer, les engagements existants et les changements prévus
3. Instances Spot :
4. Politiques de cycle de vie S3 :
5. Auto Scaling :
- Réduire la taille pendant les heures creuses
- Utiliser la mise à l'échelle prédictive
6. Surveillance :
- AWS Cost Explorer
- Alertes de budget
- Étiqueter les ressources pour l'allocation des coûts
Fréquence : Très courant Difficulté : Moyen
Sécurité et Conformité
6. Comment mettre en œuvre une défense en profondeur sur AWS ?
Réponse : Une réponse senior doit combiner contrôles préventifs, détection et réponse rapide à chaque couche :
Couches :
1. Sécurité du réseau :
2. Identité et accès :
- Préférer la fédération et les identifiants temporaires pour les personnes et les workloads
- Exiger le MFA lorsque des identifiants longue durée ou root existent encore
- Appliquer le moindre privilège et revoir régulièrement les permissions inutilisées
- Utiliser IAM Access Analyzer pour valider les politiques et repérer les accès publics, intercomptes ou inutilisés
3. Protection des données :
- Chiffrement au repos (KMS)
- Chiffrement en transit (TLS)
- Politiques de bucket S3
- Chiffrement RDS
4. Surveillance et journalisation :
5. Conformité :
- AWS Config pour la surveillance de la conformité
- Security Hub pour les résultats centralisés
- GuardDuty pour la détection des menaces
Fréquence : Très courant Difficulté : Difficile
Services de Base de Données
7. Expliquez RDS Multi-AZ vs Read Replicas et quand utiliser chacun.
Réponse : Les deux offrent une redondance, mais servent des objectifs différents :
Déploiement Multi-AZ :
- Objectif : Haute disponibilité et reprise après sinistre
- Réplication synchrone vers la veille dans une AZ différente
- Basculement automatique (1-2 minutes)
- Même point de terminaison après le basculement
- Les instances RDS Multi-AZ standard ne servent pas les lectures depuis le standby ; les clusters Multi-AZ peuvent fournir des standbys lisibles, donc il faut préciser la topologie RDS exacte
- Ajoute un coût pour la capacité standby et le stockage ; à comparer aux exigences de reprise
Réplicas en lecture :
- Objectif : Mettre à l'échelle les opérations de lecture
- Réplication asynchrone
- Plusieurs réplicas possibles (jusqu'à 15 pour Aurora)
- Différents points de terminaison pour chaque réplica
- Peut être dans différentes régions
- Peut être promu en base de données autonome
Tableau de comparaison :
Meilleure pratique : Utiliser les deux ensemble
- Multi-AZ pour la haute disponibilité
- Réplicas en lecture pour la mise à l'échelle de la lecture
Fréquence : Très courant Difficulté : Moyen-Difficile
8. Comment mettre en œuvre la migration de base de données avec un temps d'arrêt minimal ?
Réponse : Stratégies de migration de base de données pour les systèmes de production :
Stratégie 1 : AWS DMS (Database Migration Service)
Phases de migration :
1. Chargement complet :
- Copier les données existantes
- Peut prendre des heures/jours
- L'application utilise toujours la source
2. CDC (Capture de données de modification) :
- Répliquer les modifications en cours
- Garde la cible synchronisée
- Délai minimal (secondes)
3. Basculement :
Stratégie 2 : Déploiement bleu-vert
Comparaison des temps d'arrêt :
- DMS : < 1 minute (juste le basculement)
- Bleu-Vert : < 30 secondes (changement de DNS)
- Dump/restauration traditionnel : Heures à jours
Fréquence : Courant Difficulté : Difficile
Surveillance et Dépannage
9. Comment dépanner les coûts AWS élevés ?
Réponse : L'optimisation des coûts nécessite une analyse systématique :
Étapes d'investigation :
1. Utiliser Cost Explorer :
2. Identifier les anomalies de coûts :
3. Script de nettoyage des ressources :
4. Configurer des alertes de coût :
Gains rapides :
- Supprimer les volumes EBS non attachés
- Arrêter/terminer les instances EC2 inactives
- Utiliser S3 Intelligent-Tiering
- Activer les politiques de cycle de vie S3
- Utiliser les instances Spot pour les charges de travail non critiques
- Redimensionner correctement les instances sur-provisionnées
Fréquence : Très courant Difficulté : Moyen
Réseau Avancé
10. Expliquez AWS Transit Gateway et ses cas d'utilisation.
Réponse : Transit Gateway est un service de topologie de réseau en étoile qui simplifie l'architecture réseau.
Sans Transit Gateway :
Problème : Connexions N² (topologie maillée)
Avec Transit Gateway :
Solution : En étoile (connexions N)
Principales caractéristiques :
- Routage transitif : A→TGW→B→TGW→C fonctionne
- Gestion centralisée
- Prend en charge jusqu'à 5 000 VPC
- Peering inter-régions
- Tables de routage pour le contrôle du trafic
Configuration :
Cas d'utilisation :
1. Architecture Multi-VPC :
2. Segmentation du réseau :
3. Connectivité Multi-Région :
Considérations de coût :
- Les attachements et le traitement des données sont facturés ; estimez le trafic avant de tout centraliser
- L’inspection centralisée, le NAT et le routage interrégion peuvent modifier rapidement la facture
- Vérifiez les prix régionaux actuels avant de choisir Transit Gateway plutôt que le peering ou PrivateLink
Alternatives :
- VPC Peering : Plus simple, moins cher pour quelques VPC
- PrivateLink : Connectivité service à service
- VPN : Connexions directes
Fréquence : Courant Difficulté : Difficile
Conclusion
Les entretiens avec les ingénieurs cloud AWS expérimentés exigent une connaissance technique approfondie et une expérience pratique. Concentrez-vous sur :
- Architecture : Conceptions multi-tiers, haute disponibilité, reprise après sinistre
- Réseau Avancé : VPC peering, Transit Gateway, PrivateLink
- Calcul : Optimisation Auto Scaling, décisions Lambda vs EC2
- Optimisation des Coûts : Dimensionnement correct, instances réservées, politiques de cycle de vie
- Sécurité : Défense en profondeur, meilleures pratiques IAM, chiffrement
- Excellence Opérationnelle : Surveillance, journalisation, automatisation
Appuyez chaque réponse sur un exemple de production : le compromis choisi, le mode de défaillance anticipé, la métrique surveillée et ce que vous amélioreriez ensuite.


