Preguntas de entrevista para Senior AWS Cloud Engineer

Milad Bonakdar
Autor
Prepárate para entrevistas senior de AWS Cloud Engineer con preguntas prácticas sobre arquitectura, redes, Auto Scaling, Lambda, optimización de costos, seguridad IAM, RDS y troubleshooting.
Introducción
En una entrevista senior para AWS Cloud Engineer no basta con nombrar servicios: normalmente evalúan cómo tomas decisiones de producción. Prepárate para explicar un diseño, defender el modelo de seguridad, estimar el impacto en costos, planificar fallos y demostrar cómo operarías el sistema después del lanzamiento.
Esta guía reúne preguntas de entrevista senior sobre AWS con respuestas prácticas de arquitectura, redes, cómputo, optimización de costos, seguridad IAM, bases de datos, monitoreo y troubleshooting.
Arquitectura y Diseño
1. Diseñe una aplicación web de múltiples niveles de alta disponibilidad en AWS.
Respuesta: Una arquitectura de múltiples niveles lista para producción requiere redundancia, escalabilidad y seguridad:
Componentes Clave:
1. DNS y CDN:
2. Balanceo de Carga y Auto Escalado:
3. Base de Datos y Almacenamiento en Caché:
- RDS Multi-AZ para alta disponibilidad
- Réplicas de lectura para escalado de lectura
- ElastiCache para almacenamiento en caché de sesiones/datos
Principios de Diseño:
- Implementar en múltiples AZs
- Utilizar servicios administrados cuando sea posible
- Implementar auto escalado
- Separar niveles con grupos de seguridad
- Utilizar S3 para contenido estático
Frecuencia: Muy Común Dificultad: Difícil
2. Explique el Emparejamiento de VPC y cuándo usarlo.
Respuesta: El Emparejamiento de VPC conecta dos VPCs de forma privada utilizando la red de AWS.
Características:
- Conectividad privada (sin internet)
- Sin punto único de fallo
- Sin cuello de botella de ancho de banda
- Admite el emparejamiento entre regiones
- No transitivo (A↔B, B↔C no significa A↔C)
Casos de Uso:
- Conectar VPCs de producción y administración
- Compartir recursos entre VPCs
- Arquitecturas de múltiples cuentas
- Conectividad de nube híbrida
Alternativas:
- Transit Gateway: Hub-and-spoke, enrutamiento transitivo
- PrivateLink: Conectividad servicio a servicio
- VPN: Conectividad cifrada
Frecuencia: Común Dificultad: Media
Computación Avanzada
3. ¿Cómo funciona Auto Scaling y cómo lo optimiza?
Respuesta: Auto Scaling ajusta automáticamente la capacidad en función de la demanda.
Políticas de Escalado:
1. Seguimiento del Objetivo:
2. Escalado por Pasos:
3. Escalado Programado:
Estrategias de Optimización:
- Utilizar escalado predictivo para patrones conocidos
- Establecer períodos de enfriamiento apropiados
- Supervisar las métricas de escalado
- Utilizar tipos de instancias mixtas
- Implementar ganchos de ciclo de vida para un cierre correcto
Frecuencia: Muy Común Dificultad: Media-Difícil
Serverless y Servicios Avanzados
4. ¿Cuándo usaría Lambda vs EC2?
Respuesta: Elegir en función de las características de la carga de trabajo:
Utilizar Lambda cuando:
- Cargas de trabajo basadas en eventos
- Tareas de corta duración (< 15 minutos)
- Tráfico variable/impredecible
- Desea cero administración de servidores
- Optimización de costos para uso esporádico
Utilizar EC2 cuando:
- Procesos de larga duración
- Necesita control total del SO
- Requisitos de software específicos
- Carga alta constante
- Aplicaciones con estado
Ejemplo de Lambda:
Comparación de Costos:
- Lambda: Pago por solicitud + duración
- EC2: Pago por tiempo de actividad (incluso si está inactivo)
Frecuencia: Común Dificultad: Media
Optimización de Costos
5. ¿Cómo optimiza los costos de AWS?
Respuesta: Una buena respuesta senior trata la optimización de costos como un proceso operativo continuo, no como una limpieza puntual:
Estrategias:
1. Ajuste de Tamaño Correcto:
2. Instancias Reservadas y Planes de Ahorro:
- Compromisos de 1 o 3 años
- Hasta un 72% de ahorro frente a la demanda
- Usarlos para cómputo estable después de revisar recomendaciones de Cost Explorer, compromisos existentes y cambios previstos
3. Instancias Spot:
4. Políticas de Ciclo de Vida de S3:
5. Auto Escalado:
- Reducir la escala durante las horas de inactividad
- Utilizar escalado predictivo
6. Supervisión:
- AWS Cost Explorer
- Alertas de presupuesto
- Etiquetar los recursos para la asignación de costos
Frecuencia: Muy Común Dificultad: Media
Seguridad y Cumplimiento
6. ¿Cómo implementa la defensa en profundidad en AWS?
Respuesta: Una respuesta senior debe combinar controles preventivos, detección y respuesta rápida en cada capa:
Capas:
1. Seguridad de la Red:
2. Identidad y Acceso:
- Preferir federación y credenciales temporales para personas y workloads
- Exigir MFA cuando aún existan credenciales de larga duración o root
- Aplicar mínimo privilegio y revisar permisos no usados con regularidad
- Usar IAM Access Analyzer para validar políticas e identificar acceso público, entre cuentas o no utilizado
3. Protección de Datos:
- Cifrado en reposo (KMS)
- Cifrado en tránsito (TLS)
- Políticas de bucket S3
- Cifrado RDS
4. Supervisión y Registro:
5. Cumplimiento:
- AWS Config para la supervisión del cumplimiento
- Security Hub para hallazgos centralizados
- GuardDuty para la detección de amenazas
Frecuencia: Muy Común Dificultad: Difícil
Servicios de Base de Datos
7. Explique RDS Multi-AZ vs Réplicas de Lectura y cuándo usar cada uno.
Respuesta: Ambos proporcionan redundancia pero sirven para diferentes propósitos:
Implementación Multi-AZ:
- Propósito: Alta disponibilidad y recuperación ante desastres
- Replicación síncrona al standby en una AZ diferente
- Conmutación por error automática (1-2 minutos)
- Mismo punto de conexión después de la conmutación por error
- Las instancias RDS Multi-AZ estándar no sirven lecturas desde el standby; los clústeres Multi-AZ pueden ofrecer standbys legibles, así que aclara la topología exacta
- Añade costo por capacidad standby y almacenamiento; compáralo con los requisitos de recuperación
Réplicas de Lectura:
- Propósito: Escalar operaciones de lectura
- Replicación asíncrona
- Múltiples réplicas posibles (hasta 15 para Aurora)
- Puntos de conexión diferentes para cada réplica
- Puede estar en diferentes regiones
- Se puede promover a una BD independiente
Tabla de Comparación:
Mejor Práctica: Utilizar ambos juntos
- Multi-AZ para alta disponibilidad
- Réplicas de lectura para escalado de lectura
Frecuencia: Muy Común Dificultad: Media-Difícil
8. ¿Cómo implementa la migración de la base de datos con un tiempo de inactividad mínimo?
Respuesta: Estrategias de migración de bases de datos para sistemas de producción:
Estrategia 1: AWS DMS (Database Migration Service)
Fases de Migración:
1. Carga Completa:
- Copiar los datos existentes
- Puede tomar horas/días
- La aplicación todavía utiliza el origen
2. CDC (Captura de Datos de Cambio):
- Replicar los cambios en curso
- Mantiene el destino sincronizado
- Retraso mínimo (segundos)
3. Transición:
Estrategia 2: Implementación Azul-Verde
Comparación de Tiempo de Inactividad:
- DMS: < 1 minuto (solo transición)
- Azul-Verde: < 30 segundos (cambio de DNS)
- Volcado/restauración tradicional: Horas a días
Frecuencia: Común Dificultad: Difícil
Supervisión y Resolución de Problemas
9. ¿Cómo soluciona los altos costos de AWS?
Respuesta: La optimización de costos requiere un análisis sistemático:
Pasos de Investigación:
1. Utilizar Cost Explorer:
2. Identificar Anomalías de Costo:
3. Script de Limpieza de Recursos:
4. Configurar Alertas de Costo:
Victorias Rápidas:
- Eliminar volúmenes EBS no adjuntos
- Detener/terminar instancias EC2 inactivas
- Utilizar S3 Intelligent-Tiering
- Habilitar las políticas de ciclo de vida de S3
- Utilizar instancias Spot para cargas de trabajo no críticas
- Ajustar el tamaño correcto de las instancias sobre aprovisionadas
Frecuencia: Muy Común Dificultad: Media
Redes Avanzadas
10. Explique AWS Transit Gateway y sus casos de uso.
Respuesta: Transit Gateway es un servicio de topología de red hub-and-spoke que simplifica la arquitectura de la red.
Sin Transit Gateway:
Problema: Conexiones N² (topología de malla)
Con Transit Gateway:
Solución: Hub-and-spoke (conexiones N)
Características Clave:
- Enrutamiento transitivo: A→TGW→B→TGW→C funciona
- Gestión centralizada
- Soporta hasta 5,000 VPCs
- Emparejamiento entre regiones
- Tablas de enrutamiento para el control del tráfico
Configuración:
Casos de Uso:
1. Arquitectura Multi-VPC:
2. Segmentación de la Red:
3. Conectividad Multi-Región:
Consideraciones de Costo:
- Los adjuntos y el procesamiento de datos tienen costo, así que estima el tráfico antes de centralizar todo
- La inspección centralizada, NAT y el enrutamiento entre regiones pueden cambiar la factura rápidamente
- Revisa los precios regionales actuales antes de elegir Transit Gateway frente a peering o PrivateLink
Alternativas:
- Emparejamiento de VPC: Más simple, más barato para pocas VPCs
- PrivateLink: Conectividad servicio a servicio
- VPN: Conexiones directas
Frecuencia: Común Dificultad: Difícil
Conclusión
Las entrevistas para ingenieros sénior de AWS Cloud requieren un profundo conocimiento técnico y experiencia práctica. Concéntrese en:
- Arquitectura: Diseños de múltiples niveles, alta disponibilidad, recuperación ante desastres
- Redes Avanzadas: Emparejamiento de VPC, Transit Gateway, PrivateLink
- Computación: Optimización de Auto Scaling, decisiones de Lambda vs EC2
- Optimización de Costos: Ajuste de tamaño correcto, instancias reservadas, políticas de ciclo de vida
- Seguridad: Defensa en profundidad, mejores prácticas de IAM, cifrado
- Excelencia Operacional: Supervisión, registro, automatización
Respalda cada respuesta con un ejemplo de producción: el trade-off que elegiste, el modo de fallo que anticipaste, la métrica que monitoreaste y qué mejorarías después.


