Preguntas de entrevista para administrador de sistemas senior

Milad Bonakdar
Autor
Prepárate para entrevistas de sysadmin senior con preguntas prácticas sobre Linux, Windows, Active Directory, automatización, hardening, monitorización, copias de seguridad y resolución de incidentes.
Introducción
Las entrevistas para administrador de sistemas senior suelen evaluar cómo mantienes la infraestructura estable bajo presión: diagnosticar caídas, proteger entornos Linux y Windows, automatizar tareas repetibles, planificar recuperación y explicar decisiones técnicas con claridad.
Usa esta guía para preparar respuestas que demuestren experiencia práctica y criterio senior. En cada tema, conecta los pasos técnicos con reducción de riesgos, disponibilidad, control de accesos, documentación y comunicación durante incidentes.
Virtualización y nube
1. Explica la diferencia entre los hipervisores de tipo 1 y tipo 2.
Respuesta:
Tipo 1 (Bare Metal):
- Se ejecuta directamente en el hardware
- Mejor rendimiento
- Ejemplos: VMware ESXi, Hyper-V, KVM
Tipo 2 (Hosted):
- Se ejecuta en el sistema operativo host
- Más fácil de configurar
- Ejemplos: VMware Workstation, VirtualBox
Gestión de KVM:
Frecuencia: Común Dificultad: Media
2. ¿Cómo diseñas clústeres de alta disponibilidad?
Respuesta: La Alta Disponibilidad (HA) garantiza que los servicios sigan accesibles a pesar de los fallos.
Tipos de clústeres:
Clúster Activo-Pasivo:
- Un nodo activo, otros en espera
- Failover automático en caso de fallo
- Menor utilización de recursos
Clúster Activo-Activo:
- Todos los nodos sirven tráfico
- Mejor utilización de recursos
- Configuración más compleja
Configuración de Pacemaker + Corosync:
Keepalived (HA Simple):
Replicación de bases de datos (MySQL):
Comprobaciones de estado:
Prueba de Failover:
Frecuencia: Común Dificultad: Difícil
Automatización y scripting
3. ¿Cómo automatizas las tareas de administración del sistema?
Respuesta: La automatización reduce el trabajo pesado y mejora la consistencia:
Scripting en Bash:
Playbook de Ansible:
Frecuencia: Muy común Dificultad: Media-Difícil
4. ¿Cómo gestionas la configuración en cientos de servidores?
Respuesta: La gestión de la configuración a escala requiere automatización y consistencia.
Comparación de herramientas:
Ansible a escala:
Inventario dinámico:
Buenas prácticas de Infraestructura como Código:
1. Control de versiones:
2. Pruebas:
3. Gestión de secretos:
4. Idempotencia:
Ejecución paralela:
Frecuencia: Común Dificultad: Media-Difícil
Recuperación ante desastres
5. ¿Cómo diseñas un plan de recuperación ante desastres?
Respuesta: Estrategia de DR integral:
Métricas clave:
- RTO (Recovery Time Objective): Tiempo máximo aceptable de inactividad
- RPO (Recovery Point Objective): Pérdida máxima aceptable de datos
Estrategia de DR:
1. Estrategia de copia de seguridad:
2. Replicación de la base de datos:
3. Documentación:
- Procedimientos de recuperación
- Listas de contactos
- Diagramas del sistema
- Copias de seguridad de la configuración
Frecuencia: Muy común Dificultad: Difícil
Refuerzo de la seguridad
6. ¿Cómo refuerzas la seguridad de un servidor Linux?
Respuesta: Enfoque de seguridad multicapa:
1. Actualizaciones del sistema:
2. Refuerzo de SSH:
3. Configuración del firewall:
4. Detección de intrusiones:
5. Registro de auditoría:
Frecuencia: Muy común Dificultad: Difícil
Optimización del rendimiento
7. ¿Cómo optimizas el rendimiento del servidor?
Respuesta: Ajuste sistemático del rendimiento:
1. Identificar cuellos de botella:
2. Optimizar servicios:
3. Ajuste del kernel:
4. Supervisar y alertar:
Frecuencia: Común Dificultad: Media-Difícil
8. ¿Cómo diseñas una solución integral de monitorización y alertas?
Respuesta: Una monitorización eficaz evita las interrupciones y permite una respuesta rápida a los incidentes.
Arquitectura de la pila de monitorización:
Configuración de Prometheus:
Reglas de alerta:
Configuración de Alertmanager:
Panel de control de Grafana:
Conceptos de SLO/SLA/SLI:
SLI (Service Level Indicator):
- Medida cuantitativa del nivel de servicio
- Ejemplos: % de tiempo de actividad, latencia, tasa de error
SLO (Service Level Objective):
- Valor objetivo para SLI
- Ejemplo: 99,9% de tiempo de actividad, latencia p95 < 200 ms
SLA (Service Level Agreement):
- Contrato con consecuencias
- Ejemplo: 99,9% de tiempo de actividad o el cliente recibe un reembolso
Prevenir la fatiga de alertas:
-
Alertas significativas:
- Alerta sobre los síntomas, no sobre las causas
- Cada alerta debe ser accionable
- Eliminar las alertas ruidosas
-
Agrupación de alertas:
- Agrupar las alertas relacionadas
- Utilizar reglas de inhibición
- Establecer umbrales adecuados
-
Escalada:
- Advertencia → Chat del equipo
- Crítico → PagerDuty
- Utilizar rotaciones de guardia
Frecuencia: Común Dificultad: Difícil
Infraestructura empresarial
9. ¿Cómo gestionas un entorno Windows a gran escala?
Respuesta: Estrategias de gestión centralizada:
Gestión de políticas de grupo:
WSUS (Windows Update):
PowerShell Remoting:
Frecuencia: Común Dificultad: Difícil
Conclusión
Las entrevistas de administrador de sistemas senior valoran respuestas prácticas y basadas en escenarios. Muestra cómo investigas antes de cambiar algo, automatizas con seguridad, proteges accesos privilegiados, pruebas la recuperación y comunicas con claridad cuando la infraestructura falla.
- Virtualización: Hipervisores, gestión de recursos, migración
- Alta disponibilidad: Clustering, failover, replicación
- Automatización: Scripting, gestión de la configuración, orquestación
- Gestión de la configuración: Ansible, Puppet, IaC a escala
- Recuperación ante desastres: Estrategias de copia de seguridad, replicación, pruebas
- Seguridad: Refuerzo de la seguridad, cumplimiento, monitorización
- Rendimiento: Optimización, planificación de la capacidad, resolución de problemas
- Monitorización: Prometheus, Grafana, alertas, SLO/SLA
- Gestión empresarial: AD, GPO, administración centralizada
Practica cada respuesta como una historia breve: entorno, riesgo, diagnóstico, solución, validación y qué cambiaste después para evitar que el incidente se repita.


