Perguntas de entrevista para administrador de sistemas sênior

Milad Bonakdar
Autor
Prepare-se para entrevistas de sysadmin sênior com perguntas práticas sobre Linux, Windows, Active Directory, automação, hardening, monitoramento, backups e solução de incidentes.
Introdução
Entrevistas para administrador de sistemas sênior costumam avaliar como você mantém a infraestrutura confiável sob pressão: diagnosticar incidentes, proteger ambientes Linux e Windows, automatizar tarefas repetitivas, planejar recuperação e explicar decisões técnicas com clareza.
Use este guia para preparar respostas que mostrem experiência prática e julgamento sênior. Em cada tema, conecte os passos técnicos à redução de risco, disponibilidade, controle de acesso, documentação e comunicação durante incidentes.
Virtualização & Nuvem
1. Explique a diferença entre hipervisores Tipo 1 e Tipo 2.
Resposta:
Tipo 1 (Bare Metal):
- Executa diretamente no hardware
- Melhor desempenho
- Exemplos: VMware ESXi, Hyper-V, KVM
Tipo 2 (Hospedado):
- Executa em um SO host
- Mais fácil de configurar
- Exemplos: VMware Workstation, VirtualBox
Gerenciamento KVM:
Raridade: Comum Dificuldade: Média
2. Como você projeta clusters de alta disponibilidade?
Resposta: Alta Disponibilidade (HA) garante que os serviços permaneçam acessíveis apesar de falhas.
Tipos de Cluster:
Cluster Ativo-Passivo:
- Um nó ativo, outros em standby
- Failover automático em caso de falha
- Menor utilização de recursos
Cluster Ativo-Ativo:
- Todos os nós atendem o tráfego
- Melhor utilização de recursos
- Configuração mais complexa
Configuração Pacemaker + Corosync:
Keepalived (HA Simples):
Replicação de Banco de Dados (MySQL):
Verificações de Saúde:
Testando o Failover:
Raridade: Comum Dificuldade: Difícil
Automação & Scripting
3. Como você automatiza tarefas de administração de sistemas?
Resposta: A automação reduz o esforço repetitivo e melhora a consistência:
Scripting em Bash:
Playbook Ansible:
Raridade: Muito Comum Dificuldade: Média-Difícil
4. Como você gerencia a configuração em centenas de servidores?
Resposta: O gerenciamento de configuração em escala requer automação e consistência.
Comparação de Ferramentas:
Ansible em Escala:
Inventário Dinâmico:
Melhores Práticas de Infraestrutura como Código:
1. Controle de Versão:
2. Testes:
3. Gerenciamento de Segredos:
4. Idempotência:
Execução Paralela:
Raridade: Comum Dificuldade: Média-Difícil
Recuperação de Desastres
5. Como você projeta um plano de recuperação de desastres?
Resposta: Estratégia DR abrangente:
Métricas Chave:
- RTO (Recovery Time Objective): Tempo máximo aceitável de inatividade
- RPO (Recovery Point Objective): Perda máxima aceitável de dados
Estratégia DR:
1. Estratégia de Backup:
2. Replicação de Banco de Dados:
3. Documentação:
- Procedimentos de recuperação
- Listas de contato
- Diagramas do sistema
- Backups de configuração
Raridade: Muito Comum Dificuldade: Difícil
Reforço de Segurança
6. Como você reforça a segurança de um servidor Linux?
Resposta: Abordagem de segurança em várias camadas:
1. Atualizações do Sistema:
2. Reforço do SSH:
3. Configuração do Firewall:
4. Detecção de Intrusão:
5. Auditoria de Log:
Raridade: Muito Comum Dificuldade: Difícil
Otimização de Desempenho
7. Como você otimiza o desempenho do servidor?
Resposta: Ajuste sistemático do desempenho:
1. Identificar Gargalos:
2. Otimizar Serviços:
3. Ajuste do Kernel:
4. Monitorar e Alertar:
Raridade: Comum Dificuldade: Média-Difícil
8. Como você projeta uma solução abrangente de monitoramento e alertas?
Resposta: O monitoramento eficaz evita interrupções e permite uma resposta rápida a incidentes.
Arquitetura da Stack de Monitoramento:
Configuração do Prometheus:
Regras de Alerta:
Configuração do Alertmanager:
Dashboard Grafana:
Conceitos SLO/SLA/SLI:
SLI (Service Level Indicator):
- Medida quantitativa do nível de serviço
- Exemplos: % de uptime, latência, taxa de erros
SLO (Service Level Objective):
- Valor alvo para SLI
- Exemplo: 99,9% de uptime, latência p95 < 200ms
SLA (Service Level Agreement):
- Contrato com consequências
- Exemplo: 99,9% de uptime ou o cliente recebe reembolso
Prevenindo a Fadiga de Alertas:
-
Alertas Significativos:
- Alertar sobre sintomas, não causas
- Todo alerta deve ser acionável
- Remover alertas ruidosos
-
Agrupamento de Alertas:
- Agrupar alertas relacionados
- Usar regras de inibição
- Definir limites apropriados
-
Escalonamento:
- Aviso → Chat da equipe
- Crítico → PagerDuty
- Usar rodízios de plantão
Raridade: Comum Dificuldade: Difícil
Infraestrutura Empresarial
9. Como você gerencia um ambiente Windows em grande escala?
Resposta: Estratégias de gerenciamento centralizado:
Gerenciamento de Política de Grupo:
WSUS (Windows Update):
PowerShell Remoting:
Raridade: Comum Dificuldade: Difícil
Conclusão
Entrevistas de administrador de sistemas sênior valorizam respostas práticas e baseadas em cenários. Mostre como você investiga antes de mudar, automatiza com segurança, protege acessos privilegiados, testa recuperação e se comunica bem quando a infraestrutura está degradada.
- Virtualização: Hipervisores, gerenciamento de recursos, migração
- Alta Disponibilidade: Clustering, failover, replicação
- Automação: Scripting, gerenciamento de configuração, orquestração
- Gerenciamento de Configuração: Ansible, Puppet, IaC em escala
- Recuperação de Desastres: Estratégias de backup, replicação, testes
- Segurança: Reforço, conformidade, monitoramento
- Desempenho: Otimização, planejamento de capacidade, solução de problemas
- Monitoramento: Prometheus, Grafana, alertas, SLO/SLA
- Gerenciamento Empresarial: AD, GPO, administração centralizada
Pratique cada resposta como uma história curta: ambiente, risco, diagnóstico, correção, validação e o que você mudou depois para evitar reincidência.


