Perguntas de entrevista para arquiteto de nuvem: arquitetura e segurança

Milad Bonakdar
Autor
Prepare-se com perguntas práticas sobre multi-nuvem, migração, microsserviços, recuperação de desastres, zero trust e decisões de custo.
Introdução
Entrevistas para arquiteto de nuvem normalmente avaliam como você faz trade-offs: confiabilidade versus custo, serviços gerenciados versus portabilidade, padrões centrais versus autonomia dos times e controles de segurança versus velocidade de entrega. Uma boa resposta explica o objetivo de negócio, as restrições, a arquitetura-alvo, os riscos e o modelo operacional depois do lançamento.
Use este guia para praticar perguntas sobre estratégia multi-nuvem, planejamento de migração, microsserviços, service mesh, recuperação de desastres, zero trust e otimização de custos.
Estratégia Multi-Nuvem
1. Como você projeta uma estratégia multi-nuvem?
Resposta: Multi-nuvem utiliza múltiplos provedores de nuvem para resiliência, otimização de custos e evitar a dependência de um único fornecedor.
Considerações Chave:
Padrões de Arquitetura:
1. Ativo-Ativo:
- Cargas de trabalho executadas simultaneamente em várias nuvens
- Balanceamento de carga entre provedores
- Máxima disponibilidade
2. Ativo-Passivo:
- Nuvem primária para produção
- Nuvem secundária para recuperação de desastres
- Custo-efetivo
3. Serviços Agnostic de Nuvem:
- Use Kubernetes para portabilidade
- Terraform para IaC entre nuvens
- Pipelines de CI/CD padronizados
Desafios:
- Complexidade no gerenciamento
- Custos de transferência de dados
- Requisitos de habilidades
- Políticas de segurança consistentes
Raridade: Comum Dificuldade: Difícil
2. Como você planeja e executa uma migração para a nuvem?
Resposta: A migração para a nuvem requer planejamento cuidadoso, avaliação de riscos e execução faseada.
Os 7 R's da Migração:
Estratégias de Migração:
1. Rehospedar (Lift and Shift):
- Mover a aplicação com mudanças mínimas
- Útil para sair rapidamente de um data center
- Normalmente precisa de otimização depois da migração
2. Relocate:
- Mover uma plataforma ou carga virtualizada sem alterar a aplicação
- Útil quando a nuvem destino oferece um caminho compatível de relocation
- Validar rede, identidade, backup e licenciamento
3. Replatformar:
- Fazer mudanças limitadas, como migrar para banco gerenciado ou plataforma de containers
- Equilibra velocidade de migração e melhoria operacional
4. Refatorar/Re-arquitetar:
- Redesenhar para escala cloud-native, resiliência ou velocidade de entrega
- Maior esforço, então reserve para sistemas de alto valor
5. Recomprar:
- Substituir a aplicação por SaaS
- Exemplo: trocar um CRM customizado por uma plataforma CRM gerenciada
6. Aposentar:
- Desativar aplicações que não geram mais valor de negócio
7. Reter:
- Manter um sistema onde está por compliance, latência, custo ou sequência do programa
Fases da Migração:
Execução da Migração:
1. Avaliação:
- Inventário de aplicativos e dependências
- Análise de custos (TCO)
- Identificar riscos e restrições
2. Planejamento:
- Escolher a estratégia de migração por aplicativo
- Definir critérios de sucesso
- Criar planos de rollback
3. Migração Piloto:
- Começar com aplicação não crítica
- Validar abordagem
- Refinar processos
4. Migração de Dados:
5. Estratégia de Cutover:
- Big Bang: Tudo de uma vez (arriscado)
- Faseada: Migração gradual (mais segura)
- Execução Paralela: Executar ambos os ambientes
Mitigação de Riscos:
- Testes abrangentes
- Procedimentos de rollback automatizados
- Linhas de base de desempenho
- Validação de segurança
- Monitoramento de custos
Raridade: Muito Comum Dificuldade: Médio-Difícil
Arquitetura de Microsserviços
3. Como você projeta uma arquitetura de microsserviços?
Resposta: Microsserviços decompõem aplicações em serviços pequenos e independentes.
Arquitetura:
Princípios Chave:
1. Independência de Serviço:
- Cada serviço possui seus dados
- Implantação independente
- Diversidade tecnológica permitida
2. Comunicação:
3. API Gateway:
- Ponto de entrada único
- Autenticação/autorização
- Limitação de taxa
- Roteamento de requisições
4. Service Discovery:
- Registro dinâmico de serviços
- Verificações de saúde
- Balanceamento de carga
Benefícios:
- Escalonamento independente
- Flexibilidade tecnológica
- Isolamento de falhas
- Implantação mais rápida
Desafios:
- Complexidade do sistema distribuído
- Consistência de dados
- Complexidade de testes
- Sobrecarga operacional
Raridade: Muito Comum Dificuldade: Difícil
4. Como você implementa um service mesh em microsserviços?
Resposta: Um service mesh fornece uma camada de infraestrutura para a comunicação serviço a serviço, lidando com gerenciamento de tráfego, segurança e observabilidade.
Arquitetura:
Características Chave:
1. Gerenciamento de Tráfego:
- Balanceamento de carga
- Circuit breaking
- Retentativas e timeouts
- Implantações canary
- Testes A/B
2. Segurança:
- Criptografia mTLS
- Autenticação
- Políticas de autorização
3. Observabilidade:
- Rastreamento distribuído
- Coleta de métricas
- Log de acesso
Implementação Istio:
Configuração do Circuit Breaker:
Segurança mTLS:
Observabilidade com Kiali:
Comparação de Service Mesh:
Quando Usar:
- Ambientes de microsserviços em que políticas compartilhadas de tráfego, identidade e observabilidade justificam o esforço operacional
- Necessidade de gerenciamento avançado de tráfego
- Requisitos de segurança (mTLS)
- Implantações multi-cluster
- Requisitos de observabilidade
Raridade: Comum Dificuldade: Difícil
Padrões de Design
5. Explique o padrão Circuit Breaker e quando usá-lo.
Resposta: Circuit Breaker impede falhas em cascata em sistemas distribuídos.
Estados:
- Fechado: Operação normal
- Aberto: Falhas detectadas, requisições falham rapidamente
- Semi-Aberto: Testando se o serviço se recuperou
Casos de Uso:
- Chamadas de API externa
- Conexões de banco de dados
- Comunicação de microsserviços
- Integrações de terceiros
Raridade: Comum Dificuldade: Médio-Difícil
Arquitetura Orientada a Eventos
6. Explique a arquitetura orientada a eventos e quando usá-la.
Resposta: A Arquitetura Orientada a Eventos (EDA) usa eventos para disparar e comunicar entre serviços desacoplados.
Arquitetura:
Conceitos Principais:
1. Evento:
- Fato imutável que aconteceu
- Contém dados relevantes
- Com carimbo de data/hora
2. Produtor de Evento:
- Publica eventos
- Não conhece os consumidores
3. Consumidor de Evento:
- Assina eventos
- Processa assincronamente
4. Barramento/Broker de Eventos:
- Roteia eventos
- Exemplos: Kafka, RabbitMQ, AWS EventBridge
Implementação Kafka:
Padrão Event Sourcing:
CQRS (Command Query Responsibility Segregation):
Benefícios:
- Acoplamento solto
- Escalabilidade
- Flexibilidade
- Trilha de auditoria (event sourcing)
- Processamento em tempo real
Desafios:
- Consistência eventual
- Evolução do schema do evento
- Complexidade de depuração
- Tratamento de eventos duplicados
Casos de Uso:
- Processamento de pedidos de e-commerce
- Análise em tempo real
- Processamento de dados IoT
- Comunicação de microsserviços
- Sistemas de auditoria e conformidade
Raridade: Comum Dificuldade: Difícil
Recuperação de Desastres
7. Como você projeta uma estratégia de recuperação de desastres?
Resposta: DR garante a continuidade dos negócios durante interrupções.
Métricas Chave:
- RTO (Recovery Time Objective): Tempo máximo aceitável de inatividade
- RPO (Recovery Point Objective): Máxima perda de dados aceitável
Estratégias de DR:
Exemplo de Implementação:
Automação:
Testes:
- Simulações regulares de DR conforme a criticidade da carga
- Testes automatizados
- Documentar runbooks
- Revisões pós-incidente
Raridade: Muito Comum Dificuldade: Difícil
Segurança & Conformidade
8. Como você implementa segurança de confiança zero na arquitetura de nuvem?
Resposta: Confiança Zero assume que não há confiança implícita, verifique tudo.
Princípios:
- Verificar explicitamente
- Acesso com o mínimo privilégio
- Assumir a violação
Implementação:
Componentes:
1. Identidade & Acesso:
2. Segmentação de Rede:
- Micro-segmentação
- Service mesh (Istio, Linkerd)
- Políticas de rede
3. Criptografia:
- Dados em repouso
- Dados em trânsito
- Criptografia de ponta a ponta
4. Monitoramento Contínuo:
- Detecção de ameaças em tempo real
- Análise comportamental
- Resposta automatizada
Raridade: Comum Dificuldade: Difícil
Otimização de Custos
9. Como você otimiza custos entre vários provedores de nuvem?
Resposta: Estratégias de otimização de custos multi-nuvem:
1. Alocação de Carga de Trabalho:
- Analisar modelos de preços
- Considerar custos de transferência de dados
- Aproveitar diferenças regionais de preços
2. Capacidade Reservada:
- AWS Reserved Instances
- Azure Reserved VM Instances
- GCP Committed Use Discounts
3. Instâncias Spot/Preemptivas:
4. Monitoramento & Governança:
- Painéis de custos unificados
- Alertas de orçamento
- Alocação de custos baseada em tags
- Limpeza automatizada de recursos
5. Otimização de Arquitetura:
- Serverless para cargas de trabalho variáveis
- Políticas de auto-scaling
- Níveis de armazenamento
- CDN para conteúdo estático
Raridade: Muito Comum Dificuldade: Médio-Difícil
Conclusão
Entrevistas para arquiteto de nuvem valorizam mais decisões práticas do que diagramas memorizados. Prepare-se para explicar:
- Multi-nuvem: por que uma carga precisa de mais de um provedor e que complexidade isso adiciona
- Migração: opções 7R, descoberta de dependências, cutover em fases, rollback e otimização pós-migração
- Microsserviços: limites, propriedade de dados, contratos de API, resiliência e custo operacional
- Service mesh: quando mTLS, políticas de tráfego e observabilidade justificam uma camada extra de plataforma
- Padrões de design: circuit breaker, saga, CQRS, idempotência, retries e timeouts
- Sistemas orientados a eventos: contratos de eventos, ordenação, duplicidade, evolução de esquema e consistência eventual
- Recuperação de desastres: RTO/RPO, estratégia regional, runbooks, testes e evidência de recuperação
- Segurança: acesso baseado em identidade, menor privilégio, criptografia, segmentação, logs e mentalidade assume breach
- Otimização de custos: rightsizing, compromissos, tags, limpeza de recursos ociosos, transferência de dados e governança FinOps
Ao responder, comece pela restrição de negócio, nomeie o trade-off e explique como validaria o design em produção.


