Perguntas de entrevista para Senior GCP Cloud Engineer

Milad Bonakdar
Autor
Prepare-se para entrevistas sênior de GCP com perguntas práticas sobre arquitetura, GKE, Cloud Run, IAM, custos, BigQuery e confiabilidade.
Introdução
Entrevistas para Senior GCP Cloud Engineer normalmente testam se você sabe justificar decisões de produção, não apenas citar serviços do Google Cloud. Prepare-se para explicar quando escolher GKE, Cloud Run, Cloud SQL, Spanner, VPC Compartilhada, controles de IAM e guardrails de custo para uma carga específica.
Use estas perguntas para praticar respostas de nível sênior: comece pelo requisito, justifique a escolha, aponte riscos e explique como operaria a solução em produção.
Arquitetura & Design
1. Desenhe uma aplicação de alta disponibilidade no GCP.
Resposta: Arquitetura pronta para produção com redundância e escalabilidade:
Componentes Chave:
Princípios de Design:
- Implantação multi-zona
- Autoescalabilidade baseada em métricas
- Serviços gerenciados para bancos de dados
- CDN para conteúdo estático
- Verificações de saúde e monitoramento
Raridade: Muito Comum Dificuldade: Difícil
Google Kubernetes Engine (GKE)
2. Como você implanta e gerencia aplicações no GKE?
Resposta: GKE é o serviço Kubernetes gerenciado do Google.
Processo de Implantação:
Recursos do GKE que vale mencionar:
- Clusters regionais para disponibilidade do control plane e dos nós
- Cluster autoscaling com Horizontal Pod Autoscaling
- Workload Identity Federation for GKE em vez de chaves longas de conta de serviço
- Binary Authorization e varredura de imagens para controle da cadeia de suprimentos
- Cloud Logging, Cloud Monitoring, SLOs e alertas
Raridade: Muito Comum Dificuldade: Difícil
Serverless & Serviços Avançados
3. Quando você usaria Cloud Functions vs Cloud Run?
Resposta: Escolha com base no contrato operacional que você precisa assumir. Uma boa resposta compara gatilhos, empacotamento, controle do runtime, escalabilidade e complexidade operacional.
Cloud Functions:
- Melhor para pequenos handlers de eventos de Pub/Sub, Cloud Storage, Eventarc ou HTTP simples
- Superfície mínima de infraestrutura
- Útil quando o time quer deploy por função e não precisa de contêiner personalizado
- Menos controle sobre o runtime do que em um serviço conteinerizado
Cloud Run:
- Melhor para serviços HTTP, APIs, workers e serviços orientados a eventos em contêineres
- Mais controle sobre dependências, concorrência, CPU, inicialização e divisão de tráfego
- Escala para zero, mas pode usar instâncias mínimas para rotas sensíveis à latência
- Geralmente é a melhor opção quando você precisa de portabilidade, runtime próprio ou responsabilidade no nível do serviço
Raridade: Comum Dificuldade: Média
Rede Avançada
4. Explique VPC Compartilhado e quando usá-lo.
Resposta: VPC Compartilhado permite que múltiplos projetos compartilhem uma rede VPC comum.
Benefícios:
- Administração de rede centralizada
- Compartilhamento de recursos entre projetos
- Faturamento simplificado
- Políticas de segurança consistentes
Arquitetura:
Casos de Uso:
- Grandes organizações
- Ambientes multi-time
- Gerenciamento de rede centralizado
- Requisitos de conformidade
Raridade: Comum Dificuldade: Média-Difícil
Otimização de Custos
5. Como você otimiza os custos do GCP?
Resposta: Estratégias de otimização de custos:
1. Dimensionamento adequado (Right-sizing):
2. Descontos por Uso Contínuo (Committed Use Discounts):
- Compromissos de 1 ou 3 anos para cargas previsíveis
- Compromissos flexíveis para padrões de gasto; compromissos baseados em recursos para uso específico de compute
- Combine com dimensionamento adequado para não travar desperdício
3. Spot VMs:
4. Ciclo de Vida do Armazenamento (Storage Lifecycle):
5. Monitoramento:
- Relatórios do Cloud Billing
- Alertas de orçamento
- Detalhamento de custos por serviço/projeto
Raridade: Muito Comum Dificuldade: Média
Segurança
6. Como você implementa as melhores práticas de segurança no GCP?
Resposta: Use um modelo em camadas: identidade primeiro, rede privada quando reduz exposição, criptografia para dados sensíveis e detecção contínua com logs e Security Command Center.
1. Melhores Práticas de IAM:
Na entrevista, diga que evita papéis básicos em produção, separa identidades humanas e de workloads, prefere credenciais de curta duração e Workload Identity Federation, e revisa bindings de IAM regularmente.
2. Segurança de VPC:
- Acesso Privado do Google
- VPC Service Controls
- Cloud Armor para proteção contra DDoS
3. Criptografia de Dados:
4. Monitoramento:
- Cloud Audit Logs
- Security Command Center
- Cloud Logging e Monitoring
Raridade: Muito Comum Dificuldade: Difícil
Análise de Dados
7. Como você projeta e otimiza o BigQuery para análise em larga escala?
Resposta: BigQuery é o data warehouse serverless e altamente escalável do Google.
Arquitetura:
- Armazenamento colunar
- Escalabilidade automática
- Interface SQL
- Escala de petabytes
- Preço por consulta
Design de Tabela:
Estratégias de Otimização:
1. Particionamento:
2. Clustering:
3. Otimização de Consulta:
4. Controle de Custos:
Carregamento de Dados:
Melhores Práticas:
- Sempre use filtros de partição
- Cluster por colunas de alta cardinalidade
- Evite SELECT *
- Use funções aproximadas para grandes datasets
- Monitore os custos de consulta
- Use views materializadas para consultas repetidas
- Desnormalize os dados quando apropriado
Raridade: Muito Comum Dificuldade: Difícil
Serviços Avançados de Banco de Dados
8. Quando você usaria Cloud Spanner vs Cloud SQL?
Resposta: Escolha com base na escala, consistência e requisitos geográficos:
Cloud Spanner:
- Banco de dados relacional distribuído globalmente
- Escalabilidade horizontal (ilimitada)
- Consistência forte entre regiões
- SLA de 99.999% de disponibilidade
- Custo mais alto
Cloud SQL:
- Banco de dados gerenciado regional (MySQL, PostgreSQL, SQL Server)
- Escalabilidade vertical (limitada)
- Região única (com réplicas de leitura)
- SLA de 99.95% de disponibilidade
- Custo mais baixo
Comparação:
Exemplo de Cloud Spanner:
Cliente Python:
Exemplo de Cloud SQL:
Quando Usar:
Use Cloud Spanner quando:
- Precisar de distribuição global
- Requerer consistência forte entre regiões
- Escalar além de uma única região
- Transações financeiras
- Aplicações de missão crítica
- Orçamento permite um custo mais alto
Use Cloud SQL quando:
- Aplicação regional
- Familiarizado com MySQL/PostgreSQL
- Sensível a custos
- Escala moderada (< 10TB)
- Cargas de trabalho SQL existentes
- Não precisa de consistência global
Raridade: Comum Dificuldade: Média-Difícil
Segurança & Compliance
9. Como você implementa VPC Service Controls?
Resposta: VPC Service Controls cria perímetros de segurança em torno dos recursos do GCP para evitar a exfiltração de dados.
Conceitos Chave:
- Service Perimeter: Limite em torno dos recursos
- Access Levels: Condições para acesso
- Ingress/Egress Rules: Controlar o fluxo de dados
Arquitetura:
Configuração:
Criar Service Perimeter:
Regras de Entrada/Saída (Ingress/Egress Rules):
Regras de Saída (Egress Rules):
Serviços Suportados:
- Cloud Storage
- BigQuery
- Cloud SQL
- Compute Engine
- GKE
- Cloud Functions
- E muitos mais
Testes:
Monitoramento:
Casos de Uso:
- Evitar exfiltração de dados
- Requisitos de conformidade (HIPAA, PCI-DSS)
- Proteger dados sensíveis
- Isolar ambientes de produção
- Segurança multi-tenant
Melhores Práticas:
- Comece com o modo dry-run
- Teste completamente antes da aplicação
- Use níveis de acesso para controle refinado
- Monitore os logs do VPC SC
- Documente os limites do perímetro
- Revisões de acesso regulares
Raridade: Incomum Dificuldade: Difícil
Conclusão
Entrevistas para engenheiros de nuvem GCP seniores exigem profundo conhecimento técnico e experiência prática. Foque em:
- Arquitetura: Alta disponibilidade, escalabilidade, recuperação de desastres
- GKE: Orquestração de contêineres, estratégias de implantação
- Serverless: Casos de uso de Cloud Functions, Cloud Run
- Rede: VPC Compartilhado, conectividade híbrida
- Otimização de Custos: Dimensionamento adequado, uso comprometido, políticas de ciclo de vida
- Segurança: IAM, criptografia, controles de VPC
Quando possível, conecte sua resposta a um incidente, migração, revisão de custos ou melhoria de confiabilidade que você conduziu. Isso é mais forte do que apenas listar serviços.


