Perguntas de entrevista para analista de dados sênior: SQL, dashboards e stakeholders

Milad Bonakdar
Autor
Prepare-se para entrevistas de analista de dados sênior com perguntas práticas sobre SQL avançado, experimentação, qualidade de dados, dashboards, métricas e negociação com stakeholders.
Introdução
Entrevistas para analista de dados sênior geralmente testam mais do que sintaxe SQL. Você precisa mostrar como enquadra um problema de negócio, escolhe a métrica certa, escreve SQL eficiente, valida a qualidade dos dados, explica um experimento e transforma um dashboard em uma decisão.
Use este guia para praticar respostas com maturidade sênior: declarar premissas, explicar tradeoffs, conectar a análise ao impacto de negócio e dizer o que faria em seguida quando os dados não são perfeitos.
SQL Avançado (6 Perguntas)
1. Explique funções de janela e dê exemplos.
Resposta: Funções de janela realizam cálculos em um conjunto de linhas relacionadas à linha atual sem colapsar o resultado.
- Funções de Janela Comuns:
- ROW_NUMBER(): Número sequencial único
- RANK(): Classificação com lacunas para empates
- DENSE_RANK(): Classificação sem lacunas
- LAG/LEAD(): Acessa a linha anterior/seguinte
- SUM/AVG/COUNT() OVER(): Totais/médias acumuladas
Raridade: Muito Comum Dificuldade: Difícil
2. Como você otimiza consultas SQL lentas?
Resposta: A otimização de consultas melhora o desempenho e reduz o uso de recursos.
- Técnicas:
- Indexação: Crie índices em colunas frequentemente consultadas
- *Evite SELECT : Selecione apenas as colunas necessárias
- Use WHERE de forma eficiente: Filtre cedo
- Otimize JOINs: Una em colunas indexadas
- Evite subconsultas: Use JOINs ou CTEs em vez disso
- Use EXPLAIN: Analise o plano de execução da consulta
- Particione tabelas: Para tabelas muito grandes
- Agregue de forma eficiente: Use GROUP BY apropriado
Raridade: Muito Comum Dificuldade: Difícil
3. O que são CTEs (Common Table Expressions) e quando você as usaria?
Resposta: CTEs criam conjuntos de resultados temporários nomeados que existem apenas durante a execução da consulta.
- Benefícios:
- Melhora a legibilidade
- Permite recursão
- Reutilização na mesma consulta
- Melhor que subconsultas para lógica complexa
Raridade: Comum Dificuldade: Média
4. Explique a diferença entre UNION e UNION ALL.
Resposta: Ambos combinam resultados de múltiplas instruções SELECT.
- UNION:
- Remove linhas duplicadas
- Mais lento (requer ordenação/comparação)
- Use quando duplicatas devem ser eliminadas
- UNION ALL:
- Mantém todas as linhas, incluindo duplicatas
- Mais rápido (sem deduplicação)
- Use quando duplicatas são aceitáveis ou impossíveis
Raridade: Comum Dificuldade: Fácil
5. Como você lida com valores NULL em SQL?
Resposta: NULL representa dados ausentes ou desconhecidos e requer tratamento especial.
Raridade: Muito Comum Dificuldade: Média
6. O que são subconsultas e quando você as usaria em vez de JOINs?
Resposta: Subconsultas são consultas aninhadas dentro de outra consulta.
- Tipos:
- Escalar: Retorna um único valor
- Linha: Retorna uma única linha
- Tabela: Retorna múltiplas linhas/colunas
- Use Subconsultas quando:
- Precisa filtrar com base em dados agregados
- Verificando a existência (EXISTS)
- Comparando com valores agregados
- Use JOINs quando:
- Precisa de colunas de várias tabelas
- Melhor desempenho (geralmente)
Raridade: Muito Comum Dificuldade: Média
Análise Estatística (4 Perguntas)
7. Como você realiza uma análise de coorte?
Resposta: A análise de coorte agrupa usuários por características compartilhadas e rastreia o comportamento ao longo do tempo.
- Casos de Uso Comuns:
- Retenção de clientes
- Engajamento do usuário
- Tendências de receita por período de aquisição
Raridade: Comum Dificuldade: Difícil
8. Explique a análise de teste A/B e a significância estatística.
Resposta: O teste A/B compara duas versões para determinar qual tem melhor desempenho.
- Métricas Chave:
- Taxa de conversão
- Significância estatística (p-valor < 0,05)
- Intervalo de confiança
- Tamanho da amostra
- Processo:
- Defina a hipótese
- Determine o tamanho da amostra
- Execute o teste
- Analise os resultados
- Tome uma decisão
Raridade: Comum Dificuldade: Difícil
9. Como você calcula e interpreta percentis?
Resposta: Percentis dividem os dados em 100 partes iguais.
- Percentis Comuns:
- 25º (Q1), 50º (Mediana/Q2), 75º (Q3)
- 90º, 95º, 99º para detecção de outliers
- Casos de Uso:
- Benchmarking de salários
- Métricas de desempenho
- Monitoramento de SLA
Raridade: Comum Dificuldade: Média
10. O que é análise de séries temporais e como você lida com a sazonalidade?
Resposta: A análise de séries temporais examina pontos de dados coletados ao longo do tempo para identificar padrões.
- Componentes:
- Tendência: Direção de longo prazo
- Sazonalidade: Padrões regulares (diários, semanais, anuais)
- Cíclico: Flutuações irregulares
- Aleatório: Ruído
- Lidando com a Sazonalidade:
- Médias móveis
- Comparação ano a ano
- Decomposição sazonal
- Ajuste sazonal
Raridade: Média Dificuldade: Difícil
Modelagem de Dados e ETL (4 Perguntas)
11. Explique esquema estrela vs esquema floco de neve.
Resposta: Ambos são padrões de design de data warehouse.
- Esquema Estrela:
- Tabela de fatos cercada por tabelas de dimensão desnormalizadas
- Consultas simples (menos joins)
- Desempenho de consulta mais rápido
- Mais armazenamento (dados redundantes)
- Esquema Floco de Neve:
- Tabelas de dimensão normalizadas
- Menos armazenamento (sem redundância)
- Consultas mais complexas (mais joins)
- Desempenho de consulta mais lento
Raridade: Comum Dificuldade: Média
12. O que é ETL e como você projeta um pipeline de ETL?
Resposta: ETL (Extrair, Transformar, Carregar) move dados de fontes para o destino.
- Extrair: Puxe dados de fontes (bancos de dados, APIs, arquivos)
- Transformar: Limpe, valide, agregue, enriqueça
- Carregar: Insira no destino (data warehouse, banco de dados)
- Considerações de Design:
- Carga Incremental vs Carga Completa
- Tratamento de erros e registro
- Validação de dados
- Otimização de desempenho
- Agendamento e orquestração
Raridade: Muito Comum Dificuldade: Difícil
13. Como você garante a qualidade dos dados?
Resposta: A qualidade dos dados garante que os dados sejam precisos, completos e confiáveis.
- Dimensões:
- Precisão: Valores corretos
- Completude: Sem dados ausentes
- Consistência: Mesmo em todos os sistemas
- Pontualidade: Atualizado
- Validade: Conforme as regras
- Técnicas:
- Regras de validação de dados
- Testes automatizados
- Criação de perfil de dados
- Detecção de anomalias
- Auditorias regulares
Raridade: Muito Comum Dificuldade: Média
14. O que é normalização de dados e quando você desnormalizaria?
Resposta:
- Normalização: Organizar dados para reduzir a redundância
- 1NF, 2NF, 3NF, BCNF
- Benefícios: Integridade dos dados, menos armazenamento
- Desvantagem: Mais joins, consultas mais lentas
- Desnormalização: Adicionar intencionalmente redundância
- Benefícios: Consultas mais rápidas, SQL mais simples
- Desvantagens: Mais armazenamento, anomalias de atualização
- Use para: Data warehouses, relatórios, sistemas de leitura pesada
Raridade: Comum Dificuldade: Média
Painel e Visualização (3 Perguntas)
15. Como você projeta um painel eficaz?
Resposta: Painéis eficazes fornecem insights acionáveis de relance.
- Princípios:
- Conheça seu público: Executivos vs analistas
- Concentre-se em KPIs: As métricas mais importantes primeiro
- Use visualizações apropriadas: Gráfico certo para o tipo de dados
- Mantenha a consistência: Cores, fontes, layout
- Habilite a interatividade: Filtros, drill-downs
- Otimize o desempenho: Pré-agregue dados
- Conte uma história: Fluxo lógico
- Layout:
- Topo: Principais métricas/KPIs
- Meio: Tendências e comparações
- Inferior: Detalhes e detalhamentos
Raridade: Muito Comum Dificuldade: Média
16. Como você otimiza o desempenho do painel?
Resposta: Painéis lentos frustram os usuários e reduzem a adoção.
- Técnicas de Otimização:
- Agregação de dados: Pré-calcule as métricas
- Visualizações materializadas: Armazene os resultados da consulta
- Atualização incremental: Atualize apenas os novos dados
- Limite os dados: Use filtros, intervalos de datas
- Otimize as consultas: Índices, SQL eficiente
- Extraia dados: Mova para uma fonte de dados mais rápida
- Reduza as visualizações: Menos gráficos por painel
- Use extrações: Extrações do Tableau/Power BI
Raridade: Comum Dificuldade: Média
17. Quais métricas você rastrearia para diferentes funções de negócios?
Resposta: Departamentos diferentes precisam de métricas diferentes.
- Vendas:
- Receita, taxa de conversão, tamanho médio do negócio
- Duração do ciclo de vendas, taxa de ganho
- Custo de aquisição de clientes (CAC)
- Marketing:
- ROI, custo por lead, taxa de conversão de lead
- Tráfego do site, taxa de engajamento
- Valor vitalício do cliente (CLV)
- Operações:
- Tempo de atendimento do pedido, taxa de erro
- Giro de estoque, utilização da capacidade
- Taxa de entrega no prazo
- Finanças:
- Margem de lucro, fluxo de caixa, taxa de queima
- Crescimento da receita, EBITDA
- Envelhecimento de contas a receber
- Sucesso do Cliente:
- Satisfação do cliente (CSAT), Net Promoter Score (NPS)
- Taxa de rotatividade, taxa de retenção
- Tempo de resolução do ticket de suporte
Raridade: Comum Dificuldade: Fácil
Estratégia de Negócios e Comunicação (3 Perguntas)
18. Como você prioriza projetos de análise?
Resposta: A priorização garante o máximo impacto nos negócios.
- Estrutura:
- Impacto: Valor potencial para os negócios
- Esforço: Tempo e recursos necessários
- Urgência: Sensibilidade ao tempo
- Alinhamento das partes interessadas: Apoio executivo
- Matriz de Priorização:
- Alto Impacto, Baixo Esforço: Faça primeiro
- Alto Impacto, Alto Esforço: Planeje cuidadosamente
- Baixo Impacto, Baixo Esforço: Ganhos rápidos
- Baixo Impacto, Alto Esforço: Evite
- Perguntas a Fazer:
- Qual problema de negócios isso resolve?
- Qual é o ROI esperado?
- Quem são as partes interessadas?
- Quais dados estão disponíveis?
- Quais são as dependências?
Raridade: Comum Dificuldade: Média
19. Como você lida com requisitos conflitantes das partes interessadas?
Resposta: Gerenciar as partes interessadas é crucial para analistas seniores.
- Abordagem:
- Entenda as necessidades: Faça perguntas esclarecedoras
- Encontre um terreno comum: Objetivos compartilhados
- Priorize: Com base no impacto nos negócios
- Comunique as compensações: Explique as restrições
- Proponha alternativas: Soluções ganha-ganha
- Escale se necessário: Obtenha alinhamento executivo
- Documente as decisões: Registro claro
- Exemplo:
- O marketing deseja um painel em tempo real
- A TI diz que o tempo real é muito caro
- Solução: Quase em tempo real (atualização de 15 minutos) equilibra as necessidades e o custo
Raridade: Comum Dificuldade: Média
20. Como você mede o sucesso do seu trabalho de análise?
Resposta: Demonstrar valor é essencial para o crescimento na carreira.
- Métricas:
- Impacto nos Negócios:
- Aumento da receita
- Redução de custo
- Melhoria de eficiência
- Melhor tomada de decisão
- Adoção:
- Uso do painel
- Distribuição do relatório
- Feedback das partes interessadas
- Qualidade:
- Precisão dos dados
- Pontualidade
- Capacidade de ação dos insights
- Impacto nos Negócios:
- Documentação:
- Rastreie projetos e resultados
- Quantifique o impacto quando possível
- Colete depoimentos
- Apresente estudos de caso
Raridade: Média Dificuldade: Média


