dezembro 21, 2025
13 min de leitura

Perguntas para Entrevista de Analista de Dados Júnior: Guia Completo

interview
career-advice
job-search
entry-level
Perguntas para Entrevista de Analista de Dados Júnior: Guia Completo
MB

Milad Bonakdar

Autor

Domine os fundamentos da análise de dados com perguntas essenciais para entrevistas, abrangendo Excel, SQL, visualização de dados, conceitos básicos de estatística e ferramentas de business intelligence para analistas de dados júnior.


Introdução

Analistas de dados transformam dados brutos em insights acionáveis que impulsionam decisões de negócios. Espera-se que analistas de dados júnior tenham habilidades sólidas em Excel, SQL, ferramentas de visualização de dados e estatísticas básicas para apoiar a tomada de decisões orientada por dados.

Este guia aborda questões essenciais de entrevistas para Analistas de Dados Júnior. Exploramos funções do Excel, consultas SQL, visualização de dados com Tableau e Power BI, fundamentos de estatística e melhores práticas de análise de dados para ajudá-lo a se preparar para sua primeira função como analista de dados.


Fundamentos do Excel (5 Perguntas)

1. Quais são as funções do Excel mais importantes para análise de dados?

Resposta: Funções essenciais do Excel que todo analista de dados deve conhecer:

  • VLOOKUP/XLOOKUP: Procurar valores em tabelas
  • IF/IFS: Lógica condicional
  • SUMIF/SUMIFS: Soma condicional
  • COUNTIF/COUNTIFS: Contagem condicional
  • TABELAS DINÂMICAS: Resumir e analisar dados
  • INDEX/MATCH: Mais flexível que VLOOKUP
  • Funções de TEXTO: LEFT, RIGHT, MID, CONCATENATE
  • Funções de DATA: TODAY, DATEDIF, EOMONTH
# Exemplo de VLOOKUP
=VLOOKUP(A2, Produtos!A:C, 3, FALSE)

# Exemplo de SUMIFS (soma as vendas onde região="Leste" e produto="Widget")
=SUMIFS(Vendas!C:C, Vendas!A:A, "Leste", Vendas!B:B, "Widget")

# Exemplo de INDEX/MATCH (mais flexível que VLOOKUP)
=INDEX(Preços!C:C, MATCH(A2, Preços!A:A, 0))

# Formatação condicional com IF
=IF(B2>1000, "Alto", IF(B2>500, "Médio", "Baixo"))

Raridade: Muito Comum Dificuldade: Fácil


2. Explique a diferença entre VLOOKUP e INDEX/MATCH.

Resposta:

  • VLOOKUP:
    • Sintaxe mais simples
    • Procura apenas para a direita
    • Menos flexível
    • Mais lento para grandes conjuntos de dados
  • INDEX/MATCH:
    • Sintaxe mais complexa
    • Pode procurar para a esquerda ou direita
    • Mais flexível
    • Desempenho mais rápido
    • Pode retornar linhas/colunas inteiras
# VLOOKUP - procura valor na coluna A, retorna da coluna C
=VLOOKUP(A2, A:C, 3, FALSE)

# INDEX/MATCH - equivalente, mas mais flexível
=INDEX(C:C, MATCH(A2, A:A, 0))

# Vantagem do INDEX/MATCH: pode procurar para a esquerda
=INDEX(A:A, MATCH(C2, C:C, 0))  # VLOOKUP não pode fazer isso

Raridade: Muito Comum Dificuldade: Fácil


3. Como você cria e usa Tabelas Dinâmicas?

Resposta: As Tabelas Dinâmicas resumem grandes conjuntos de dados rapidamente.

  • Passos:
    1. Selecione o intervalo de dados
    2. Inserir → Tabela Dinâmica
    3. Arraste os campos para Linhas, Colunas, Valores
    4. Aplique filtros e formatação
  • Casos de Uso: Resumir vendas por região, analisar tendências, criar relatórios
# Estrutura da Tabela Dinâmica:
Linhas: Categoria do Produto
Colunas: Trimestre
Valores: Soma das Vendas
Filtros: Região

# Campos calculados em Tabelas Dinâmicas
Margem de Lucro = (Receita - Custo) / Receita

# Agrupando datas
Clique com o botão direito na data → Agrupar → Selecione Meses/Trimestres/Anos

Raridade: Muito Comum Dificuldade: Fácil


4. O que é formatação condicional e quando você a usaria?

Resposta: A formatação condicional aplica formatação visual com base nos valores das células.

  • Casos de Uso:
    • Destacar valores superiores/inferiores
    • Mostrar barras de dados ou escalas de cores
    • Identificar duplicatas
    • Sinalizar outliers
    • Criar mapas de calor
# Destacar células maiores que 1000
Selecione o intervalo → Formatação Condicional → Regras de Realce das Células → Maior Que

# Escala de cores (gradiente)
Selecione o intervalo → Formatação Condicional → Escalas de Cores

# Barras de dados
Selecione o intervalo → Formatação Condicional → Barras de Dados

# Fórmula personalizada
=AND($B2>1000, $C2="Ativo")

Raridade: Comum Dificuldade: Fácil


5. Como você remove duplicatas e lida com dados ausentes no Excel?

Resposta: A limpeza de dados é essencial para uma análise precisa.

# Remover duplicatas
Guia Dados → Remover Duplicatas → Selecione as colunas

# Encontrar duplicatas com formatação condicional
Selecione o intervalo → Formatação Condicional → Regras de Realce das Células → Valores Duplicados

# Lidar com dados ausentes
# Opção 1: Filtrar e excluir
Filtrar coluna → Desmarque (Em Branco) → Excluir linhas visíveis

# Opção 2: Preencher com a média
=IF(ISBLANK(A2), AVERAGE(A:A), A2)

# Opção 3: Preencher para baixo
Selecione o intervalo → Ctrl+D (Windows) ou Cmd+D (Mac)

# Encontrar e substituir espaços em branco
Ctrl+H → Localizar: (deixe em branco) → Substituir por: 0 ou N/A

Raridade: Muito Comum Dificuldade: Fácil


Noções Básicas de SQL (5 Perguntas)

6. Escreva uma consulta SQL para selecionar todas as colunas de uma tabela.

Resposta: A instrução SELECT básica recupera dados de tabelas.

-- Selecionar todas as colunas
SELECT * FROM empregados;

-- Selecionar colunas específicas
SELECT primeiro_nome, ultimo_nome, salario
FROM empregados;

-- Selecionar com alias
SELECT 
    primeiro_nome AS "Primeiro Nome",
    ultimo_nome AS "Último Nome",
    salario AS "Salário Anual"
FROM empregados;

-- Selecionar valores distintos
SELECT DISTINCT departamento
FROM empregados;

-- Limitar resultados
SELECT * FROM empregados
LIMIT 10;

Raridade: Muito Comum Dificuldade: Fácil


7. Como você filtra dados usando a cláusula WHERE?

Resposta: A cláusula WHERE filtra linhas com base em condições.

-- Condição simples
SELECT * FROM empregados
WHERE salario > 50000;

-- Múltiplas condições com AND
SELECT * FROM empregados
WHERE departamento = 'Vendas' AND salario > 60000;

-- Múltiplas condições com OR
SELECT * FROM empregados
WHERE departamento = 'Vendas' OR departamento = 'Marketing';

-- Operador IN
SELECT * FROM empregados
WHERE departamento IN ('Vendas', 'Marketing', 'TI');

-- Operador BETWEEN
SELECT * FROM empregados
WHERE salario BETWEEN 50000 AND 80000;

-- Operador LIKE (correspondência de padrão)
SELECT * FROM empregados
WHERE primeiro_nome LIKE 'J%';  -- Começa com J

-- IS NULL
SELECT * FROM empregados
WHERE gerente_id IS NULL;

-- Operador NOT
SELECT * FROM empregados
WHERE departamento NOT IN ('RH', 'Finanças');

Raridade: Muito Comum Dificuldade: Fácil


8. Explique as operações JOIN e seus tipos.

Resposta: JOINs combinam dados de várias tabelas.

  • INNER JOIN: Retorna linhas correspondentes de ambas as tabelas
  • LEFT JOIN: Retorna todas as linhas da tabela da esquerda, correspondentes da direita
  • RIGHT JOIN: Retorna todas as linhas da tabela da direita, correspondentes da esquerda
  • FULL OUTER JOIN: Retorna todas as linhas de ambas as tabelas
-- INNER JOIN
SELECT e.primeiro_nome, e.ultimo_nome, d.nome_departamento
FROM empregados e
INNER JOIN departamentos d ON e.departamento_id = d.departamento_id;

-- LEFT JOIN (todos os empregados, mesmo sem departamento)
SELECT e.primeiro_nome, e.ultimo_nome, d.nome_departamento
FROM empregados e
LEFT JOIN departamentos d ON e.departamento_id = d.departamento_id;

-- Múltiplos joins
SELECT 
    e.primeiro_nome,
    d.nome_departamento,
    l.cidade
FROM empregados e
INNER JOIN departamentos d ON e.departamento_id = d.departamento_id
INNER JOIN localizacoes l ON d.localizacao_id = l.localizacao_id;

-- Self join (empregados e seus gerentes)
SELECT 
    e.primeiro_nome AS empregado,
    m.primeiro_nome AS gerente
FROM empregados e
LEFT JOIN empregados m ON e.gerente_id = m.empregado_id;

Raridade: Muito Comum Dificuldade: Médio


9. Como você usa GROUP BY e funções de agregação?

Resposta: GROUP BY agrupa linhas e funções de agregação resumem dados.

-- Contar empregados por departamento
SELECT departamento, COUNT(*) AS quantidade_empregados
FROM empregados
GROUP BY departamento;

-- Salário médio por departamento
SELECT 
    departamento,
    AVG(salario) AS salario_medio,
    MIN(salario) AS salario_minimo,
    MAX(salario) AS salario_maximo
FROM empregados
GROUP BY departamento;

-- Cláusula HAVING (filtrar grupos)
SELECT departamento, AVG(salario) AS salario_medio
FROM empregados
GROUP BY departamento
HAVING AVG(salario) > 60000;

-- Múltiplas colunas de agrupamento
SELECT 
    departamento,
    titulo_cargo,
    COUNT(*) AS quantidade,
    AVG(salario) AS salario_medio
FROM empregados
GROUP BY departamento, titulo_cargo
ORDER BY departamento, salario_medio DESC;

-- Funções de agregação comuns
-- COUNT, SUM, AVG, MIN, MAX, COUNT(DISTINCT)

Raridade: Muito Comum Dificuldade: Médio


10. Qual é a diferença entre WHERE e HAVING?

Resposta:

  • WHERE: Filtra linhas antes do agrupamento
  • HAVING: Filtra grupos após o agrupamento
  • WHERE: Não pode usar funções de agregação
  • HAVING: Pode usar funções de agregação
-- WHERE - filtrar antes do agrupamento
SELECT departamento, AVG(salario) AS salario_medio
FROM empregados
WHERE salario > 40000  -- Filtrar linhas individuais
GROUP BY departamento;

-- HAVING - filtrar após o agrupamento
SELECT departamento, AVG(salario) AS salario_medio
FROM empregados
GROUP BY departamento
HAVING AVG(salario) > 60000;  -- Filtrar grupos

-- Ambos juntos
SELECT departamento, AVG(salario) AS salario_medio
FROM empregados
WHERE data_contratacao > '2020-01-01'  -- Filtrar linhas primeiro
GROUP BY departamento
HAVING COUNT(*) > 5;  -- Então filtrar grupos

-- Isso estaria ERRADO:
-- SELECT departamento FROM empregados
-- WHERE COUNT(*) > 5;  -- Erro: não pode usar agregação em WHERE

Raridade: Muito Comum Dificuldade: Fácil


Visualização de Dados (4 Perguntas)

11. Quais são os princípios-chave da visualização de dados eficaz?

Resposta: Boas visualizações comunicam insights claramente.

  • Princípios:
    • Escolha o tipo de gráfico certo (barra para comparação, linha para tendências, pizza para partes do todo)
    • Mantenha simples (evite sobrecarga)
    • Use cores apropriadas (consistentes, acessíveis)
    • Rotule claramente (títulos, eixos, legendas)
    • Conte uma história (destaque insights-chave)
    • Considere o público (técnico vs não técnico)
Loading diagram...

Raridade: Comum Dificuldade: Fácil


12. Quando você usaria um gráfico de barras vs um gráfico de linhas?

Resposta: Diferentes tipos de gráficos servem a diferentes propósitos:

  • Gráfico de Barras:
    • Comparar categorias
    • Dados discretos
    • Exemplos: Vendas por região, comparação de produtos
  • Gráfico de Linhas:
    • Mostrar tendências ao longo do tempo
    • Dados contínuos
    • Exemplos: Receita mensal, preços de ações
  • Outros Gráficos:
    • Gráfico de Pizza: Partes de um todo (use com moderação)
    • Gráfico de Dispersão: Relação entre duas variáveis
    • Histograma: Distribuição de dados contínuos

Raridade: Comum Dificuldade: Fácil


13. O que é Tableau e quais são seus principais recursos?

Resposta: Tableau é uma ferramenta líder de visualização de dados e business intelligence.

  • Principais Recursos:
    • Interface de arrastar e soltar (sem necessidade de codificação)
    • Conectar a múltiplas fontes de dados (bancos de dados, Excel, nuvem)
    • Painéis interativos
    • Atualizações de dados em tempo real
    • Campos calculados e parâmetros
    • Compartilhamento e colaboração
  • Tarefas Comuns:
    • Criar planilhas (visualizações individuais)
    • Construir painéis (múltiplas visualizações)
    • Aplicar filtros e parâmetros
    • Criar campos calculados
    • Publicar no Tableau Server/Online

Raridade: Muito Comum Dificuldade: Fácil


14. Qual é a diferença entre Tableau e Power BI?

Resposta: Ambos são ferramentas de BI populares com diferentes pontos fortes:

  • Tableau:
    • Melhor para visualizações complexas
    • Mais intuitivo para iniciantes
    • Capacidades de visualização de dados mais fortes
    • Mais caro
  • Power BI:
    • Melhor integração com a Microsoft
    • Mais acessível
    • Forte para usuários do Excel
    • Melhor para modelagem de dados
    • DAX para cálculos
  • A escolha depende de:
    • Orçamento
    • Stack tecnológico existente
    • Complexidade das visualizações
    • Habilidades da equipe

Raridade: Comum Dificuldade: Fácil


Estatística e Análise (4 Perguntas)

15. Quais medidas de tendência central você conhece?

Resposta: Medidas de tendência central descrevem o centro de um conjunto de dados:

  • Média: Média aritmética (soma / contagem)
    • Sensível a outliers
    • Use para dados normalmente distribuídos
  • Mediana: Valor do meio quando ordenado
    • Robusta a outliers
    • Use para dados assimétricos
  • Moda: Valor mais frequente
    • Use para dados categóricos
import numpy as np

data = [1, 2, 2, 3, 4, 5, 100]

mean = np.mean(data)  # 16.71 (afetado pelo outlier 100)
median = np.median(data)  # 3 (não afetado pelo outlier)
# mode = 2 (mais frequente)

print(f"Média: {mean}")
print(f"Mediana: {median}")

Raridade: Muito Comum Dificuldade: Fácil


16. Como você identifica outliers em um conjunto de dados?

Resposta: Outliers são pontos de dados que diferem significativamente de outras observações.

  • Métodos:
    • Visual: Box plots, gráficos de dispersão
    • Estatístico:
      • Método IQR (1,5 × IQR além de Q1/Q3)
      • Z-score (|z| > 3)
      • Desvio padrão (além de 2-3 desvios padrão)
import numpy as np

data = np.array([10, 12, 13, 12, 11, 14, 13, 15, 100, 12])

# Método IQR
Q1 = np.percentile(data, 25)
Q3 = np.percentile(data, 75)
IQR = Q3 - Q1

lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

outliers = data[(data < lower_bound) | (data > upper_bound)]
print(f"Outliers: {outliers}")  # [100]

# Método Z-score
mean = np.mean(data)
std = np.std(data)
z_scores = np.abs((data - mean) / std)
outliers_z = data[z_scores > 3]
print(f"Outliers (Z-score): {outliers_z}")

Raridade: Comum Dificuldade: Médio


17. Qual é a diferença entre correlação e causalidade?

Resposta:

  • Correlação: Relação estatística entre variáveis
    • Medida pelo coeficiente de correlação (-1 a 1)
    • Não implica causalidade
  • Causalidade: Uma variável causa diretamente mudanças em outra
    • Requer experimentos controlados
    • Correlação é necessária, mas não suficiente

Exemplos:

  • Vendas de sorvete e mortes por afogamento são correlacionadas (ambas aumentam no verão)
  • Mas sorvete não causa afogamento (variável de confusão: temperatura)
-- Calcular correlação em SQL (simplificado)
SELECT 
    CORR(vendas, temperatura) AS correlacao
FROM dados_diarios;

-- Correlação positiva: ambos aumentam juntos
-- Correlação negativa: um aumenta, outro diminui
-- Correlação zero: sem relação

Raridade: Muito Comum Dificuldade: Fácil


18. Como você calcula a variação percentual?

Resposta: A variação percentual mede a mudança relativa entre dois valores.

# Fórmula
Variação Percentual = ((Novo Valor - Valor Antigo) / Valor Antigo) × 100

# Fórmula do Excel
=(B2-A2)/A2*100

# Exemplo:
Valor Antigo: 100
Novo Valor: 120
Variação: (120-100)/100 = 0.20 = 20% de aumento

# Crescimento Ano a Ano
=(Vendas_2023 - Vendas_2022) / Vendas_2022 * 100
-- Variação percentual em SQL
SELECT 
    ano,
    receita,
    LAG(receita) OVER (ORDER BY ano) AS receita_ano_anterior,
    ((receita - LAG(receita) OVER (ORDER BY ano)) / 
     LAG(receita) OVER (ORDER BY ano) * 100) AS pct_variacao
FROM vendas_anuais;

Raridade: Muito Comum Dificuldade: Fácil


Business Intelligence e Relatórios (2 Perguntas)

19. O que é um KPI e como você escolhe os corretos?

Resposta: KPI (Key Performance Indicator) é um valor mensurável que mostra quão eficazmente os objetivos estão sendo alcançados.

  • Características de bons KPIs:
    • Específico: Claro e bem definido
    • Mensurável: Quantificável
    • Atingível: Realista
    • Relevante: Alinhado com os objetivos de negócios
    • Com prazo: Tem um prazo
  • Exemplos:
    • Vendas: Receita mensal, taxa de conversão
    • Marketing: Custo de aquisição de clientes, ROI
    • Operações: Tempo de atendimento do pedido, taxa de erro
    • Cliente: Pontuação de satisfação, taxa de retenção

Raridade: Comum Dificuldade: Fácil


20. Como você apresenta insights de dados para stakeholders não técnicos?

Resposta: A comunicação eficaz é crucial para analistas de dados.

  • Melhores Práticas:
    • Comece com a conclusão (o que eles precisam saber)
    • Use visualizações simples (evite gráficos complexos)
    • Conte uma história (contexto, insight, recomendação)
    • Evite jargões (explique termos técnicos)
    • Concentre-se no impacto nos negócios (receita, custo, eficiência)
    • Forneça recomendações acionáveis
    • Esteja preparado para perguntas
  • Estrutura:
    1. Resumo executivo
    2. Principais descobertas
    3. Dados/visualizações de suporte
    4. Recomendações
    5. Próximos passos

Raridade: Comum Dificuldade: Médio


Newsletter subscription

Dicas de carreira semanais que realmente funcionam

Receba as últimas ideias diretamente na sua caixa de entrada

Decorative doodle

Destaque-se para Recrutadores e Conquiste o Emprego dos Seus Sonhos

Junte-se a milhares que transformaram suas carreiras com currículos impulsionados por IA que passam no ATS e impressionam gerentes de contratação.

Comece a criar agora

Compartilhar esta publicação

Reduza o Tempo de Escrita do Currículo em 90%

O candidato a emprego médio gasta mais de 3 horas formatando um currículo. Nossa IA faz isso em menos de 15 minutos, levando você à fase de candidatura 12 vezes mais rápido.