Preguntas para Entrevistas de Analista de Datos Junior: Guía Completa

Milad Bonakdar
Autor
Domina los fundamentos del análisis de datos con preguntas esenciales para entrevistas que cubren Excel, SQL, visualización de datos, conceptos básicos de estadística y herramientas de inteligencia empresarial para analistas de datos junior.
Introducción
Los analistas de datos transforman los datos brutos en información práctica que impulsa las decisiones empresariales. Se espera que los analistas de datos junior tengan sólidas habilidades en Excel, SQL, herramientas de visualización de datos y estadística básica para respaldar la toma de decisiones basada en datos.
Esta guía cubre las preguntas esenciales de la entrevista para Analistas de Datos Junior. Exploramos las funciones de Excel, las consultas SQL, la visualización de datos con Tableau y Power BI, los fundamentos de la estadística y las mejores prácticas de análisis de datos para ayudarle a prepararse para su primer puesto de analista de datos.
Fundamentos de Excel (5 preguntas)
1. ¿Cuáles son las funciones de Excel más importantes para el análisis de datos?
Respuesta: Funciones esenciales de Excel que todo analista de datos debe conocer:
- VLOOKUP/XLOOKUP (BUSCARV/BUSCARX): Buscar valores en tablas
- IF/IFS (SI/SI.CONJUNTO): Lógica condicional
- SUMIF/SUMIFS (SUMAR.SI/SUMAR.SI.CONJUNTO): Suma condicional
- COUNTIF/COUNTIFS (CONTAR.SI/CONTAR.SI.CONJUNTO): Conteo condicional
- PIVOT TABLES (TABLAS DINÁMICAS): Resumir y analizar datos
- INDEX/MATCH (INDICE/COINCIDIR): Más flexible que BUSCARV
- Funciones de TEXTO: LEFT (IZQUIERDA), RIGHT (DERECHA), MID (EXTRAE), CONCATENATE (CONCATENAR)
- Funciones de FECHA: TODAY (HOY), DATEDIF (SIFECHA), EOMONTH (FIN.MES)
Frecuencia: Muy común Dificultad: Fácil
2. Explique la diferencia entre BUSCARV e INDICE/COINCIDIR.
Respuesta:
- BUSCARV:
- Sintaxis más sencilla
- Sólo busca a la derecha
- Menos flexible
- Más lento para grandes conjuntos de datos
- INDICE/COINCIDIR:
- Sintaxis más compleja
- Puede buscar a la izquierda o a la derecha
- Más flexible
- Mayor rendimiento
- Puede devolver filas/columnas enteras
Frecuencia: Muy común Dificultad: Fácil
3. ¿Cómo se crean y utilizan las Tablas Dinámicas?
Respuesta: Las Tablas Dinámicas resumen grandes conjuntos de datos rápidamente.
- Pasos:
- Seleccionar el rango de datos
- Insertar → Tabla Dinámica
- Arrastrar los campos a Filas, Columnas, Valores
- Aplicar filtros y formato
- Casos de uso: Resumir las ventas por región, analizar las tendencias, crear informes
Frecuencia: Muy común Dificultad: Fácil
4. ¿Qué es el formato condicional y cuándo lo usaría?
Respuesta: El formato condicional aplica formato visual basado en los valores de las celdas.
- Casos de uso:
- Resaltar los valores superiores/inferiores
- Mostrar barras de datos o escalas de color
- Identificar duplicados
- Señalar los valores atípicos
- Crear mapas de calor
Frecuencia: Común Dificultad: Fácil
5. ¿Cómo se eliminan los duplicados y se gestionan los datos que faltan en Excel?
Respuesta: La limpieza de datos es esencial para un análisis preciso.
Frecuencia: Muy común Dificultad: Fácil
Fundamentos de SQL (5 preguntas)
6. Escriba una consulta SQL para seleccionar todas las columnas de una tabla.
Respuesta: La instrucción SELECT básica recupera datos de las tablas.
Frecuencia: Muy común Dificultad: Fácil
7. ¿Cómo se filtran los datos utilizando la cláusula WHERE?
Respuesta: La cláusula WHERE filtra las filas basándose en las condiciones.
Frecuencia: Muy común Dificultad: Fácil
8. Explique las operaciones JOIN y sus tipos.
Respuesta: Los JOIN combinan datos de varias tablas.
- INNER JOIN: Devuelve las filas coincidentes de ambas tablas
- LEFT JOIN: Devuelve todas las filas de la tabla izquierda, las coincidentes de la derecha
- RIGHT JOIN: Devuelve todas las filas de la tabla derecha, las coincidentes de la izquierda
- FULL OUTER JOIN: Devuelve todas las filas de ambas tablas
Frecuencia: Muy común Dificultad: Media
9. ¿Cómo se utilizan las funciones GROUP BY y aggregate?
Respuesta: GROUP BY agrupa las filas y las funciones aggregate resumen los datos.
Frecuencia: Muy común Dificultad: Media
10. ¿Cuál es la diferencia entre WHERE y HAVING?
Respuesta:
- WHERE: Filtra las filas antes de agrupar
- HAVING: Filtra los grupos después de agrupar
- WHERE: No puede utilizar funciones aggregate
- HAVING: Puede utilizar funciones aggregate
Frecuencia: Muy común Dificultad: Fácil
Visualización de datos (4 preguntas)
11. ¿Cuáles son los principios clave de la visualización eficaz de datos?
Respuesta: Las buenas visualizaciones comunican las ideas con claridad.
- Principios:
- Elegir el tipo de gráfico adecuado (barras para la comparación, líneas para las tendencias, tarta para las partes del todo)
- Mantener la sencillez (evitar el desorden)
- Utilizar colores apropiados (coherentes, accesibles)
- Etiquetar claramente (títulos, ejes, leyendas)
- Contar una historia (destacar las ideas clave)
- Considerar el público (técnico frente a no técnico)
Frecuencia: Común Dificultad: Fácil
12. ¿Cuándo usaría un gráfico de barras frente a un gráfico de líneas?
Respuesta: Los diferentes tipos de gráficos tienen diferentes propósitos:
- Gráfico de Barras:
- Comparar categorías
- Datos discretos
- Ejemplos: Ventas por región, comparación de productos
- Gráfico de Líneas:
- Mostrar las tendencias a lo largo del tiempo
- Datos continuos
- Ejemplos: Ingresos mensuales, precios de las acciones
- Otros Gráficos:
- Gráfico Circular: Partes de un todo (utilizar con moderación)
- Gráfico de Dispersión: Relación entre dos variables
- Histograma: Distribución de datos continuos
Frecuencia: Común Dificultad: Fácil
13. ¿Qué es Tableau y cuáles son sus principales características?
Respuesta: Tableau es una herramienta líder de visualización de datos e inteligencia empresarial.
- Características principales:
- Interfaz de arrastrar y soltar (no requiere codificación)
- Conectar a múltiples fuentes de datos (bases de datos, Excel, nube)
- Paneles interactivos
- Actualizaciones de datos en tiempo real
- Campos calculados y parámetros
- Compartir y colaborar
- Tareas comunes:
- Crear hojas de trabajo (visualizaciones individuales)
- Construir paneles (múltiples visualizaciones)
- Aplicar filtros y parámetros
- Crear campos calculados
- Publicar en Tableau Server/Online
Frecuencia: Muy común Dificultad: Fácil
14. ¿Cuál es la diferencia entre Tableau y Power BI?
Respuesta: Ambas son herramientas de BI populares con diferentes puntos fuertes:
- Tableau:
- Mejor para visualizaciones complejas
- Más intuitivo para los principiantes
- Mayores capacidades de visualización de datos
- Más caro
- Power BI:
- Mejor integración con Microsoft
- Más asequible
- Fuerte para los usuarios de Excel
- Mejor para el modelado de datos
- DAX para los cálculos
- La elección depende de:
- Presupuesto
- Pila tecnológica existente
- Complejidad de las visualizaciones
- Habilidades del equipo
Frecuencia: Común Dificultad: Fácil
Estadística y Análisis (4 preguntas)
15. ¿Qué medidas de tendencia central conoce?
Respuesta: Las medidas de tendencia central describen el centro de un conjunto de datos:
- Media: Promedio (suma / conteo)
- Sensible a los valores atípicos
- Utilizar para datos distribuidos normalmente
- Mediana: Valor medio cuando se ordena
- Robusta a los valores atípicos
- Utilizar para datos sesgados
- Moda: Valor más frecuente
- Utilizar para datos categóricos
Frecuencia: Muy común Dificultad: Fácil
16. ¿Cómo se identifican los valores atípicos en un conjunto de datos?
Respuesta: Los valores atípicos son puntos de datos que difieren significativamente de otras observaciones.
- Métodos:
- Visual: Diagramas de caja, diagramas de dispersión
- Estadístico:
- Método IQR (1,5 × IQR más allá de Q1/Q3)
- Puntuación Z (|z| > 3)
- Desviación estándar (más allá de 2-3 desviaciones estándar)
Frecuencia: Común Dificultad: Media
17. ¿Cuál es la diferencia entre correlación y causalidad?
Respuesta:
- Correlación: Relación estadística entre variables
- Medida por el coeficiente de correlación (-1 a 1)
- No implica causalidad
- Causalidad: Una variable causa directamente cambios en otra
- Requiere experimentos controlados
- La correlación es necesaria pero no suficiente
Ejemplos:
- Las ventas de helados y las muertes por ahogamiento están correlacionadas (ambas aumentan en verano)
- Pero el helado no causa el ahogamiento (variable de confusión: temperatura)
Frecuencia: Muy común Dificultad: Fácil
18. ¿Cómo se calcula el cambio porcentual?
Respuesta: El cambio porcentual mide el cambio relativo entre dos valores.
Frecuencia: Muy común Dificultad: Fácil
Inteligencia empresarial e informes (2 preguntas)
19. ¿Qué es un KPI y cómo se eligen los correctos?
Respuesta: KPI (Key Performance Indicator, Indicador Clave de Rendimiento) es un valor medible que muestra la eficacia con la que se están alcanzando los objetivos.
- Características de los buenos KPI:
- Específico: Claro y bien definido
- Medible: Cuantificable
- Alcanzable: Realista
- Relevante: Alineado con los objetivos empresariales
- Con plazos: Tiene un plazo de tiempo
- Ejemplos:
- Ventas: Ingresos mensuales, tasa de conversión
- Marketing: Coste de adquisición de clientes, ROI
- Operaciones: Tiempo de cumplimiento de los pedidos, tasa de error
- Cliente: Puntuación de satisfacción, tasa de retención
Frecuencia: Común Dificultad: Fácil
20. ¿Cómo presenta la información sobre los datos a las partes interesadas no técnicas?
Respuesta: La comunicación eficaz es crucial para los analistas de datos.
- Mejores prácticas:
- Empiece por la conclusión (lo que necesitan saber)
- Utilice visualizaciones sencillas (evite los gráficos complejos)
- Cuente una historia (contexto, información, recomendación)
- Evite la jerga (explique los términos técnicos)
- Céntrese en el impacto empresarial (ingresos, costes, eficiencia)
- Proporcione recomendaciones prácticas
- Esté preparado para las preguntas
- Estructura:
- Resumen ejecutivo
- Conclusiones clave
- Datos/visualizaciones de apoyo
- Recomendaciones
- Próximos pasos
Frecuencia: Común Dificultad: Media



