Junior Data Analyst Interviewfragen: SQL, Excel & BI

Milad Bonakdar
Autor
Uebe Junior-Data-Analyst-Interviewfragen zu SQL, Excel, Dashboards, Statistik, KPIs und klarer Kommunikation von Erkenntnissen.
Junior Data Analyst Interviewfragen: Worauf du dich vorbereiten solltest
In einem Junior-Data-Analyst-Interview geht es meist darum, ob du unordentliche Daten bereinigen, einfache SQL-Abfragen schreiben, Daten in Excel zusammenfassen, ein klares Dashboard bauen und den geschäftlichen Nutzen verständlich erklären kannst. Bereite kurze Beispiele vor, in denen du ein Problem gefunden, die Daten geprüft, die passende Kennzahl gewählt und das Ergebnis erklärt hast.
Dieser Leitfaden konzentriert sich auf praktische Fragen für Einstiegsrollen: Excel-Lookups und Pivot-Tabellen, SQL-Filter und Joins, Tableau- oder Power-BI-Dashboards, Statistikgrundlagen, KPIs und Kommunikation mit Stakeholdern. Nutze jede Antwort als Grundlage und ergänze ein echtes Projekt-, Kurs- oder Praktikumsbeispiel.
So nutzt du diesen Leitfaden
Wähle vor dem Interview ein Datenprojekt aus und verknüpfe deine Antworten damit. Interviewer möchten nicht nur hören, dass du eine Funktion oder Abfrage kennst, sondern auch wann du sie einsetzt, wie du das Ergebnis prüfst und wie du den Befund einem nichttechnischen Team erklärst.
Excel-Grundlagen (5 Fragen)
1. Was sind die wichtigsten Excel-Funktionen für die Datenanalyse?
Antwort: Wesentliche Excel-Funktionen, die jeder Datenanalyst kennen sollte:
- SVERWEIS/XVERWEIS: Nachschlagen von Werten in Tabellen
- WENN/WENNS: Bedingte Logik
- SUMMEWENN/SUMMEWENNS: Bedingte Summation
- ZÄHLENWENN/ZÄHLENWENNS: Bedingtes Zählen
- PIVOT-TABELLEN: Zusammenfassen und Analysieren von Daten
- INDEX/VERGLEICH: Flexibler als SVERWEIS
- TEXT-Funktionen: LINKS, RECHTS, TEIL, VERKETTEN
- DATUM-Funktionen: HEUTE, DATEDIF, MONATSENDE
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
2. Erklären Sie den Unterschied zwischen SVERWEIS und INDEX/VERGLEICH.
Antwort:
- SVERWEIS:
- Einfachere Syntax
- Sucht nur nach rechts
- Weniger flexibel
- Langsamer bei großen Datensätzen
- INDEX/VERGLEICH:
- Komplexere Syntax
- Kann nach links oder rechts suchen
- Flexibler
- Schnellere Leistung
- Kann ganze Zeilen/Spalten zurückgeben
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
3. Wie erstellen und verwenden Sie Pivot-Tabellen?
Antwort: Pivot-Tabellen fassen große Datensätze schnell zusammen.
- Schritte:
- Datenbereich auswählen
- Einfügen → PivotTable
- Felder in Zeilen, Spalten, Werte ziehen
- Filter und Formatierung anwenden
- Anwendungsfälle: Umsätze nach Region zusammenfassen, Trends analysieren, Berichte erstellen
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
4. Was ist bedingte Formatierung und wann würden Sie sie verwenden?
Antwort: Die bedingte Formatierung wendet visuelle Formatierungen basierend auf Zellwerten an.
- Anwendungsfälle:
- Hervorheben von Top-/Bottom-Werten
- Anzeigen von Datenbalken oder Farbskalen
- Identifizieren von Duplikaten
- Kennzeichnen von Ausreißern
- Erstellen von Heatmaps
Seltenheit: Häufig Schwierigkeitsgrad: Leicht
5. Wie entfernen Sie Duplikate und behandeln fehlende Daten in Excel?
Antwort: Die Datenbereinigung ist für eine genaue Analyse unerlässlich.
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
SQL-Grundlagen (5 Fragen)
6. Schreiben Sie eine SQL-Abfrage, um alle Spalten aus einer Tabelle auszuwählen.
Antwort: Die grundlegende SELECT-Anweisung ruft Daten aus Tabellen ab.
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
7. Wie filtern Sie Daten mit der WHERE-Klausel?
Antwort: Die WHERE-Klausel filtert Zeilen basierend auf Bedingungen.
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
8. Erklären Sie JOIN-Operationen und ihre Typen.
Antwort: JOINs kombinieren Daten aus mehreren Tabellen.
- INNER JOIN: Gibt übereinstimmende Zeilen aus beiden Tabellen zurück
- LEFT JOIN: Gibt alle Zeilen aus der linken Tabelle zurück, übereinstimmende aus der rechten
- RIGHT JOIN: Gibt alle Zeilen aus der rechten Tabelle zurück, übereinstimmende aus der linken
- FULL OUTER JOIN: Gibt alle Zeilen aus beiden Tabellen zurück
Seltenheit: Sehr häufig Schwierigkeitsgrad: Mittel
9. Wie verwenden Sie GROUP BY und Aggregatfunktionen?
Antwort: GROUP BY gruppiert Zeilen und Aggregatfunktionen fassen Daten zusammen.
Seltenheit: Sehr häufig Schwierigkeitsgrad: Mittel
10. Was ist der Unterschied zwischen WHERE und HAVING?
Antwort:
- WHERE: Filtert Zeilen vor der Gruppierung
- HAVING: Filtert Gruppen nach der Gruppierung
- WHERE: Kann keine Aggregatfunktionen verwenden
- HAVING: Kann Aggregatfunktionen verwenden
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
Datenvisualisierung (4 Fragen)
11. Was sind die wichtigsten Prinzipien effektiver Datenvisualisierung?
Antwort: Gute Visualisierungen kommunizieren Erkenntnisse klar.
- Prinzipien:
- Wählen Sie den richtigen Diagrammtyp (Balken für Vergleiche, Linie für Trends, Kreis für Teile des Ganzen)
- Halten Sie es einfach (vermeiden Sie Unordnung)
- Verwenden Sie geeignete Farben (konsistent, zugänglich)
- Beschriften Sie klar (Titel, Achsen, Legenden)
- Erzählen Sie eine Geschichte (heben Sie wichtige Erkenntnisse hervor)
- Berücksichtigen Sie die Zielgruppe (technisch vs. nicht-technisch)
Seltenheit: Häufig Schwierigkeitsgrad: Leicht
12. Wann würden Sie ein Balkendiagramm gegenüber einem Liniendiagramm verwenden?
Antwort: Verschiedene Diagrammtypen dienen unterschiedlichen Zwecken:
- Balkendiagramm:
- Vergleichen von Kategorien
- Diskrete Daten
- Beispiele: Umsätze nach Region, Produktvergleich
- Liniendiagramm:
- Zeigen von Trends im Zeitverlauf
- Kontinuierliche Daten
- Beispiele: Monatliche Einnahmen, Aktienkurse
- Andere Diagramme:
- Kreisdiagramm: Teile eines Ganzen (sparsam verwenden)
- Streudiagramm: Beziehung zwischen zwei Variablen
- Histogramm: Verteilung kontinuierlicher Daten
Seltenheit: Häufig Schwierigkeitsgrad: Leicht
13. Was ist Tableau und was sind seine wichtigsten Funktionen?
Antwort: Tableau ist ein führendes Tool für Datenvisualisierung und Business Intelligence.
- Hauptmerkmale:
- Drag-and-Drop-Oberfläche (keine Programmierung erforderlich)
- Verbindung zu mehreren Datenquellen (Datenbanken, Excel, Cloud)
- Interaktive Dashboards
- Echtzeit-Datenaktualisierungen
- Berechnete Felder und Parameter
- Freigabe und Zusammenarbeit
- Häufige Aufgaben:
- Erstellen von Arbeitsblättern (einzelne Visualisierungen)
- Erstellen von Dashboards (mehrere Visualisierungen)
- Anwenden von Filtern und Parametern
- Erstellen von berechneten Feldern
- Veröffentlichen auf Tableau Server/Online
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
14. Was ist der Unterschied zwischen Tableau und Power BI?
Antwort: Beide Tools helfen beim Erstellen von Reports und Dashboards. Im Interview solltest du zeigen, dass du je nach Team und Datenumgebung auswählst.
- Tableau: Gut für flexible visuelle Analyse, Dashboards, berechnete Felder, Parameter und interaktive Ansichten. Es passt oft, wenn visuelle Exploration über verschiedene Datenquellen im Vordergrund steht.
- Power BI: Stark in Microsoft-Umgebungen, besonders mit Excel, Fabric, Microsoft 365, Power Query, semantischen Modellen und DAX. Es passt oft für standardisierte Reports und wiederkehrende Business-Dashboards.
- Gute Antwort: Sage nicht, dass ein Tool immer besser ist. Vergleiche Zielgruppe, bestehende Tools, Datenmodell, Aktualisierung, Berechtigungen und Wartung.
Eine starke Junior-Antwort: „Ich kann mit beiden Tools einfache Dashboards bauen. Power BI würde ich wählen, wenn das Unternehmen stark mit Microsoft arbeitet; Tableau, wenn flexible visuelle Exploration wichtiger ist. In beiden Fällen starte ich mit der Business-Frage, bereinige die Daten, definiere die Kennzahl und prüfe die Summen vor der Veröffentlichung.“
Statistik & Analyse (4 Fragen)
15. Welche Maße der zentralen Tendenz kennen Sie?
Antwort: Maße der zentralen Tendenz beschreiben das Zentrum eines Datensatzes:
- Mittelwert: Durchschnitt (Summe / Anzahl)
- Empfindlich gegenüber Ausreißern
- Verwenden Sie ihn für normalverteilte Daten
- Median: Mittlerer Wert, wenn sortiert
- Robust gegenüber Ausreißern
- Verwenden Sie ihn für schiefe Daten
- Modus: Häufigster Wert
- Verwenden Sie ihn für kategoriale Daten
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
16. Wie identifizieren Sie Ausreißer in einem Datensatz?
Antwort: Ausreißer sind Datenpunkte, die sich erheblich von anderen Beobachtungen unterscheiden.
- Methoden:
- Visuell: Boxplots, Streudiagramme
- Statistisch:
- IQR-Methode (1,5 × IQR jenseits Q1/Q3)
- Z-Score (|z| > 3)
- Standardabweichung (jenseits von 2-3 Standardabweichungen)
Seltenheit: Häufig Schwierigkeitsgrad: Mittel
17. Was ist der Unterschied zwischen Korrelation und Kausalität?
Antwort:
- Korrelation: Statistische Beziehung zwischen Variablen
- Gemessen durch den Korrelationskoeffizienten (-1 bis 1)
- Impliziert keine Kausalität
- Kausalität: Eine Variable verursacht direkt Veränderungen in einer anderen
- Erfordert kontrollierte Experimente
- Korrelation ist notwendig, aber nicht hinreichend
Beispiele:
- Eisverkäufe und Todesfälle durch Ertrinken korrelieren (beide nehmen im Sommer zu)
- Aber Eis verursacht kein Ertrinken (Störvariable: Temperatur)
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
18. Wie berechnen Sie die prozentuale Veränderung?
Antwort: Die prozentuale Veränderung misst die relative Veränderung zwischen zwei Werten.
Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht
Business Intelligence & Reporting (2 Fragen)
19. Was ist ein KPI und wie wählen Sie die richtigen aus?
Antwort: KPI (Key Performance Indicator) ist ein messbarer Wert, der zeigt, wie effektiv Ziele erreicht werden.
- Merkmale guter KPIs:
- Spezifisch: Klar und genau definiert
- Messbar: Quantifizierbar
- Erreichbar: Realistisch
- Relevant: Auf Geschäftsziele ausgerichtet
- Zeitgebunden: Hat einen Zeitrahmen
- Beispiele:
- Vertrieb: Monatlicher Umsatz, Konversionsrate
- Marketing: Kundenakquisitionskosten, ROI
- Betrieb: Auftragsabwicklungszeit, Fehlerrate
- Kunde: Zufriedenheitswert, Kundenbindungsrate
Seltenheit: Häufig Schwierigkeitsgrad: Leicht
20. Wie präsentieren Sie Datenerkenntnisse für nicht-technische Stakeholder?
Antwort: Effektive Kommunikation ist für Datenanalysten entscheidend.
- Bewährte Verfahren:
- Beginnen Sie mit der Schlussfolgerung (was sie wissen müssen)
- Verwenden Sie einfache Visualisierungen (vermeiden Sie komplexe Diagramme)
- Erzählen Sie eine Geschichte (Kontext, Erkenntnis, Empfehlung)
- Vermeiden Sie Fachjargon (erklären Sie technische Begriffe)
- Konzentrieren Sie sich auf die geschäftlichen Auswirkungen (Umsatz, Kosten, Effizienz)
- Geben Sie umsetzbare Empfehlungen
- Seien Sie auf Fragen vorbereitet
- Struktur:
- Zusammenfassung für Führungskräfte
- Wichtigste Erkenntnisse
- Unterstützende Daten/Visualisierungen
- Empfehlungen
- Nächste Schritte
Seltenheit: Häufig Schwierigkeitsgrad: Mittel


