Dezember 21, 2025
12 Min. Lesezeit

Junior Data Analyst: Interviewfragen – Der komplette Leitfaden

interview
career-advice
job-search
entry-level
Junior Data Analyst: Interviewfragen – Der komplette Leitfaden
MB

Milad Bonakdar

Autor

Meistern Sie die Grundlagen der Datenanalyse mit wichtigen Interviewfragen zu Excel, SQL, Datenvisualisierung, Statistikgrundlagen und Business-Intelligence-Tools für Junior Data Analysten.


Einführung

Datenanalysten wandeln Rohdaten in umsetzbare Erkenntnisse um, die Geschäftsentscheidungen vorantreiben. Von Junior-Datenanalysten wird erwartet, dass sie über fundierte Kenntnisse in Excel, SQL, Datenvisualisierungstools und grundlegenden Statistiken verfügen, um datengestützte Entscheidungsfindung zu unterstützen.

Dieser Leitfaden behandelt wichtige Interviewfragen für Junior-Datenanalysten. Wir untersuchen Excel-Funktionen, SQL-Abfragen, Datenvisualisierung mit Tableau und Power BI, Grundlagen der Statistik und Best Practices der Datenanalyse, um Ihnen bei der Vorbereitung auf Ihre erste Rolle als Datenanalyst zu helfen.


Excel-Grundlagen (5 Fragen)

1. Was sind die wichtigsten Excel-Funktionen für die Datenanalyse?

Antwort: Wesentliche Excel-Funktionen, die jeder Datenanalyst kennen sollte:

  • SVERWEIS/XVERWEIS: Nachschlagen von Werten in Tabellen
  • WENN/WENNS: Bedingte Logik
  • SUMMEWENN/SUMMEWENNS: Bedingte Summation
  • ZÄHLENWENN/ZÄHLENWENNS: Bedingtes Zählen
  • PIVOT-TABELLEN: Zusammenfassen und Analysieren von Daten
  • INDEX/VERGLEICH: Flexibler als SVERWEIS
  • TEXT-Funktionen: LINKS, RECHTS, TEIL, VERKETTEN
  • DATUM-Funktionen: HEUTE, DATEDIF, MONATSENDE
# SVERWEIS-Beispiel
=SVERWEIS(A2; Produkte!A:C; 3; FALSCH)

# SUMMEWENNS-Beispiel (Summe der Umsätze, wenn Region="Ost" und Produkt="Widget")
=SUMMEWENNS(Umsätze!C:C; Umsätze!A:A; "Ost"; Umsätze!B:B; "Widget")

# INDEX/VERGLEICH-Beispiel (flexibler als SVERWEIS)
=INDEX(Preise!C:C; VERGLEICH(A2; Preise!A:A; 0))

# Bedingte Formatierung mit WENN
=WENN(B2>1000; "Hoch"; WENN(B2>500; "Mittel"; "Niedrig"))

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


2. Erklären Sie den Unterschied zwischen SVERWEIS und INDEX/VERGLEICH.

Antwort:

  • SVERWEIS:
    • Einfachere Syntax
    • Sucht nur nach rechts
    • Weniger flexibel
    • Langsamer bei großen Datensätzen
  • INDEX/VERGLEICH:
    • Komplexere Syntax
    • Kann nach links oder rechts suchen
    • Flexibler
    • Schnellere Leistung
    • Kann ganze Zeilen/Spalten zurückgeben
# SVERWEIS - Wert in Spalte A suchen, Wert aus Spalte C zurückgeben
=SVERWEIS(A2; A:C; 3; FALSCH)

# INDEX/VERGLEICH - äquivalent, aber flexibler
=INDEX(C:C; VERGLEICH(A2; A:A; 0))

# INDEX/VERGLEICH Vorteil: kann nach links suchen
=INDEX(A:A; VERGLEICH(C2; C:C; 0))  # SVERWEIS kann das nicht

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


3. Wie erstellen und verwenden Sie Pivot-Tabellen?

Antwort: Pivot-Tabellen fassen große Datensätze schnell zusammen.

  • Schritte:
    1. Datenbereich auswählen
    2. Einfügen → PivotTable
    3. Felder in Zeilen, Spalten, Werte ziehen
    4. Filter und Formatierung anwenden
  • Anwendungsfälle: Umsätze nach Region zusammenfassen, Trends analysieren, Berichte erstellen
# PivotTable-Struktur:
Zeilen: Produktkategorie
Spalten: Quartal
Werte: Summe der Umsätze
Filter: Region

# Berechnete Felder in Pivot-Tabellen
Gewinnmarge = (Umsatz - Kosten) / Umsatz

# Datumsangaben gruppieren
Rechtsklick auf Datum → Gruppieren → Monate/Quartale/Jahre auswählen

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


4. Was ist bedingte Formatierung und wann würden Sie sie verwenden?

Antwort: Die bedingte Formatierung wendet visuelle Formatierungen basierend auf Zellwerten an.

  • Anwendungsfälle:
    • Hervorheben von Top-/Bottom-Werten
    • Anzeigen von Datenbalken oder Farbskalen
    • Identifizieren von Duplikaten
    • Kennzeichnen von Ausreißern
    • Erstellen von Heatmaps
# Zellen hervorheben, die größer als 1000 sind
Bereich auswählen → Bedingte Formatierung → Regeln zum Hervorheben von Zellen → Größer als

# Farbskala (Gradient)
Bereich auswählen → Bedingte Formatierung → Farbskalen

# Datenbalken
Bereich auswählen → Bedingte Formatierung → Datenbalken

# Benutzerdefinierte Formel
=UND($B2>1000; $C2="Aktiv")

Seltenheit: Häufig Schwierigkeitsgrad: Leicht


5. Wie entfernen Sie Duplikate und behandeln fehlende Daten in Excel?

Antwort: Die Datenbereinigung ist für eine genaue Analyse unerlässlich.

# Duplikate entfernen
Daten-Registerkarte → Duplikate entfernen → Spalten auswählen

# Duplikate mit bedingter Formatierung finden
Bereich auswählen → Bedingte Formatierung → Regeln zum Hervorheben von Zellen → Doppelte Werte

# Fehlende Daten behandeln
# Option 1: Filtern und löschen
Spalte filtern → (Leere) deaktivieren → Sichtbare Zeilen löschen

# Option 2: Mit Durchschnittswert füllen
=WENN(ISTLEER(A2); MITTELWERT(A:A); A2)

# Option 3: Nach unten ausfüllen
Bereich auswählen → Strg+D (Windows) oder Cmd+D (Mac)

# Leere Felder suchen und ersetzen
Strg+H → Suchen nach: (leer lassen) → Ersetzen durch: 0 oder N/A

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


SQL-Grundlagen (5 Fragen)

6. Schreiben Sie eine SQL-Abfrage, um alle Spalten aus einer Tabelle auszuwählen.

Antwort: Die grundlegende SELECT-Anweisung ruft Daten aus Tabellen ab.

-- Alle Spalten auswählen
SELECT * FROM Mitarbeiter;

-- Spezifische Spalten auswählen
SELECT Vorname, Nachname, Gehalt
FROM Mitarbeiter;

-- Auswählen mit Alias
SELECT 
    Vorname AS "Vorname",
    Nachname AS "Nachname",
    Gehalt AS "Jahresgehalt"
FROM Mitarbeiter;

-- Eindeutige Werte auswählen
SELECT DISTINCT Abteilung
FROM Mitarbeiter;

-- Ergebnisse begrenzen
SELECT * FROM Mitarbeiter
LIMIT 10;

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


7. Wie filtern Sie Daten mit der WHERE-Klausel?

Antwort: Die WHERE-Klausel filtert Zeilen basierend auf Bedingungen.

-- Einfache Bedingung
SELECT * FROM Mitarbeiter
WHERE Gehalt > 50000;

-- Mehrere Bedingungen mit AND
SELECT * FROM Mitarbeiter
WHERE Abteilung = 'Vertrieb' AND Gehalt > 60000;

-- Mehrere Bedingungen mit OR
SELECT * FROM Mitarbeiter
WHERE Abteilung = 'Vertrieb' OR Abteilung = 'Marketing';

-- IN-Operator
SELECT * FROM Mitarbeiter
WHERE Abteilung IN ('Vertrieb', 'Marketing', 'IT');

-- BETWEEN-Operator
SELECT * FROM Mitarbeiter
WHERE Gehalt BETWEEN 50000 AND 80000;

-- LIKE-Operator (Mustervergleich)
SELECT * FROM Mitarbeiter
WHERE Vorname LIKE 'J%';  -- Beginnt mit J

-- IS NULL
SELECT * FROM Mitarbeiter
WHERE Vorgesetzter_ID IS NULL;

-- NOT-Operator
SELECT * FROM Mitarbeiter
WHERE Abteilung NOT IN ('Personal', 'Finanzen');

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


8. Erklären Sie JOIN-Operationen und ihre Typen.

Antwort: JOINs kombinieren Daten aus mehreren Tabellen.

  • INNER JOIN: Gibt übereinstimmende Zeilen aus beiden Tabellen zurück
  • LEFT JOIN: Gibt alle Zeilen aus der linken Tabelle zurück, übereinstimmende aus der rechten
  • RIGHT JOIN: Gibt alle Zeilen aus der rechten Tabelle zurück, übereinstimmende aus der linken
  • FULL OUTER JOIN: Gibt alle Zeilen aus beiden Tabellen zurück
-- INNER JOIN
SELECT e.Vorname, e.Nachname, d.Abteilungsname
FROM Mitarbeiter e
INNER JOIN Abteilungen d ON e.Abteilungs_ID = d.Abteilungs_ID;

-- LEFT JOIN (alle Mitarbeiter, auch ohne Abteilung)
SELECT e.Vorname, e.Nachname, d.Abteilungsname
FROM Mitarbeiter e
LEFT JOIN Abteilungen d ON e.Abteilungs_ID = d.Abteilungs_ID;

-- Mehrere Joins
SELECT 
    e.Vorname,
    d.Abteilungsname,
    l.Stadt
FROM Mitarbeiter e
INNER JOIN Abteilungen d ON e.Abteilungs_ID = d.Abteilungs_ID
INNER JOIN Standorte l ON d.Standort_ID = l.Standort_ID;

-- Self-Join (Mitarbeiter und ihre Vorgesetzten)
SELECT 
    e.Vorname AS Mitarbeiter,
    m.Vorname AS Vorgesetzter
FROM Mitarbeiter e
LEFT JOIN Mitarbeiter m ON e.Vorgesetzter_ID = m.Mitarbeiter_ID;

Seltenheit: Sehr häufig Schwierigkeitsgrad: Mittel


9. Wie verwenden Sie GROUP BY und Aggregatfunktionen?

Antwort: GROUP BY gruppiert Zeilen und Aggregatfunktionen fassen Daten zusammen.

-- Anzahl der Mitarbeiter nach Abteilung
SELECT Abteilung, COUNT(*) AS Mitarbeiteranzahl
FROM Mitarbeiter
GROUP BY Abteilung;

-- Durchschnittliches Gehalt nach Abteilung
SELECT 
    Abteilung,
    AVG(Gehalt) AS Durchschnittsgehalt,
    MIN(Gehalt) AS Mindestgehalt,
    MAX(Gehalt) AS Maximalgehalt
FROM Mitarbeiter
GROUP BY Abteilung;

-- HAVING-Klausel (Gruppen filtern)
SELECT Abteilung, AVG(Gehalt) AS Durchschnittsgehalt
FROM Mitarbeiter
GROUP BY Abteilung
HAVING AVG(Gehalt) > 60000;

-- Mehrere Gruppierungsspalten
SELECT 
    Abteilung,
    Berufsbezeichnung,
    COUNT(*) AS Anzahl,
    AVG(Gehalt) AS Durchschnittsgehalt
FROM Mitarbeiter
GROUP BY Abteilung, Berufsbezeichnung
ORDER BY Abteilung, Durchschnittsgehalt DESC;

-- Häufige Aggregatfunktionen
-- COUNT, SUM, AVG, MIN, MAX, COUNT(DISTINCT)

Seltenheit: Sehr häufig Schwierigkeitsgrad: Mittel


10. Was ist der Unterschied zwischen WHERE und HAVING?

Antwort:

  • WHERE: Filtert Zeilen vor der Gruppierung
  • HAVING: Filtert Gruppen nach der Gruppierung
  • WHERE: Kann keine Aggregatfunktionen verwenden
  • HAVING: Kann Aggregatfunktionen verwenden
-- WHERE - Filtern vor der Gruppierung
SELECT Abteilung, AVG(Gehalt) AS Durchschnittsgehalt
FROM Mitarbeiter
WHERE Gehalt > 40000  -- Einzelne Zeilen filtern
GROUP BY Abteilung;

-- HAVING - Filtern nach der Gruppierung
SELECT Abteilung, AVG(Gehalt) AS Durchschnittsgehalt
FROM Mitarbeiter
GROUP BY Abteilung
HAVING AVG(Gehalt) > 60000;  -- Gruppen filtern

-- Beides zusammen
SELECT Abteilung, AVG(Gehalt) AS Durchschnittsgehalt
FROM Mitarbeiter
WHERE Einstellungsdatum > '2020-01-01'  -- Zuerst Zeilen filtern
GROUP BY Abteilung
HAVING COUNT(*) > 5;  -- Dann Gruppen filtern

-- Das wäre FALSCH:
-- SELECT Abteilung FROM Mitarbeiter
-- WHERE COUNT(*) > 5;  -- Fehler: kann Aggregatfunktion nicht in WHERE verwenden

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


Datenvisualisierung (4 Fragen)

11. Was sind die wichtigsten Prinzipien effektiver Datenvisualisierung?

Antwort: Gute Visualisierungen kommunizieren Erkenntnisse klar.

  • Prinzipien:
    • Wählen Sie den richtigen Diagrammtyp (Balken für Vergleiche, Linie für Trends, Kreis für Teile des Ganzen)
    • Halten Sie es einfach (vermeiden Sie Unordnung)
    • Verwenden Sie geeignete Farben (konsistent, zugänglich)
    • Beschriften Sie klar (Titel, Achsen, Legenden)
    • Erzählen Sie eine Geschichte (heben Sie wichtige Erkenntnisse hervor)
    • Berücksichtigen Sie die Zielgruppe (technisch vs. nicht-technisch)
Loading diagram...

Seltenheit: Häufig Schwierigkeitsgrad: Leicht


12. Wann würden Sie ein Balkendiagramm gegenüber einem Liniendiagramm verwenden?

Antwort: Verschiedene Diagrammtypen dienen unterschiedlichen Zwecken:

  • Balkendiagramm:
    • Vergleichen von Kategorien
    • Diskrete Daten
    • Beispiele: Umsätze nach Region, Produktvergleich
  • Liniendiagramm:
    • Zeigen von Trends im Zeitverlauf
    • Kontinuierliche Daten
    • Beispiele: Monatliche Einnahmen, Aktienkurse
  • Andere Diagramme:
    • Kreisdiagramm: Teile eines Ganzen (sparsam verwenden)
    • Streudiagramm: Beziehung zwischen zwei Variablen
    • Histogramm: Verteilung kontinuierlicher Daten

Seltenheit: Häufig Schwierigkeitsgrad: Leicht


13. Was ist Tableau und was sind seine wichtigsten Funktionen?

Antwort: Tableau ist ein führendes Tool für Datenvisualisierung und Business Intelligence.

  • Hauptmerkmale:
    • Drag-and-Drop-Oberfläche (keine Programmierung erforderlich)
    • Verbindung zu mehreren Datenquellen (Datenbanken, Excel, Cloud)
    • Interaktive Dashboards
    • Echtzeit-Datenaktualisierungen
    • Berechnete Felder und Parameter
    • Freigabe und Zusammenarbeit
  • Häufige Aufgaben:
    • Erstellen von Arbeitsblättern (einzelne Visualisierungen)
    • Erstellen von Dashboards (mehrere Visualisierungen)
    • Anwenden von Filtern und Parametern
    • Erstellen von berechneten Feldern
    • Veröffentlichen auf Tableau Server/Online

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


14. Was ist der Unterschied zwischen Tableau und Power BI?

Antwort: Beide sind beliebte BI-Tools mit unterschiedlichen Stärken:

  • Tableau:
    • Besser für komplexe Visualisierungen
    • Intuitiver für Anfänger
    • Stärkere Datenvisualisierungsfunktionen
    • Teurer
  • Power BI:
    • Bessere Microsoft-Integration
    • Erschwinglicher
    • Stark für Excel-Benutzer
    • Besser für Datenmodellierung
    • DAX für Berechnungen
  • Die Wahl hängt ab von:
    • Budget
    • Vorhandenem Technologie-Stack
    • Komplexität der Visualisierungen
    • Team-Fähigkeiten

Seltenheit: Häufig Schwierigkeitsgrad: Leicht


Statistik & Analyse (4 Fragen)

15. Welche Maße der zentralen Tendenz kennen Sie?

Antwort: Maße der zentralen Tendenz beschreiben das Zentrum eines Datensatzes:

  • Mittelwert: Durchschnitt (Summe / Anzahl)
    • Empfindlich gegenüber Ausreißern
    • Verwenden Sie ihn für normalverteilte Daten
  • Median: Mittlerer Wert, wenn sortiert
    • Robust gegenüber Ausreißern
    • Verwenden Sie ihn für schiefe Daten
  • Modus: Häufigster Wert
    • Verwenden Sie ihn für kategoriale Daten
import numpy as np

data = [1, 2, 2, 3, 4, 5, 100]

mean = np.mean(data)  # 16.71 (beeinflusst von Ausreißer 100)
median = np.median(data)  # 3 (nicht von Ausreißer beeinflusst)
# mode = 2 (häufigster)

print(f"Mittelwert: {mean}")
print(f"Median: {median}")

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


16. Wie identifizieren Sie Ausreißer in einem Datensatz?

Antwort: Ausreißer sind Datenpunkte, die sich erheblich von anderen Beobachtungen unterscheiden.

  • Methoden:
    • Visuell: Boxplots, Streudiagramme
    • Statistisch:
      • IQR-Methode (1,5 × IQR jenseits Q1/Q3)
      • Z-Score (|z| > 3)
      • Standardabweichung (jenseits von 2-3 Standardabweichungen)
import numpy as np

data = np.array([10, 12, 13, 12, 11, 14, 13, 15, 100, 12])

# IQR-Methode
Q1 = np.percentile(data, 25)
Q3 = np.percentile(data, 75)
IQR = Q3 - Q1

lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

outliers = data[(data < lower_bound) | (data > upper_bound)]
print(f"Ausreißer: {outliers}")  # [100]

# Z-Score-Methode
mean = np.mean(data)
std = np.std(data)
z_scores = np.abs((data - mean) / std)
outliers_z = data[z_scores > 3]
print(f"Ausreißer (Z-Score): {outliers_z}")

Seltenheit: Häufig Schwierigkeitsgrad: Mittel


17. Was ist der Unterschied zwischen Korrelation und Kausalität?

Antwort:

  • Korrelation: Statistische Beziehung zwischen Variablen
    • Gemessen durch den Korrelationskoeffizienten (-1 bis 1)
    • Impliziert keine Kausalität
  • Kausalität: Eine Variable verursacht direkt Veränderungen in einer anderen
    • Erfordert kontrollierte Experimente
    • Korrelation ist notwendig, aber nicht hinreichend

Beispiele:

  • Eisverkäufe und Todesfälle durch Ertrinken korrelieren (beide nehmen im Sommer zu)
  • Aber Eis verursacht kein Ertrinken (Störvariable: Temperatur)
-- Korrelation in SQL berechnen (vereinfacht)
SELECT 
    CORR(Umsatz, Temperatur) AS Korrelation
FROM Tagesdaten;

-- Positive Korrelation: Beide nehmen zusammen zu
-- Negative Korrelation: Einer nimmt zu, der andere ab
-- Null Korrelation: Keine Beziehung

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


18. Wie berechnen Sie die prozentuale Veränderung?

Antwort: Die prozentuale Veränderung misst die relative Veränderung zwischen zwei Werten.

# Formel
Prozentuale Veränderung = ((Neuer Wert - Alter Wert) / Alter Wert) × 100

# Excel-Formel
=(B2-A2)/A2*100

# Beispiel:
Alter Wert: 100
Neuer Wert: 120
Veränderung: (120-100)/100 = 0.20 = 20% Anstieg

# Wachstum im Jahresvergleich
=(Umsatz_2023 - Umsatz_2022) / Umsatz_2022 * 100
-- SQL prozentuale Veränderung
SELECT 
    Jahr,
    Umsatz,
    LAG(Umsatz) OVER (ORDER BY Jahr) AS Vorjahresumsatz,
    ((Umsatz - LAG(Umsatz) OVER (ORDER BY Jahr)) / 
     LAG(Umsatz) OVER (ORDER BY Jahr) * 100) AS Prozentuale_Veränderung
FROM Jahresumsätze;

Seltenheit: Sehr häufig Schwierigkeitsgrad: Leicht


Business Intelligence & Reporting (2 Fragen)

19. Was ist ein KPI und wie wählen Sie die richtigen aus?

Antwort: KPI (Key Performance Indicator) ist ein messbarer Wert, der zeigt, wie effektiv Ziele erreicht werden.

  • Merkmale guter KPIs:
    • Spezifisch: Klar und genau definiert
    • Messbar: Quantifizierbar
    • Erreichbar: Realistisch
    • Relevant: Auf Geschäftsziele ausgerichtet
    • Zeitgebunden: Hat einen Zeitrahmen
  • Beispiele:
    • Vertrieb: Monatlicher Umsatz, Konversionsrate
    • Marketing: Kundenakquisitionskosten, ROI
    • Betrieb: Auftragsabwicklungszeit, Fehlerrate
    • Kunde: Zufriedenheitswert, Kundenbindungsrate

Seltenheit: Häufig Schwierigkeitsgrad: Leicht


20. Wie präsentieren Sie Datenerkenntnisse für nicht-technische Stakeholder?

Antwort: Effektive Kommunikation ist für Datenanalysten entscheidend.

  • Bewährte Verfahren:
    • Beginnen Sie mit der Schlussfolgerung (was sie wissen müssen)
    • Verwenden Sie einfache Visualisierungen (vermeiden Sie komplexe Diagramme)
    • Erzählen Sie eine Geschichte (Kontext, Erkenntnis, Empfehlung)
    • Vermeiden Sie Fachjargon (erklären Sie technische Begriffe)
    • Konzentrieren Sie sich auf die geschäftlichen Auswirkungen (Umsatz, Kosten, Effizienz)
    • Geben Sie umsetzbare Empfehlungen
    • Seien Sie auf Fragen vorbereitet
  • Struktur:
    1. Zusammenfassung für Führungskräfte
    2. Wichtigste Erkenntnisse
    3. Unterstützende Daten/Visualisierungen
    4. Empfehlungen
    5. Nächste Schritte

Seltenheit: Häufig Schwierigkeitsgrad: Mittel


Newsletter subscription

Wöchentliche Karrieretipps, die wirklich funktionieren

Erhalten Sie die neuesten Einblicke direkt in Ihr Postfach

Decorative doodle

Hören Sie auf, sich zu bewerben. Beginnen Sie, eingestellt zu werden.

Verwandeln Sie Ihren Lebenslauf in einen Vorstellungsgespräch-Magneten mit KI-gestützter Optimierung, der von Arbeitssuchenden weltweit vertraut wird.

Kostenlos starten

Diesen Beitrag teilen

Werden Sie 50% Schneller Eingestellt

Arbeitssuchende mit professionellen, KI-optimierten Lebensläufen finden in durchschnittlich 5 Wochen eine Stelle, verglichen mit den üblichen 10. Hören Sie auf zu warten und beginnen Sie mit Vorstellungsgesprächen.