декабря 21, 2025
12 мин. чтения

Вопросы для собеседования на должность младшего аналитика данных: Полное руководство

interview
career-advice
job-search
entry-level
Вопросы для собеседования на должность младшего аналитика данных: Полное руководство
MB

Milad Bonakdar

Автор

Освойте основы анализа данных с помощью важных вопросов для собеседования, охватывающих Excel, SQL, визуализацию данных, основы статистики и инструменты бизнес-аналитики для начинающих аналитиков данных.


Введение

Аналитики данных преобразуют необработанные данные в действенные аналитические выводы, которые определяют бизнес-решения. Ожидается, что младшие аналитики данных будут обладать сильными навыками работы с Excel, SQL, инструментами визуализации данных и базовой статистикой для поддержки принятия решений на основе данных.

В этом руководстве рассматриваются основные вопросы для собеседования с младшими аналитиками данных. Мы рассмотрим функции Excel, запросы SQL, визуализацию данных с помощью Tableau и Power BI, основы статистики и лучшие практики анализа данных, чтобы помочь вам подготовиться к вашей первой роли аналитика данных.


Основы Excel (5 вопросов)

1. Какие наиболее важные функции Excel для анализа данных?

Ответ: Основные функции Excel, которые должен знать каждый аналитик данных:

  • VLOOKUP/XLOOKUP: Поиск значений в таблицах
  • IF/IFS: Условная логика
  • SUMIF/SUMIFS: Условное суммирование
  • COUNTIF/COUNTIFS: Условный подсчет
  • СВОДНЫЕ ТАБЛИЦЫ: Обобщение и анализ данных
  • INDEX/MATCH: Более гибкие, чем VLOOKUP
  • Текстовые функции: LEFT, RIGHT, MID, CONCATENATE
  • Функции даты: TODAY, DATEDIF, EOMONTH
# Пример VLOOKUP
=ВПР(A2; Products!A:C; 3; ЛОЖЬ)

# Пример SUMIFS (суммирование продаж, где region="Восток" и product="Виджет")
=СУММЕСЛИМН(Sales!C:C; Sales!A:A; "Восток"; Sales!B:B; "Виджет")

# Пример INDEX/MATCH (более гибкий, чем VLOOKUP)
=ИНДЕКС(Prices!C:C; ПОИСКПОЗ(A2; Prices!A:A; 0))

# Условное форматирование с IF
=ЕСЛИ(B2>1000; "Высокий"; ЕСЛИ(B2>500; "Средний"; "Низкий"))

Распространенность: Очень часто Сложность: Легко


2. Объясните разницу между VLOOKUP и INDEX/MATCH.

Ответ:

  • VLOOKUP:
    • Более простой синтаксис
    • Ищет только вправо
    • Менее гибкий
    • Медленнее для больших наборов данных
  • INDEX/MATCH:
    • Более сложный синтаксис
    • Может искать влево или вправо
    • Более гибкий
    • Более высокая производительность
    • Может возвращать целые строки/столбцы
# VLOOKUP - поиск значения в столбце A, возврат из столбца C
=ВПР(A2; A:C; 3; ЛОЖЬ)

# INDEX/MATCH - эквивалент, но более гибкий
=ИНДЕКС(C:C; ПОИСКПОЗ(A2; A:A; 0))

# Преимущество INDEX/MATCH: может искать влево
=ИНДЕКС(A:A; ПОИСКПОЗ(C2; C:C; 0))  # VLOOKUP этого не может

Распространенность: Очень часто Сложность: Легко


3. Как создать и использовать сводные таблицы?

Ответ: Сводные таблицы быстро обобщают большие наборы данных.

  • Шаги:
    1. Выберите диапазон данных
    2. Вставка → Сводная таблица
    3. Перетащите поля в «Строки», «Столбцы», «Значения»
    4. Примените фильтры и форматирование
  • Сценарии использования: Обобщение продаж по регионам, анализ тенденций, создание отчетов
# Структура сводной таблицы:
Строки: Категория продукта
Столбцы: Квартал
Значения: Сумма продаж
Фильтры: Регион

# Вычисляемые поля в сводных таблицах
Рентабельность = (Выручка - Себестоимость) / Выручка

# Группировка дат
Щелкните правой кнопкой мыши дату → Группировать → Выберите месяцы/кварталы/годы

Распространенность: Очень часто Сложность: Легко


4. Что такое условное форматирование и когда его следует использовать?

Ответ: Условное форматирование применяет визуальное форматирование на основе значений ячеек.

  • Сценарии использования:
    • Выделить верхние/нижние значения
    • Показать гистограммы или цветовые шкалы
    • Определить дубликаты
    • Отметить выбросы
    • Создать тепловые карты
# Выделить ячейки больше 1000
Выберите диапазон → Условное форматирование → Правила выделения ячеек → Больше

# Цветовая шкала (градиент)
Выберите диапазон → Условное форматирование → Цветовые шкалы

# Гистограммы
Выберите диапазон → Условное форматирование → Гистограммы

# Пользовательская формула
=И(B2>1000; C2="Активный")

Распространенность: Часто Сложность: Легко


5. Как удалить дубликаты и обработать отсутствующие данные в Excel?

Ответ: Очистка данных необходима для точного анализа.

# Удалить дубликаты
Вкладка «Данные» → «Удалить дубликаты» → Выберите столбцы

# Найти дубликаты с помощью условного форматирования
Выберите диапазон → Условное форматирование → Правила выделения ячеек → Дублирующиеся значения

# Обработка отсутствующих данных
# Вариант 1: Фильтр и удаление
Отфильтруйте столбец → Снимите флажок (Пустые) → Удалите видимые строки

# Вариант 2: Заполнить средним значением
=ЕСЛИ(ЕПУСТО(A2); СРЗНАЧ(A:A); A2)

# Вариант 3: Заполнить вниз
Выберите диапазон → Ctrl+D (Windows) или Cmd+D (Mac)

# Найти и заменить пустые ячейки
Ctrl+H → Найти: (оставьте пустым) → Заменить на: 0 или Н/Д

Распространенность: Очень часто Сложность: Легко


Основы SQL (5 вопросов)

6. Напишите SQL-запрос для выбора всех столбцов из таблицы.

Ответ: Базовая инструкция SELECT извлекает данные из таблиц.

-- Выбрать все столбцы
SELECT * FROM employees;

-- Выбрать определенные столбцы
SELECT first_name, last_name, salary
FROM employees;

-- Выбрать с псевдонимом
SELECT 
    first_name AS "Имя",
    last_name AS "Фамилия",
    salary AS "Годовой оклад"
FROM employees;

-- Выбрать уникальные значения
SELECT DISTINCT department
FROM employees;

-- Ограничить результаты
SELECT * FROM employees
LIMIT 10;

Распространенность: Очень часто Сложность: Легко


7. Как фильтровать данные с помощью предложения WHERE?

Ответ: Предложение WHERE фильтрует строки на основе условий.

-- Простое условие
SELECT * FROM employees
WHERE salary > 50000;

-- Несколько условий с AND
SELECT * FROM employees
WHERE department = 'Sales' AND salary > 60000;

-- Несколько условий с OR
SELECT * FROM employees
WHERE department = 'Sales' OR department = 'Marketing';

-- Оператор IN
SELECT * FROM employees
WHERE department IN ('Sales', 'Marketing', 'IT');

-- Оператор BETWEEN
SELECT * FROM employees
WHERE salary BETWEEN 50000 AND 80000;

-- Оператор LIKE (сопоставление с образцом)
SELECT * FROM employees
WHERE first_name LIKE 'J%';  -- Начинается с J

-- IS NULL
SELECT * FROM employees
WHERE manager_id IS NULL;

-- Оператор NOT
SELECT * FROM employees
WHERE department NOT IN ('HR', 'Finance');

Распространенность: Очень часто Сложность: Легко


8. Объясните операции JOIN и их типы.

Ответ: JOIN объединяют данные из нескольких таблиц.

  • INNER JOIN: Возвращает совпадающие строки из обеих таблиц
  • LEFT JOIN: Возвращает все строки из левой таблицы, совпадающие из правой
  • RIGHT JOIN: Возвращает все строки из правой таблицы, совпадающие из левой
  • FULL OUTER JOIN: Возвращает все строки из обеих таблиц
-- INNER JOIN
SELECT e.first_name, e.last_name, d.department_name
FROM employees e
INNER JOIN departments d ON e.department_id = d.department_id;

-- LEFT JOIN (все сотрудники, даже без отдела)
SELECT e.first_name, e.last_name, d.department_name
FROM employees e
LEFT JOIN departments d ON e.department_id = d.department_id;

-- Несколько соединений
SELECT 
    e.first_name,
    d.department_name,
    l.city
FROM employees e
INNER JOIN departments d ON e.department_id = d.department_id
INNER JOIN locations l ON d.location_id = l.location_id;

-- Self join (сотрудники и их менеджеры)
SELECT 
    e.first_name AS employee,
    m.first_name AS manager
FROM employees e
LEFT JOIN employees m ON e.manager_id = m.employee_id;

Распространенность: Очень часто Сложность: Средний


9. Как использовать GROUP BY и агрегатные функции?

Ответ: GROUP BY группирует строки, а агрегатные функции обобщают данные.

-- Подсчет сотрудников по отделам
SELECT department, COUNT(*) AS employee_count
FROM employees
GROUP BY department;

-- Средняя зарплата по отделам
SELECT 
    department,
    AVG(salary) AS avg_salary,
    MIN(salary) AS min_salary,
    MAX(salary) AS max_salary
FROM employees
GROUP BY department;

-- Предложение HAVING (фильтр групп)
SELECT department, AVG(salary) AS avg_salary
FROM employees
GROUP BY department
HAVING AVG(salary) > 60000;

-- Несколько столбцов группировки
SELECT 
    department,
    job_title,
    COUNT(*) AS count,
    AVG(salary) AS avg_salary
FROM employees
GROUP BY department, job_title
ORDER BY department, avg_salary DESC;

-- Общие агрегатные функции
-- COUNT, SUM, AVG, MIN, MAX, COUNT(DISTINCT)

Распространенность: Очень часто Сложность: Средний


10. В чем разница между WHERE и HAVING?

Ответ:

  • WHERE: Фильтрует строки перед группировкой
  • HAVING: Фильтрует группы после группировки
  • WHERE: Нельзя использовать агрегатные функции
  • HAVING: Можно использовать агрегатные функции
-- WHERE - фильтр перед группировкой
SELECT department, AVG(salary) AS avg_salary
FROM employees
WHERE salary > 40000  -- Фильтр отдельных строк
GROUP BY department;

-- HAVING - фильтр после группировки
SELECT department, AVG(salary) AS avg_salary
FROM employees
GROUP BY department
HAVING AVG(salary) > 60000;  -- Фильтр групп

-- Оба вместе
SELECT department, AVG(salary) AS avg_salary
FROM employees
WHERE hire_date > '2020-01-01'  -- Сначала отфильтруйте строки
GROUP BY department
HAVING COUNT(*) > 5;  -- Затем отфильтруйте группы

-- Это было бы НЕПРАВИЛЬНО:
-- SELECT department FROM employees
-- WHERE COUNT(*) > 5;  -- Ошибка: нельзя использовать агрегат в WHERE

Распространенность: Очень часто Сложность: Легко


Визуализация данных (4 вопроса)

11. Каковы ключевые принципы эффективной визуализации данных?

Ответ: Хорошие визуализации четко передают аналитические выводы.

  • Принципы:
    • Выберите правильный тип диаграммы (столбчатая для сравнения, линейная для тенденций, круговая для частей целого)
    • Сохраняйте простоту (избегайте беспорядка)
    • Используйте подходящие цвета (последовательные, доступные)
    • Четко маркируйте (заголовки, оси, легенды)
    • Расскажите историю (выделите ключевые идеи)
    • Учитывайте аудиторию (техническую и нетехническую)
Loading diagram...

Распространенность: Часто Сложность: Легко


12. Когда следует использовать столбчатую диаграмму, а когда — линейную?

Ответ: Различные типы диаграмм служат разным целям:

  • Столбчатая диаграмма:
    • Сравнение категорий
    • Дискретные данные
    • Примеры: Продажи по регионам, сравнение продуктов
  • Линейная диаграмма:
    • Показать тенденции во времени
    • Непрерывные данные
    • Примеры: Ежемесячный доход, цены на акции
  • Другие диаграммы:
    • Круговая диаграмма: Части целого (используйте экономно)
    • Диаграмма рассеяния: Взаимосвязь между двумя переменными
    • Гистограмма: Распределение непрерывных данных

Распространенность: Часто Сложность: Легко


13. Что такое Tableau и каковы его основные функции?

Ответ: Tableau — ведущий инструмент визуализации данных и бизнес-аналитики.

  • Основные функции:
    • Интерфейс перетаскивания (не требуется кодирование)
    • Подключение к нескольким источникам данных (базы данных, Excel, облако)
    • Интерактивные панели мониторинга
    • Обновления данных в реальном времени
    • Вычисляемые поля и параметры
    • Обмен и сотрудничество
  • Типичные задачи:
    • Создание рабочих листов (отдельные визуализации)
    • Создание панелей мониторинга (несколько визуализаций)
    • Применение фильтров и параметров
    • Создание вычисляемых полей
    • Публикация на Tableau Server/Online

Распространенность: Очень часто Сложность: Легко


14. В чем разница между Tableau и Power BI?

Ответ: Оба являются популярными инструментами BI с разными сильными сторонами:

  • Tableau:
    • Лучше для сложных визуализаций
    • Более интуитивно понятен для начинающих
    • Более сильные возможности визуализации данных
    • Дороже
  • Power BI:
    • Лучшая интеграция с Microsoft
    • Более доступный
    • Силен для пользователей Excel
    • Лучше для моделирования данных
    • DAX для вычислений
  • Выбор зависит от:
    • Бюджет
    • Существующий технологический стек
    • Сложность визуализаций
    • Навыки команды

Распространенность: Часто Сложность: Легко


Статистика и анализ (4 вопроса)

15. Какие меры центральной тенденции вы знаете?

Ответ: Меры центральной тенденции описывают центр набора данных:

  • Среднее: Среднее значение (сумма / количество)
    • Чувствителен к выбросам
    • Используйте для нормально распределенных данных
  • Медиана: Среднее значение при сортировке
    • Устойчив к выбросам
    • Используйте для скошенных данных
  • Мода: Наиболее часто встречающееся значение
    • Используйте для категориальных данных
import numpy as np

data = [1, 2, 2, 3, 4, 5, 100]

mean = np.mean(data)  # 16.71 (зависит от выброса 100)
median = np.median(data)  # 3 (не зависит от выброса)
# mode = 2 (наиболее часто встречающееся)

print(f"Среднее: {mean}")
print(f"Медиана: {median}")

Распространенность: Очень часто Сложность: Легко


16. Как определить выбросы в наборе данных?

Ответ: Выбросы — это точки данных, которые значительно отличаются от других наблюдений.

  • Методы:
    • Визуальный: Ящики с усами, диаграммы рассеяния
    • Статистический:
      • Метод IQR (1,5 × IQR за пределами Q1/Q3)
      • Z-оценка (|z| > 3)
      • Стандартное отклонение (за пределами 2-3 стандартных отклонений)
import numpy as np

data = np.array([10, 12, 13, 12, 11, 14, 13, 15, 100, 12])

# Метод IQR
Q1 = np.percentile(data, 25)
Q3 = np.percentile(data, 75)
IQR = Q3 - Q1

lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

outliers = data[(data < lower_bound) | (data > upper_bound)]
print(f"Выбросы: {outliers}")  # [100]

# Метод Z-оценки
mean = np.mean(data)
std = np.std(data)
z_scores = np.abs((data - mean) / std)
outliers_z = data[z_scores > 3]
print(f"Выбросы (Z-оценка): {outliers_z}")

Распространенность: Часто Сложность: Средний


17. В чем разница между корреляцией и причинно-следственной связью?

Ответ:

  • Корреляция: Статистическая взаимосвязь между переменными
    • Измеряется коэффициентом корреляции (от -1 до 1)
    • Не подразумевает причинно-следственную связь
  • Причинно-следственная связь: Одна переменная напрямую вызывает изменения в другой
    • Требуются контролируемые эксперименты
    • Корреляция необходима, но недостаточна

Примеры:

  • Продажи мороженого и случаи утопления коррелируют (оба увеличиваются летом)
  • Но мороженое не вызывает утопление (скрывающаяся переменная: температура)
-- Вычислить корреляцию в SQL (упрощенно)
SELECT 
    CORR(sales, temperature) AS correlation
FROM daily_data;

-- Положительная корреляция: оба увеличиваются вместе
-- Отрицательная корреляция: один увеличивается, другой уменьшается
-- Нулевая корреляция: нет взаимосвязи

Распространенность: Очень часто Сложность: Легко


18. Как рассчитать процентное изменение?

Ответ: Процентное изменение измеряет относительное изменение между двумя значениями.

# Формула
Процентное изменение = ((Новое значение - Старое значение) / Старое значение) × 100

# Формула Excel
=(B2-A2)/A2*100

# Пример:
Старое значение: 100
Новое значение: 120
Изменение: (120-100)/100 = 0,20 = увеличение на 20%

# Рост год к году
=(Sales_2023 - Sales_2022) / Sales_2022 * 100
-- Процентное изменение SQL
SELECT 
    year,
    revenue,
    LAG(revenue) OVER (ORDER BY year) AS prev_year_revenue,
    ((revenue - LAG(revenue) OVER (ORDER BY year)) / 
     LAG(revenue) OVER (ORDER BY year) * 100) AS pct_change
FROM annual_sales;

Распространенность: Очень часто Сложность: Легко


Бизнес-аналитика и отчетность (2 вопроса)

19. Что такое KPI и как выбрать правильные?

Ответ: KPI (ключевой показатель эффективности) — это измеримое значение, которое показывает, насколько эффективно достигаются цели.

  • Характеристики хороших KPI:
    • Конкретный: Четкий и хорошо определенный
    • Измеримый: Количественный
    • Достижимый: Реалистичный
    • Релевантный: Соответствует бизнес-целям
    • Ограниченный по времени: Имеет временные рамки
  • Примеры:
    • Продажи: Ежемесячный доход, коэффициент конверсии
    • Маркетинг: Стоимость привлечения клиента, ROI
    • Операции: Время выполнения заказа, частота ошибок
    • Клиент: Оценка удовлетворенности, коэффициент удержания

Распространенность: Часто Сложность: Легко


20. Как представить аналитические выводы нетехническим заинтересованным сторонам?

Ответ: Эффективная коммуникация имеет решающее значение для аналитиков данных.

  • Лучшие практики:
    • Начните с вывода (что им нужно знать)
    • Используйте простые визуализации (избегайте сложных диаграмм)
    • Расскажите историю (контекст, понимание, рекомендация)
    • Избегайте жаргона (объясните технические термины)
    • Сосредоточьтесь на влиянии на бизнес (доход, затраты, эффективность)
    • Предоставьте действенные рекомендации
    • Будьте готовы к вопросам
  • Структура:
    1. Краткое изложение для руководства
    2. Основные результаты
    3. Подтверждающие данные/визуализации
    4. Рекомендации
    5. Следующие шаги

Распространенность: Часто Сложность: Средний


Newsletter subscription

Еженедельные советы по карьере, которые действительно работают

Получайте последние идеи прямо на вашу почту

Похожие посты

Decorative doodle

Ваше следующее собеседование — всего одно резюме

Создайте профессиональное оптимизированное резюме за несколько минут. Не нужны навыки дизайна—только проверенные результаты.

Создать моё резюме

Поделиться этим постом

Сократите Время Написания Резюме на 90%

Средний соискатель тратит более 3 часов на форматирование резюме. Наш ИИ делает это менее чем за 15 минут, ускоряя переход к этапу подачи заявки в 12 раз.