Вопросы на собеседовании Junior Data Analyst: SQL, Excel и BI

Milad Bonakdar
Автор
Практикуйте вопросы для Junior Data Analyst по SQL, Excel, дашбордам, статистике, KPI и понятной презентации выводов.
Вопросы на собеседовании Junior Data Analyst: что подготовить
На собеседовании Junior Data Analyst обычно проверяют, умеете ли вы очищать неидеальные данные, писать базовые SQL-запросы, сводить данные в Excel, строить понятный дашборд и объяснять бизнес-эффект без лишнего усложнения. Подготовьте короткие примеры, где вы нашли проблему, проверили данные, выбрали правильную метрику и объяснили результат.
Этот гид фокусируется на практических вопросах, которые чаще всего встречаются на начальном уровне: поисковые функции и сводные таблицы в Excel, фильтры и JOIN в SQL, дашборды Tableau или Power BI, базовая статистика, KPI и коммуникация со стейкхолдерами. Используйте ответы как основу и добавляйте пример из проекта, учебы или стажировки.
Как использовать этот гид
Перед собеседованием выберите один проект с данными и связывайте ответы с ним. Интервьюеры хотят услышать не только знание функции или запроса, но и когда вы их примените, как проверите результат и как объясните вывод нетехнической команде.
Основы Excel (5 вопросов)
1. Какие наиболее важные функции Excel для анализа данных?
Ответ: Основные функции Excel, которые должен знать каждый аналитик данных:
- VLOOKUP/XLOOKUP: Поиск значений в таблицах
- IF/IFS: Условная логика
- SUMIF/SUMIFS: Условное суммирование
- COUNTIF/COUNTIFS: Условный подсчет
- СВОДНЫЕ ТАБЛИЦЫ: Обобщение и анализ данных
- INDEX/MATCH: Более гибкие, чем VLOOKUP
- Текстовые функции: LEFT, RIGHT, MID, CONCATENATE
- Функции даты: TODAY, DATEDIF, EOMONTH
Распространенность: Очень часто Сложность: Легко
2. Объясните разницу между VLOOKUP и INDEX/MATCH.
Ответ:
- VLOOKUP:
- Более простой синтаксис
- Ищет только вправо
- Менее гибкий
- Медленнее для больших наборов данных
- INDEX/MATCH:
- Более сложный синтаксис
- Может искать влево или вправо
- Более гибкий
- Более высокая производительность
- Может возвращать целые строки/столбцы
Распространенность: Очень часто Сложность: Легко
3. Как создать и использовать сводные таблицы?
Ответ: Сводные таблицы быстро обобщают большие наборы данных.
- Шаги:
- Выберите диапазон данных
- Вставка → Сводная таблица
- Перетащите поля в «Строки», «Столбцы», «Значения»
- Примените фильтры и форматирование
- Сценарии использования: Обобщение продаж по регионам, анализ тенденций, создание отчетов
Распространенность: Очень часто Сложность: Легко
4. Что такое условное форматирование и когда его следует использовать?
Ответ: Условное форматирование применяет визуальное форматирование на основе значений ячеек.
- Сценарии использования:
- Выделить верхние/нижние значения
- Показать гистограммы или цветовые шкалы
- Определить дубликаты
- Отметить выбросы
- Создать тепловые карты
Распространенность: Часто Сложность: Легко
5. Как удалить дубликаты и обработать отсутствующие данные в Excel?
Ответ: Очистка данных необходима для точного анализа.
Распространенность: Очень часто Сложность: Легко
Основы SQL (5 вопросов)
6. Напишите SQL-запрос для выбора всех столбцов из таблицы.
Ответ: Базовая инструкция SELECT извлекает данные из таблиц.
Распространенность: Очень часто Сложность: Легко
7. Как фильтровать данные с помощью предложения WHERE?
Ответ: Предложение WHERE фильтрует строки на основе условий.
Распространенность: Очень часто Сложность: Легко
8. Объясните операции JOIN и их типы.
Ответ: JOIN объединяют данные из нескольких таблиц.
- INNER JOIN: Возвращает совпадающие строки из обеих таблиц
- LEFT JOIN: Возвращает все строки из левой таблицы, совпадающие из правой
- RIGHT JOIN: Возвращает все строки из правой таблицы, совпадающие из левой
- FULL OUTER JOIN: Возвращает все строки из обеих таблиц
Распространенность: Очень часто Сложность: Средний
9. Как использовать GROUP BY и агрегатные функции?
Ответ: GROUP BY группирует строки, а агрегатные функции обобщают данные.
Распространенность: Очень часто Сложность: Средний
10. В чем разница между WHERE и HAVING?
Ответ:
- WHERE: Фильтрует строки перед группировкой
- HAVING: Фильтрует группы после группировки
- WHERE: Нельзя использовать агрегатные функции
- HAVING: Можно использовать агрегатные функции
Распространенность: Очень часто Сложность: Легко
Визуализация данных (4 вопроса)
11. Каковы ключевые принципы эффективной визуализации данных?
Ответ: Хорошие визуализации четко передают аналитические выводы.
- Принципы:
- Выберите правильный тип диаграммы (столбчатая для сравнения, линейная для тенденций, круговая для частей целого)
- Сохраняйте простоту (избегайте беспорядка)
- Используйте подходящие цвета (последовательные, доступные)
- Четко маркируйте (заголовки, оси, легенды)
- Расскажите историю (выделите ключевые идеи)
- Учитывайте аудиторию (техническую и нетехническую)
Распространенность: Часто Сложность: Легко
12. Когда следует использовать столбчатую диаграмму, а когда — линейную?
Ответ: Различные типы диаграмм служат разным целям:
- Столбчатая диаграмма:
- Сравнение категорий
- Дискретные данные
- Примеры: Продажи по регионам, сравнение продуктов
- Линейная диаграмма:
- Показать тенденции во времени
- Непрерывные данные
- Примеры: Ежемесячный доход, цены на акции
- Другие диаграммы:
- Круговая диаграмма: Части целого (используйте экономно)
- Диаграмма рассеяния: Взаимосвязь между двумя переменными
- Гистограмма: Распределение непрерывных данных
Распространенность: Часто Сложность: Легко
13. Что такое Tableau и каковы его основные функции?
Ответ: Tableau — ведущий инструмент визуализации данных и бизнес-аналитики.
- Основные функции:
- Интерфейс перетаскивания (не требуется кодирование)
- Подключение к нескольким источникам данных (базы данных, Excel, облако)
- Интерактивные панели мониторинга
- Обновления данных в реальном времени
- Вычисляемые поля и параметры
- Обмен и сотрудничество
- Типичные задачи:
- Создание рабочих листов (отдельные визуализации)
- Создание панелей мониторинга (несколько визуализаций)
- Применение фильтров и параметров
- Создание вычисляемых полей
- Публикация на Tableau Server/Online
Распространенность: Очень часто Сложность: Легко
14. В чем разница между Tableau и Power BI?
Ответ: Оба инструмента помогают создавать отчеты и дашборды, но на собеседовании важно показать, что вы выбираете инструмент под команду и среду данных.
- Tableau: Силен в гибкой визуальной аналитике, дашбордах, вычисляемых полях, параметрах и интерактивных представлениях. Часто подходит, когда главное — визуально исследовать данные из разных источников.
- Power BI: Силен в экосистеме Microsoft, особенно с Excel, Fabric, Microsoft 365, Power Query, семантическими моделями и DAX. Часто подходит для управляемой отчетности и регулярных бизнес-дашбордов.
- Как отвечать: Не утверждайте, что один инструмент всегда лучше. Сравните аудиторию, текущий стек, сложность модели данных, обновления, права доступа и поддержку.
Хороший ответ junior-кандидата: «Я могу строить базовые дашборды в обоих инструментах. Я выберу Power BI, если компания уже активно использует Microsoft, и Tableau, если команде нужна более гибкая визуальная аналитика. В обоих случаях я начну с бизнес-вопроса, очищу данные, определю метрику и проверю итоговые значения перед публикацией.»
Статистика и анализ (4 вопроса)
15. Какие меры центральной тенденции вы знаете?
Ответ: Меры центральной тенденции описывают центр набора данных:
- Среднее: Среднее значение (сумма / количество)
- Чувствителен к выбросам
- Используйте для нормально распределенных данных
- Медиана: Среднее значение при сортировке
- Устойчив к выбросам
- Используйте для скошенных данных
- Мода: Наиболее часто встречающееся значение
- Используйте для категориальных данных
Распространенность: Очень часто Сложность: Легко
16. Как определить выбросы в наборе данных?
Ответ: Выбросы — это точки данных, которые значительно отличаются от других наблюдений.
- Методы:
- Визуальный: Ящики с усами, диаграммы рассеяния
- Статистический:
- Метод IQR (1,5 × IQR за пределами Q1/Q3)
- Z-оценка (|z| > 3)
- Стандартное отклонение (за пределами 2-3 стандартных отклонений)
Распространенность: Часто Сложность: Средний
17. В чем разница между корреляцией и причинно-следственной связью?
Ответ:
- Корреляция: Статистическая взаимосвязь между переменными
- Измеряется коэффициентом корреляции (от -1 до 1)
- Не подразумевает причинно-следственную связь
- Причинно-следственная связь: Одна переменная напрямую вызывает изменения в другой
- Требуются контролируемые эксперименты
- Корреляция необходима, но недостаточна
Примеры:
- Продажи мороженого и случаи утопления коррелируют (оба увеличиваются летом)
- Но мороженое не вызывает утопление (скрывающаяся переменная: температура)
Распространенность: Очень часто Сложность: Легко
18. Как рассчитать процентное изменение?
Ответ: Процентное изменение измеряет относительное изменение между двумя значениями.
Распространенность: Очень часто Сложность: Легко
Бизнес-аналитика и отчетность (2 вопроса)
19. Что такое KPI и как выбрать правильные?
Ответ: KPI (ключевой показатель эффективности) — это измеримое значение, которое показывает, насколько эффективно достигаются цели.
- Характеристики хороших KPI:
- Конкретный: Четкий и хорошо определенный
- Измеримый: Количественный
- Достижимый: Реалистичный
- Релевантный: Соответствует бизнес-целям
- Ограниченный по времени: Имеет временные рамки
- Примеры:
- Продажи: Ежемесячный доход, коэффициент конверсии
- Маркетинг: Стоимость привлечения клиента, ROI
- Операции: Время выполнения заказа, частота ошибок
- Клиент: Оценка удовлетворенности, коэффициент удержания
Распространенность: Часто Сложность: Легко
20. Как представить аналитические выводы нетехническим заинтересованным сторонам?
Ответ: Эффективная коммуникация имеет решающее значение для аналитиков данных.
- Лучшие практики:
- Начните с вывода (что им нужно знать)
- Используйте простые визуализации (избегайте сложных диаграмм)
- Расскажите историю (контекст, понимание, рекомендация)
- Избегайте жаргона (объясните технические термины)
- Сосредоточьтесь на влиянии на бизнес (доход, затраты, эффективность)
- Предоставьте действенные рекомендации
- Будьте готовы к вопросам
- Структура:
- Краткое изложение для руководства
- Основные результаты
- Подтверждающие данные/визуализации
- Рекомендации
- Следующие шаги
Распространенность: Часто Сложность: Средний


