May 14, 2025

Разработка инструкции и проведение анализа BI-платформ

Для выполнения задания я воспользовался данными с информацией о культурных мероприятиях.

Гипотезы для анализа

Гипотеза 1: Какие типы мероприятий наиболее популярны?

  • Визуализация: круговая диаграмма или столбчатая диаграмма.
  • Цель: определить долю каждого типа мероприятий (например, концерты, спектакли, выставки) в общем количестве.

Гипотеза 2: Как распределяются цены на мероприятия по категориям?

  • Визуализация: ящик с усами (boxplot) или гистограмма.
  • Цель: проанализировать разброс цен для каждого типа мероприятий.

Гипотеза 3: Какие места проведения чаще всего используются для мероприятий?

  • Визуализация: столбчатая диаграмма.
  • Цель: определить самые популярные места проведения мероприятий.

Инструкция по созданию дашбордов

Looker Studio

Подключение данных :

    • Импортируйте CSV-файл или загрузите данные через Google Sheets.

Выбираете файл с данными, дождитесь его загрузки и добавьте в свой отчет

Создание визуализаций :

  • Для гипотезы 1: создайте круговую диаграмму и используйте поле вид для разделения.

Популярность типов мероприятий

  • На основе подсчета количества мероприятий по каждому типу:
    • КОНЦЕРТЫ : 46,1% мероприятий (наиболее популярный тип).
    • СПЕКТАКЛИ : 36,9% мероприятий.
    • ВЫСТАВКИ : 12,1% мероприятий.
    • ДРУГОЕ : 4,9% мероприятий.
  • Вывод : Концерты являются наиболее популярным типом мероприятий, что может быть связано с их универсальностью и широкой аудиторией.

Yandex DataLens

Инструкция по созданию дашборда

  1. Подключение данных : Загрузите CSV-файл через интерфейс DataLens.

Распределение цен на мероприятия

  • Цены на мероприятия варьируются от 300 рублей до 4800 рублей .
  • Для каждого типа мероприятий стоимость составила:
    • КОНЦЕРТЫ : 300 - 4800 рублей. Средняя цена: 2550 рублей.
    • СПЕКТАКЛИ : 400 - 2600 рублей. Средняя цена: 1500 рублей.
    • ВЫСТАВКИ : 500 - 1200 рублей. Средняя цена: 850 рублей.
  • Вывод : Выставки — наиболее доступный тип мероприятий, тогда как концерты имеют более высокий ценовой диапазон.

Эти данные были получены не из линейной диаграммы сверху, а добавлением к диаграмме цветов по полю вид

Tableau

Подключение данных

  1. Откройте Tableau и подключитесь к файлу pushkin.csv.
Популярные места проведения
  1. Перетащите поле место в секцию "Rows".
  2. Добавьте COUNT(название) в секцию "Columns".
  3. Выберите тип диаграммы: Bar.
  4. Добавьте заголовок: "Популярные места проведения".

Популярные места проведения

  • Наиболее популярные места:
    • Иркутская областная филармония : 35 мероприятия.
    • Иркутский музыкальный театр им. Н. М. Загурского : 31 мероприятие.
    • Органный зал Иркутской областной филармонии : 23 мероприятия.
  • Вывод : Иркутская областная филармония и Иркутский музыкальный театр им. Н. М. Загурского — ключевые площадки.

Сравнение платформ

  1. Подключение данных : Все три платформы поддерживают загрузку CSV-файлов, но Tableau предлагает более широкие возможности для работы с базами данных.
  2. Разнообразие диаграмм : Tableau лидирует благодаря большому количеству типов визуализаций.
  3. Вычисляемые поля : Tableau позволяет создавать сложные вычисления с использованием формул и скриптов.
  4. Фильтры и параметры : Все платформы предоставляют гибкие настройки фильтров.
  5. Экшены и выгрузка : Yandex DataLens и Looker Studio поддерживают кросс-фильтрацию и экспорт в HTML, что делает их предпочтительными для презентаций.

Заключение

  • Yandex DataLens : Лучший выбор для быстрого старта и удобной визуализации. Подходит для новичков.
  • Looker Studio : Удобен для интеграции с Google-экосистемой и создания интерактивных дашбордов.
  • Tableau : Самый мощный инструмент для продвинутых пользователей, которые нуждаются в сложных вычислениях и кастомизации.

Ответ: Tableau​ — рекомендуемый инструмент для глубокого анализа данных.