BI-платформы
В качестве датасета я выбрал фильмы
В платформах я буду строить дашборды, проверяющие 3 гипотезы:
- Чем лучше фильм - тем больше сборы в Америке
- Чем лучше фильм - тем меньше сборы в России
- В преддверьях новогодних праздников наивысшие сборы
Yandex DataLens
Загрузка данных
Заходим на сайт и регистрируемся. Процесс регистрации описывать не буду.
В боковом меню мы видим различные вкладки, нас будут интересоваться графики (Столбцы), подключения (Молния), датасеты (Кругляшки) и дашборды (Квадрат).
Первое, что нам нужно сделать - это создать датасет. Но просто так создать датасет нельзя - нет,нет! Сначала нам нужно создать подключение: подключение данных. Тыкаем на подключения.
У нас открывается боковое меню, в нём мы тыкаем на "Создать новое подключение и у нас открывается выбор данных, которые можно подключить.
В дальнейшем, когда я буду говорить "Создаём А", я не буду прикреплять картинки как создать. Каждый раз, когда вы хотите что-то создать, вы выбираете это в левом меню, потом нажимаете "Создать А".
И так, у нас тут есть различные БД, которые можно подключить - нас интересует файлы. Там соответственно выбираем и прикрепляем наш файл. После этого в подключениях мы его увидим.
В дальнейшем, всё что мы будем создавать, также будет появляться в соответствующих вкладках.
Думаете, что мы теперь можем создать датасет - НЕТ!
Сначала, нам нужно создать воркбук, это самая верхняя вкладка. Создаётся он практически аналогично, тому, что и подключение.
Теперь мы можем создать датасет, но у нас появиться дополнительное окно, когда мы нажмём "Создать Б", то у нас будет такое окно, с выбором воркбука, где нужно выбрать только что созданный воркбук и нажать кнопку создать.
Дальше нам нужно слева сверху найти кнопку "Источники"
У нас появиться выбор "Подключения" нажимаем добавить и выбираем сделанное, до этого подключение.
УРА! Мы наконец-то сделали датасет!
Создание графика
Создаём график, тут он называется "чарт". (При создании выбираем тип Wizard)
Интерфейс очень напоминает Табло.
Сначала выбираем датасет в окне слева. Дальше всё делаем также как в табло, только тут возможностей меньше и никакие нормальные графики нельзя сделать.
Результат
Я построил дашбард, в котором отобразил чарты, которые подтверждают гипотезы.
Glarus-BI
Платформа с более интуитивно понятным интерфейсом, чем у Yandex DataLens, но возможность настолько ограничены, что даже один из графиков не получился.
Добавление данных
Для добавления данных нужно нажать кнопку "Загрузить файл excel" в меню слева. К сожалению, никакие другие форматы данных не поддерживаются.
Дальше там по инструкции добвляем данные нашей таблицы.
Создание графика
Сначала нам нужно будет создать коллекцию, в бесплатной версии доступна и сразу предлагается создать "Ваша личная коллекция". Выбрав её, сверху справа нам нужно найти кнопку "+ Новый". Через эту кнопку тут всё создаётся. Тут графики назваются "Запрос", именно его и нужно создать.
Дальше нам предлагают выбрать данные. У меня после добавление данные лежат в "Исходные данные -> ClickHouse_Test -> films/Worksheet". Выбираем их. Теперь нам наконец-то открылся доступ, по созданию графиков. Оси данных у нас тут под тайтлом "Суммировать". Слева - Ось ОУ, справа - ось ОХ. Из плюсов, тут достаточно удобно выбирать агрегацию.
После того, как выбирем колонки - нажимаем "Визуализация".
Дальшей нам автоматически подбирается тип визуализации и создаётся график.
Если нам не нравиться получившийся тип графика, то можно выбать другой. Для этого нужно внизу справа, рядом с кнопкой нажать на шестерёнку - это настройка графика. Там выбираем вкладку "Данные", в них на Оси ординат, нажимаем на троеточие, там выбираем вкладку "Стиль" и тут можно выбрать другой график.
Результат
К сожалению, эта платформа не поддерживает графики сложнее самый простых, поэтому третий график не получилось сделать.
Tableu Public
Мы изучали работу с ним весь месяц, поэтому описывать как создавать графики не буду. Только покажу результат.
Всё очень просто и удобно, но веб версия очень медленно работает.
Итоги
- Подключение данных - возможность подключения определенного типа данных (файлов/бд/прочее)
- Разнообразие диаграмм - возможность выполнения определенного вида диаграмм
- Вычисляемые поля - сложность/возможность подключения своих скриптов/другое
- Фильтры - применение в рамках визуализации/на уровне данных/на дашборде
- Параметры - возможность создания своих параметров
- Сортировка - применение сортировки к одной визуализации
- Экшены (кросс-фильтрация на дашборде)
- Выгрузка дашборда/визуализаций в формате html-фрейма
Tableu
- Можно подключить практические любые данные
- Куча разных диаграмм, а главное их комбинаций
- Да
- Да
- Да
- Да
- Да
- Не совсем удобно реализовано
Yandex DataLens
- Можно подключить практически любые данные, достаточно удобно, а главное работает даже с базами данных.
- Достаточное количество диаграмм, но их комабанции очень скудны.
- Остальное всё как в табло.
- Выгрузка очень удобная, например можно в колаб выгрузить html ссылкой и весь дашборд будет там и интерактивный.