September 27, 2023

Первая задача: «Клубок из данных»

Клубок данных

После двух недель удаленной работы я перебрался в офис. Работа в офисе куда удобнее и продуктивнее работы в библиотеке. Именно с приходом в офис мне стали поручать более сложные задачи, которые к тому же относились к проектам моего подразделения.

Первая поставленная передо мной задача была в «распутывании» клубка данных из одного отчета. Суть задачи была в следующем:

В BI-системе Qlik было (да и по сей день есть) огромное количество отчетов. Под каждым отчетом лежит огромный пласт бизнес-процессов и логики, которая реализована через отдельные переменные в системе. И в одном из таких отчетов было необходимо определить, откуда и какие данные приходят? Так для первого моего отчета мне повезло работать только с одним доменом, но в последующих – это была солянка.

Отмечу, что на мой взгляд данная задача была бы не актуальна, если бы в процессе разработки и поддержки данного отчета велась техническая и бизнес-логическая документация. Правда для этого нужно было бы выделять время и человека, а как я после выяснил – это что-то на фантастическом.

Помню, что главной сложностью всей задачи по началу было непонимание интерфейса Qlik Sense. Мой наставник скинул мне ознакомительные статьи и курсы по платформе, которые я просмотрел лишь мельком. И признаюсь, что стоило уделить этому больше времени, хотя в дальнейшем это мне совсем не понадобилось.

Погружение в данные проходило с треском. Приходилось перебирать на каждом листе отчета каждую визуализацию. В каждой визуализации была также зашита логика того или иного показателя, который мог проходить до нескольких этапов агрегации на уровне источника и самой платформы. Благо от меня требовалось найти показатель, который передавал источник и не погружаться еще глубже в данные.

Схема показателей, который перетекают из источника в систему агрегации и дальше текут в отчеты пользователей

Мое погружение сопровождалось неоценимой помощью как моего наставника, так и тимлида проекта. Они не только показали мне алгоритм поиска интересующего меня показателя, но и рассказали о самих источниках. Именно благодаря их наставлениям я стал понимать, как связываются между собой компоненты приложения Qlik’а.

Тогда я слабо себе представлял разветвлённые системы сбора данных. Для меня все представлялось как один источник, который собирает в себя информацию, которую транслирует дальше. Но таких источников было огромное количество, хотя они и собирались в логические группы.

Именно эта задача дала мне примерное понимание, чем занимается Аналитик данных, но опять же – это был лишь урезанный его функционал. Задача была закрыта и собранные данные в конечном итоге не пригодились в дальнейшем развитии проекта, так как заказчик выбрал иной вектор развития.

Хоть мои труды и не повлияли глобально на дальнейшую судьбу проекта, это была отличная практика для меня…

ХОЧЕШЬ ЗНАТЬ БОЛЬШЕ?

Qlik

Генерация изображений