Подход к ХД и ETL

Простой и вменяемый подход: https://www.sql.ru/forum/1314656/source-etl-dwh-stage-dwh-ods-dwh-analyst-olap-reporting-pbi-excel-kto-dlinnee

1. Source -> Stage

Чтобы максимально быстро и без каких-либо преобразований (ну за редким исключением) забрать дельту данных из источника в буферную зону для дальнейшей расфасовки. Также иногда храним данные в буферной зоне за некоторый период для разбора полетов, для доказательств что именно такие данные мы забарли из источника, если там они вдруг хитрым образом были скорректированы

2. Stage -> DWH (ODS/3NF/др.)

слой хранения сведенных, сопоставленных, обработанных, обогащенных данных; длительное постоянное хранение в едином формате (нужна модель данных) данных в состоянии покоя.

Сюда пользователям и системам доступ не даем.

Кстати, модель данных - инструмент коммуникации бизнесов между собой и с ИТ

3. DWH -> DWH(Analyst)

аналитический слой - денормализованные, агрегированные (не обязательно Group BY), скомпонованные данные - для:

* удобства работы Power Users, adHoc-ов

* как единый согласованный источник для OLAP и всевозможных BI Tools

* для Reporting-отчетов

* предоставления внешним/ другим прикладным системам

Тем более нужна модель данных.

Единый словарь, семантика

Если пользователи или системы будут ходить к 2., то до 80% своего времени будут тратить не на решении аналитических задач, а на работу с данными. И куча других проблем образуется