Подход к ХД и ETL
Простой и вменяемый подход: https://www.sql.ru/forum/1314656/source-etl-dwh-stage-dwh-ods-dwh-analyst-olap-reporting-pbi-excel-kto-dlinnee
1. Source -> Stage
Чтобы максимально быстро и без каких-либо преобразований (ну за редким исключением) забрать дельту данных из источника в буферную зону для дальнейшей расфасовки. Также иногда храним данные в буферной зоне за некоторый период для разбора полетов, для доказательств что именно такие данные мы забарли из источника, если там они вдруг хитрым образом были скорректированы
2. Stage -> DWH (ODS/3NF/др.)
слой хранения сведенных, сопоставленных, обработанных, обогащенных данных; длительное постоянное хранение в едином формате (нужна модель данных) данных в состоянии покоя.
Сюда пользователям и системам доступ не даем.
Кстати, модель данных - инструмент коммуникации бизнесов между собой и с ИТ
3. DWH -> DWH(Analyst)
аналитический слой - денормализованные, агрегированные (не обязательно Group BY), скомпонованные данные - для:
* удобства работы Power Users, adHoc-ов
* как единый согласованный источник для OLAP и всевозможных BI Tools
* для Reporting-отчетов
* предоставления внешним/ другим прикладным системам
Тем более нужна модель данных.
Единый словарь, семантика
Если пользователи или системы будут ходить к 2., то до 80% своего времени будут тратить не на решении аналитических задач, а на работу с данными. И куча других проблем образуется