Introducción
Una vez que tenemos los datos cargados en PostgreSQL (Bronze) y transformados parcialmente (Silver), el siguiente paso es diseñar nuestro modelo de datos analítico, típicamente con un Modelo de Estrella (Star Schema).
- Este modelo facilita consultas rápidas y análisis eficientes en un Data Warehouse.
- Se compone de:
- Tablas de hechos (Fact tables): contienen las métricas o eventos que queremos analizar (ventas, transacciones, pedidos).
- Tablas de dimensiones (Dimension tables): contienen atributos descriptivos relacionados con las métricas (clientes, productos, tiempo, ubicación).
Exploración de tablas
- Usar DBeaver para inspeccionar las tablas
- Identificar las tablas candidatas para hechos y dimensiones:
Diseño del Modelo de Estrella
- El modelo qué se busca obtener es el siguiente.
Para conseguir el modelo final de estrella con dimensiones y una tabla de hechos, es recomendable construir primero modelos intermedios:
- Cada tabla tendrá su propio modelo Silver.
- Estos modelos incluyen joins, pequeñas transformaciones, filtros, agrupaciones y renombres de columnas.
- La capa SILVER actúa como un paso intermedio entre los datos crudos (Bronze) y los modelos finales de hechos y dimensiones (Gold).
Persistencia y tipos de modelos
- Por defecto, todos los modelos de la capa SILVER se crearán como vistas, ya que no necesitan almacenamiento físico persistente y esto facilita la actualización automática.
- Excepción: la dimensión track_full será una tabla persistida, dado que contiene un volumen mayor de datos y se consultará con frecuencia, mejorando el rendimiento.
Francisco Rodriguez Alfaro