D A T A M A N A G E M E N T

Cargando...

Introducción

Una vez que tenemos los datos cargados en PostgreSQL (Bronze) y transformados parcialmente (Silver), el siguiente paso es diseñar nuestro modelo de datos analítico, típicamente con un Modelo de Estrella (Star Schema).

  • Este modelo facilita consultas rápidas y análisis eficientes en un Data Warehouse.
  • Se compone de:
    • Tablas de hechos (Fact tables): contienen las métricas o eventos que queremos analizar (ventas, transacciones, pedidos).
    • Tablas de dimensiones (Dimension tables): contienen atributos descriptivos relacionados con las métricas (clientes, productos, tiempo, ubicación).

Exploración de tablas

  • Usar DBeaver para inspeccionar las tablas
  • Identificar las tablas candidatas para hechos y dimensiones:
    • Hechos
    • Dimensiones

Diseño del Modelo de Estrella

  • El modelo qué se busca obtener es el siguiente. 

Para conseguir el modelo final de estrella con dimensiones y una tabla de hechos, es recomendable construir primero modelos intermedios:

  • Cada tabla tendrá su propio modelo Silver.
  • Estos modelos incluyen joins, pequeñas transformaciones, filtros, agrupaciones y renombres de columnas.
  • La capa SILVER actúa como un paso intermedio entre los datos crudos (Bronze) y los modelos finales de hechos y dimensiones (Gold).

Persistencia y tipos de modelos

  • Por defecto, todos los modelos de la capa SILVER se crearán como vistas, ya que no necesitan almacenamiento físico persistente y esto facilita la actualización automática.
  • Excepción: la dimensión track_full será una tabla persistida, dado que contiene un volumen mayor de datos y se consultará con frecuencia, mejorando el rendimiento.

Leave a Comment

Virgen del pilar nº4, ático H

03330 Crevillente (Alicante)