Almacenes de datos y OLAP Diseño dimensional

134
Dise˜ no dimensional Almacenes de datos y OLAP Dise˜ no dimensional Diego Villalba Universidad de Costa Rica 2012-04-09 Diego Villalba Almacenes de datos y OLAP

Transcript of Almacenes de datos y OLAP Diseño dimensional

Page 1: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional

Almacenes de datos y OLAP

Diseno dimensional

Diego Villalba

Universidad de Costa Rica

2012-04-09

Diego Villalba Almacenes de datos y OLAP

Page 2: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 3: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo,

no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 4: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 5: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 6: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 7: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.

El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 8: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.

La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 9: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.

El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 10: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 11: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 12: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero...

...limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 13: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Page 14: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 15: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 16: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 17: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 18: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...

su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 19: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto

, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 20: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:

hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 21: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 22: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 23: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 24: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 25: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Page 26: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Corporate Information Factory de Inmon

Diego Villalba Almacenes de datos y OLAP

Page 27: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Dimensional Data Warehouse de Kimball

Diego Villalba Almacenes de datos y OLAP

Page 28: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Stand-alone Data Mart

Diego Villalba Almacenes de datos y OLAP

Page 29: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Stand-alone Data Marts Multiples

Diego Villalba Almacenes de datos y OLAP

Page 30: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Comparacion

Diego Villalba Almacenes de datos y OLAP

Page 31: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Estrellas y cubos

1 Caracterısticas de las tablas de dimensiones

2 Caracterısticas de las tablas de hechos

3 Dimensiones lentamente cambiantes

4 Cubos

Diego Villalba Almacenes de datos y OLAP

Page 32: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 33: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 34: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 35: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:

1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 36: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.

2 El desarrollo de un conjunto ricamente detallado decolumnas de dimensiones.

3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 37: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.

3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 38: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Page 39: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

Diego Villalba Almacenes de datos y OLAP

Page 40: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 41: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 42: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 43: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 44: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 45: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 46: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Page 47: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

Diego Villalba Almacenes de datos y OLAP

Page 48: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Page 49: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Page 50: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”

“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Page 51: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Page 52: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Page 53: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Page 54: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Page 55: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Page 56: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Page 57: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Page 58: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Page 59: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Page 60: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Page 61: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Page 62: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Page 63: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Diego Villalba Almacenes de datos y OLAP

Page 64: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Page 65: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Page 66: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Page 67: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Page 68: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle,

lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Page 69: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Page 70: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Page 71: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta:

¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Page 72: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Page 73: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Page 74: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Page 75: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Page 76: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Page 77: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Page 78: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Page 79: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Page 80: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Tabla de dimensiones tipo junk

Diego Villalba Almacenes de datos y OLAP

Page 81: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Snowflakes

¿Por que no poner las marcas de productos en otra tabla?

Diego Villalba Almacenes de datos y OLAP

Page 82: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Page 83: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Page 84: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Page 85: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Page 86: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Page 87: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.

Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 88: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.

En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 89: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 90: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 91: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Capturando hechos

En un diseno dimensional, cada tabla de hechos describeun proceso de negocio.

Debe proveer un conjunto de mediciones comprensibles...

...incluso aunque algunas de ellas sean redundantes.

Diego Villalba Almacenes de datos y OLAP

Page 92: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Capturando hechos

En un diseno dimensional, cada tabla de hechos describeun proceso de negocio.

Debe proveer un conjunto de mediciones comprensibles...

...incluso aunque algunas de ellas sean redundantes.

Diego Villalba Almacenes de datos y OLAP

Page 93: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Capturando hechos

En un diseno dimensional, cada tabla de hechos describeun proceso de negocio.

Debe proveer un conjunto de mediciones comprensibles...

...incluso aunque algunas de ellas sean redundantes.

Diego Villalba Almacenes de datos y OLAP

Page 94: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Capturando hechos

¿Redundancia otra vez? ¿Calcular utilidad durante ETL?

Diego Villalba Almacenes de datos y OLAP

Page 95: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Hechos no aditivos

Diego Villalba Almacenes de datos y OLAP

Page 96: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Hechos no aditivos

Diego Villalba Almacenes de datos y OLAP

Page 97: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Page 98: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Page 99: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.

Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Page 100: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Page 101: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Page 102: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Grano

“Facturas por Dıa, Vendedor, Producto y Cliente”

Diego Villalba Almacenes de datos y OLAP

Page 103: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones degeneradas

Diego Villalba Almacenes de datos y OLAP

Page 104: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Los datos de las tablas de dimensiones se originan en lossistemas operacionales.

Luego de ser insertados en las tablas de dimensiones,podrıan cambiar en la fuente.

En un diseno dimensional, es crucial identificar comorepresentar los cambios en los datos fuente en las tablasde dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 105: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Los datos de las tablas de dimensiones se originan en lossistemas operacionales.

Luego de ser insertados en las tablas de dimensiones,podrıan cambiar en la fuente.

En un diseno dimensional, es crucial identificar comorepresentar los cambios en los datos fuente en las tablasde dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 106: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Los datos de las tablas de dimensiones se originan en lossistemas operacionales.

Luego de ser insertados en las tablas de dimensiones,podrıan cambiar en la fuente.

En un diseno dimensional, es crucial identificar comorepresentar los cambios en los datos fuente en las tablasde dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 107: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Diego Villalba Almacenes de datos y OLAP

Page 108: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:

1 Tipo 1: sobreescribir historia transaccional.2 Tipo 2: conservar historia transaccional.3 Tipo 3: no se requiere historia transaccional pero se

conservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Page 109: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:1 Tipo 1: sobreescribir historia transaccional.

2 Tipo 2: conservar historia transaccional.3 Tipo 3: no se requiere historia transaccional pero se

conservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Page 110: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:1 Tipo 1: sobreescribir historia transaccional.2 Tipo 2: conservar historia transaccional.

3 Tipo 3: no se requiere historia transaccional pero seconservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Page 111: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:1 Tipo 1: sobreescribir historia transaccional.2 Tipo 2: conservar historia transaccional.3 Tipo 3: no se requiere historia transaccional pero se

conservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Page 112: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Sobreescribir el valor.

Hechos preexistentes tienen nuevo contexto.

Historia de la dimension no se conserva.

Diego Villalba Almacenes de datos y OLAP

Page 113: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Sobreescribir el valor.

Hechos preexistentes tienen nuevo contexto.

Historia de la dimension no se conserva.

Diego Villalba Almacenes de datos y OLAP

Page 114: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Sobreescribir el valor.

Hechos preexistentes tienen nuevo contexto.

Historia de la dimension no se conserva.

Diego Villalba Almacenes de datos y OLAP

Page 115: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Diego Villalba Almacenes de datos y OLAP

Page 116: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Diego Villalba Almacenes de datos y OLAP

Page 117: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Metodologıa mas utilizada: insertar una nueva fila.

Contexto historico se conserva.

Historia de la dimension se conserva parcialmente.

Diego Villalba Almacenes de datos y OLAP

Page 118: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Metodologıa mas utilizada: insertar una nueva fila.

Contexto historico se conserva.

Historia de la dimension se conserva parcialmente.

Diego Villalba Almacenes de datos y OLAP

Page 119: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Metodologıa mas utilizada: insertar una nueva fila.

Contexto historico se conserva.

Historia de la dimension se conserva parcialmente.

Diego Villalba Almacenes de datos y OLAP

Page 120: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Diego Villalba Almacenes de datos y OLAP

Page 121: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Diego Villalba Almacenes de datos y OLAP

Page 122: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Parte importante del diseno: identificar reglas para elprocesamiento de cambio lento en dimensiones.

Dada una fuente de cambio, la respuesta correctadepende de los requerimientos analıticos.

Responsabilidad de los desarrolladores de ETL.

Diego Villalba Almacenes de datos y OLAP

Page 123: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Parte importante del diseno: identificar reglas para elprocesamiento de cambio lento en dimensiones.

Dada una fuente de cambio, la respuesta correctadepende de los requerimientos analıticos.

Responsabilidad de los desarrolladores de ETL.

Diego Villalba Almacenes de datos y OLAP

Page 124: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Parte importante del diseno: identificar reglas para elprocesamiento de cambio lento en dimensiones.

Dada una fuente de cambio, la respuesta correctadepende de los requerimientos analıticos.

Responsabilidad de los desarrolladores de ETL.

Diego Villalba Almacenes de datos y OLAP

Page 125: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Documentando las reglasde cambio lento para unatabla de dimensiones.

Diego Villalba Almacenes de datos y OLAP

Page 126: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Resumen de tecnicas para diseno e implementacion dedimensiones lentamente cambiantes

Diego Villalba Almacenes de datos y OLAP

Page 127: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cubos

Los modelos dimensionales no siempre se implementan enbases de datos relacionales.

Las MDB guardan la informacion dimensional en unformato llamado cubo.

El concepto basico detras del cubo es la computacion apriori de varias combinaciones de valores de hechos ydimensiones para que puedan ser estudiadasinteractivamente.

Diego Villalba Almacenes de datos y OLAP

Page 128: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cubos

Los modelos dimensionales no siempre se implementan enbases de datos relacionales.

Las MDB guardan la informacion dimensional en unformato llamado cubo.

El concepto basico detras del cubo es la computacion apriori de varias combinaciones de valores de hechos ydimensiones para que puedan ser estudiadasinteractivamente.

Diego Villalba Almacenes de datos y OLAP

Page 129: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Cubos

Los modelos dimensionales no siempre se implementan enbases de datos relacionales.

Las MDB guardan la informacion dimensional en unformato llamado cubo.

El concepto basico detras del cubo es la computacion apriori de varias combinaciones de valores de hechos ydimensiones para que puedan ser estudiadasinteractivamente.

Diego Villalba Almacenes de datos y OLAP

Page 130: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

La principal ventaja de una MDB es su velocidad.

El cubo permite a los usuarios cambiar su perspectiva delos datos interactivamente, agregando o quitandoatributos en su vista y recibiendo respuesta instantanea.

Este proceso es conocido como OLAP.

Diego Villalba Almacenes de datos y OLAP

Page 131: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

La principal ventaja de una MDB es su velocidad.

El cubo permite a los usuarios cambiar su perspectiva delos datos interactivamente, agregando o quitandoatributos en su vista y recibiendo respuesta instantanea.

Este proceso es conocido como OLAP.

Diego Villalba Almacenes de datos y OLAP

Page 132: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

La principal ventaja de una MDB es su velocidad.

El cubo permite a los usuarios cambiar su perspectiva delos datos interactivamente, agregando o quitandoatributos en su vista y recibiendo respuesta instantanea.

Este proceso es conocido como OLAP.

Diego Villalba Almacenes de datos y OLAP

Page 133: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

Tecnologıas alternativas para el almacenamiento de datosdimensionales

Diego Villalba Almacenes de datos y OLAP

Page 134: Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional Esquema de estrella

Referencias

Adamson, C.Star Schema - The Complete Reference.McGraw-Hill, 2010.

Diego Villalba Almacenes de datos y OLAP