Almacenes de datos y OLAP Diseño dimensional

Post on 15-Oct-2021

4 views 0 download

Transcript of Almacenes de datos y OLAP Diseño dimensional

Diseno dimensional

Almacenes de datos y OLAP

Diseno dimensional

Diego Villalba

Universidad de Costa Rica

2012-04-09

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo,

no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.

El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.

La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.

El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero...

...limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Tratamos resaltar una serie de mejores practicas.

Sin embargo, no existe una unica forma correcta demodelar un proceso de negocio particular.

Entre otros aspectos, debemos considerar:

El valor para el negocio.El esfuerzo requerido para construir reportes.La complejidad del proceso de carga.El costo.

Por ejemplo:

El aplanamiento de una jerarquıa recursiva simplifica laconstrucion de reportes y reduce el costo de desarrollo,pero......limita el poder de la solucion final.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...

su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto

, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:

hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Disenamos bases de datos analıticas.

Modelamos la medicion de los procesos de negocios.

El modelo dimensional de un proceso de negocio estahecho de dos componentes:

Las mediciones y...su contexto, conocidos como:hechos y dimensiones.

Implementado en una base de datos relacional, al modelodimensional se le llama:

esquema de estrella.

Implementado en una base de datos multidimensional, selo conoce como:

cubo.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Corporate Information Factory de Inmon

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Dimensional Data Warehouse de Kimball

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Stand-alone Data Mart

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Stand-alone Data Marts Multiples

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Recapitulacion

Arquitecturas - Comparacion

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Estrellas y cubos

1 Caracterısticas de las tablas de dimensiones

2 Caracterısticas de las tablas de hechos

3 Dimensiones lentamente cambiantes

4 Cubos

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:

1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.

2 El desarrollo de un conjunto ricamente detallado decolumnas de dimensiones.

3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.

3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de dimensiones

Un conjunto de tablas de dimensiones bien desarrolladoprovee capacidades analıticas variadas y poderosas.

Las dimensiones proveen informacion contextual.

Sin ellas, los reportes no tendrıan sentido.

Un diseno dimensional exitoso depende de:1 El uso apropiado de las llaves.2 El desarrollo de un conjunto ricamente detallado de

columnas de dimensiones.3 El rechazo a la necesidad de ahorrar espacio.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

En un esquema de estrella, a cada tabla de dimension sele asigna una llave sustituta (Surrogate Key - SK)

Aparte de las SKs, una o mas llaves naturales (NK)aparecen en la mayorıa de las tablas de dimensiones.

Las NKs podrıan tener significado para el usuario.

¿Podrıan las NKs necesitar mas de una columna?

¿Que ocurre cuando las NKs provienen de fuentesdiferentes?

¿Que ocurre si en la tabla de dimension Cliente utilizamoscomo PK el ID Cliente de la tabla fuente y el clientecambia de direccion?

¿Que podrıamos utilizar como alternativa a una SK?¿Numeros de version? ¿Marcas de tiempo?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Llaves sustitutas y llaves naturales

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”

“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones proveen contexto a los hechos.

Sin contexto, los hechos no pueden ser interpretados.

Por ejemplo:

“Total facturado: $10,000”“Total facturado en diciembre de 2011 por concepto deartıculos en la categorıa Monitores: $10,000”

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Las dimensiones y sus valores agregan significado de variasformas:

Se utilizan para filtrar consultas o reportes.

Se utilizan para controlar el ambito de agregacion para loshechos.

Se utilizan para ordenar la informacion.

Acompanan a los hechos para proveer contexto en losreportes.

Se utilizan para definir organizacion maestro-detalle,agrupamientos, subtotales y resumenes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Cuanto mayor es el conjunto de atributos de dimensiones,hay mas formas en que los hechos pueden ser analizados.

Cada atributo que agregamos aumenta dramaticamente elnumero de posibilidades analıticas.

Tablas de dimensiones con un gran numero de atributosmaximizan el valor analıtico.

Ademas de atributos comunes, las tablas de dimensionesguardan combinaciones de atributos usados comunmente.

Codigos pueden ser reemplazados por sus descripciones,al igual que banderas booleanas.

Campos multiparte se conservan y ademas, sedescomponen.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Rico conjunto de dimensiones

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle,

lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones con valores numericos

La mayorıa de las dimensiones contienen valores textuales.

Los hechos tienden a ser numericos.

El precio de un artıculo vendido, ¿es un hecho o unadimension?

No siempre esta claro si un elemento numerico es unhecho o una dimension. En caso de duda, ponga atenciona como sera utilizado.

Si los valores del elemento son usados para filtrarconsultas, ordenar datos, controlar agregacion o crearrelaciones maestro-detalle, lo mas probable es que es unadimension.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta:

¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones de comportamiento

Una tecnica analıtica poderosa utiliza patrones decomportamiento para analizar hechos.

Considere esta pregunta: ¿Reciben los clientes quegeneran mas de un millon de dolares en ventas mejoresdescuentos que los que generan cien mil o menos?

Las ordenes de compras o facturas son rastreadas por unhecho. Para responder a esta pregunta, debemos agruparlos clientes basados en su actividad de compra pasada.

Estos agrupamientos son entonces usados como unadimension y luego utilizados para estudiar descuentos.

Una dimension que se calcula basandose en hechos seconoce como dimension de comportamiento.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Agrupando dimensiones

Los atributos de dimensiones se agrupan en tablas querepresentan categorıas grandes de informacion dereferencia.

Cuando principios de normalizacion son aplicados a unatabla de dimension, el resultado se conoce como“snowflake”.

Atributos miscelaneos que no comparten una afinidadnatural, se agrupan en dimensiones de tipo “junk”.

A diferencia del diseno en 3NF, el diseno dimensionalacepta y alienta el almacenaje redundante de datos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Tabla de dimensiones tipo junk

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Snowflakes

¿Por que no poner las marcas de productos en otra tabla?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Beneficios de la redundancia

Tres principales beneficios:

1 Rendimiento.

2 Usabilidad.

3 Consistencia.

El almacenaje explıcito de cada atributo de dimensionmaximiza el rendimiento, ayuda en la usabilidad y garantizaconsistencia a traves de diferentes aplicaciones. Las reglas denormalizacion se adaptan mejor a las necesidades de sistemasoperacionales que a las de los sistemas analıticos.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.

Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.

En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Caracterısticas de las tablas de hechos

Mientras que las tablas de dimensiones son anchas, las tablasde hechos son profundas.Usualmente, acumulan filas mucho mas rapidamente que lastablas de dimensiones asociadas.En algunos casos, las tablas de hechos pueden tambiencontener dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Capturando hechos

En un diseno dimensional, cada tabla de hechos describeun proceso de negocio.

Debe proveer un conjunto de mediciones comprensibles...

...incluso aunque algunas de ellas sean redundantes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Capturando hechos

En un diseno dimensional, cada tabla de hechos describeun proceso de negocio.

Debe proveer un conjunto de mediciones comprensibles...

...incluso aunque algunas de ellas sean redundantes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Capturando hechos

En un diseno dimensional, cada tabla de hechos describeun proceso de negocio.

Debe proveer un conjunto de mediciones comprensibles...

...incluso aunque algunas de ellas sean redundantes.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Capturando hechos

¿Redundancia otra vez? ¿Calcular utilidad durante ETL?

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Hechos no aditivos

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Hechos no aditivos

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.

Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Grano

Nivel de detalle representado por una fila de la tabla dehechos.

Declarar el grano es parte importante en el proceso dediseno:

Asegura que no habra confusion sobre el significado decada fila de la tabla de hechos.Garantiza que todos los hechos seran registrados almismo nivel de detalle.

En el ejemplo anterior, puede ser descrito como:“Facturas por Dıa, Vendedor, Producto y Cliente”.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Grano

“Facturas por Dıa, Vendedor, Producto y Cliente”

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones degeneradas

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Los datos de las tablas de dimensiones se originan en lossistemas operacionales.

Luego de ser insertados en las tablas de dimensiones,podrıan cambiar en la fuente.

En un diseno dimensional, es crucial identificar comorepresentar los cambios en los datos fuente en las tablasde dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Los datos de las tablas de dimensiones se originan en lossistemas operacionales.

Luego de ser insertados en las tablas de dimensiones,podrıan cambiar en la fuente.

En un diseno dimensional, es crucial identificar comorepresentar los cambios en los datos fuente en las tablasde dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Los datos de las tablas de dimensiones se originan en lossistemas operacionales.

Luego de ser insertados en las tablas de dimensiones,podrıan cambiar en la fuente.

En un diseno dimensional, es crucial identificar comorepresentar los cambios en los datos fuente en las tablasde dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:

1 Tipo 1: sobreescribir historia transaccional.2 Tipo 2: conservar historia transaccional.3 Tipo 3: no se requiere historia transaccional pero se

conservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:1 Tipo 1: sobreescribir historia transaccional.

2 Tipo 2: conservar historia transaccional.3 Tipo 3: no se requiere historia transaccional pero se

conservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:1 Tipo 1: sobreescribir historia transaccional.2 Tipo 2: conservar historia transaccional.

3 Tipo 3: no se requiere historia transaccional pero seconservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Dimensiones lentamente cambiantes

Tres tipos diferentes de respuestas:1 Tipo 1: sobreescribir historia transaccional.2 Tipo 2: conservar historia transaccional.3 Tipo 3: no se requiere historia transaccional pero se

conservan valores antes y despues.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Sobreescribir el valor.

Hechos preexistentes tienen nuevo contexto.

Historia de la dimension no se conserva.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Sobreescribir el valor.

Hechos preexistentes tienen nuevo contexto.

Historia de la dimension no se conserva.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Sobreescribir el valor.

Hechos preexistentes tienen nuevo contexto.

Historia de la dimension no se conserva.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 1

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Metodologıa mas utilizada: insertar una nueva fila.

Contexto historico se conserva.

Historia de la dimension se conserva parcialmente.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Metodologıa mas utilizada: insertar una nueva fila.

Contexto historico se conserva.

Historia de la dimension se conserva parcialmente.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Metodologıa mas utilizada: insertar una nueva fila.

Contexto historico se conserva.

Historia de la dimension se conserva parcialmente.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cambios de tipo 2

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Parte importante del diseno: identificar reglas para elprocesamiento de cambio lento en dimensiones.

Dada una fuente de cambio, la respuesta correctadepende de los requerimientos analıticos.

Responsabilidad de los desarrolladores de ETL.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Parte importante del diseno: identificar reglas para elprocesamiento de cambio lento en dimensiones.

Dada una fuente de cambio, la respuesta correctadepende de los requerimientos analıticos.

Responsabilidad de los desarrolladores de ETL.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Parte importante del diseno: identificar reglas para elprocesamiento de cambio lento en dimensiones.

Dada una fuente de cambio, la respuesta correctadepende de los requerimientos analıticos.

Responsabilidad de los desarrolladores de ETL.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Documentando las reglasde cambio lento para unatabla de dimensiones.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Implementacion de los tipos de respuesta

Resumen de tecnicas para diseno e implementacion dedimensiones lentamente cambiantes

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cubos

Los modelos dimensionales no siempre se implementan enbases de datos relacionales.

Las MDB guardan la informacion dimensional en unformato llamado cubo.

El concepto basico detras del cubo es la computacion apriori de varias combinaciones de valores de hechos ydimensiones para que puedan ser estudiadasinteractivamente.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cubos

Los modelos dimensionales no siempre se implementan enbases de datos relacionales.

Las MDB guardan la informacion dimensional en unformato llamado cubo.

El concepto basico detras del cubo es la computacion apriori de varias combinaciones de valores de hechos ydimensiones para que puedan ser estudiadasinteractivamente.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Cubos

Los modelos dimensionales no siempre se implementan enbases de datos relacionales.

Las MDB guardan la informacion dimensional en unformato llamado cubo.

El concepto basico detras del cubo es la computacion apriori de varias combinaciones de valores de hechos ydimensiones para que puedan ser estudiadasinteractivamente.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

La principal ventaja de una MDB es su velocidad.

El cubo permite a los usuarios cambiar su perspectiva delos datos interactivamente, agregando o quitandoatributos en su vista y recibiendo respuesta instantanea.

Este proceso es conocido como OLAP.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

La principal ventaja de una MDB es su velocidad.

El cubo permite a los usuarios cambiar su perspectiva delos datos interactivamente, agregando o quitandoatributos en su vista y recibiendo respuesta instantanea.

Este proceso es conocido como OLAP.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

La principal ventaja de una MDB es su velocidad.

El cubo permite a los usuarios cambiar su perspectiva delos datos interactivamente, agregando o quitandoatributos en su vista y recibiendo respuesta instantanea.

Este proceso es conocido como OLAP.

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Almacenamiento multidimensional vs. relacional

Tecnologıas alternativas para el almacenamiento de datosdimensionales

Diego Villalba Almacenes de datos y OLAP

Diseno dimensional Esquema de estrella

Referencias

Adamson, C.Star Schema - The Complete Reference.McGraw-Hill, 2010.

Diego Villalba Almacenes de datos y OLAP