Dimensiones de la calidad de datos Completitud

5
Dimensiones de la Calidad de Datos Completitud Carlos Loachamin

Transcript of Dimensiones de la calidad de datos Completitud

Page 1: Dimensiones de la calidad de datos   Completitud

Dimensiones de la Calidad de Datos

Completitud

Carlos Loachamin

Page 2: Dimensiones de la calidad de datos   Completitud

Completitud

Qué tan completo está un registro?

Un registro se considera completo incluso si faltan datos opcionales.

Si los datos cumplen las expectativas, entonces los datos se consideran completos.

Existen dos factores a tomar en cuenta:

Cobertura: La porción de datos de la realidad que se encuentra contenido en los sistemas de información.

Densidad: Es la cantidad de información contenida y faltante acerca de las entidades.

Problemas en completitud se da por valores nulos, vacíos, y por clasificación de defecto

Page 3: Dimensiones de la calidad de datos   Completitud

Errores

Valor Nulo Información omitida

Se analiza la causa de la omisión.

Se define qué valor debería tomar el valor nulo.

Influye en el análisis de los datos

Al analizar si no se completa los omitidos

Al omitirse genera un análisis erróneo

Page 4: Dimensiones de la calidad de datos   Completitud

Errores

Clasificación de Errores Se da al momento de detectar defectos y se los clasifica de

manera errónea.

Se pueden dar por las siguientes causas.

Omisión por parte del verificador al registrar un defecto y omitir clasificarlo.

Falta de conocimiento por parte del verificador al no saber como clasificar el defecto registrado.

Un error en la aplicación o BDD al almacenar la información referente a la clasificación del defecto.

Page 5: Dimensiones de la calidad de datos   Completitud

Ejemplos Caso roles de pago

Los salarios de los vendedores no solo están determinado por su sueldo, muchas veces se percibe por el ingreso por comisiones, el campo de comisiones no siempre está con datos en el caso de que el empleado no sea un vendedor, por ello es necesario remplazar los valores nulos con el cero.

Caso datos personales del cliente

Cuando el operador toma datos del cliente, en muchos casos la información es llenada con datos erróneos, por ejemplo en el caso de la dirección se llenan con puntos, o cuando se debe establecer la ubicación geográfica del cliente, se establece el primero que se encuentra en la lista.

 Caso datos de los productos

El operador ingresa un producto que puede estar contenido en dos o más clasificadores, pero toma la decisión de clasificarlo bajo su propia perspectiva, sin tomar en cuenta la experiencia de la empresa de sus recursos.