adidex.comadidex.com/files/estadistica-Descriptiva.docx · Web viewes cada uno de los valores que...

31
2. DESCRIPCION DE UN CONJUNTO DE DATOS 2.1 Descripción numérica de un conjunto de datos. Como se mencionó en el capitulo 1, uno de los aspectos básicos de la estadística es la recolección de datos. Los datos son mediciones de alguna variable de interés, obtenidas de una población particular mediante la selección de una muestra. Los datos obtenidos de la muestra son de utilidad para obtener estimaciones de los valores de la población. Una población se define como el conjunto de todos los elementos que se somete a un estudio. Un individuo o unidad estadística es cada uno de los elementos que componen la población. Una muestra es un conjunto de elementos extraídos aleatoriamente, cuyo tamaño es menor que la población y que es estadísticamente representativa. El muestreo es la técnica o método con que se extraen los elementos de la población a estudiar. Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire una vez obtenemos un posible valor, cara o cruz. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Las medidas descriptivas numéricas asociadas a una población de mediciones se llaman parámetros de la población ; las medidas obtenidas de una muestra de una población se le llaman estadísticos . (Ver fig. 2.1). 3

Transcript of adidex.comadidex.com/files/estadistica-Descriptiva.docx · Web viewes cada uno de los valores que...

2. DESCRIPCION DE UN CONJUNTO DE DATOS

2.1 Descripción numérica de un conjunto de datos.

Como se mencionó en el capitulo 1, uno de los aspectos básicos de la estadística es la recolección de datos. Los datos son mediciones de alguna variable de interés, obtenidas de una población particular mediante la selección de una muestra. Los datos obtenidos de la muestra son de utilidad para obtener estimaciones de los valores de la población. Una población se define como el conjunto de todos los elementos que se somete a un estudio. Un individuo o unidad estadística es cada uno de los elementos que componen la población. Una muestra es un conjunto de elementos extraídos aleatoriamente, cuyo tamaño es menor que la población y que es estadísticamente representativa. El  muestreo es la técnica o método con que se extraen los elementos de la población a estudiar. Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire una vez obtenemos un posible valor, cara o cruz. Un  dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Las medidas descriptivas numéricas asociadas a una población de mediciones se llaman parámetros de la población; las medidas obtenidas de una muestra de una población se le llaman estadísticos. (Ver fig. 2.1).

Fig. 2.1.- Población y Espacio muestral

3

Para analizar el comportamiento o distribución de un conjunto de datos comúnmente se inicia calculando los estadísticos básicos; como son: La Media, la Mediana y la Moda, como medidas de tendencia central, y la Varianza, la Desviación estándar y la Amplitud, como medidas de variabilidad, entre otras.

2.1.1 Medidas de tendencia central.Las medidas de tendencia central mas usadas son:

La Media Aritmética o Promedio: X estadístico para lamuestra, y

μ parámetro para la población .

Se obtiene a partir de la suma de todos sus datos dividida entre el número total de datos, es decir:

X=x1+x2+…+xn

n=∑i=1

n

x i

n

(2.1)

μ=x1+ x2+…+ xn

N=∑i=1

N

x i

N

(2.2)

La Mediana: Me ,o~X

Es un conjunto de números ordenados en orden de magnitud ascendente, es decir, de menor a mayor; el dato que ocupa la posición central corresponde a la mediana.

4

Ejemplo 2.1. Sea el siguiente conjunto de datos, para el caso 1 y caso 2, tenemos que

La Moda: Mo En un conjunto de números es el dato que ocurre con mayor frecuencia,

es decir, es el dato mas frecuente. La moda puede no existir en la distribución e incluso puede tener hasta

dos o más. En el caso de una moda la distribución es unimodal, en el caso de dos

modas es bimodal, en el caso de tres modas es trimodal, y así sucesivamente.

En la figura 2.2 se observan las gráficas que muestran los distintos sesgos que se pueden presentar en una distribución de datos, como lo son sesgo a la izquierda o sesgo a la derecha o sin sesgo.

Fig. 2.2 Tipos de sesgos

5

2.1.2 Medidas de Dispersión.

La dispersión o variabilidad de los datos intenta dar una idea de que tan esparcidos se encuentran los datos de una distribución. Las medidas de dispersión más comunes son:

Rango o Amplitud: R

El Rango R se define, como la diferencia existente entre el dato mayor y el dato menor de un conjunto de datos, esto es

R=datomayor−datomenor(2.3)

Ejemplo 2.2. Obtener el rango o amplitud de los siguientes datos,

2 4 3 5 4 3 5 7 6 2 4 5 7 4

El dato mayor es 7 y el dato menor es 2, por consiguiente el rango o amplitud es

R=datomayor−datomenor=7−2=5

La Desviación Estándar: Sestadístico para lamuestra , y

σ parámetro para la población .

La desviación estándar representa las desviaciones de cada uno de los números obtenidos con respecto a su media aritmética, dividido entre el total de datos menos 1, se representa de la siguiente manera.

6

S=√∑i=1n

(xi−x)2

n−1

(2.4)

σ=√∑i=1N

(x i−µ)2

N

(2.5)

La Varianza: S2 estadístico para lamuestra , y

σ 2 parámetro para la población .

La varianza de una variable aleatoria es una medida de dispersión definida como la suma de cuadrados de las desviaciones de los datos con respecto a su media, esto es

S2=∑i=1

n

(xi−x)2

n−1

(2.6)

σ 2=∑i=1

N

(x i−µ)2

N

(2.7)

Coeficiente de Variación: CV

El Coeficiente de variación (CV), es una medida que se emplea fundamentalmente para:

1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida, por ejemplo, kilos y cms.

2. Comparar la variabilidad entre dos grupos de datos obtenidos entre dos o más personas distintas.

7

3. Comparar dos grupos de datos que tienen la misma media aritmética.

El coeficiente de variación se denota y se define matemáticamente como la expresión 2.8,

CV= SX100 (2.8)

Desviación Media: DM

La desviación media  se define como la suma de los  valores absolutos de las desviaciones de los datos con respecto a la media dividida entre el total de datos, matemáticamente se expresa como,

DM=1n∑i=1

n

|x i−X|(2.9)

Ejemplo 2.3. Obtener S ,S2 ,CV y DM para los datos del ejemplo 2.2,2 4 3 5 4 3 5 7 6 2 4 5 7 4

El valor de la media es,

X=2+4+3+5+4+3+5+7+6+2+4+5+7+414

=4.4

El valor de la varianza es,

S2= 2(2−4.4)2+4 (4−4.4)2+2(3−4.4)2+3(5−4.4)2+(6−4.4 )2+2(7−4.4)2

14−1=2.55

El valor de la desviación estándar es,S=√2.55=1.59

El valor del coeficiente de variación es,

8

CV=1.594.4

100=36.13%

El valor de la desviación media es,

DM=2|2−4.4|+4|4−4.4|+2|3−4.4|+3|5−4.4|+|6−4.4|+2|7−4.4|

14=1.27

2.1.3 Regla Empírica.

En muchos de los casos, los datos que surgen en la práctica se ha

observado que; para distribuciones normales, se cumple lo siguiente:

1. X -S y X+S (una desviación estándar) están aproximadamente el 68% del total de los datos.

2. X± 2S (dos desviaciones estándar) están aproximadamente el 95% del total de los datos.

3. X ± 3S (3 desviaciones estándar) están aproximadamente el 99.7% del total de los datos.

En la práctica es común usar 3 desviaciones estándar.La figura 2.3 Muestra geométricamente los porcentajes de la Regla Empírica

9

Figura 2.3 Representación gráfica de la Regla Empírica

Ejemplo 2.4. Aplicar la regla empírica para los datos del ejemplo2.2

2 4 3 5 4 3 5 7 6 2 4 5 7 4

En el ejemplo 2.3 encontramos que

Media Una desviación estándar (S)

Dos desviaciones estándar

Tres desviaciones estándar

4.4 1.59 3.18 4.77

En la tabla 2.1 se pueden ver los intervalos según la regla empírica. Para una desviación estándar tenemos que, el 68% de los datos están entre 2.81 a 5.99. Para dos desviaciones estándar se tiene que el 95% de los datos están entre 1.22 a 7.58 y si son tres desviaciones estándar el 99.7% de los datos están entre 0 y 9.17.

Intervalo Limite inferior limite superior % Regla EmpíricaX ±S 2.81 5.99 68%

10

X ±2S 1.22 7.58 95%X ±3S 0 9.17 99.7%

Tabla 2.1 Intervalos de datos según la regla empírica.

2.2 Descripción gráfica de un conjunto de datos.

2.2.1 Histograma y tabla de frecuencias.

Distribuciones o tabla de frecuencia:La construcción de una tabla de frecuencias requiere solo del conteo del

número de elementos o individuos que están dentro de cierta clase o intervalo determinado.

El Histograma El histograma es una gráfica de las frecuencias observadas de un conjunto de datos (Montgomery D.C., 1991); es uno de los métodos gráficos más comúnmente usados para ver la distribución de los datos. Tiene varias ventajas, una de ellas es que podemos observar la tendencia central y su dispersión (ver figura 2.4).

.

11

Figura 2.4 Histograma

12

Figura 2.5 Formas Típicas del Histogramas

Dependiendo de las características de los datos, el histograma puede tomar varias formas típicas, en la figura 2.5 se dan algunos ejemplos de las formas típicas en que suelen presentarse en un histograma.

Ejemplo 2.5. Realizar el histograma de los datos de la tabla 2.2 que representan las edades de 40 personas.

36 25 37 24 39 20 36 45 31 31 30 25 24 24 30 35 38 40 30 41

39 24 29 23 41 40 33 24 34 40 35 35 36 29 27 29 35 33 32 38

Tabla 2.2 Edades de 40 personas

CONSTRUCCION DEL HISTOGRAMA

Usando los datos de la tabla 2.2, el histograma para las edades de las personas se obtiene mediante los siguientes pasos:

13

PASO 1. Calcular el rango de los datos. Rango= Dato mayor – Dato menor = 45-20=25

PASO 2. Determinar el número de clases. Hay varias maneras de determinar el número de clases, el cual varía entre 5 y 15 dependiendo del número de datos, uno de los más comunes es que el número de clases sea aproximadamente igual a la raíz cuadrada del número de datos. En las edades de los adultos se tiene que son 40 datos, entonces

el numero de clases será aproximadamente igual a √40=6 .32 , como tiene que ser un numero entero, en este caso puede ser el 6 o el 7, tomaremos el numero 6.

PASO 3. Fijar la longitud de clase. Una forma de asignar la misma importancia a todas las clases es tomando la longitud de clase (lc) igual

a

lc= rangonumero declases

=256

=4.16

PASO 4. Construir los intervalos de clase. Los intervalos se obtienen dividiendo el total de los datos en seis intervalos de igual longitud de clase, como se muestra en la tabla 2.3.

CLASE INTERVALO

1 20 -24.16

2 24.16-28.32

3 28.32-32.48

4 32.48-36.64

5 36.64-40.80

6 40.80-45.00

Tabla 2.3 Intervalos de clase para las edades de las personas

PASO 5. Cuantificar la frecuencia de cada clase. Realizar el conteo de los datos que caen en cada intervalo de clase y especificar su frecuencia, como se ilustra en la tabla 2.4

14

CLASE INTERVALO FRECUENCIA

1 20 -24.16 7

2 24.16-28.32 3

3 28.32-32.48 9

4 32.48-36.64 10

5 36.64-40.80 8

6 40.80-45.00 3

Tabla 2.4 frecuencias de edades

PASO 6. Las frecuencias relativas de cada intervalo de clase. Las frecuencias relativas se obtienen dividiendo cada frecuencia por el total de datos, como se puede ver en la tabla 2.5.

CLASE INTERVALO FRECUENCIAFRECUENCIA

RELATIVA

1 20 -24.16 7 0.1750

2 24.16-28.32 3 0.075

3 28.32-32.48 9 0.225

4 32.48-36.64 10 0.25

5 36.64-40.80 8 0.20

6 40.80-45.00 3 0.075

Tabla 2.5 Frecuencias relativas para las edades

PASO 7. Hacer el histograma de frecuencias o de frecuencias relativas. El histograma consiste en una serie de barras cuya longitud de las bases son los intervalos de clase y la altura representa la frecuencia o la frecuencia relativa de los datos contenida en cada clase. En la figura 2.6 se puede ver el histograma de la frecuencia y en la figura 2.7 esta el histograma de la frecuencia relativa.

15

Histograma

20 25 30 35 40 45EDADES

0

2

4

6

8

10

frec

uenc

ia

porc

enta

je=f

rec.

rel

ativ

a*10

0

Histograma

20 25 30 35 40 45EDADES

0

5

10

15

20

25

Figura 2.6 Histograma de frecuenciaspara edades

Figura 2.7Histograma de frecuenciasrelativas para edades

2.2.2 Diagrama de caja.

Un diagrama de Caja o Caja y Bigotes es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y los "bigotes".

Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes.

Ejemplo 2.6. Realizar el diagrama de Caja y-Bigotes de los datos de las edades de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

Ordenar los datos de menor a mayor para calcular los estadísticos.

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

16

Calculo de cuartiles:

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; como N es un numero par, la mediana es el valor promedio del decimo dato mas el dato que le sigue,

~X= Q2 = (33 + 34)/ 2 =33,5

Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En este caso, como 3N / 4 = 15, resulta que

Q2= (39 + 39) / 2 = 39

DIBUJAR LA CAJA Y LOS BIGOTES; en la figura 2.8 se muestra la gráfica de Caja- Bigotes de las edades de las 20 personas.

Figura 2.8 Caja-Bigotes

Nótese que en la figura 2.8, el bigote de la parte izquierda representa al 25% de edades ( Xmín, Q1). La primera parte de la caja a (Q1, Q2) es el otro 25%. La segunda parte de la caja a (Q2, Q3) es otro 25% y finalmente el  bigote de la parte derecha viene dado por (Q3, Xmáx) y que representa el ultimo 25% de los datos.

17

Interpretaciones de la caja de bigotes

Dependiendo de la cantidad de datos y de la dispersión de los datos, el diagrama de caja y bigotes puede presentar algunas variantes en su interpretación, a continuación se presentan algunos casos

1- Si la parte izquierda de la caja es mayor que la de la derecha, ello quiere decir que las edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y el 75%.

2- El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados que el 25% de los mayores.

3- El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años.

2.3 Descripción de datos categóricos.2.3.1 Diagrama de barras y gráfica circular.

El grafico de barras y la grafica circular son muy útiles para cuando los datos son del tipo cualitativo o categórico. Los Datos Cualitativos o Categóricos, son aquellos que expresan atributos o categorías. Para facilitar el análisis estadístico de este tipo de datos frecuentemente se codifican a números, esta codificación da lugar a dos subtipos de datos categóricos:

Datos Nominales: Son aquellos datos categóricos que pueden ser codificados numéricamente pero donde hay una relación arbitraria entre los números asignados y el valor de la variable.

Datos Ordinales: Son aquellos que al ser codificados numéricamente deben guardar una correspondencia entre los números asignados y el verdadero valor de la variable.

Las graficas de barras son de utilidad para describir una variable cuyos valores son categorías o para clasificar o ver la relación entre dos o más

18

variables. En la figura 2.9 esta la grafica de barras que muestra las temperaturas en grados Fahrenheit diarias durante una semana.

Fig. 2.9 Gráfica de Barras

Gráfica circular que utiliza radios para dividir un círculo en sectores de manera que las áreas de los sectores son proporcionales a las cantidades representadas.

Fig. 2.10 Gráfica circular

Ejemplo 2.7. En una fábrica de ropa se registran los defectos en-contrados en prendas de vestir cuando se hace la inspección final. Los registros de las últimas dos semanas se muestran a continuación.

T C H T H O M H T H C H O T H OM H C H O C C C H M M O H H T O T

19

Donde: C= COSTURA, M= MONTAJE, T=TELA, O=CORTE y H=HILO.En la Tabla 2.6 se puede ver la tabla de frecuencias para los defectos de

ropa encontrados. En las figuras 2.11; y 2.12 se muestran, la gráfica de barras y la gráfica circular respectivamente del ejemplo 2.7.

Frecuencia Frecuencia FrecuenciaClase Valor Frecuencia Relativa Acumulada Rel. acum.

1 C 6 0.1818 6 0.18182 H 11 0.3333 17 0.51523 M 4 0.1212 21 0.63644 O 6 0.1818 27 0.81825 T 6 0.1818 33 1.0000

Tabla 2.6 Tabla de frecuencias para defectos en prendas de vestir

Diagrama de Barras de DEFECTO

0

2

4

6

8

10

12

frecu

encia

{[}{\}{]}{ }̂{_}{`}

COSTURA HILO MONTAJE CORTE TELA

Diagrama de Sectores de DEFECTO

DEFECTOCOSTURAHILOMONTAJECORTETELA

18.18%

33.33%

12.12%

18.18%

18.18%

Figura 2.11 Grafica de barras para defectos en prendas de vestir

Figura 2.12 Grafica Circular para defectos en prendas de vestir

2.3.2 Diagrama de Pareto.

El Diagrama de Pareto es una forma especial de gráfico de barras verticales que separa los problemas muy importantes de los menos importantes, estableciendo un orden de prioridades.

Fue creado sobre la base del principio de Pareto, según el cual, el 80% de los problemas son provenientes de apenas el 20% de las causas (ley 80-20, pocos vitales, muchos triviales). Vilfredo Pareto fue un economista italiano que,

20

en el siglo XIX, presentó una fórmula que mostraba la desigualdad en la distribución de los salarios.

El Diagrama de Pareto se usa para, identificar y dar prioridad a las causas o defectos más importantes en cualquier proceso, evaluando el comportamiento de un problema, comparando los datos entre el "antes" y el "después".

Ejemplo 2.8. Utilizando los datos del ejemplo 2.7 El de la fábrica de ropa; realizar el diagrama de Pareto.

T C H T H O M H T H C H O T H O

M H C H O C C C H M M O H H T O T

Donde: C= COSTURA, M= MONTAJE, T=TELA, O=CORTE y H=HILO.

¿COMO CONSTRUIRLO?Se trazan dos ejes verticales de la misma longitud perpendicular en

cada esquina de un eje horizontal. En el eje vertical izquierdo, se traza una escala desde el cero hasta el número de defectos en listados. En el eje vertical derecho haga una escala de 0 a 100%. El 100% corresponderá al total de defectos enlistados. Divida el eje horizontal en intervalos iguales, de acuerdo con la cantidad de categorías o lista de defectos. Construya y denomine las barras, colocando las categorías en orden decreciente de frecuencia, de izquierda a derecha. Trace una línea punteada que conecte el origen con la esquina superior derecha de la primera barra, se suma la altura de la primera barra, la altura de la segunda barra. Marque con un punto el valor obtenido en la prolongación del lado derecho de la segunda barra. Sume a esta nueva altura la altura de la tercera barra. Marque con un punto el valor obtenido en la prolongación del lado derecho de la tercera barra. Hacer esto, sucesivamente, hasta la última barra .Enlace todos los puntos marcados con una línea, dando continuidad a la línea punteada iniciada en el origen, para formar la curva de Pareto. El último punto representa el 100 % de los eventos. Complete el gráfico con informaciones tales como: nombre del gráfico, período, responsable, etc.

21

Nótese en el diagrama de Pareto de la figura 2.13, que el defecto mas importante en la ropa es el derivado del hilo.

Gráfica de Pareto para DEFECTO

0

10

20

30

40

frec

uenc

ia

Hilo Tela Corte Costura Montaje

33.33

51.52

69.70

87.88100.00

Figura 2.13 Diagrama de Pareto para defectos en ropa

Ejercicios de la unidad 2.

Para cada ejercicio del 1 al 8 calcular:• La Media, Mediana y Moda• Identificar si existe sesgo y de que tipo.• Calcular la Amplitud, Varianza, Desviación Estándar y Coeficiente de

Variación.• Calcule los porcentajes de datos según la Regla Empírica.• Elabore la tabla de Frecuencias, Histograma, Barras y/o Circular.• Elabore el Diagrama de Caja.• Escribe una breve conclusión o interpretación.

Problema 1.- En un estudio de dos semanas sobre la productividad de 100 trabajadores, se obtuvieron los siguientes datos sobre el número total de piezas fabricadas por trabajador.

22

65 39 54 79 32 43 53 41 40 47

68 35 68 22 35 50 35 43 76 58

46 51 61 65 34 76 69 57 33 40

45 85 84 63 53 64 54 51 52 70

55 55 62 44 28 21 36 34 82 56

60 47 73 53 88 42 56 45 37 48

65 49 52 50 80 41 70 68 38 77

35 55 45 56 51 67 74 74 75 62

36 57 45 82 67 60 61 78 60 26

72 62 73 59 59 74 52 50 61 48

Problema 2.- Se registró el tiempo (en meses) entre el inicio de una enfermedad en particular y su repetición en 50 pacientes.

2.1 19.2 14.1 3.7 9.0 4.1 8.7 1.6 8.2 0.2

8.2 1.3 26.7 9.9 1.2 18.0 0.4 6.1 9.6 1.6

0.3 18.0 32.3 3.3 2.4 5.6 3.9 1.4 7.4 7.4

11.4 2.7 4.3 2.4 23.1 6.6 0.2 14.7 5.8 8.3

4.4 6.9 1.0 12.6 2.0 18.4 24.0 13.5 16.7 3.5

Problema 3.-Los datos siguientes son las velocidades del viento promedio (en millas por hora) que se producen en 45 ciudades seleccionadas de la Republica Mexicana.

8.9 7.9 6.2 9.4 12.5 6.2 9.7 8.9 7.9

23

9.3 9.5 8.2 10.2 7.8 7.0 8.9 10.7 11.9

10.5 7.7 9.1 9.2 8.9 11.5 8.9 12.9 10.4

11.0 9.1 10.8 9.6 8.8 8.3 10.4 9.4 35.3

7.1 10.4 11.1 10.5 11.3 8.7 9.1 8.6 7.9

Problema 4.- Considere la siguiente muestra (La resistencia de 50 lotes de algodón, libras necesarias para romper una madeja).

74 100 90 99 97 89 108 94 87 79

101 90 105 83 91 96 81 98 81 98

105 110 91 99 101 94 106 98 93 82

90 86 96 88 97 103 85 106 92 115

97 101 102 96 100 76 96 81 101 93

Problema 5.-.En la elaboración de envases de plástico primero se elabora la preforma, para la cual se tienen varios criterios de calidad, uno de ellos es el peso de esta. Para cierto envase se tiene que el peso debe estar en 28 ±0.5g . A continuación se muestran los últimos 112 datos.

27.72 28.39 28.21 28.19 28.02 27.93 27.89 27.88

28.06 27.91 27.97 27.95 27.96 27.94 28.04 28.05

27.81 27.74 27.95 27.91 27.93 28.07 28.13 27.98

27.87 27.87 27.82 28.23 27.9 27.91 28.16 27.94

24

27.86 27.84 27.7 27.98 28.02 28 27.99 28.13

28.26 28.1 27.94 28.07 27.84 27.9 27.87 27.76

27.95 27.94 27.81 27.76 27.96 27.84 27.85 27.93

28.22 27.96 27.88 28.08 28.04 28.19 27.89 28.08

28.09 28.02 27.85 28.27 27.75 27.98 27.75 27.82

28.13 27.88 28.11 28.05 28.14 28.11 28.08 28.16

28.04 28.05 27.75 27.89 27.94 28.19 28.1 27.78

27.63 27.93 27.74 28.1 28.14 27.91 27.84 28.21

27.85 27.84 28.12 28.01 27.97 27.88 28 28.1

28.16 28.16 28.01 28.13 27.97 27.9 27.87 27.94

Problema 6.-Una característica clave en la calidad de las pinturas es su densidad, y un componente que influye en ésta es la cantidad de arenas que se utilizan en su elaboración. La cantidad de arena en la formulación de un lote se controla por medio del número de costales, que según el proveedor contiene 20 kg. Sin embargo, continuamente se tienen problemas en la densidad de la pintura que es necesario corregir con el retrabajo y reprocesos adicionales. En este contexto se decide investigar cuanta arena contiene en realidad los costales. Para ello, se toma una muestra de 30 costales de cada lote o pedido (500). Los pesos obtenidos en las muestras de los últimos tres lotes se muestran en la siguiente tabla. Las especificaciones iniciales que se establecen para el peso de los costales de arena son de 20 ±0.8kg .

Lote Peso en costales Lote Peso en costales Lote Peso en costales

1

18.6 19.1 19.6

2

18.6 19.6 18.9

3

20.1 19.7 19.9

19.2 18.6 19.4 19.5 19.7 19.3 20 19.6 20.4

19.5 19.4 19.8 20 19 18.8 20.2 20.1 20.5

19.2 18.7 19.1 19.9 19.4 18.4 20.2 19.7 20.3

18.9 21 20 19.1 17.8 20.7 19.7 19.7 19.6

19.4 19.8 20.4 18.4 20.1 19.2 19.7 20 20

19 19 18.8 18.8 19.6 19 21 20.4 20.4

20 18.6 19.3 18.5 19.4 19.6 20.8 19.8 20.6

19.3 19.6 19.1 18.9 19.7 20.6 20 19.1 20

25

20 19 19.1 18.4 20.3 19.7 19.7 19.8 20.2

Problema 7.- Una característica importante en la calidad de leche de vaca es la concentración de grasa. En una industria en particular se fijo el 3% como el estándar mínimo que debe cumplir el producto que se recibe directamente de los establos lecheros. Por medio de muestreos y evaluaciones en cierta época del año se obtuvieron los siguientes 90 datos sobre concentración de grasa en cierta región. Obtenga resultados e interprete.

2.7 3.4 2.9 3.3 3.3 2.9 3.1 2.8 3

3.4 3.1 3.1 3.2 2.8 3.3 3.2 2.7 2.9

2.2 3 3.2 3.1 2.7 3.3 3.2 3.4 3.8

3.2 3.5 3.2 2.9 3.6 2.9 3.5 3 3.1

3.4 3.1 4 3.4 3 3 3.3 2.9 2.8

2.9 3 3.6 3.3 3.1 3.3 3.1 3.4 3.3

3.4 3.5 2.5 3.2 3.3 3.6 3.3 2.6 3.5

2.9 3.3 2.7 3 3.8 3.6 3.1 3.1 3.5

3.4 3.3 3.2 3.2 3.5 3.1 3.5 3.7 3.4

2.7 2.9 3.5 3.3 3 3.9 3.4 3 3.2

Problema 8.- En la elaboración de una bebida se desea garantizar que el porcentaje de CO2 (gas) éste entre 2.5 y 3. En el monitoreo del proceso se obtuvieron los siguientes 115 datos. Obtenga resultados e interprete.

2.61 2.56 2.63 2.56 2.53 2.64 2.61 2.6 2.48

2.69 2.51 2.64 2.68 2.59 2.63 2.63 2.67 2.56

2.61 2.61 2.57 2.63 2.59 2.67 2.52 2.57 2.7

2.57 2.49 2.59 2.61 2.56 2.67 2.66 2.55 2.65

2.73 2.62 2.56 2.64 2.52 2.64 2.52 2.57 2.52

2.6 2.65 2.66 2.64 2.61 2.62 2.56 2.67

26

2.61 2.6 2.58 2.69 2.66 2.6 2.6 2.6

2.64 2.65 2.58 2.67 2.66 2.57 2.61 2.59

2.5 2.67 2.71 2.67 2.56 2.58 2.6 2.57

2.56 2.49 2.66 2.64 2.61 2.64 2.59 2.53

2.62 2.52 2.72 2.57 2.53 2.67 2.49 2.58

2.53 2.61 2.65 2.51 2.57 2.57 2.58 2.55

2.64 2.55 2.55 2.52 2.6 2.65 2.65 2.53

Problema 9.-Diseñar el Diagrama de Pareto

Problema 10.- En una empresa se está buscando reducir las quejas de clientes. Se tienen los registros del último semestre, clasificados por área de trabajo y turno.

Área Turno1 Turno2

A Ooo

xxx

++

oooooooooo

xxxxxx

/

B Oooo

xx

+++ /

ooooooooo

Xxxxxxx

++

C Ooooo Oooooooo

Quejas:

o Retrasos x Pedidos

+ Facturas / Otros

a) Realice un análisis de Pareto completo. Empezando por un Pareto para problemas, y luego a partir del mismo, enfocar Paretos para causas.

b) ¿Cuál es el problema más importante?c) ¿Cuáles son las principales pistas para encontrar la

causa del problema principal?

27

x

+

Xxxxx

/

D Oooo

xx

++ //

ooooooooooooo

xxxxx

++++

Problema 11.- En una empresa procesadora de carnes frías se tienen los datos de una semana de los defectos en la inspección final de la salchicha se muestran a continuación.

Máquina Turno Defecto y número de paquetes defectuosos

empacadora Falta de vacío Mancha verde Mancha amarilla

A I 4300 700 700

II 6300 650 650

B I 3500 700 400

II 6600 500 420

C I 8500 800 324

II 9120 655 345

Realice un análisis de Pareto completo y encuentre las principales pistas para resolver los problemas en las salchichas.

28