2.estadistica

DR. JORGE ACUÑA A.

INGENIERIA INDUSTRIALINGENIERIA INDUSTRIAL

CONTROL DE CALIDAD ICONTROL DE CALIDAD I

2. ESTADISTICA2. ESTADISTICA

Muestras correctamente

seleccionadas permiten inferir

sobre la situación real de una

característica en estudio.

Aplicación de la estadística al

control de procesos y de materiales

es solamente un arma para la

toma de decisiones y no la solución

a los problemas existentes.

ING. JORGE ACUÑA A., PhD., PROFESOR

Diseño de procedimientos eficientes que suministren datos confiables para su posterior análisis.

Planear la recolección de datos indicando entre otros aspectos tiempo (¿cuándo?, lugar (¿dónde?), responsabilidades (¿quién?), formatos y procedimientos (¿cómo?).

El registro y análisis de la información proveniente de muestras representativas tomadas de pruebas físicas químicas y servicioscon el fin de verificar su estado.

Datos deben ser veraces y reflejar las condiciones del proceso, datos erróneos generan conclusiones erróneas.

El analista debe tener plena confianza en los datos para que el estudio sea válido.

Mínima desconfianza en los datos o en su procedencia obligan al analista a descartarlos.

Recolección de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.

Acciones correctivas y preventivas, con las que se procurará reducir y si es posible eliminar los problemas.

Análisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias históricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.

Visualizar la posible distribución de datos

Cada dato pierde su identidad.

Distribuciones estadísticas teóricas o

empíricas para inferir hacia el problema.

Distribuciones de frecuencia de datos no

agrupados presentan una distribución

que es muy difícil de aproximar.

Cifras significativas de los datos

Selección de un número de clases que

refleje una adecuada distribución. ING. JORGE ACUÑA A., PhD., PROFESOR

Recolectar los datos (xi) de acuerdo con el tamaño de muestra previamente calculado.

Ordenar los datos de menor a mayor.

Calcular el rango:

R = ximáx - ximín

Fijar el número de clases (k),

Calcular el intervalo de clase (i), así:

i = R/k

El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.

Calcular el rango propuesto (Rp)

Rp = ir * k

Calcular la diferencia (d)

d = Rp – R

Este valor es un número cuya última cifra significativa debe ser impar. Si no lo es, se debe devolver al paso 5 y hacer el cálculo con otro número de clases, hasta que se cumpla la condición.

Calcular la mitad de la diferencia (md)

md = d/2

Fijar los límites reales de clase (Li, Ls), usando el siguiente procedimiento:

a. Tomar el valor del dato menor y restarle el valor de md; el valor obtenido es el primer Li.

Li1 = ximín – md

b. Sumar i al valor de Li1, para obtener el primer Ls.

Ls1 = Li1 + i

Lsk = ximáx + md

donde Lsk = último límite real superior.

Completar el cuadro de

frecuencias de datos agrupados.

Construir el histograma para

observar la distribución del

conjunto de datos.

Se toman doce grupos de cinco unidades de una máquina llenadora de latas de pasta de tomate y se pesan, originando los siguientes datos:

Construir una distribución de frecuencias de datos agrupados.

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

# 1 2 3 4 5 6 7 8 9 10 11 12

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5

2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0

3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5

4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5

5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––-

R = ximáx - ximín

R = 25,0 – 18,5 = 6,5

k = 1 + 3,3 log n

k = 1 + 3,3 log 60

i = —— = ——— = 0,923 = 1,0

Rp = ir * k = 7 * 1,0 = 7,0

md = d/2 = ——= 0,25

Li1 = ximín - md = 18,5 - 0,25 = 18,25

Ls1 = Li1 + i = 18,25 + 1,0 = 19,25

Li2 = Ls1 = 19,25

Ls2 = Li2 + i = 19,25 + 1,0 = 20,25

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Li Ls CONTEO nk xk Nk fk Fk

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

18,25 19,25 ||||| 5 18,75 5 8,33 8,33

19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33

20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33

21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00

22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33

23,25 24,25 ||||| 5 23,75 58 8,33 96,67

24,25 25,25 || 2 24,75 60 3,33 100

CV=s/x

PROMEDIO

DESVIACION

ESTANDAR

COEFICIENTE DE VARIACION:

Calcular la media aritmética y la desviación

estándar

_ A= 21,75 para d = 0

x = 21,75 + (-12/60) * 1,0 = 21,55 decigramos

decigramoss 525,160

142*0,1

––––––––––––––––––––––––––––––––––––––––––––––

xk nk d nk*d nk*d2

–––––––––––––––––––––––––––––––––––––––––––––

18,75 5 –3 –15 45

19,75 9 –2 –18 36

20,75 9 –1 – 9 9

21,75 16 0 0 0

22,75 14 1 14 14

23,75 5 2 10 20

24,75 2 3 6 18

––––––––––––––––––––––––––––––––––––––––––––––––––

TOTAL nk*d= –12 nk*d2= 142

Esta distribución conocida por su forma de campana (campana de Gauss) es una de las más importantes en teoría estadística.

Esta distribución tiene propiedades importantes, tales como: › Está definida de - a + . › Es simétrica lo que implica que la probabilidad de

ocurrencia de un valor x menor que la media es igual a la de un valor x mayor que la media.

› El área bajo la curva es 1. › La moda, media y mediana son iguales. › Si se conoce la media ( ) y la varianza ( 2) se

determina la curva

La distribución muestral es normal aunque la poblacional no lo sea. Tiene promedio y desviación estándar igual a /√n

Puede estandarizarse usando el estadístico Z = (x - )/ .

Las funciones densidad y acumulada son para - x + :

dxxfxF )()(

Una fábrica especifica que el peso de los tarros de frutas que produce debe obedecer a un peso medio de 2,00 kg con una desviación estándar de 0,05 kg. ¿Cuál es la probabilidad de que un determinado tarro pese entre 1,90 y 2,06 kg, sabiendo que esta variable se distribuye normalmente?

206.206.19.1 NNxPA

A = N(1,2) – N(–2,0) A = 0,8849 – 0,0228 A = 0,8621 La probabilidad de que un determinado

tarro pese entre 1,90 y 2,06 kg es 0,8621.

1.9 2.06

"Si se toman m-muestras aleatorias de tamaño n de una población cuya distribución puede o no ser normal y que tiene media µ y desviación estándar , la distribución de muestreo correspondiente a los promedios de las m muestras será aproximadamente normal, con media µ igual a µ y desviación muestral igual a / n."

Un proceso de llenado de bolsas de

cacao en polvo origina un peso

medio de 50,10 g y una desviación

estándar de 5,25 g. Si se toma una

muestra de 40 bolsas, ¿cuál es la

probabilidad de que su media se

encuentre entre 48,10 y 50,90 g?

A=P(48,10< <50,9)= N((50,90-50,10)/0,83)

- N((48,10-50,10)/0,83)

A = N(0,96) - N(-2,41)

A = 0,83147 - 0,00798 (Obtenidos de Tablas )

A = 0,8235

La probabilidad de que la media de peso de

una muestra de 40 bolsas se encuentre entre

48,10 y 50,90 gramos es 0,8235.

En una industria se fabrican productos

que deben tener un peso medio

comprendido entre 10,049 y 10,095

g. Se toma una muestra de 15

unidades, originándose un promedio

de 10,072 g y una desviación

estándar de 0,100 g. ¿Cuál es la

probabilidad de cumplir con el peso

fijado?

P(10,049 10,095)=T((10,095-10,072)/(0,100/ 14))

-T((10,049-10,072)/(0,100/ 14))

= T (0,861) - T (-0,861)

= 0,80 - 0,20

= 0,60

La probabilidad de cumplir con el peso medio fijado es 0,60.

Los valores de T(0,861) y T(-0,861) sirven para calcular las probabilidades usando la Tablas.

Una máquina llenadora ha

ejecutado su operación con una

varianza de 0,83 grms2. Si se toma

una muestra de 15 unidades,

¿cuál es la probabilidad de tener

una varianza:

a. Superior a 1,31 grms2?

b. Inferior a 0,56 grms2?

n * s2 15 (1,31)

a. 2 = –––––– = –––––––– = 23,7

2 0,83

n * s2 15 (0,56)

b. 2 = –––––– = ———— = 10,1 2 0,83 Los valores de la probabilidad se encuentran en

Tablas.

En conclusión, la probabilidad de obtener una varianza superior a 1,31 grms2 es 0,05 y la de obtener una varianza inferior a 0,56 grms2 es 0,25.

En un proceso de corte de varillas para un ensamble especial, existen dos máquinas cortadoras tecnológicamente parecidas aunque diferentes en antigüedad. Esta similitud hace pensar que las varianzas de corte generadas por ambas máquinas puedan ser comparadas.

Si se toma una muestra de 16 elementos de cada máquina, calcular la probabilidad de que la razón de varianzas sea:

a. Mayor a 1,97 b. Menor a 0,508

Utilizando Tablas: v1 = n1 - 1 = 16 - 1 = 15 v2 = n2 - 1 = 16 - 1 = 15 Fv1,v2, 1= F15,15, 1 =1,97 para 1=0,10 Fv1,v2, 2= F15,15, 2 =0,508 para 2=0,10

pues F15,15, 2 = 1 / F15,15, 1 Como respuesta al problema se tiene que

la probabilidad de que la razón de varianzas sea superior a 1,97 es 0,10 y de que sea inferior a 0,508 es también 0,10.

Una distribución de variable discreta si se ajusta a experimentos que cumplen con cinco propiedades:

Hay n pruebas Existe una probabilidad de éxito p y una de fracaso q=1-p Las pruebas son independientes Interesan x casos del total de casos Las funciones densidad y acumulada así como el valor

esperado ( ) y la varianza ( 2) son las siguientes: f(x) = n px * q n-x para x 0

x (n-x) n’ F(x) = f(x) = np 2= npq X=0

Un cliente establece que para aceptar un lote de producto que le envía el fabricante, éste debe cumplir con el contrato firmado. Este contrato establece que el lote se acepta si una muestra de 20 unidades extraída de él, contiene dos o menos defectuosos.

Si el fabricante envía un lote 10% defectuoso, ¿cuál es la probabilidad de que sea rechazado?

Primero que todo se debe analizar si se cumple con las cuatro condiciones fijadas para la distribución binomial.

1. n = 20 3. Hay independencia 2. p = 0,10 4. x 2 Por leyes de probabilidad se tiene que la

probabilidad de rechazo es igual al complemento de la probabilidad de aceptación.

P(X > 2) = 1 – P (X 2) 2 P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0

P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0 P(X 2) = b(0,20,0,10) + b(1,20,0,10) + b(2,20,0,10) 20! 20! 20! P(X 2) = ––––– 0,100 * 0,9020 + ––––––– 0,101 * 0,9019 + –––––– 0,102*0,9018

20! * 0! 19! * 1! 18! * 2!

P(X 2) = 0,1216+0,27+0,2853 = 0,6769 Probabilidad de rechazo = P(X>2) = 1 - P(X 2) = 1-0,6769 = 0,3231 Si se utiliza la Tabla se tiene que: P(X 2) = B (2,20,0,10) = 0,6769 P(X>2) = 1 - P(X 2) = 1 - 0,6769 = 0,3231

Por lo tanto la respuesta es que si se envía un lote

10% defectuoso la probabilidad de que sea rechazado es 0,3231.

Una compañía farmacéutica afirma que existe una probabilidad de 0,005 de que un paciente que ingiere un nuevo medicamento, sufra una reacción secundaria. Si 2000 pacientes compran este medicamento, ¿cuál es la probabilidad de que:

a. ocho sufran efectos secundarios? b. mas de ocho sufran efectos

secundarios?

p = 0,005 n = 2000 x= 8 = 2000 * 0,005 = 10 a. Utilizando la fórmula se tiene: 108

p (8,10) = e-10 ——— = 0,1126 8! Utilizando la Tabla p (8,10)= P (8,10)– P (7,10) = 0,333 – 0,220 = 0,113 Por lo tanto, la probabilidad de que ocho de los 2000

pacientes sufran efectos secundarios al ingerir el medicamento es 0,113.

b. P(x>8) = 1 - P( x 8 ) = 1 – 0,333 = 0,667 Por lo tanto, la probabilidad de que mas de ocho de los 2000

pacientes sufran efectos secundarios al ingerir el medicamento es 0,667.

Para µ, se calculan así:

Lc = x Z /2 * ——— si es conocida

Lc = x t /2 * ——— si es desconocida

Para 2, se calculan así:

ns2 ns2

LIc = ——— LSc = ———

2 1- /2 2

Se toman 30 varillas cortadas por una

máquina cortadora. Si se tiene una

longitud promedio de 5,35 cm, con una

desviación típica de 0,85 cm.

a. ¿Cuáles son los límites de confianza para µ, con 95% de confianza?

b. ¿Cuáles son los límites de confianza para 2, con 95% de confianza?

c. Si se conociera que 2 es igual a 1,58 cm2,

¿cuál es la respuesta a la pregunta a?

_ a. n = 30 x = 5,35 cm s = 0,85 cm (1- ) = 0,95

= 0,05 _ s _ s LIc = x – t /2 ——— LSc = x + t /2 ——— n-1 n-1 0,85 0,85 LIc = 5,35 – 2,045 ——— LSc = 5,35 + 2,045 ——— 29 29 = 5,02 cm = 5,67 cm t /2 = t 0,025 = 2,045 de Tablas Esto significa que se puede afirmar con 95% de confianza

que el proceso de corte de varillas tiene un promedio de corte comprendido entre 5,02 cm y 5,67 cm.

b. s2 = 0,852 = 0,7225 cm2

n s2 30 (0,7225) 21,675 LIc = ——— = —————– = ––———— = 0,474 cm2

20,975 45,7 45,7

n s2 30(0,7225) 21,675 LSc = ——— = ————— = ———— = 1,35 cm2

2 0,025 16 16

Los valores de chi-cuadrado provienen de Tablas. Esto significa que se puede afirmar con 95% de confianza

que el proceso de corte de varillas tiene una varianza de corte comprendida entre 0,474 cm2 y 1,35 cm2.

c. Si 2 = 1,58 cm2 entonces = 1,257 cm. _ 1,257 LIc = x – Z /2 ——— = 5,35 – 1,96 ———— = 4,9 cm n 30 _ 1,257 LSc= x + Z /2 ——— = 5,35 + 1,96 ———– = 5,8 cm n 30 Los valores de Z se obtuvieron de tablas Esto significa que se puede afirmar con 95% de confianza que el

proceso de corte de varillas tiene un promedio de corte comprendido entre 4,9 cm y 5,8 cm.

Comportamiento de un proceso con el fin de ejecutar acciones que prevengan problemas de calidad.

Procedimiento mediante el cual, sujeto a un error tipo I denotado por , se contrasta una hipótesis planteada con el fin de probar su veracidad o su falsedad.

Error tipo I ( ) es la probabilidad de rechazar la hipótesis nula siendo esta verdadera.

Error tipo II (ß) es la probabilidad de aceptar la hipótesis nula siendo esta falsa.

a. Plantear la hipótesis nula H0 y la hipótesis alternativa denotada por Ha.

b. Prueba debe ser unilateral o bilateral.

c. Fijar el nivel de significación ( ) o error tipo I, (1%, 5% ó 10%)

d. Definir el estadístico a usar de acuerdo con la distribución de probabilidad que le corresponde a la variable en estudio y según lo que se desee probar (una media, dos medias, una varianza, dos varianzas, una proporción o dos proporciones).

e. Definir las áreas donde se cumplirá cada una de las hipótesis.

f. Calcular el valor del estadístico seleccionado

g. Comparar el estadístico obtenido con el estadístico teórico. El resultado permitirá conocer la decisión de aceptación o rechazo

h. Obtener las conclusiones del experimento efectuado. Un valor importante de calcular aquí es el error tipo II.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 45

EJEMPLO 2.14 pag. 76EJEMPLO 2.14 pag. 76

En un proceso de fabricación de

piezas de precisión se quiere que el

valor nominal del diámetro de una

pieza sea 20,0 mm. Se conoce que la

desviación estándar de esta

característica es 3,0 mm. Se toma una

muestra de 25 piezas obteniéndose un

promedio de diámetro de 19,2 mm.

¿Se ha cumplido con lo requerido?

Use =5%.

PROFESOR 46

SOLUCION Se seguirá el procedimiento planteado.

a. Planteo de la hipótesis

H0: µ = 20,0

Ha: µ 20,0

b. La hipótesis es bilateral puesto que no

se cumple con lo requerido si el promedio de la

muestra es mayor o menor que lo especificado.

c. El nivel de significación es dado, = 5%.

d. El estadístico por usar es el siguiente:

x – µ

Z = ––––––

PROFESOR 47

SOLUCION e. Las áreas de cumplimiento de la hipótesis .

f. Cálculo del estadístico citado en d.

x – µ 19,2 – 20,0

Z = ——— = —————— = –1,33

/ n 3,0/ 25

g. El valor de Z calculado (–1,33) se encuentra en

el área de cumplimiento de la hipótesis nula.

h. En conclusión, se puede afirmar, con =5%, que

estadísticamente se cumple con el valor nominal

requerido.

PROFESOR 48

Si en el Ejemplo anterior no se

conoce la desviación estándar pero

a partir de la muestra se calcula una

desviación típica de 2,1 mm ¿Qué

conclusiones se obtienen? Use

PROFESOR 49

SOLUCIONSOLUCION Se seguirá el procedimiento planteado. a. Planteo de la hipótesis H0: µ = 20,0 Ha: µ 20,0 b. La hipótesis es bilateral puesto que no se

cumple con lo requerido si el promedio de la muestra

es mayor o menor que lo especificado. c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente: _

x – µ t = ————

s/ n-1

PROFESOR 50

SOLUCIONSOLUCION

e. Las áreas de cumplimiento de la hipótesis.

f. Cálculo del estadístico citado en d. _ x – µ 19,2 – 20,0 t = –––––––––– = —————— = –1,87 s/ n-1 2,1/ 24 g. El valor de t calculado (–1,87) se encuentra

en el área de cumplimiento de la hipótesis nula. h. En conclusión, se puede afirmar, con

= 5%, que estadísticamente se cumple con el valor

nominal requerido.

Un proveedor envía lotes de producto

que según sus registros son 5%

defectuosos. Un cliente toma una

muestra de 200 unidades y encuentra

16 unidades defectuosas. ¿Es cierto lo

que muestran los registros del

proveedor, con =5%?

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis

H0: p = 0,05 Ha: p > 0,05

b. La hipótesis es unilateral puesto que lo problemático en cuanto a calidad es que el porcentaje de defectuosos supere lo especificado.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

x – np Z = –––––––

e. Las áreas de cumplimiento de la hipótesis. f. Cálculo del estadístico x – np 16 – 200(0,05) Z = ———— = ––––––––––––––– = 1,95 npq 200*0,05*0,95 g. El valor de Z calculado (1,95) se encuentra

fuera del área de cumplimiento de la hipótesis nula.

h. En conclusión, no hay evidencia estadística para aceptar la hipótesis nula con = 5%. Por lo tanto, estadísticamente no es cierto lo que anotan los registros del fabricante.

Para el mismo producto del Ejemplo 3, existe otro proveedor. Una muestra de 200 unidades extraídas de un lote enviado por él, tenía 12 unidades defectuosas. ¿Se puede decir con 95% de confianza que el proveedor del Ejemplo 3 da peor calidad que el de este ejemplo.

PROFESOR 55

SOLUCIONSOLUCION

Se seguirá el procedimiento planteado.

a. Planteo de la hipótesis

p1: fracción defectuosa del proveedor A

p2: fracción defectuosa del proveedor B

H0: p1 = p2

Ha: p1 > p2

b. La hipótesis es unilateral pues se

quiere probar si la cantidad de defectuosos

enviada por un proveedor es

significativamente mayor que la del otro.

c. El nivel de significación es dado, = 5%.

PROFESOR 56

SOLUCIONSOLUCION d. El estadístico por usar es:

x1 + x2

p’ = ————— q’ = 1 – p’

n1 + n2 e. Las áreas de cumplimiento

f. Cálculo del estadístico

x1 + x2 16 + 12

p’ = –––––––– = ––––––––– = 0,07

n1 + n2 200 + 200 q’ = 1 – 0,07 = 0,93 g. El valor de Z calculado (0,784) está en el área de

cumplimiento de la hipótesis nula.

h. Se puede afirmar, con =5%, que no hay diferencia

significativa entre las calidades suministradas por ambos

proveedores.

193.0*07.0

• En el corte de una varilla

cromada se genera una

varianza de la longitud de 2,5

mm2. Se toma una muestra de

30 varillas y se mide la varianza

muestral de la longitud, la que

resulta ser 2,0 mm2. ¿Existe

alguna diferencia significativa

con el valor inicial de 2,5 mm2?

Use =5%.

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis

H0: 2 = 2,5

Ha: 2 2,5 b. La hipótesis es bilateral puesto que no se cumple con

lo requerido si la varianza de la muestra es mayor o menor que la especificada.

s2 2= (n-1) ——

2 e. Las áreas de cumplimiento de la hipótesis.

f. Cálculo del estadístico citado en d.

s2 2= (n-1) —— = 29 * (2/2,5) = 23,2

g. El valor de 2 calculado (23,2) se encuentra en el área de cumplimiento de la hipótesis nula.

h. En conclusión, se puede afirmar, con = 5%, que estadísticamente no existe diferencia con la varianza inicial.

En un proceso de corte de bolsas plásticas se usan dos máquinas. De la máquina A se toma una muestra de 30 unidades que genera una varianza en la longitud de corte de 3,3 mm2 y de la máquina B se toma una muestra de 25 unidades que genera una varianza en la longitud de corte de 4,1 mm2. ¿Se puede afirmar, con = 5%, que una máquina es mejor en la ejecución de esta operación que la otra?

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis Sea 2

A la varianza producida por la máquina A 2

B la varianza producida por la máquina B H0:

2A = 2

Ha: 2A 2

b. La hipótesis es bilateral puesto se desea probar la existencia de diferencias entre las varianzas de ambas máquinas.

F = ——— s2

e. Las áreas de cumplimiento de hipótesis. Los valores de F de

0.53 y 1.94 fueron extraídos de tablas F con /2 = 0.025. f. Cálculo del estadístico citado en d.

s12 3,3

F = ——–– = ——–– = 0,805 s2

2 4,1 g. El valor de F calculado (0,805) se encuentra en el área de

cumplimiento de la hipótesis nula (ver Figura 2.18). h. En conclusión, se puede afirmar, con =5%, que no existe

ninguna diferencia de variabilidad de la longitud de corte entre ambas máquinas.

Una inspección de calidad efectuada sobre dos marcas de baterías para linterna, reveló que una muestra aleatoria de 61 unidades de la marca A generó un promedio de vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras que otra muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8 horas con una desviación estándar de 1,5 horas.

Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre la vida útil de ambas marcas.

Para probar si hay diferencia significativa entre los promedios se debe comprobar primero la diferencia entre las varianzas, para así seleccionar el estadístico adecuado.

1. Hipótesis de varianzas Siguiendo los pasos de una prueba de hipótesis se tiene: a. Planteo de la hipótesis

A = 2B

Ha: 2A 2

b. Como la hipótesis alternativa es de desigualdad, entonces es bilateral. Esto significa que puede darse una relación mayor o menor.

c. El nivel de significancia es = 5%.

d. El estadístico por usar es Fc = s12/ s2

2 (distribución F-Fisher), pues lo que se desea es medir la relación de varianzas.

e. Las áreas de la hipótesis que se va a probar. v1 = n1–1 = 61–1=60 v2=n2-1 = 31–1=30 De una Tabla F con /2= 2.5% se tiene:

F 60,30,0.025 = 0,551 F 60,30,0.975 = 1,440

f. Fc= s12/ s2

2 = 1,82/1,52 = 1,44 g. Este valor calculado de Fc cae en el área donde se

cumple Ho, por lo tanto se acepta Ho.

h. Se concluye que ambas varianzas, al 5% de significancia, son iguales.

Se procede entonces a hacer la hipótesis de promedios.

Siguiendo los pasos de prueba de hipótesis se tiene: a. Planteo de la hipótesis

Ho: µ1 = µ2

Ha : µ1 µ2

b. La hipótesis es bilateral al igual que en la hipótesis anterior.

c. El nivel de significación es del 5%

d. Según la hipótesis anterior las varianzas son desconocidas pero iguales, además, los tamaños de muestra son mayores que 30. Por lo tanto el estadístico por usar es:

e. Las áreas de cumplimiento y rechazo. v = n1 + n2 – 2 v = 61 + 31 – 2 v = 90

De tablas se obtienen los valores: t 90, 0,025 = –1,987 t90,0,975=1,987

f. El estadístico calculado es:

En este caso ( 1 – 2) = 0 pues es de suponer que tratándose de un mismo producto las medias poblacionales son iguales.

g. No hay evidencia estadística, con = 5%, para concluir que ambas medias sean diferentes.

845,0355,0

08,365,3622

Permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error .

El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.

Se usa el estadístico chi-cuadrado para n>50, de lo contrario, se debe aplicar otras técnicas tales como Kolgomorov o Shapiro-Wilks

Ho : f(x) = función densidad de la distribución teórica siendo probada

Ha : f(x) a esa función Ejemplo: e– x

Ho: f(x) = p (x, ) = ––––––– x!

e– x

Ha: f(x) p (x, ) = ———— x!

Se usa el estadístico chi-cuadrado: K

2c = (nk – ek)

2 / ek

PROFESOR 71

MUESTREO ESTADISTICOMUESTREO ESTADISTICO • Confianza en los resultados obtenidos a partir del

análisis de muestras.

• Aleatoriedad y representatividad.

• Una muestra es aleatoria cuando los elementos

que la componen fueron extraídos de una población

en la cual todos sus componentes tuvieron la misma

probabilidad de pertenecer a esa muestra.

• Una muestra es representativa cuando sus

elementos reflejan las características de la población

de la cual fueron extraídos.

• Ambas propiedades están ligadas al tamaño de la

muestra y al método usado para su selección.

PROFESOR 72

PROCEDIMIENTOPROCEDIMIENTO • Identificación de la característica por estudiar y

del marco de muestreo.

• Escogencia del tipo de muestreo

• Determinación del tamaño de la muestra,

mediante la fórmula que especifique el tipo de

muestreo.

• Selección aleatoria de la muestra previa

definición del procedimiento adecuado.

• Escogencia del método de estimación del error

estadístico.

• Cálculo de inferencias, errores y grado de

confianza de las conclusiones.

PROFESOR 73

VENTAJASVENTAJAS •Ahorro de dinero al evitar la inspección 100%, la

cual tiene costos más altos.

•Ahorro de tiempo al disminuir la cantidad por

inspeccionar en relación con la inspección 100%.

•Atención de casos individuales

•Recurso indispensable cuando la inspección es

destructiva.

•Unico método posible cuando la población es

infinita.

•Excelente opción cuando los errores no

muestrales, especialmente humanos, son grandes

e imposibles de reducir.

•Error y sesgo

PROFESOR 74

TIPOS DE MUESTREOTIPOS DE MUESTREO

• Muestreo aleatorio simple

• Muestreo sistemático

• Muestreo estratificado

• Muestreo por conglomerados

• Muestreo de aceptación.

PROFESOR 75

MUESTREO ALEATORIO MUESTREO ALEATORIO

SIMPLESIMPLE • ESTIMACION DE PROMEDIOS

• ESTIMACION DE PROPORCIONES

PROFESOR 76

Considérese un lote de producción de 1000

unidades, cuya varianza en el diámetro de

una de sus partes es 250 mm. Se desea

estimar el promedio del diámetro, a partir de

una muestra, con una confianza del 95% y

con error no mayor a 1 mm. ¿Cuál es ese

tamaño de muestra y su error estándar?

PROFESOR 77

SOLUCIONSOLUCION

N = 1000 E = 1

Z /2 = 1,96 (extraído de Tablas)

2 = 250

Para estimar el promedio de diámetro de esta

pieza, se debe extraer una muestra de 481

unidades. El muestreo tiene un error estándar

de 0,52.

481~2,480)1*1000(250*96,1

250*1000*96,1

52,0481

4811000 2

PROFESOR 78

Un fabricante afirma que el 2,5% de los

productos que entrega el comprador son

defectuosos. Si éste recibe los productos en

lotes de 5000 unidades, ¿cuál debe ser el

tamaño de la muestra por usar para verificar

lo expresado por el fabricante? Use 95% de

confianza y un error no máximo del 1% en la

estimación.

PROFESOR 79

SOLUCIONSOLUCION

E = 0,01 p = 0,025 q = 0,975

N = 5000 (1- ) =0,95 Z /2 = 1,96

Lo anterior significa que para estimar el

porcentaje defectuoso de ese producto, se

debe extraer una muestra de 789 unidades.

Este muestreo tiene un error estándar de

0,005.

789)01,0*5000()975,0*025,0*96,1(

975,0*025,0*5000*96,1

005,0789

975,0*025,0*

7895000**1 n

PROFESOR 80

MUESTREO MUESTREO

ESTRATIFICADOESTRATIFICADO • Los elementos poblacionales se dividen primero en k-

grupos y luego se aplica muestreo aleatorio simple

• Este proceso se llama estratificación y a cada grupo

se le llama estrato.

• Se estratifica porque los elementos poblacionales

presentan heterogeneidad, por lo que la obtención de

conclusiones representativas se hace difícil.

• Las probabilidades de selección de los estratos pueden

ser diferentes y no es necesario que todos los elementos

tengan la misma oportunidad de selección, pero se debe

conocer la probabilidad de cada uno.

• La estratificación se ejecuta de tal manera que exista

cierta homogeneidad entre los elementos de cada grupo

y que queden en igual número en cada estrato.

PROFESOR 81

MUESTREO MUESTREO

ESTRATIFICADOESTRATIFICADO • Afijación proporcional: se basa en el tamaño del

estrato

•Afijación óptima

**ii N

PROFESOR 82

EJEMPLO 2.32 pag. 119EJEMPLO 2.32 pag. 119 La producción de una empresa se ha dividido en tres estratos, de

acuerdo con la fracción defectuosa que presenten. Por registros de

los últimos años se conoce la siguiente información:

–––––––––––––––––––––––––––––––––––––––––––––––––––––––

Estrato No. % Defectuoso No. Lotes i (%)

1 5 ó más 35 0,97

2 1,5 a 4,99 80 0,82

3 Menos de 1,5 15 0,30

–––––––––––––––––––––––––––––––––––––––––––––––––––––––

TOTAL 130 1,25*

* Para el total de la producción.

a. A. Si se desea tomar una muestra de 20 lotes, ¿cuántos lotes de

cada estrato se deben seleccionar?

b. B. Compare los errores estándar correspondientes con el error

estándar de muestreo aleatorio simple.

PROFESOR 83

SOLUCIONSOLUCION Para efectos didácticos este problema se resolverá por

afijación proporcional y por afijación óptima. En

situaciones prácticas se debe escoger el que mejor se

adapte a las condiciones.

• Afijación proporcional

––––––––––––––––––––––––––––––––––––––

Estrato Tamaño de la muestra

–––––––––––––––––––––––––––––––––––––––––––

1 n1 = (20/130) * 35 = 5,38 ³ 5

2 n2 = (20/130) * 80 = 12,3 ³ 12

3 n3 = (20/130) * 15 = 2,3 ³ 3

––––––––––––––––––––––––––––––––––––––––––––

Para completar los 20 lotes seleccionados, se deben

tomar 5 lotes del estrato 1, 12 lotes del estrato 2 y 3

lotes del estrato 3.

PROFESOR 84

SOLUCIONSOLUCION

• Afijación óptima

Los cálculos iniciales para obtener el tamaño de

muestra por este método.

––––––––––––––––––––––––––––––––––––––––––––

Estrato Ni i Ni* i i2 Ni* i2

––––––––––––––––––––––––––––––––––––––––––––

1 35 0,97 33,95 0,94 32,93

2 80 0,82 65,60 0,67 53,79

3 15 0,30 4,50 0,09 1,35

––––––––––––––––––––––––––––––––––––––––––––

TOTALES Ni* i=104,05 Ni* i2= 88,07

–––––––––––––––––––––––––––––––––––––––––––

PROFESOR 85

SOLUCIONSOLUCION Se calculan los tamaños de muestra de la siguiente manera:

b. Comparación de errores

El error estándar para afijación proporcional es:

186,005,104

5,4*20

1361,1205,104

6,65*20

652,605,104

95,33*20

30,0*1582,0*8097,0*35*130

20*130

PROFESOR 86

SOLUCIONSOLUCION El error estándar para muestreo por afijación óptima es:

El error estándar si se usa muestreo aleatorio simple

se calcula así:

Los errores del muestreo por afijación proporcional (0,169) y

óptima (0,164) son parecidos, mientras que el error del

muestreo aleatorio simple (0,26)

05,104*

26,020

20130 2

2.estadistica

Education

Transcript of 2.estadistica

Seminario 2 estadistica

Capítulo 2 estadistica

ACTIVIDAD 2 - Estadistica

Estadistica 2 administracion

Estadistica simple 2

Estadistica 2 sg

ANTOLOGIA ESTADISTICA 2

Clase 2 estadistica

Estadistica 2 Unidad

Estadistica 2 2

Estadistica 2

Estadistica ejercicio 2

estadistica (2).pptx

Estadistica seminario 2

SESION 2 estadistica

2 estadistica-inferencial

Modulo 2 Estadistica

Estadistica descriptiva 2

Estadistica 2 Unas

Estadistica I 2