PRUEBAS NO PARAMÉTRICAS
Se utilizan cuando no se conoce la distribución o no se cumplen lossupuestos de la distribución normal
DISTRIBUCIÓN CHI-CUADRADO
Permite relalizar pruebas de bondad de ajuste y pruebas de independencia
Chi Cuadrado de la muestra gl =1
Alfa = Zona de rechazo
gl =10
Distribución Chi-Cuadrado
PRUEBAS DE BONDAD DE AJUSTE
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribución particular planteada como hipótesisSi el ajuste es razonablemente cercano, puede concluirse que sí exite la forma de distribución planteada como hipótesis
Por ejemplo:
Ho: La distribución poblacional es uniforme Ha: La distribución poblacional no es uniforme
Se usa el estadístico Chi-Cuadrado
Oi = Frecuencia de los eventos observados en los datos muestrales
Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
f(X2)
X2
χ2=∑i=1
K (Oi−Ei )2
Ei
cumplir con este requisito.K = Número de categorías o clases
Ejemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperaría que se vendieran 12 botes / mes. La cantidad real que se vendió fue:
Ventas (Oi) Ventas (Ei)Tipo de bote observadas esperadas
A 15 12B 11 12C 10 12D 12 12
DISTR.CHI
Entonces el estadístico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020817
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3
Chi cuadrado de excel = 7.815
El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se aceptala hipótesis nula
PRUEBA.CHI.INVOtro ejemplo:
Ho: Se mantuvo el patrón de 60% créditos comerciales, 30% extranjeros y 10% personalesHa: No se mantuvo el patrón deseado
Tipo de Frec. (Oi) Frec. (Ei)Crédito Observada Esperada
Comercial 62 51 60%Personal 10 8.5 10%
Extranjero 13 25.5 30%
TOTAL 85 85 DISTR.CHI
Estadístico Chi Cuadrado de la muestra = 8.76 Valor P = 0.01252536Chi Cuadrado de excel con alfa 0.1 y gl = K (Categorías) - 1 = 2 es 4.605 Ho se rechaza, no se mantuvo el patrón
PRUEBA.CHI.INVPRUEBA DE NORMALIDAD
Ho: Los niveles de llenado se ditribuyen normalmenteHa: Los niveles de llenado no se ditribuyen normalmente
Frecuencias .esperadas .. . . .. . .. Ei=npi
La presión de llenado de tanques de immersión promedio debe ser de 600 lb con una desviación estándar de 10 lb.Se mide el nivel de llenado de 1000 tanques:
Frec. (Oi) Probabilidad Frec. (Ei)PSI Observada de ocurrencia Esperada
0 - 579.9 20 0.0228 228 580 - 589.9 142 0.1359 135.9590 - 599.9 310 0.3413 341.3600 - 609.9 370 0.3413 341.3610 - 619.9 128 0.1359 135.9620 - arriba 30 0.0228 22.8
TOTAL 1000 1 1000
Por ejemplo para las frecuencias por debajo de 580:
Z = (X-Media) / Desv. Estándar = (580 - 600) / 10 = -2
P(Z<= -2) = 0.0228
Para el caso del área entre 580 y 590:
Z = (X -Media) / Desv. Estándar = (590 - 600) / 10 = -1
P(Z<=-1) = 0.15865525
P(580 < X < 590 ) = 0.1598 - 0.0228 = 0.1359
Etcetera DISTR.CHI
El estadístico Chi Cuadrado de la muestra es = 8.63 Valor P = 0.12476391
El Chi Cuadrado de excel para alfa = 0.05 y K - 1 = 6 - 1 = 5 Gl. Es 11.07
Por tanto no se rechaza Ho y se sigue una distribución normal
NOTA: Si la media y desviación estándar poblacionales no fueran conocidas se hubieran tenido que estimar de los datos muestrales entonces m = 2 y los gl. = K - m - 1 = 3
PRUEBA.CHI.INV
TABLAS DE CONTINGENCIA - PRUEBAS DE INDEPENDENCIA
Permite probar la hipótesis de independencia de dos variables, por ejemplo:para probar la efectividad de un nuevo insecticida por 100 consumidores:
A - Clasifica- B - Ubicación ción Urbano Rural Total f = Filas = 3
> Promedio 20 11 31 c = Columnas = 2Promedio 40 8 48
< Promedio 15 6 21Total 75 25 100
Las hipótesis son:
Ho: La clasificación y la ubicación son independientesHa: La clasificación y la ubicación no son independientes
Las frecuencias esperadas se determinan como sigue:
Eij = (Suma renglón i x Suma columna j ) / Total
E11 = 31 * 75 / 100 = 23.3E12 =48 * 75 / 100 = 36Etcetera
La tabla completa queda como sigue:
A - Clasifica- B - Ubicación ción Urbano Rural Total
> Promedio 20 11 3123.3 7.75
Promedio 40 8 4836 12
< Promedio 15 6 2115.8 5.25
Total 75 25 100DISTR.CHI
El estadístico Chi Cuadrado de la muestra = 3.76 Valor P correspondiente = 0.15259011
El estadístico de excel se determina con alfa = 0.1 para (f-1)(c-1) gl = 2 gl. Dando 4.605
Por tanto no se rechaza Ho y la Ubicación y Clasificación son independientes
PRUEBA.CHI.INV
El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
La presión de llenado de tanques de immersión promedio debe ser de 600 lb con una desviación
NOTA: Si la media y desviación estándar poblacionales no fueran conocidas se hubieran
PRUEBA DEL SIGNO
Es una prueba de hipótesis que compara las distribuciones de dos poblaciones.
Se asume que se tienen datos de antes y después para una muestra y se desea comparar estos conjuntos de datos correspondientes.No se tiene interés en la diferencia sino únicamente en si resulta un signo + o -.
m = número de signos menos y p = número de signos más
Ho: m = p Ho: m <= p Ho: m >= pHa: m<> p Ha: m > p Ha: m < p
Por ejemplo se trata de probar la efectividad de un juego promocional en las ventas en tiendas:
Ventas antes Ventas con Tienda del juego el juego Signo
1 42 40 + Los signos menos indican incremento 2 57 60 - de las ventas ya que se resta el Antes 3 38 38 0 menos el Después4 49 47 +5 63 65 -6 36 39 -7 48 49 -8 58 50 +9 47 47 0
10 51 52 -11 83 72 +12 27 33 -
Se trata de probar la hipótesis:
Ho: m <= pHa: m > p
Ignorando los 0's se tienen 6 signos más y 4 signos menos para un total de n = 10 signos.
Si probabilidad de ambos signos es de pi = 0.5. 0.01953125
De la tabla C del apéndice III o DISTR.BINOM, la probabilidad de 6 o más signos menos es:
P( m >= 6 | n = 10, pi = 0.5) = 1 - P( X <= 5) = 1 - 06230 = 0.3770
o P ( p <= 4 | n = 10, pi = 0.5) = 0.377 DISTR.BINOM(4,10,0.5,verdadero)
Como este valor de P = 0.377 es mayor que un alfa de 0.05 entonces no se rechaza Hoindicando que el juego promocional no incremena las ventas
Para el caso de muestras grandes n >= 30 se puede aproximar al uso de Z, con k = número designos más o menos. Si k < n/2 se utiliza k + 0.5 y en caso contrario se usa k - 0.5 parautilizar la distribución normal que es continua.
Por ejemplo al comparar dos tipos de 10 bandas en su desgaste se obtuvieron,ignorando los 0s:
m = 8, p = 1
Si Ho: m = p Ha: m<> p
Usando la tabla C del apéndice III o la función e Excel DISTR.BINOM
P (p <= 1 | n = 9, pi = 0.5) = 0.0195
o P (m >= 8 | n = 9, pi = 0.5) = 1 - P(m <= 7) = 1 - 0.9805 = 0.0195
Con Alfa /2 = 0.025 siendo mayor al valor P de la probabilidad serechaza la hipótesis Ho y el desgaste es diferente
Usando el estadístico Z se tiene:
Z=k±0. 5−0 .5n
0 .5√n
Por ejemplo al comparar dos tipos de 10 bandas en su desgaste se obtuvieron,ignorando los 0s:
Unidad 14 Pruebas no paramétricasPruebas Chi cuadrEjercicio 1
Frecuencia (Oi)Frecuencia (Ei)Tipos de Créditoobservada esperadas Oi-Ei (Oi-Ei)2 (Oi-Ei)2 / Ei
Autos 55 66.66 -11.66 135.9556 2.03953795Estudiantes 47 66.66 -19.66 386.5156 5.79831383
98 66.66 31.34 982.1956 14.7344074200 199.98 22.5722592
Ho: Los tres tipos de crédito se conceden en la misma proporciónHa: Los tres tipos de crédito no se conceden en la misma proporción
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2Chi cuadrado de excel = 5.99146455
Dado que el valor k1 = 22.57 > 5,99 se rechaza la Ho:
Ejercicio 2
Frecuencia (Oi)Frecuencia (Ei)Tipos de Créditoobservada esperadas Oi-Ei (Oi-Ei)2 (Oi-Ei)2 / Ei
Autos 55 50 5 25 0.5Estudiantes 47 50 -3 9 0.18
98 100 -2 4 0.04200 200 0.72
Ho: Se mantuvo el patrón deseado para créditos generales el 50%, para autos el 25% y para estudiantes 25%Ha: No se mantuvo el patrón deseado para créditos generales el 50%, para autos el 25% y para estudiantes 25%
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2Chi cuadrado de excel = 5.99146455
Dado que el valor k1 = 0.72 menor que 5,99 no se rechaza la Ho:
PRUEBA DE SIGNOS
Ejercicio 6
Publicidad 1 Publicidad 2 Diferencia
Propósitos generales
Propósitos generales
8 7 19 3 6 Mas 115 2 3 Menos 37 8 -19 5 44 5 -13 7 -48 2 69 1 85 3 27 7 08 2 68 2 67 3 49 8 1
Ejercicio 7
Con grasa Sin grasa Diferencia10 15 -512 13 -1 Mas 314 12 2 Menos 618 9 917 17 018 19 -1 n= 95 3 2
21 27 -66 12 -68 14 -6
Ha : m≠pHo : m=p
P (m≤3|n=14 , π=0. 5 )=0 . 287
P (m≥11|n=14,π=0 . 5 )=1−p (m≤10 )=1−0 . 9713 =0. 0287
Debido a que α= 0 . 10/2 = 0 . 05 > 0 . 0287 Se rechaza la Ho .
PRUEBA U DE MANN-WHITNEY
Ejercicio 10
Mujeres Rango Hombres Rango2.12 13.02 23.15 33.42 43.72 54.42 6
4.45 74.87 85.12 9.5 5.12 9.5
5.42 115.72 12
Ha : m≻pHo : m≥p
P (m≻3|n=9 , π=0 . 5 )=0. 2539
P (m≥6|n=9,π=0. 5 )=1−p (m≤5 )=1−0 .7461 =0 . 2539
Debido a que α= 0 . 10/2 = 0 . 05 ≺ 0 . 253 No se rechaza la Ho .
Ho :U 1≥U2
Ha :U 1≺U 2
5.83 136.43 146.49 15
8.17 168.79 178.89 189.02 199.73 20
66.5 143.5
Para un valor de alfa del 10%-1.28155157
Conclusiones: Dado que Z=-2.9 se encuentra en la zona de rechazose rechaza la Ho y se acepta la Ha.
Ejercicio 12
n1= 42n2= 35
Para un valor de alfa del 5% Z=1.96
Conclusiones: Dado que Z=1.96 se encuentra en la zona de rechazose rechaza la Ho y se acepta la Ha.
∑ R1=66 .5
∑ R2=143 .5
U1=10∗10+10∗(10+1 )
2−66 . 5=88.5
U 2=10∗10+10∗(10+1 )
2−143 .5=11. 5
μu=10∗10
2=50
σ u=√10∗10 (10+10+1 )12
=13.22
Z=11. 5−5013 .22
=−2 . 91
∑ R1=1833. 5
∑ R2=1169. 5
U1=42∗35+42∗(42+1 )
2−1833 .5=539 .5
U 2=42∗35+35 (35+1 )
2−1169. 5=930 . 5
μu=42∗35
2=735
σ u=√42∗35 ( 42+35+1 )12
=97 . 74
Z=930 .5−73597 .74
=2
Ho :U 1=U2
Ha :U 1≠U2
CORRELACIÓN DE RANGOS DE SPERMAN
Ejercicio 14
Ingreso Consumo di= x-y x-ycuadrado97 55 1 3 -2 458 63 6 2 4 1669 54 3 4 -1 147 37 8 9 -1 158 45 6 7 -1 138 38 9 8 1 191 71 2 1 1 167 52 5 6 -1 168 53 4 5 -1 147 37 8 9 -1 148 37 7 9 -2 4
32
No existe relación entre las dos variables
Existe relación entre las dos variables
De tabla n apendice 3 Para un valor alfa del 5% y n=11 r=0.6091
Dado que rs= 0.85 mayor que r= 0.6091 la Ho.se rechaza.
Clasificación del ingreso X
Clasificación Consumo Y
α=5%
rs=1−6∑ di2
n ( n2−1 )
rs=1−6(32 )
11 (112−1 )=1−192
1320=0 . 85
Ho : Ps=0
Ha : Ps≠0
U 2=42∗35+35 (35+1 )
2−1169. 5=930 . 5
Ejercicio 15
Tiempo Nota di= x-y x-ycuadrado21 67 2 2 0 018 58 3 4 -1 115 59 5 3 2 417 54 4 5 -1 118 58 3 4 -1 125 80 1 1 0 018 14 3 9 -6 36
4 15 8 8 0 06 19 6 7 -1 15 21 7 6 1 1
45
No existe relación entre las dos variables
Existe relación entre las dos variables
De tabla n apendice 3 Para un valor alfa del 10% y n=10 r=0.5515
Dado que rs= 0.72 mayor que r= 0.5515 la Ho.se rechaza.
Clasificación del Tiempo X
Clasificación Nota Y
Ho : Ps=0
Ha : Ps≠0
rs=1−6 (45 )
10 ( 102−1 )=1−270
990=0 . 72
PRUEBA DE KRUSKAL-WALLIS
Ejercicio 18
Planta 1 Rango Planta 2 Rango Planta 3 Rango25 6 31 12.5 29 10.536 15 28 8.5 28 8.538 16 39 17 22 431 12.5 41 18 26 729 10.5 21 3 24 533 14 20 1.5 20 1.5
74 60.5 36.5
Para un alfa de 5% k-1 gl
Dado que la Ho no se rechaza.
Ejercicio 19
K=12n (n+1 ) [∑ Ri
2
ni]−3 (n+1 )
K=1218 (18+1 ) [742
6+60 . 52
6+36 .52
6 ]−3 (18+1 )=0 .035(912 . 66+610 . 041+222. 04 )−57=0. 035 (1744 .741 )−57=4 .06
K0 .05 ,2=5 . 991
K=4 . 06≺5.991
Mezcla 1 Rango Mezcla 2 Rango Mezcla 3 Rango3 2.5 3 2.5 10 25.56 7.5 4 4 8 149 21.5 8 14 9 21.55 5 9 21.5 8 146 7.5 7 9.5 7 9.5
44 51.5 84.5
Para un alfa de 5% k-1 gl
Dado que la Ho se rechaza.
Determinación de diferencias estadísticamente significativas
Valor critíco Ck
Dado que No hay diferencia entre la Mezcla 1 y la Mezcla 2
K=1220 (20+1 ) [442
5+51. 52
5+84 . 52
5+94 . 52
5 ]−3 (20+1 )=0 . 028(387 . 2+530 . 45+1428. 05+4465 . 12)−63=
K=0.028 (6810.82 )−63=127 .7
K0 .05 ,3=7 . 815
K=127 . 7≻7 ,815
R1=445
=8 .8 R2=51 . 5
5=10 . 3R3=
84 . 55
=16 . 9R4=94 . 5
5=18 . 9
R1−R2=8 .8−10 . 3=−1 .5
R1−R3=8 .8−16 .9=−8 .1
R1−R4=8 .8−18.9=−10 .1
R2−R3=10 .3−16 . 9=−6 . 6
R2−R4=10 . 3−18 . 9=−8 . 6
R3−R4=16 . 9−18 . 9=−2
Ck=√7 .815 [20 (20+1)12 ] [1
5+
15 ]=10 .45
R1−R2=−1.5≺10 . 45
Dado que No hay diferencia entre la Mezcla 1 y la Mezcla 3
Dado que No hay diferencia entre la Mezcla 1 y la Mezcla 4
Dado que No hay diferencia entre la Mezcla 2 y la Mezcla 3
Dado que No hay diferencia entre la Mezcla 2 y la Mezcla 4
Dado que No hay diferencia entre la Mezcla 3 y la Mezcla 4
R1−R2=−1.5≺10 . 45
R1−R3=−8 . 1≺10. 45
R1−R4=−10 .1≺10 . 45
R2−R3=−6 . 6≺10 .45
R2−R4=−8. 6≺10 . 45
R3−R4=−2≺10 . 45
Unidad 14 Pruebas no paramétricas
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2
Ho: Se mantuvo el patrón deseado para créditos generales el 50%, para autos el 25% y para estudiantes 25%Ha: No se mantuvo el patrón deseado para créditos generales el 50%, para autos el 25% y para estudiantes 25%
El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 2
pm
P (m≥11|n=14,π=0 . 5 )=1−p (m≤10 )=1−0 . 9713 =0. 0287
Debido a que α= 0 . 10/2 = 0 . 05 > 0 . 0287 Se rechaza la Ho .
P (m≥6|n=9,π=0. 5 )=1−p (m≤5 )=1−0 .7461 =0 . 2539
Debido a que α= 0 . 10/2 = 0 . 05 ≺ 0 . 253 No se rechaza la Ho .
Para un valor de alfa del 10%
Conclusiones: Dado que Z=-2.9 se encuentra en la zona de rechazose rechaza la Ho y se acepta la Ha.
Para un valor de alfa del 5% Z=1.96
Conclusiones: Dado que Z=1.96 se encuentra en la zona de rechazose rechaza la Ho y se acepta la Ha.
μu=10∗10
2=50
σ u=√10∗10 (10+10+1 )12
=13.22
Z=11.5−5013 . 22
=−2 .91
μu=42∗35
2=735
σ u=√42∗35 ( 42+35+1 )12
=97 . 74
Z=930 .5−73597 .74
=2
¿El coeficiente de correlación de rangos de Spearmansugiere alguna relación?
No existe relación entre las dos variables
α=5%
¿El coeficiente de correlación de rangos de Spearmansugiere alguna relación?
No existe relación entre las dos variables
α=10 %
Ejercicio 19
K=1218 (18+1 ) [742
6+60 . 52
6+36 .52
6 ]−3 (18+1 )=0 .035(912 . 66+610 . 041+222. 04 )−57=0. 035 (1744 .741 )−57=4 .06
Mezcla 4 Rango Mezcla 1 Rango Mezcla 28 14 3 1.5 3
10 25.5 6 5.5 411 27 9 15 8
8 14 5 4 98 14 6 5.5 7
94.5 31.5
Para un alfa de 5% k-1 gl
Dado que la Ho no se rechaza.
Lo cual quiere decir que no se observó una diferencia significativa en los incrementos en peso de los cachorros al 5%
K=1220 (20+1 ) [442
5+51. 52
5+84 . 52
5+94 . 52
5 ]−3 (20+1 )=0 . 028(387 . 2+530 . 45+1428. 05+4465 . 12)−63= K=1220 (20+1 ) [31 .52
5+372
5+60 .52
5+76 .52
5 ]−3 (20+1 )=0 . 028(198 . 45+273 . 8+732 . 05+1155. 2)−63=
K=0.028 (2359.5 )−63=3 . 066
K0 .05 ,3=7 . 815
K=3 .066≺7 ,815
Rango Mezcla 3 Rango Mezcla 4 Rango1.5 10 17.5 8 10.5
3 8 10.5 10 25.510.5 9 15 11 19
15 8 10.5 8 10.57 7 7 8 10.5
37 60.5 76
Ho: Todas los incrementos en el peso permanecen igualesHa: No todos los incrementos en el peso permanecen iguales
Dado que la Ho no se rechaza.
Lo cual quiere decir que no se observó una diferencia significativa en los incrementos en peso de los cachorros al 5%
K=1220 (20+1 ) [31 .52
5+372
5+60 .52
5+76 .52
5 ]−3 (20+1 )=0 . 028(198 . 45+273 . 8+732 . 05+1155. 2)−63=
PRUEBA U DE MANN WHITNEY
Contrasta la igualdad de dos distribuciones poblacionales, se basa en la suposición de que dos muestras aleatorias se sacan independientemente de variables continuas. Es la contraparte dela prueba paramétrica t aunque no requiere que las diferencias de las muestras estén distribuidas normalmente.
La prueba puede realizarse para analizar la igualdad de las dos medias o medianaspoblacionales. Para el caso de medias, se debe asumir que las poblaciones son simétricasy que tienen la misma varianza, si el supuesto de simetría se elimina entonces la medianareemplaza a la media como estadístico de prueba.
Los datos se ordenan en forma ascendente:
Ejemplo: Se trata de probar si el tiempo de enfriamiento de piezas de barro después de serhorneadas con dos métodos diferentes presenta los mismos resultados.
Método 1: 27, 31, 28, 29, 39, 40, 35, 33, 32, 36, 37, 43Método 2: 34, 24, 38, 28, 30, 34, 37, 42, 41, 44
Ordenado los datos se tiene:
Método 1 Rango Método 2 Rango 24 1
27 228 3.5 28 3.5 Promedio de rangos correspondientes29 5
30 631 732 833 9
34 10.534 10.5
35 1236 1337 14.5 37 14.5 38 16
39 1740 18
41 1942 20
43 2144 22
Suma 130 123rangos
Se calcula el estadístico U de Mann Whitney para la primera y segunda muestras,así como la media y la distribución estándar de la distribución U:
U1 = (12)(10) + (12)(12 + 1) / 2 - 130 = 68
U2 = (12)(10) + (10)(10 + 1) / 2 -123 = 52
Media U = (12)(10) / 2 = 60
Desv. Est. U = 15.17
Valor de Z para normalizar U = (Ui - Media U ) / Desv. Est. U
Las hipótesis son:
Ho: Media 1 = Media 2Ha: Media 1 <> Media 2
Se puede utilizar de manera arbitraria U1 o U2, escogiendo U2 se tiene:
Zu2 = (52 - 60) / 15.17 = - 0.53 Valor P = 0.29805597
SI alfa es 0.1 entonces Z de excel para alfa entre dos es -1.65
Por tanto no se rechaza Ho
NOTA: Para pruebas de una cola, si se trata de cola derecha, se utiliza el valor de U que sea mayor y para cola izquierda el valor de U que sea menor.
Estadístico . Pr imera .muestra .. . . .U 1=n1n2+n1 (n1+1 )2
−∑ R1
Estadístico .Segunda .muestra . . .. .U2=n1n2+n2(n2+1)2
−∑ R2
Media .de . la .distribución ..U . . .. . . .. μu=n1n2
2
Desviación.estándar .de .. .U . .. . . .. . .σu=√n1 n2( n1+n2+1)12
Contrasta la igualdad de dos distribuciones poblacionales, se basa en la suposición de que dos
Top Related