3.2 Bondad de ajuste Prueba de ji cuadrada Cuadrada-174.pdf · 3.2 Bondad de ajuste Prueba de ji...
Transcript of 3.2 Bondad de ajuste Prueba de ji cuadrada Cuadrada-174.pdf · 3.2 Bondad de ajuste Prueba de ji...
3.2 Bondad de ajuste
Prueba de ji cuadrada
Chi cuadrada
• La prueba de la chi cuadrada (X2)
permite que el analista determine si el
patrón de frecuencia observado
corresponde o se ajusta al patrón
"esperado“
• Así comprueba "la calidad del ajuste" de la
distribución observada en relación con la
distribución esperada
Prueba de la chi cuadrada para
una muestra única
• Considere un gerente de mercadotecnia de una
cadena de tiendas de electrónica que necesita
probar la eficacia de tres ofertas especiales
(oferta1, oferta 2 y oferta 3), cada una será
válida un mes
• El gerente desea medir el efecto de cada oferta
en los clientes que visitan una tienda de prueba
durante el tiempo en que la oferta es válida
• El número de dichos clientes es:
OFERTA MES CLIENTES POR MES
1 Abril 11700
2 Mayo 12100
3 Junio 11780
TOTAL 35580
El gerente necesita saber si el número de clientes que visitó la
tienda durante el periodo en que estuvo vigente cada oferta
difiere en forma significativa. Este problema se resuelve
aplicando la prueba de la chi cuadrada (X2) a la muestra única,
como sigue:
1. Se especifican la hipótesis nula y la hipótesis alterna
• Hipótesis nula H0: la cantidad de clientes que visitan la tienda en el
curso de las ofertas es igual.
• Hipótesis alterna Ha: hay una diferencia significativa en dicha
cantidad.
2. Se determina el número de visitantes esperados de cada
categoría, si la hipótesis nula fuera correcta (Ei)
En el ejemplo, la hipótesis nula indica que no hay diferencia
en la cantidad de clientes atraídos por las diferentes ofertas
Por lo tanto, es de esperarse que haya un número igual de
clientes en el curso de cada oferta
Por supuesto, se supone que no hay otros factores que
influyan en la cantidad de visitas a la tienda
• Según la hipótesis nula (de que no hay
diferencia), el número esperado de
clientes que visitó la tienda en cada
periodo de ofertas fue 11860
• Y se calcula:
Se calcula el valor de X2
mediante la ecuación:
El resultado es:
• Se elige el nivel de significado a.
Para el nivel de significado a de .05,
el valor tabulado de X2 con dos
grados de libertad (k- 1) es 5.99.
(véase TABLA)
• Como el valor calculado para X2
(7.55) es más alto que el valor
tabulado (véase la tabla para k - 1 =
2, gl, a = .05), se rechazaría la
hipótesis nula
CONCLUSIÓN• Por lo tanto, se concluye con 95 por ciento
de confianza que la respuesta de los
consumidores a las ofertas fue
significativamente distinta
• Por desgracia, esta prueba sólo indica que
la variación general entre las frecuencias
de las celdas es mayor de lo que podría
esperarse de manera casual y no indica si
una celda difiere en forma significativa de
las otras.
EJEMPLO 1:
Se evalúan cuatro variedades de sabores de refrescos de cola. Los resultados fueron los
siguientes:
SABORES PREFERENCIAS
A 104
B 92
C 101
D 87
Pasos a seguir:
Hipótesis:
• H0 = Las preferencias de los clientes son
iguales
• Ha = Las preferencias de los clientes son
diferentes
Numero de preferencias
esperadas para cada sabor (Ei)
Se calcula el valor de X2
Después:• Se elige el nivel de significado a. Para el
nivel de significado a de .05, el valor tabulado
de X2 con dos grados de libertad (k- 1) es
7.81
• Como el valor calculado para X2 (1.94) es
menor que el valor tabulado para k - 1 = 3,
gl, a = .05), se aceptaría la hipótesis nula.
• Por lo tanto, se concluye con 95 por ciento
de confianza que la respuesta de los
consumidores a las ofertas no fue
significativamente distinta
Ejemplo 2:• Un gerente de marketing tiene 5 colores de
donde escoger para el diseño de un
empaque
• Sólo puede usar uno
• ¿Cuál es el preferido del mercado?
• Realizo un muestreo aleatorio de 400
consumidores y obtuvo estos resultados.
• Los resultados sugieren el Azul
• Hay que saber que este resultado no sea
por casualidad
Color del empaque
Preferencia de Los consumidores
Rojo 70
Azul 106
Verde 80
Rosa 70
Naranja 74
TOTAL 400
Color del empaque
Frecuencia observada (O)
Frecuencia Esperada (E) (O – E)2
Rojo 70 80 100 1.25
Azul 106 80 676 8.45
Verde 80 80 0 0.00
Rosa 70 80 100 1.25
Naranja 74 80 36 0.45
TOTAL 400 400 ----- 11.40
Resultados:
• La hipótesis nula da igual preferencia para
todos los colores
• El valor de ji cuadrada es 11.40
• El valor crítico de ji cuadrada con un nivel de
significancia de 0.05 y 4 grados de libertad
es 9.488.
• Se elimina la hipótesis nula
• Los consumidores no prefieren por igual
todos los colores, realmente prefieren el azul
Prueba de la chi cuadrada para dos
muestras independientes
• Los investigadores de mercados a menudo necesitan
determinar si dos o más variables están asociadas
• Tienen que contestar preguntas como:
– "¿Hombres y mujeres se dividen de igual manera
entre las categorías de usuarios fuertes, intermedios
y ligeros?“
– "Los compradores y no compradores se distinguen de
igual modo en grupos de ingresos bajos, intermedios
y altos?"
• En este caso es adecuado aplicar la prueba de la chi
cuadrada (X2) para dos muestras independientes
Ejemplo:
• Una cadena de tiendas de conveniencia desea
determinar la naturaleza de la relación, si es que la hay,
entre el sexo del consumidor y la frecuencia con que
visita las tiendas.
• Se divide la frecuencia de visitas en tres categorías:
– De una a cinco visitas al mes (usuario ligero)
– De seis a 14 visitas al mes (usuario intermedio)
– 15 o más visitas al mes (usuario fuerte)
• A continuación se describen los pasos necesarios para
llevar a cabo esta prueba:
Datos para X2 , prueba con dos muestras independientes
TABLA 3: Datos para X2 , prueba con dos muestras independientes
Visita de mujeres a la tienda de conveniencia Visita de mujeres a la tienda de conveniencia
Número
Xm
Frecuencia
fm %
%
Acumulativo
Número
Xf
Frecuencia
ff %
%
Acumulativo
2 2 4.4 4.4 2 5 7.0 7.0
3 5 11.1 15.6 3 4 5.6 12.7
5 7 15.6 31.1 4 7 9.9 22.5
6 2 4.4 35.6 5 10 14.1 36.6
7 1 2.2 37.8 6 6 8.5 45.1
8 2 4.4 42.2 7 3 4.2 49.3
9 1 2.2 44.4 8 6 8.5 57.7
10 7 15.6 60.0 9 2 2.8 60.6
12 3 6.7 66.7 10 13 18.3 78.9
15 5 11.1 77.8 12 4 5.6 84.5
20 6 13.3 91.1 15 3 4.2 88.7
23 1 2.2 93.3 16 2 2.8 91.5
25 1 2.2 95.6 20 4 5.6 97.2
30 1 2.2 97.8 21 1 1.4 98.6
40 1 2.2 100.0 25 1 1.4 100.0
Total nm = 45 nf = 71
Se formulan la hipótesis nula y
la hipótesis alterna.– Hipótesis nula H0: no hay relación entre el
sexo y la frecuencia de las visitas
– Hipótesis alterna Ha: hay una relación
significativa entre el sexo y la frecuencia de
las visitas
Se colocan las frecuencias observadas (de la muestra) en
una tabla k x r (tabla de tabulación cruzada o de
contingencia); las columnas k se emplean para los
grupos de la muestra y los renglones de r, para las
condiciones o tratamientos. Se calcula la suma de cada
renglón y cada columna. Los totales se registran en los
márgenes de la tabla (se llaman totales marginales).
También se calcula el total para toda la tabla (N).
FRECUENCIA
DE VISITAS MASCULINO FEMENINO TOTALES
1 – 5 14 26 40
6 – 14 16 34 50
15 o más 15 11 26
TOTALES 45 71 116
Se determina la frecuencia esperada para cada celda de la tabla de
contingencia calculando el producto de los dos totales marginales
comunes a esa celda y dividiendo dicho valor entre N
El valor de X2 se distorsiona si más del 20 por ciento de las
celdas tiene una frecuencia esperada inferior al 5 por ciento o si
cualquier celda ofrece una frecuencia esperada inferior a 1. En
esas condiciones, la prueba no debe emplearse.
Calcule el valor de X2 usando
Oij = número observado en la pésima fila de la pésima columna
Eij = número esperado en la pésima fila de la pésima columna
Para el ejemplo
Para concluir:
• El valor tabulado de X2 a nivel de
significado del .05 Y con (r- 1) (k-l) = 2
grados de libertad es 5.99 (véase el
Tabla)
• Como la X2 = 5.12 calculada es inferior al
valor tabulado, no se rechaza la hipótesis
nula y se concluye que no hay diferencia
significativa entre la frecuencia de visitas
de los varones y las mujeres
OTRO EJEMPLO:
Se evalúa si el tipo de envase es
determinante en la preferencia de
jugos y néctares. Los datos son los
siguientes:
Tipo de envase
Hojalata Vidrio
0.170 0.240
0.010 0.110
0.260 1.250
0.070 0.160
0.040 1.270
0.110 0.410
0.150 0.260
0.110 0.350
0.220 0.710
0.120 1.200
0.210 0.670
0.430 0.370
0.000 0.450
0.210 0.060
0.260 0.310
0.070 0.240
0.250 0.000
0.200 0.000
0.000 0.000
0.130 0.600
0.160 1.080
0.040 0.640
0.480 0.850
0.030 1.050
0.250 0.100
0.200 0.000
Pasos a seguir:
1. Se formulan la hipótesis nula y la
hipótesis alterna
• Hipótesis nula H0: no hay relación entre el
tipo de envase y su aceptación
• Hipótesis alterna Ha: hay una relación
significativa entre el tipo de envase y su
aceptación
Se obtienen una tabla de contingencias
Frecuencias Hojalata Vidrio Totales
0 a 0.1 8 6 14
0.01 a 0.2 9 2 11
0.201 a 0.3 7 3 10
0.301 a 0.4 0 3 3
0.401 a 0.5 2 2 4
0.501 a 1.27 0 10 10
Totales 26 26 52
Se determina la frecuencia esperada para cada celda de la tabla de
contingencia calculando el producto de los dos totales marginales
comunes a esa celda y dividiendo dicho valor entre N
FRECUENCIA HOJALATA VIDRIO
0 a 0.1 = 7 = 7
0.01 a 0.2 = 5.5 = 5.5
0.201 a 0.3 = 5 = 5
0.301 a 0.4 = 1.5 = 1.5
0.401 a 0.5 = 2 = 2
0.501 a 1.27 = 5 = 5
Calcule el valor de X2
Conclusión:
• El valor tabulado de X2 a nivel de
significado del .05 y con (r- 1) (k-l) = 5
grados de libertad es 11.0705 (véase
TABLA)
• Como la X2 = 19.33 calculada es mayor al
valor tabulado, se rechaza la hipótesis
nula y se concluye que hay diferencia
significativa entre las preferencias por tipo
de envase