Seminario 8

24
Seminario 8: Chi cuadrado de Pearson

Transcript of Seminario 8

Page 1: Seminario 8

Seminario 8: Chi cuadrado de Pearson

Page 2: Seminario 8

• El estadístico Chi cuadrado de Pearson se puede utilizar para: – Estudiar la relación o independencia de una variable

con más de una categoría • Es una prueba de conformidad o bondad de ajuste

– Estudiar la relación entre dos o más muestras o poblaciones • Es una prueba de homogeneidad

– Entre dos o más variables de una población de la que hemos extraído una muestra • Es una prueba de independencia o relación

Recordemos que…

Page 3: Seminario 8

La prueba o estadístico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos:

– Está dentro de lo normal y probable, es decir, la diferencia que observamos en los datos es debida al azar • Recordemos que la Ho establece que no hay diferencia

o lo que es lo mismo hay igualdad. • Aceptamos la Ho

– La diferencia que observamos es debida a algo más • Rechazamos la Hipótesis Nula

Page 4: Seminario 8

Condiciones para aplicarla…

• Las observaciones deben ser independientes. – Es decir, al clasificar los sujetos en cada casilla debe haber sujetos

distintos; no puede haber sujetos repetidos en más de una casilla. Ni los sujetos se pueden clasificar en más de un lugar.

• Utilizar en variables cualitativas • Más de 50 casos • Las frecuencias teóricas o esperadas en cada casilla de

clasificación no deben ser inferiores a 5. – Es tolerable que un 20% de las casillas tengan una frecuencia teórica

inferior a 5, pero no deben ser muy inferiores.

• Si no se cumplen los requisitos – Utilizar el estadístico de Fisher – Corrección de continuidad de Yates

• Actualmente discutido por bastantes autores y se puede no tener en cuenta

• Conviene mencionarla porque responde a una práctica muy generalizada y figura en muchos textos.

Page 5: Seminario 8

Recordar …

• Frecuencia observada: la que recogen los datos

• Frecuencia esperada: la que observaríamos si no hubiera relación

• Grados de libertad…

Se trata de comparar las frecuencias observadas y las frecuencias esperadas

Page 6: Seminario 8

Grados de libertad

• Número de valores o datos que pueden variar libremente dado un determinado resultado

• Si un criterio de clasificación. Ejemplo: 300 sujetos están clasificados según elijan A, B o C (tres categorías de clasificación) – Grados de libertad = k -1 (número de categorías menos una) – Grados de libertad serán 3-1 = 2

• Si dos criterios de clasificación. - Grados de libertad = (f -1)(c -1)

(número de filas menos una) por (número de columnas menos una).

Page 7: Seminario 8

Si comparamos una variable…

• Si se da el caso que las frecuencias esperadas sean pequeñas o menores de 5… no se puede utilizar el estadístico Chi – ¿Qué hacemos?

• Reagrupar los valores de las categorías

• Utilizar

– la Prueba exacta de Fisher

– Corrección de Yates

Page 8: Seminario 8

La Chi… para comparar dos variables…

• Para comparar dos variables cualitativas: tabla de contingencia

• Poner las frecuencias observadas (datos) • Calcular las frecuencias teóricas o esperadas

– Es importante caer en la cuenta de que la suma de las frecuencias observadas debe ser igual a la suma de las frecuencias teóricas • Estas sumas (de todas las frecuencias observadas y de todas las

frecuencias teóricas) con frecuencia no son idénticas porque redondeamos los decimales, pero deben ser muy parecidas

• Calcular los grados de libertad

Page 9: Seminario 8

Calcular los grados de libertad

• Los grados de libertad son igual al número de valores o datos que pueden variar libremente dado un determinado resultado (o resultados). – Grados de libertad = k -1 (número de categorías menos una)

• Si un criterio de clasificación – Ejemplo si hay 300 sujetos están clasificados según elijan A, B o C (tres

categorías de clasificación) • Grados de libertad serán 3-1 = 2.

• Si dos criterios de clasificación – Grados de libertad = (f -1)(c -1)

(número de filas menos una) por (número de columnas menos una).

Page 10: Seminario 8

Los software informáticos… nos facilitan la vida

• Analizar------Estadísticos Descriptivos------

Tablas de contingencia

• Elegir las dos variables categóricas.

• Contrasta la hipótesis de que las dos variables a contrastar son independientes.

Page 11: Seminario 8

Chi en SPSS

Page 12: Seminario 8
Page 13: Seminario 8
Page 14: Seminario 8

Ejercicio casa blog

Una enfermera analiza las historias de enfermería de 292 mujeres y de 192 hombres que cuidan a familiares dependientes. De entre todas las historias revisadas, observa que 450 personas presentan cansancio en el rol de cuidador, de las cuales 168 son hombres y 282 mujeres. Trabaja con un nivel de confianza del 99%.

¿Existe relación entre tener cansancio en el rol del cuidador y el sexo?

Page 15: Seminario 8

¿Podemos aplicar chi cuadrado?

• Se trata de variables cualitativas, sexo y cansancio.

• Son excluyentes (dos observaciones independientes).

• En la tabla de frecuencias esperadas no puede haber valores menor que 5.

Page 16: Seminario 8

Procedimiento

1. Establecer la hipótesis nula.

2. Realizar una tabla con los datos observados o frecuencias observadas.

3. Calcular los grados de libertad.

4. Calcular las frecuencias esperadas o teóricas.

5. Utilizar el estadístico.

6. Compararlo con las tablas al nivel de significación fijado.

7. Aceptar o rechazar la H0.

2

2 ( )fo ft

ft

Page 17: Seminario 8

1. Formular las hipótesis.

– Ho: No existe relación entre tener cansancio en el rol del cuidador y el sexo (no hay diferencias).

– H1: Existe relación entre tener cansancio en el rol del cuidador y el sexo.

Page 18: Seminario 8

2. Tabla de frecuencias observadas

Sí presentan cansancio

No presentan cansancio

Total

Mujeres 282 10 292

Hombres 168 24 192

Total 450 34 484

Page 19: Seminario 8

Para calcular las frecuencias observadas…

Page 20: Seminario 8

3. Tabla de frecuencias esperadas (teóricas)

Sí presentan cansancio

No presentan cansancio

Total

Mujeres 271,5 20,5 292

Hombres 178,5 13,5 192

Total 450 34 484

Page 21: Seminario 8

4. Aplicar la fórmula 2

Celda a = (282 – 271,5)2 / 271,5 = 0,41

Celda b = (10 – 20,5)2 / 20,5 = 5,38

Celda c = (168 – 178,5)2 / 178,5 = 0,62

Celda d = (24 – 13,5)2 / 13,5 = 8,17

X2 = = 0,41 + 5,38 + 0,62 + 8,17 = 14,58

2

2 ( )fo ft

ft

Page 22: Seminario 8

5. Calcular los grados de libertad: (2-1)(2-1) = 1

6. Buscar en la tabla de la a un nivel de significación del 0,01 y con un grado de libertad el valor es = 6,64

2

Page 23: Seminario 8
Page 24: Seminario 8

7. Conclusiones …

X2 real= 14,58 (chi observada en los datos o que obtenemos mediante la fórmula)

X2 0,01; 1 (teórica) = 6,64 (la que habría esperar si no hubiera

diferencia)

Puesto que la X2real > X2teórica, se rechaza la Hipótesis nula. Lo que quiere decir que si existe relación entre tener cansancio del rol de cuidador y el sexo. Al rechazar la hipótesis nula estamos diciendo que las diferencias encontradas son estadísticamente significativas, lo que es lo mismo, no es debido al azar.