Seminario 7: Análisis bivariado con variables cualitativas.

15
Seminario 7: Análisis bivariado con variables cualitativas. Ana Mª Macho Torres Subgrupo 3

Transcript of Seminario 7: Análisis bivariado con variables cualitativas.

Page 1: Seminario 7: Análisis bivariado con variables cualitativas.

Seminario 7: Análisis bivariado con variables cualitativas.

Ana Mª Macho TorresSubgrupo 3

Page 2: Seminario 7: Análisis bivariado con variables cualitativas.

Ejercicio 1:• Si queremos conocer si existe asociación entre el consumo de

tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:

• – De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer. • – De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al

nacer.

• 1. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes.

• 2. Establece una hipótesis adecuada para el estudio.• 3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.• 4. Calcula la odds ratio. • 5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?.• 6. Sube los resultados al blog

Page 3: Seminario 7: Análisis bivariado con variables cualitativas.

1-. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes.

FRECUENCIA OBSERVADAS

Niño PESO BAJO

Niño PESO NORMAL

TOTAL

Fumadoras 43 207 250

NO fumadoras 105 1645 1750

TOTAL 148 1852 2000

% Niño PESO BAJO

Niño PESO NORMAL

TOTAL

Fumadoras 17,2% 82,2% 100%

NO fumadoras 6% 94% 100%

Page 4: Seminario 7: Análisis bivariado con variables cualitativas.

2-. Establece una hipótesis adecuada para el estudio.

Antes de poder establecer las hipótesis para el estudio, necesitamos tener una pregunta de investigación. En este caso sería: -¿Influye que la madre sea o no fumadora en el peso del hijo? A partir de esto:

Hipótesis nula: Que la madre sea o no fumadora no influye en el peso del hijo.Hipótesis alternativa: Que la madre sea o no

fumadora influye en el peso del hijo.

Page 5: Seminario 7: Análisis bivariado con variables cualitativas.

3-. Utiliza la prueba de CHI CUADRADO para realizar el contraste de hipótesis.

• En primer lugar, calculamos las frecuencias esperadas:• X1=(250×148)÷2000= 18’5• X2=(250×1852)÷2000= 231’5• X3=(1750×148)÷2000= 129’5• X4=(1750×1852)÷2000= 162’5

• En segundo lugar, aplicamos la fórmula de CHI CUADRADO: χ²=∑(fo-fe)÷fe = ((43-18’5)²÷18’5)+((207-231’5)²÷ 231’5) + ((105-129’5)²÷129’5)+((1645-1620’5)²÷1620’5)= 40’04

• Seguidamente, calculamos el grado de libertad:Grado de libertad= (f-1)×(c-1)= (2-1)×(2-1)= 1

Page 6: Seminario 7: Análisis bivariado con variables cualitativas.

• Una vez obtenidos estos datos, comparamos el valor teórico de la CHI CUADRADO con el valor calculado por nosotros.

• Para ello, debemos buscar el valor teórico en la siguiente tabla, a partir del valor del GL.

Page 7: Seminario 7: Análisis bivariado con variables cualitativas.

• • Chi cuadrado en la tabla teórica: 3,84• • Chi cuadrado en los datos observados: 40,04

• R= El valor de Chi Cuadrado en los datos observados es 40,03, siendo mayor que el resultado de las tablas, 3,84.

40,03>3,84• Por lo tanto, aceptamos la hipótesis alternativa y esto

quiere decir que existen diferencias estadísticamente significativas o lo que es lo mismo, estas diferencias no son debidas al azar. • H1: Existe relación entre el peso de los recién nacidos y que la

madre sea fumadora.

Page 8: Seminario 7: Análisis bivariado con variables cualitativas.

4.- Calcula la Odds Ratio.

• Odds Ratio (OR) = a·d/ c·b

La Odds Ratio permite cuantificar la importancia/fuerza de la asociación entre dos variables. OR= (43÷207)÷(105÷1645)= 3’5

Por lo tanto como el resultado es >1 podemos decir que la presencia del factor exposición (tabaco) se asocia a mayor ocurrencia del evento (nacen niños con bajo peso).

Page 9: Seminario 7: Análisis bivariado con variables cualitativas.

5-. Repite los ejercicios con R Commander.

Page 10: Seminario 7: Análisis bivariado con variables cualitativas.

Observamos:-Las mismas frecuencias frecuencias observadas y en porcentajes. -Resultado de la chi cuadrado, con 1 grado de libertad y un p-valor de 2,483·10^-10.-Odds ratio: 3,2515

Page 11: Seminario 7: Análisis bivariado con variables cualitativas.

• R= Si aceptamos la hipótesis alternativa cometemos un error de 2,483e-10,mucho menor del que nosotros estábamos dispuestos a asumir (0,05).

• Por lo que se acepta la hipótesis alternativa (al igual que dijimos anteriormente)

• En lo referente al valor de la Odds ratio, hemos obtenido el mismo que al hacerlo con la fórmula (3,2515).

Page 12: Seminario 7: Análisis bivariado con variables cualitativas.

Ejercicio 2:• Siguiendo todos los pasos anteriores establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:

• – Practicadeporte (Sí, No) • – Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”

Page 13: Seminario 7: Análisis bivariado con variables cualitativas.

A.-• Formulamos una pregunta de investigación a partir de estas variables que vamos a estudiar:

¿Hay alguna relación entre el sexo y la práctica de deportiva?

• A partir de nuestra pregunta de investigación formulamos:

-H Nula: No existen diferencias en las horas de práctica deportiva entre hombres y mujeres.

-H alternativa: Existen diferencias en las horas de práctica deportiva entre hombres y mujeres.

Page 14: Seminario 7: Análisis bivariado con variables cualitativas.

El p-valor obtenido en la Chi Cuadrado es de 1,2e-05.Esto nos muestra el error que cometeríamos si aceptamos la hipótesis alternativa es 1,2e-05<0,05. Por lo tanto, aceptamos la hipótesis alternativa que dice que existen diferencias en las horas de práctica deportiva entre hombres y mujeres.

La Odds ratio es 0,2048, inferior a 1 lo que significa que la presencia del factor de exposición se asocia a menor ocurrencia del evento, es decir que ser hombre implica una práctica deportiva menor ,Esta afirmación es contraria a lo que habíamos obtenido anteriormente. Sin embargo, si nos fijamos en el intervalo de confianza de la Odds ratio, este se encuentra entre 0,0838 y 0,450, es decir, no se encuentra incluido el 1 y por lo tanto se rechaza la Odds ratio, siguiendo con la hipótesis alternativa.

Page 15: Seminario 7: Análisis bivariado con variables cualitativas.

B.-• ¿Hay relación entre el sexo y la ingesta de fruta? H0: No existe relación entre el sexo y comer fruta. H1: Sí existe una relación entre el sexo y la ingesta de fruta.

Observamos el valor de p-valor, 0,1072>0,05, esto nos permite aceptar la hipótesis alternativa, ya que el error que cometeríamos si la aceptáramos es menor del que hemos asumido (0,05).

H1: Si existe relación entre el sexo y la ingesta de frutas.