Seminario 7
-
Upload
beatriz-rojas-jimenez -
Category
Technology
-
view
45 -
download
0
Transcript of Seminario 7
![Page 1: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/1.jpg)
Seminario VII: Análisis bivariado con variables
cualitativas (proporciones)
Beatriz Rojas JíménezEstadística y Tic’s
1º Enfermería Virgen del Rocío; subgrupo 16Curso: 2015/16
![Page 2: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/2.jpg)
IntroducciónEn R Commader podemos realizar operaciones diferentes. En este caso vamos a realizar operaciones para dos o más variables cualitativas relacionadas (tablas de contingencia, chi-cuadrado y odds ratio). 1) Contrastar los resultados del ejercicio realizado manualmente con los resultados en R
Commander: Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer;
estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.
2) Establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:
• Practicadeporte (Sí, No)• Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”,
4- “Tres o más veces a la semana”, 5 “A diario”
![Page 3: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/3.jpg)
Ejercicio 1: Contrastar los resultados del ejercicio realizado manualmente con los resultados en R Commander
Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al
nacer.
![Page 4: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/4.jpg)
1º) Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes.
V1 = MUJERES V2 = NIÑOS
SÍ bajo peso al nacer
NO bajo peso al nacer
TOTAL
F1 = Fumadoras a = 43 b = 207 250 (a+b)
F1% 17’2 82’8 100
F2 = no fumadoras
c =105 d = 1645 1750 (c+d)
F2% 6 94 100
TOTAL 148 (a+c) 1852 (b+d) N =2000
TOTAL% 7’4 92’6 100
![Page 5: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/5.jpg)
2º) Establece una hipótesis adecuada para el estudio.
¿Existe asociación entre el consumo de tabaco de las mujeres y la probabilidad de tener hijos con bajo peso al nacer?• H0 = No existe asociación entre el consumo de tabaco en
mujeres y tener hijos con bajo peso.• H1 = Existe asociación entre el consumo de tabaco en
mujeres y tener hijos con bajo peso.
![Page 6: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/6.jpg)
3º) Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.
A. Primero debemos calcular las frecuencias esperadas a partir de las observadas:• FE11 = = = 18’5• FE12 = = = 231’5• FE21 = = = 129’5• FE22 = = = 1620’5
![Page 7: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/7.jpg)
B. Ahora ya podemos calcular la chi-cuadrado a partir de la fórmula:
X2 = ∑ = + + + = 40’04436402
V1 = MUJERES V2 = NIÑOSSÍ bajo peso al nacer
NO bajo peso al nacer
TOTAL
F1 = Fumadoras a = 43 (FE = 18’5) b = 207 (FE = 231’5)
250 (a+b)
F1% 17’2 82’8 100F2 = no fumadoras c =105 (FE = 129’5) d = 1645 (FE =
1620’5)1750 (c+d)
F2% 6 94 100TOTAL 148 (a+c) 1852 (b+d) N =2000TOTAL% 7’4 92’6 100
![Page 8: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/8.jpg)
C. Calculamos los grados de libertad:
g. i. = (Número de filas – 1)*(Número de columnas – 1) = (2 – 1)*(2 – 1) = 1
Es una variable dicotómica, tabla 2x2.
![Page 9: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/9.jpg)
D. Buscamos la chi-cuadrado teórica en las tablas de chi-cuadrado asociada al margen de error establecido (0’05)
X2 = 3’8415• Aceptamos H0 X2 real < X2 teórica (no existe relación entre las variables).• Rechazamos H0 X2 real > X2 teórica (existe relación entre las variables).Por tanto, en nuestro caso 40’044 > 3’8415 Rechazamos la hipótesis nula (H0) Existe relación entre las variables.
![Page 10: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/10.jpg)
4º) Calcula la Odds ratio
OR = = = 3’2544
• Si OR = 1 no hay asociación, son independientes• Si OR > 1 la presencia del factor se asocia a mayor ocurrencia del evento.• Si OR < 1 la presencia del factor se asocia a menor ocurrencia del evento.
En nuestro caso, 3’2544 > 1 por tanto, la presencia del factor se asocia a mayor ocurrencia del evento.
![Page 11: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/11.jpg)
5º) Repite el ejercicio con R Commander ¿Los resultados son los mismos?
Como siempre que empezamos con R Commander: establecemos el directorio de trabajo y cargamos los datos que vamos a utilizar.A) Estadísticos Tablas de contingencia Introducir y analizar una tabla de doble entrada Introducir datos en la tabla 2x2
![Page 12: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/12.jpg)
Aquí podemos comprobar como:
• X2 = 40’044.
• “P”
• FE
• Test exacto de Fisher’s
• Odds ratio = 3’25158
Por tanto, podemos ver como los valores son similares a los resultados obtenidos manualmente (aceptamos H1).
![Page 13: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/13.jpg)
Ejercicio 2:
Establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:• Practicadeporte (Sí, No)• Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por
semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”
![Page 14: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/14.jpg)
Abrimos de nuevo R Commander, establecemos el directorio de trabajo y cargamos los datos de “activossalud” (como en los seminarios anteriores).1º) Realizamos una tabla de contingencia: Estadísticos Tablas de contingencia Tabla de doble entrada… Elegir variables (sexo-practicadeporte)
![Page 15: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/15.jpg)
Tenemos una chi-cuadrado de 19’163.Sabiendo que la chi-cuadrado teórica es 3’84 establecemos que:Como real > X2 teórica (19’163 > 3’84), rechazamos la hipótesis nula (H0) y por tanto, aceptamos la hipótesis alternativa (H1). Esto significa que existe asociación entre las variables “sexo” y “practicadeporte”.
![Page 16: Seminario 7](https://reader035.fdocuments.es/reader035/viewer/2022070510/58a7979e1a28ab5f6c8b6309/html5/thumbnails/16.jpg)
2) Ahora cambiamos las variables y elegimos, “sexo” y “fruta”
En este caso, X2 real > X2
teórica (7’6036>3’84) por tanto, rechazamos la hipótesis nula (H0) y
podemos afirmar que las variables “sexo” y “fruta”
están relacionadas.