CORRELACIÓN
María Jesús Rodríguez Delgado
Seminario 8
Determina si existe relación entre las variables
altura y peso del fichero de datos “activos en
salud” y si existe determina cómo de fuerte es
Para resolver el ejercicio usamos R commander, y
gráficos;
Usamos gráfica de comparación de cuantiles para
poder confirmar si ambas variables siguen una
distribución normal:
Comparamos ambas gráficas de las variables altura y peso, y podemos
observar numerosos puntos que se encuentran fuera de la línea
marcada. Esto nos indica una ausencia de la normalidad.
Ninguno de los dos gráficos sigue una simetría típica de una
distribución normal, de los gráficos Q-Q vistos en el temario.
De igual manera, en los boxplot no se encuentra la caja en la parte intermedia.
No sigue una distribución normal
1. Por lo tanto, tras haber comparado los datos
podemos asegurar que no siguen una
distribución normal.
2. A continuación vamos a estudiar que tipo de
relación existe entre ellas y si existe, que de
fuerte es esta relación.
Para ello vamos a crear un diagrama de
dispersión entre ambas variables:
Línea de
mínimos
cuadrados
Observando el gráfico anterior podemos
confirmar que no existe una relación entre
ambas variables, aunque es difícil establecer
una relación a simple vista
Por lo que vamos a contrastarla
numéricamente a través del Test de
correlación
Una vez en la matriz de correlaciones, introducimos las dos variables
del problema, peso y altura; señalamos el coeficiente de Pearson, ya
que se trata de dos variables cuantitativas.
Repetimos el
mismo proceso,
ahora con el
Coeficiente de
Spearman
Los dos resultados son muy semejantes: 0.63
aproximadamente (63%)
Estos datos quieren decir que existe una
correlación entra las dos variables de peso y
altura. Esta correlación es positiva.
De esta modos:
- Aceptamos H0: existe correlación entre altura y
peso (Rho entre -1 y 1)
-Rechazamos H1: no existe correlación entre
altura y peso (Rho=0)