Seminario 8:Análisis bivariado con variables cuantitativas. Normalidad y linealidad.

Post on 15-Apr-2017

118 views 1 download

Transcript of Seminario 8:Análisis bivariado con variables cuantitativas. Normalidad y linealidad.

Seminario 8:Análisis bivariado con variables cuantitativas. Normalidad y linealidad. Diagrama de dispersión. Coeficientes de correlación de Pearson y Rho de Spearman.

ANA Mª MACHO TORRESGRUPO A MACARENA

EJERCICIO: Determina si existe relación entre las

variables altura y peso del fichero de datos “activos en salud” y si existe determina cómo de fuerte es.

1-. Abrimos R Commander y cargamos el conjunto de datos “Activos en salud”.

2-. Estudiaremos como se relacionan dos variables cuantitativas, peso y altura. Para ello, en primer lugar tenemos que comprobar si siguen o no una distribución normal:

Pearson, si la distribución sigue la normalidad

Rho de Spearman que se emplea cuando la distribución no sigue la normalidad.

• 3-. Observamos si mediante el Diagrama de dispersión se puede ver algún tipo de relación entre las variables. En este caso se observa algo de relación positiva pero no queda muy claro, por lo que realizaremos los coeficientes de correlación.

4-. Antes de elegir un coeficiente de correlación deberemos estudiar si existe distribución normal en las variables (como indicamos anteriormente).

5-. Realizaremos el Test de Shapiro Wilk para estudiar la normalidad.

Establecemos las hipótesis:- H0: La variable (peso o altura) sí sigue la

normalidad.- H1: La variable (peso o altura) no sigue la

normalidad.

ALTURA:

PESO:

En ambos casos, el p-valor < 0,05 por tanto aceptamos la HIPÓTESIS ALTERNATIVA. Esto es debido a que el error que cometeríamos si la aceptáramos es menor al que hemos establecido (0,05).

6.- Otra forma de estudiar la normalidad es mediante graficas. Por ejemplo:

1. Gráfico Q-Q

No siguen la distribución normal, puesto que existen muchos puntos que se salen de las líneas.

2. Box-plot

No siguen una distribución normal, puesto que si siguiesen una distribución normal, media, mediana y moda deberían coincidir y colocarse en el lugar central de la caja, a la misma distancia del rango superior e inferior y esto en ninguna ocurre así.

3. Histograma.

No siguen la distribución normal, puesto que para que las variables siguiesen una distribución normal la gráfica tendría que ser simétrica a un lado y otro de la mediana. En ambos casos, se encuentra desplazada a la izquierda.

6.- Como las variables no siguen la distribución normal, utilizaremos el coeficiente de Test de Spearman.

Establecemos las hipótesis:

-H0: existe correlación entre peso y altura. (Rho entre -1 y 1)

-H1:no existe correlación entre peso y altura (Rho=0)

Como rho es distinto de cero podemos decir que existe correlación entre las variables. Es una correlación positiva, ya que 0,622 está alejado del cero y más cerca del 1.

Por tanto, aceptamos la hipótesis nula: Existe correlación entre peso y altura.