Seminario 8 blog

Post on 15-Feb-2017

60 views 1 download

Transcript of Seminario 8 blog

SEMINARIO 8.

Análisis bivariado con variables cuantitativas.

Noelia Marmesat EspejoGrupo 14

EJERCICIO

Determina que si existe relación y cómo de fuerte es entre las variables “altura”

y “peso”.

Paso 1: Abriremos el programa R y cargaremos el archivo con el que queremos trabajar, que en este caso es “activossalud”. Seleccionaremos en la barra superior la opción “Datos”, y posteriormente “Cargar conjunto de

datos”.

Paso 2: Seleccionamos la carpeta y el archivo que deseamos.

Hemos elegido las variables “altura” y “peso”. El procedimiento que debemos seguir es el siguiente:

1º) Determinar el nivel de medición de las variables y el número de variables a analizar. Debemos identificar la naturaleza de las variables. En este caso, ambas son variables cuantitativas, es

decir, adoptan valores numéricos y, por tanto, se pueden realizar operaciones aritméticas con ella.

2º) Tenemos que comprobar si estas variables siguen una distribución normal o no.Para ello, optaremos por un método gráfico, el gráfico QQ, aunque también sería válida la prueba de

Kolmogorov-Smirnov, puesto que en nuestra muestra el número de individuos es superior a 50. También podríamos comprobar la normalidad de las variables mediante histogramas.

3º) Seleccionar la prueba estadística más adecuada.

4º) Finalmente, verificar si hay relación entre las variables o, de lo contrario, no.

Paso 3: Seleccionamos en la pantalla de R commander, en la barra superior, la opción “Gráficas”, y posteriormente “Gráficas de comparación de cuantiles”.

Paso 4: Seleccionamos la variable “altura”.

Paso 5: Seleccionamos la pestaña “Opciones”, comprobamos las opciones que están seleccionadas y hacemos clic en “Aceptar”.

Paso 6: Obtenemos el siguiente gráfico q-q.

De este gráfico podemos deducir que la variable “altura” no presenta una distribución normal. Puesto que hay una parte de los puntos que no se encuentran dentro del intervalo de confianza.

Paso 7: Realizamos lo mismo, pero en este caso, para la variable “peso”, y obtenemos el siguiente gráfico q-q.

De este gráfico podemos deducir que la variable “peso” tampoco presenta una distribución normal. Puesto que hay una parte de los puntos que no se encuentran dentro del intervalo de confianza.

Paso 8: Seleccionaremos la prueba estadística más adecuada.

Dado que ninguna de las dos variables presenta una distribución normal, pasaremos a realizar el test Rho de Spearman con el fin de comprobar si existe alguna relación entre ellas y estudiar la linealidad de estas variables.

Paso 9: Seleccionamos en la barra superior “Gráficas” y posteriormente “Diagrama de dispersión”.

Paso 10: Seleccionamos las variables “altura” y “peso”.

Paso 11: Seleccionamos la pestaña “Opciones” y marcamos la opción “Línea de mínimos cuadrados”. Por último hacemos clic en “Aceptar”.

Paso 12: Obtenemos el siguiente diagrama de dispersión.

Una vez obtenido el diagrama de dispersión, podemos afirmar que existe cierta relación entre ambas variables, ya que hay una distribución regular de los puntos alrededor de la línea de mínimos cuadrados (pendiente de la línea).

Ambas variables tiene una relación positiva, es decir, a medida que aumenta el valor de la variable “x” (altura), aumenta la variable “y” (peso), a mayor altura, mayor peso.

Paso 13: Ahora estudiaremos la fuerza de relación que existe entre ambas variables, a través de los coeficientes de relación. En este caso, estas variables no son normales, por lo tanto optaremos por el

coeficiente Rho de Spearman.

Paso 14: Seleccionamos las variables “altura” y “peso”. Hacemos clic en “Aceptar”.

Paso 15: Obtenemos los siguientes datos.

Los valores del coeficiente de correlación van de 0 a 1, (siendo 0 ausencia de relación y 1 relación perfecta). El resultado del test Rho de Spearman es 0’6224114, por lo que se confirma la información proporcionada por el diagrama, hay buena relación entre ambas variables.

¡Espero que os haya servido de ayuda!