ESTADÍSTICA Y TIC
Seminario 10: Correlación
Consolación López Sousa
2013
EUNUCIADO 1
A partir de una tabla en el programa spss que exponemos a continuación,
debemos realizar los siguientes ejercicios.
Vista de
variables.
EJERCICIOS
1. Calcula la correlación entre la variable peso y la variable hora de dedicación al
deporte. Comenta los resultados
Lo primero que debemos hacer es calcular la correlación de Pearson. Para ello en el
spss seguimos los siguientes pasos:
Analizar Correlación Bivariadas Seleccionamos la variables deseadas (en nuestro
caso peso y hora de dedicación al deporte)
Hemos obtenido una
correlación del 0,410.Eesto
quiere decir que hay una
correlación baja entre las dos
variables.
Hay que tener en cuenta que la
relación entre una y otra será
mayor cuanto más próximo a 1
esté.
2. Calcula el Coeficiente de Correlación de Pearson para las variables nº de
cigarrillos fumados al día y nota de acceso. Comenta los resultados
Realizamos el mismo procedimiento que en el anterior pero en este caso señalamos
otras variables, por un lado nº de cigarrillos y por otro nota de acceso.
En este caso podemos
observar una correlación
de -0,976. Es decir, que la
relación entre ambas
variables es muy buena.
Como la correlación es
negativa indica que al
aumentar una de las
variables disminuye la
otra. Por ejemplo: Al
aumentar el n1 de
cigarrillo disminuye la
nota de acceso.
3. Calcula el coeficiente de correlación de Pearson para las variables peso y altura.
Comenta los resultados.
Volvemos a realizar el mismo procedimiento que en las anteriores, en esta ocasión las
variables son: peso y altura.
En esta ocasión la correlación de
Pearson obtenida es de 0,668.
Esto nos indica que tiene una
relación buena entre estas dos
variables. Su relación es positiva
(directa)
4. Muestra los gráficos en una de las correlaciones.
Para este ejercicio voy a elegir como variables las del segundo caso: nº de cigarrillos al
día y por otro lado la nota de acceso. Los pasos a seguir son los siguientes:
Gráficos Cuadro de diálogos antiguos Dispersión/puntos simple Seleccionamos
en cada eje las variables que vamos a tener en cuenta (en este caso nº cigarrillos y nota
de acceso)
Esta gráfica nos muestra una correlación negativa
entra ambas variables. Tal y como ya habíamos
calculado cono la correlación de Pearson.
ENUNCIADO 2
De una muestra de niños conocemos su edad medida en días y su peso en Kg,
según los resultados de la tabla. Si ambas variables se distribuyen normalmente:
EJERCICIOS
1. Calcular el coeficiente de correlación de Pearson
- Primero vamos a realizar (n=21):
EDADES EN
DÍAS (X)
PESO
CORPORAL
(Y)
XY
0 3,65 0 13.3225 0
O 3,40 0 1.56 0
0 3,175 0 10.0806 0
30 3,9 900 15.21 117
30 4,2 900 17.64 126
30 5,19 900 26.961 115.7
60 5,82 3600 33,8724 349.2
60 5.115 3600 26.1632 306,9
60 4,5 3600 20,25 270
90 5,97 8100 35.6409 537,3
90 5,2 8100 27.04 468
90 6,8 8100 46,24 612
120 6,2 14400 49.9849 848,4
120 7,07 14400 61, 6225 942
150 7,235 22500 52.3452 1085.3
150 6,12 22500 37.4544 918
150 8,1 22500 65.61 1215
180 8,67 32400 75.1689 1560
180 7,75 32400 60.0625 1395
180 6,9 32400 47,1 1242
SUMATORIOS
1890 122,815 245700 772.2541 12892.4
- Calculamos la correlación:
= ( ( )) ( )
√ ( ( ) ( )(( ( ) ))
Tal y como podemos observar es distinta a 0 por tanto nos informa que
existe correlación lineal entre la variable peso (kg) y edad. La correlación
es muy próxima a 1 por tanto existe una correlación positiva muy alta.
- Para ver si el coeficiente de correlación es significativo, es decir si esta
correlación se debe al azar o no:
a) Se calcula el contraste de hipótesis:
p=0 no hay correlación entre ambas variables
p≠0 Hay correlación entre ambas variables
b) Cálculo estadísticos de la t de Student con un grado de libertad de 2:
√(
) = 0,91 √ = 9,567
se compra con el valor de punto crítico obtenido en la tabla t de Student
según n-2 gl y una significación del 0,05 2, 093
9,567> 2,093 Rechazamos la hipótesis nula y aceptamos la alternativa
Esto significa que en la población existe una correlación distinta de 0, por lo
que existe relación lineal entre las variables “edad” y “peso”. Correlación muy
positiva.
2. De una muestra de alumnos conocemos las notas de Matemáticas (X) y de Lengua
(Y), según los resultados de la tabla. Si ambas variables se distribuyen
normalmente, averiguar si existe correlación entre ambas variables en la población
de donde proviene la muestra.
c) Realizamos los mismo procedimientos anteriores:
= ( ) –( )
√ ( ( ) – )( ( ) – )
=
√ ( ) =0
Como =0 podemos interpretar que en la muestra no existe asociación lineal entre
las dos variables
- Para averiguar si el coeficiente de significación es significativo:
p=0 no hay correlación entre ambas variables
p≠0 Hay correlación entre ambas variables
d) Cálculo estadísticos de la t de Student con un grado de libertad de 2:
√(
) = √
= 0
se compra con el valor de punto crítico obtenido en la tabla t de Student
según n-2 gl y una significación del 0,05 2,571
0 < 2,571 Aceptamos la hipótesis nula
Esto significa que en la población no existe relación lineal entre las variables
“edad” y “peso”. Correlación muy positiva.