El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

28
Estadística y Probabilidad II El Coeficiente de Correlación Lineal y la Recta de Mínimos Cuadrados Ciclo escolar 2013-2014

description

El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Transcript of El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Page 1: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Estadística y Probabilidad II

El Coeficiente de Correlación Lineal

y la Recta de Mínimos Cuadrados

Ciclo escolar 2013-2014

Page 2: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Relación entre variables.

• En la práctica es frecuente encontrar una relación entre dos o más variables. Por ejemplo, el peso de los hombres adultos depende en cierto grado de su estatura, las circunferencias de los círculos depende en cierto grado de su radio, y la presión de una masa de gas depende de su temperatura y volumen.

• Entonces, es mejor expresar esta relación en forma matemática, lo cual sucede determinando una ecuación que enlaza las variables.

Page 3: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Ajuste de curvas.

• Para hallar una ecuación que relacione variables, un primer paso es recolectar datos que muestran los valores correspondientes de las variables en consideración. Por ejemplo, supóngase que y denotan la estatura y peso de hombres adultos, respectivamente; entonces, una muestra de individuos revelaría las estaturas , , ... , , asi como los pesos correspondientes , , ... , .

• El próximo paso es marcar los puntos , , ... , sobre un sistema de coordenadas rectangulares. El conjunto resultante se llama a veces diagrama de dispersión. A partir del diagrama de dispersión es posible, con frecuencia visualizar una curva suave que aproxima los datos.

X Y

1X 2X NX

1Y 2Y NY 11,YX 22 ,YX

NN YX ,

Page 4: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Distintos tipos de diagramas.

Page 5: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Teoría de correlación.

• Si todos los valores de las variables satisfacen una ecuación exactamente, decimos que las variables están perfectamente correlacionadas o que hay correlación perfecta entre ellas.

Page 6: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Correlación Lineal.

• Si e son las dos variables de cuestión, un diagrama de dispersión muestra la localización de los puntos sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en una recta, como en la figura (a) y (b), la correlación se llama lineal. En tales casos, una ecuación lineal es adecuada a efectos de regresión.

X Y

),( YX

a) Correlación Lineal Directa (positiva).

a) Correlación Lineal Inversa (negativa).

a) Correlación Nula.

Page 7: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Correlación Lineal.

• Si Y tiende a crecer cuando X crece, como en la figura (a), la correlación se dice positiva, o directa.

• Si Y tiende a decrecer cuando X crece, como en la figura (b), la correlación se dice negativa o inversa.

• Si no hay relación entre las variables, como en la figura (c), decimos que no hay correlación entre ellas.

Page 8: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Un Ejemplo.

• Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un núcleo de población, acuden los clientes que figuran en la tabla.

a) Trazar el diagrama de dispersión b) Calcular el coeficiente de correlación lineal c) Calcular la recta de mínimos Cuadrados

No de clientes (X) 8 7 6 4 2 1

Distancia (Y) 15 19 25 23 34 40

Page 9: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

Page 10: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

Page 11: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

Page 12: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Covarianza.

La definición formal de covarianza es la siguiente:

Al igual que con la desviación estándar podemos obtener este resultado mediantes formulas cortas.

N

YYXX

s

N

i

ii

XY

1

YXXYsXY

Page 13: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Covarianza.

X Y

8 15

7 19

6 25

4 23

2 34

1 40

Page 14: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Covarianza.

X Y XY 8 15 120

7 19 133

6 25 150

4 23 92

2 34 68

1 40 40

4.6667 26 100.5 Promedios

YXXYsXY

266667.45.100 XYs

8342.20XYs

Page 15: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Desviación Estándar.

La definición formal de la desviación estándar para la variable X es la siguiente: Y aquí tenemos su forma corta De manera análoga podemos obtener el de la variable Y

N

XX

s

N

i

i

X

1

2

22 XXsX

22 YYsY

Page 16: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Desviación Estándar.

X Y X2 Y2 XY 8 15 64 225 120

7 19 49 361 133

6 25 36 625 150

4 23 16 529 92

2 34 4 1156 68

1 40 1 1600 40

4.6667 26 28.3333 749.3333 100.5 Promedios

22 XXsX

26667.43333.28 Xs

5604.2Xs

5635.8Ys

Page 17: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Coeficiente de correlación lineal.

• La forma breve del coeficiente de correlación lineal es :

YX

XY

ss

sr

5635.85604.2

8342.20r

9502.0r

Page 18: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Propiedades del coeficiente de correlación.

• El coeficiente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.

• El signo del coeficiente de correlación es el mismo que el de la covarianza. a) Si la covarianza es positiva, la correlación es directa. b) Si la covarianza es negativa, la correlación es inversa. c) Si la covarianza es nula, no existe correlación.

• El coeficiente de correlación lineal es un número real comprendido entre -1 y 1.

11 r

Page 19: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Propiedades del coeficiente de correlación.

• Si el coeficiente de correlación lineal toma valores cercanos a -1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime a -1.

• Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime a 1.

• Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.

• Si ó , los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

1r 1

Page 20: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

La recta de Mínimos Cuadrados.

• La recta de mínimos cuadrados que aproxima el conjunto de puntos , ,…, tiene por ecuación:

donde las constantes quedan fijadas al resolver simultáneamente las ecuaciones

que se llaman ecuaciones normales para la recta de mínimos cuadrados.

11,YX 22 ,YX NN YX ,

bmxy

XbXmXY

bNXmY

2

Page 21: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

La recta de Mínimos Cuadrados.

• Las constantes y de las ecuaciones anteriores se pueden hallar de las formulas

22

XXN

YXXYNm

m b

22

2

XXN

XYXXYb

Page 22: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

La recta de Mínimos Cuadrados.

• También pueden obtenerse de su forma corta:

2X

XY

s

sm XmYb

0655.41

6667.42283.326

b

2283.3

5604.2

8342.202

m

Page 23: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

Page 24: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

Page 25: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

Page 26: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5 6 7 8 9

No de Clientes

D

i

s

t

a

n

c

i

a

0655.412283.3 xy

Page 27: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Actividad

• En un Centro de Salud hacen el seguimiento de la tensión arterial de sus pacientes, y los resultados constatan que aquellos que tienen sobrepeso, tienen una tensión arterial superior a la media. Calcule el coeficiente de correlación de Pearson y la recta de mínimos cuadrados para corroborar estos resultados en una muestra de 10 pacientes.

X=Peso (Kg) 72 76 78 81 89 95 108 115 120 130

Y=Tensión

Sistólica(mm Hg)115 121 125 130 141 150 165 170 177 178

Page 28: El Coeficiente de Correlación y la Recta de Mínimos Cuadrados

Actividad

• La tabla nos muestra las puntuaciones en Literatura (X), y las puntuaciones en Matemática (Y) de un grupo de alumnos de un determinado centro educativo.

• Trace el diagrama de dispersión, calcule el coeficiente de correlación, y la recta de mínimos cuadrados.

EstudianteX Y

1 10 30

2 30 15

3 38 37

4 40 25

5 60 35

6 65 5

7 80 20

8 90 10