35 regresion lineal simple y correlacion

2

Click here to load reader

Transcript of 35 regresion lineal simple y correlacion

Page 1: 35 regresion lineal simple y correlacion

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN.

Análisis de regresión. Es una técnica estadística para modelar e investigar la relación entre dos o más

variables. El análisis de regresión es una colección de herramientas estadísticas para encontrar las estimaciones de los parámetros del modelo de regresión.

Diagrama de dispersión. Se trata de una gráfica en la que cada par ),( ii yx está representado por un

punto graficado en un sistema de coordenadas bidimensionales. Al inspeccionar el diagrama de

dispersión se observa que, aun cuando ninguna curva simple pasará exactamente por todos los puntos,

hay claros indicios de que los puntos se encuentran dispersos aleatoriamente alrededor de una línea recta.

Modelo de regresión lineal simple: xY 10.

0 es la ordenada al origen, 1 es la pendiente

y es el término del error aleatorio.

Coeficientes de regresión. 0 es la ordenada al origen,

1 es la pendiente.

Recta de regresión ajustada o estimada: xbby 10ˆ

Ecuaciones normales de mínimos cuadrados.

n

i

ii

n

i

i

n

i

i yxxbxb11

2

1

1

0

n

i

i

n

i

i yxbnb11

10

Coeficientes de regresión:

Ordenada al origen. Pendiente.

2

11

2

1111

2

0

)(

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

xxn

xyxyx

b

2

11

2

1111

)(

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

xxn

yxyxn

b

Se debe completar la tabla de datos con lo siguiente:

ix iy 2

ix ii yx 2

iy

n

i

ix1

n

i

iy1

n

i

ix1

2

n

i

ii yx1

n

i

iy1

2

Suma de cuadrados de x:

n

i

ix xxSC1

2)( n

x

xSC

n

i

in

i

ix

2

1

1

2

)(

Suma de cuadrados de y:

n

i

iy yySC1

2)( n

y

ySC

n

i

in

i

iy

2

1

1

2

)(

Suma de los productos de x y de y:

n

i

iyx yyxxSC1

)()(

n

yx

yxSC

n

i

i

n

i

in

i

iiyx

11

1

Suma de cuadrados de los errores:

n

i

ii yySCE1

2)ˆ(

x

yx

ySC

SCSCSCE

2)(

Cuadrado medio del error:

2

n

SCECME

Covarianza: 1

)()(1

n

yyxx

S

n

i

i

yx

1

n

SCS

yx

yx

Promedios: n

x

x

n

i

i 1

n

y

y

n

i

i 1

Coeficientes de regresión.

Pendiente:

x

yx

SC

SCb 1

2

1

2

11

)(xnx

yxnyx

bn

i

i

n

i

ii

Ordenada al origen.

xbyb 10

Estos cálculos son extremadamente sensibles a la aproximación. Esto es especialmente cierto

para el cálculo del coeficiente de determinación. Por tanto, se aconseja en aras de la

exactitud, efectuar los cálculos hasta con cinco o seis cifras decimales. Error estándar de estimación.

2

)ˆ(1

2

n

yy

Se

n

i

ii

2

1

1

1

0

1

2

n

yxbyby

Se

n

i

ii

n

i

i

n

i

i

CMESe

Coeficiente de correlación.

yx

yx

SCSC

SCr

2

11

22

11

2

111

)()(

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

yynxxn

yxyxn

r

Coeficiente de determinación.

yx

yx

SCSC

SCr

2

2)(

2

1

2

2

1

1

1

02

)(

)(

yny

ynyxaya

rn

i

i

n

i

ii

n

i

i

2

11

22

11

2

2

1112

)()(n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

yynxxn

yxyxn

r

Variación explicada: ySCrEV 2 Variación sin explicar:

ySCrEV ) 1( 2

Error estándar estimado de la ordenada al origen:

x

bSC

x

nSes

210

Page 2: 35 regresion lineal simple y correlacion

x

i

bSCn

xSes

2

0

Error estándar estimado de la pendiente:

x

bSC

Ses

1

2

1

2 )(1

xnx

Ses

n

i

i

b

Intervalos de confianza en el análisis de regresión.

Intervalo de confianza de ( 1 )% para la ordenada al origen 0 .

x

n

x

nSC

x

nSetb

SC

x

nSetb

2

2,2/00

2

2,2/0

11

Intervalo de confianza de ( 1 )% para la pendiente 1 .

x

n

x

nSC

Setb

SC

Setb 2,2/112,2/1

Intervalo de confianza de ( 1 )% alrededor de la respuesta media en el valor de 0xx .

x

nY

x

nYSC

xx

nSety

SC

xx

nSet

xx

2

02,2/0

2

02,2/

)(1ˆ

)(1ˆ

00

Donde yxxbyx

Y ˆ)(ˆ 10

Intervalo de confianza de ( 1 )% para una observación futura 0y ( Intervalo de predicción).

x

n

x

nSC

xx

nSetyy

SC

xx

nSety

2

02,2/00

2

02,2/0

)(11ˆ

)(11ˆ

El valor 0y se calcula a partir del modelo de regresión 010ˆ xbby .

Intervalo de confianza de ( 1 )% para el coeficiente de correlación poblacional .

3tanhtanh

3tanhtanh 2/12/1

n

zr

n

zr

Pruebas para los parámetros poblacionales.

Prueba para 0 .

Hipótesis nula. Hipótesis alternativa.

H0: 0,00 H1: 0,00 (Bilateral)

Nivel de significancia: .

Regla de decisión.

Rechazar H0 si 2,2/ ntt ó 2,2/ ntt No rechazar H0 si 2,2/2,2/ nn ttt

Estadístico de prueba:

0

0,00

bs

bt

,

x

bSC

x

nSes

210

y tiene n – 2 grados de libertad.

Prueba para 1 (Prueba de significancia del modelo).

Hipótesis nula. Hipótesis alternativa.

H0: 0,11 H1: 0,11 (Bilateral)

Nivel de significancia: .

Regla de decisión.

Rechazar H0 si 2,2/ ntt ó 2,2/ ntt No rechazar H0 si 2,2/2,2/ nn ttt

Estadístico de prueba:

1

0,11

bs

bt

,

x

bSC

Ses

1

y tiene n – 2 grados de libertad.

Prueba para el coeficiente de correlación poblacional .

Hipótesis nula. Hipótesis alternativa.

H0: 0 H1: 0 (Bilateral)

Regla de decisión.

Rechazar H0 si 2,2/ ntt ó 2,2/ ntt No rechazar H0 si 2,2/2,2/ nn ttt

Estadístico de prueba:

rs

rt ,

2

1 2

n

rsr

y tiene n – 2 grados de libertad.

Hipótesis nula. Hipótesis alternativa.

H0: 0 H1: 0 (Bilateral)

Nivel de significancia: .

Regla de decisión.

Rechazar H0 si 2/zz ó 2/zz No rechazar H0 si 2/2/ tzz

Estadístico de prueba: 3)tanh(tanh 0

11 nrz

Autor: Ing. Willians Medina. / +58–424–9744352 / +58–426–2276504 / [email protected] /

PIN: 58B3CF2D – 569A409B.

http://www.slideshare.net/asesoracademico/

Mayo 2016.