35 regresion lineal simple y correlacion
Click here to load reader
-
Upload
willians-medina -
Category
Education
-
view
1.073 -
download
4
Transcript of 35 regresion lineal simple y correlacion
REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN.
Análisis de regresión. Es una técnica estadística para modelar e investigar la relación entre dos o más
variables. El análisis de regresión es una colección de herramientas estadísticas para encontrar las estimaciones de los parámetros del modelo de regresión.
Diagrama de dispersión. Se trata de una gráfica en la que cada par ),( ii yx está representado por un
punto graficado en un sistema de coordenadas bidimensionales. Al inspeccionar el diagrama de
dispersión se observa que, aun cuando ninguna curva simple pasará exactamente por todos los puntos,
hay claros indicios de que los puntos se encuentran dispersos aleatoriamente alrededor de una línea recta.
Modelo de regresión lineal simple: xY 10.
0 es la ordenada al origen, 1 es la pendiente
y es el término del error aleatorio.
Coeficientes de regresión. 0 es la ordenada al origen,
1 es la pendiente.
Recta de regresión ajustada o estimada: xbby 10ˆ
Ecuaciones normales de mínimos cuadrados.
n
i
ii
n
i
i
n
i
i yxxbxb11
2
1
1
0
n
i
i
n
i
i yxbnb11
10
Coeficientes de regresión:
Ordenada al origen. Pendiente.
2
11
2
1111
2
0
)(
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xxn
xyxyx
b
2
11
2
1111
)(
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
xxn
yxyxn
b
Se debe completar la tabla de datos con lo siguiente:
ix iy 2
ix ii yx 2
iy
n
i
ix1
n
i
iy1
n
i
ix1
2
n
i
ii yx1
n
i
iy1
2
Suma de cuadrados de x:
n
i
ix xxSC1
2)( n
x
xSC
n
i
in
i
ix
2
1
1
2
)(
Suma de cuadrados de y:
n
i
iy yySC1
2)( n
y
ySC
n
i
in
i
iy
2
1
1
2
)(
Suma de los productos de x y de y:
n
i
iyx yyxxSC1
)()(
n
yx
yxSC
n
i
i
n
i
in
i
iiyx
11
1
Suma de cuadrados de los errores:
n
i
ii yySCE1
2)ˆ(
x
yx
ySC
SCSCSCE
2)(
Cuadrado medio del error:
2
n
SCECME
Covarianza: 1
)()(1
n
yyxx
S
n
i
i
yx
1
n
SCS
yx
yx
Promedios: n
x
x
n
i
i 1
n
y
y
n
i
i 1
Coeficientes de regresión.
Pendiente:
x
yx
SC
SCb 1
2
1
2
11
)(xnx
yxnyx
bn
i
i
n
i
ii
Ordenada al origen.
xbyb 10
Estos cálculos son extremadamente sensibles a la aproximación. Esto es especialmente cierto
para el cálculo del coeficiente de determinación. Por tanto, se aconseja en aras de la
exactitud, efectuar los cálculos hasta con cinco o seis cifras decimales. Error estándar de estimación.
2
)ˆ(1
2
n
yy
Se
n
i
ii
2
1
1
1
0
1
2
n
yxbyby
Se
n
i
ii
n
i
i
n
i
i
CMESe
Coeficiente de correlación.
yx
yx
SCSC
SCr
2
11
22
11
2
111
)()(
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r
Coeficiente de determinación.
yx
yx
SCSC
SCr
2
2)(
2
1
2
2
1
1
1
02
)(
)(
yny
ynyxaya
rn
i
i
n
i
ii
n
i
i
2
11
22
11
2
2
1112
)()(n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r
Variación explicada: ySCrEV 2 Variación sin explicar:
ySCrEV ) 1( 2
Error estándar estimado de la ordenada al origen:
x
bSC
x
nSes
210
x
i
bSCn
xSes
2
0
Error estándar estimado de la pendiente:
x
bSC
Ses
1
2
1
2 )(1
xnx
Ses
n
i
i
b
Intervalos de confianza en el análisis de regresión.
Intervalo de confianza de ( 1 )% para la ordenada al origen 0 .
x
n
x
nSC
x
nSetb
SC
x
nSetb
2
2,2/00
2
2,2/0
11
Intervalo de confianza de ( 1 )% para la pendiente 1 .
x
n
x
nSC
Setb
SC
Setb 2,2/112,2/1
Intervalo de confianza de ( 1 )% alrededor de la respuesta media en el valor de 0xx .
x
nY
x
nYSC
xx
nSety
SC
xx
nSet
xx
2
02,2/0
2
02,2/
)(1ˆ
)(1ˆ
00
Donde yxxbyx
Y ˆ)(ˆ 10
Intervalo de confianza de ( 1 )% para una observación futura 0y ( Intervalo de predicción).
x
n
x
nSC
xx
nSetyy
SC
xx
nSety
2
02,2/00
2
02,2/0
)(11ˆ
)(11ˆ
El valor 0y se calcula a partir del modelo de regresión 010ˆ xbby .
Intervalo de confianza de ( 1 )% para el coeficiente de correlación poblacional .
3tanhtanh
3tanhtanh 2/12/1
n
zr
n
zr
Pruebas para los parámetros poblacionales.
Prueba para 0 .
Hipótesis nula. Hipótesis alternativa.
H0: 0,00 H1: 0,00 (Bilateral)
Nivel de significancia: .
Regla de decisión.
Rechazar H0 si 2,2/ ntt ó 2,2/ ntt No rechazar H0 si 2,2/2,2/ nn ttt
Estadístico de prueba:
0
0,00
bs
bt
,
x
bSC
x
nSes
210
y tiene n – 2 grados de libertad.
Prueba para 1 (Prueba de significancia del modelo).
Hipótesis nula. Hipótesis alternativa.
H0: 0,11 H1: 0,11 (Bilateral)
Nivel de significancia: .
Regla de decisión.
Rechazar H0 si 2,2/ ntt ó 2,2/ ntt No rechazar H0 si 2,2/2,2/ nn ttt
Estadístico de prueba:
1
0,11
bs
bt
,
x
bSC
Ses
1
y tiene n – 2 grados de libertad.
Prueba para el coeficiente de correlación poblacional .
Hipótesis nula. Hipótesis alternativa.
H0: 0 H1: 0 (Bilateral)
Regla de decisión.
Rechazar H0 si 2,2/ ntt ó 2,2/ ntt No rechazar H0 si 2,2/2,2/ nn ttt
Estadístico de prueba:
rs
rt ,
2
1 2
n
rsr
y tiene n – 2 grados de libertad.
Hipótesis nula. Hipótesis alternativa.
H0: 0 H1: 0 (Bilateral)
Nivel de significancia: .
Regla de decisión.
Rechazar H0 si 2/zz ó 2/zz No rechazar H0 si 2/2/ tzz
Estadístico de prueba: 3)tanh(tanh 0
11 nrz
Autor: Ing. Willians Medina. / +58–424–9744352 / +58–426–2276504 / [email protected] /
PIN: 58B3CF2D – 569A409B.
http://www.slideshare.net/asesoracademico/
Mayo 2016.