Regresion linealr

19
REGRESIÓN LINEAL MÉTODOS NUMÉRICOS REGRESIÓN E INTERPOLACIÓN

Transcript of Regresion linealr

REGRESIÓN LINEAL

MÉTODOS NUMÉRICOS

REGRESIÓN E INTERPOLACIÓN

2

REGRESIÓN LINEAL

)( iii xfy

FORMULACIÓN DEL PROBLEMA DE LA REGRESIÓN

Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la función y= f(x), que se ajuste mejor a ellos. El criterio que normalmente se usa para establecer el mejor ajuste es el de mínimos cuadrados que consiste en minimizar la suma de los cuadrados de los errores residuales. El error residual para el punto i, se define como:

La suma de los cuadrados de los errores residuales se expresa como:

2

1

10

1

2

n

i

ii

n

i

ir xaayS

3

REGRESIÓN LINEAL

Dados n puntos (x1, y1), (x2, y2), … , (xn, yn) hallar la función que se ajuste mejor a ellos. Para este caso el error residual para el dato i se puede expresar como: La suma de los cuadrados de los errores residuales, en este caso, sería:

xaay 10

i10ii xaayε

2

1

10

1

2

n

i

ii

n

i

ir xaayS

REGRESIÓN LINEAL

Las constantes a0 y a1, del modelo lineal serán aquellas que minimicen a Sr, lo cual requieres derivar Sr con respecto a cada uno de los coeficientes:

0121

10

0

n

i

iir xaay

a

S

021

10

1

n

i

iiir xxaay

a

S

Lo cual puede escribirse como:

i

n

i

ii

n

i

i

n

i

xyxaxa

1

2

1

1

1

0

n

i

ii

n

i

n

i

yxaa11

1

1

0

5

REGRESIÓN LINEAL

i

n

1i

i

n

1i

i

1

0

n

1i

2

i

n

1i

i

n

1i

i

xy

y

a

a

xx

xn

n

1i

ii

n

1i

10 yxana

i

n

i

ii

n

i

i

n

i

xyxaxa

1

2

1

1

1

0

Teniendo en cuenta se obtiene: 0

n

1i

0 naa

Que se puede expresar matricialmente como;

6

REGRESIÓN LINEAL

2

11

2

1111

2

0

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

xxn

yxxyx

a

n

1i

n

1i

ii

n

1i

2

i

n

1i

ii

n

1i

i

n

1i

2

i

n

1i

i

n

1i

2

i

n

1i

i

n

1i

i

n

1i

2

ii

n

1i

i

n

1i

i

n

1i

i

0

xxxn

xxyxy

xx

xn

xxy

xy

a

Aplicando la regla de Crámer, para resolver este sistema, se ontiene

7

REGRESIÓN LINEAL

2

11

2

1111

2

0

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

xxn

yxxyx

a

n

1i

n

1i

ii

n

1i

2

i

n

1i

ii

n

1i

i

n

1i

2

i

n

1i

i

n

1i

2

i

n

1i

i

n

1i

i

n

1i

2

ii

n

1i

i

n

1i

i

n

1i

i

0

xxxn

xxyxy

xx

xn

xxy

xy

a

REGRESIÓN LINEAL

1 1 11 2

2

1 1

n n n

i i i i

i i i

n n

i i

i i

n x y x y

a

n x x

n

1i

n

1i

ii

n

1i

2

i

n

1i

n

1i

iii

n

1i

i

n

1i

2

i

n

1i

i

n

1i

i

i

n

1i

i

n

1i

i

n

1i

i

1

xxxn

yxxy

xx

xn

xyx

y

a

n

n

EJEMPLO

Se sabe que el esfuerzo a la tensión de un plástico se incrementa como función del tiempo que recibe tratamiento a base de calor. Se obtuvieron los datos que se muestran en la tabla.

Ajuste una línea recta a estos datos y utilice una ecuación para determinar el esfuerzo a la tensión en un tiempo de 32 minutos

Contador Tiempo (min)

Esfuerzo a la tensión(N/cm2)

i xi yi

1 10 5

2 15 20

3 20 18

4 25 40

5 40 33

6 50 54

7 55 70

8 60 60

9 75 78

Tomado del texto: Chapra, Steven C y Canale, Raymond. Métodos Numéricos para ingeniero. Quinta edición

EJEMPLO

0

10

20

30

40

50

60

70

80

90

0 10 20 30 40 50 60 70 80

esfuerzo a la tensión(N/cm2)

Tiempo(min)

Esfu

erzo

a la

tens

ión(

N/c

m2

GRÁFICO DE DISPERSIÓN PARA: Esfuerzo a la tensión vs. Tiempo

EJEMPLO

La solución básicamente consiste en hallar los coeficientes de la ecuación de la recta de mejor ajuste. Para el problema planteado, la forma de la ecuación de la recta sería:

Donde y= esfuerzo a la tensión(N/cm2)

x= tiempo(min)

1

n

i i

i

x y

0 1y a a x

Para determinar los coeficientes a0 y a1, del modelo lineal, se utiliza el procedimiento de regresión lineal, para lo cual se deben calcular las siguientes cantidades:

2

1

n

i

i

x

1

n

i

i

x

1

n

i

i

y

EJEMPLO

Teniendo en cuenta que para este problema, n=9 datos, entonces:

9

1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9

1

i i

i

x y x y x y x y x y x y x y x y x y x y

9

1

10 5 15 20 20 18 25 40 40 33 50 54 55 70 60 60 75 78i i

i

x y

9

1

19030i i

i

x y

9

1 2 3 4 5 6 7 8 9

1

i

i

x x x x x x x x x x

9

1

10 15 20 25 40 50 55 60 75i

i

x

9

1

350i

i

x

EJEMPLO

9

1 2 3 4 5 6 7 8 9

1

i

i

y y y y y y y y y y

9

1

5 20 18 40 33 54 70 60 78i

i

y

9

1

378i

i

x

92 2 2 2 2 2 2 2 2 2

1 2 3 4 5 6 7 8 9

1

i

i

x x x x x x x x x x

92 2 2 2 2 2 2 2 2 2

1

10 15 20 25 40 50 55 60 75i

i

x

92

1

17700i

i

x

EJEMPLO

Con estas cantidades calculadas, se pueden utilizar las fórmulas para los coeficientes, obtenidas anteriormente:

2

11

2

1111

2

0

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

xxn

yxxyx

a

1 1 11 2

2

1 1

n n n

i i i i

i i i

n n

i i

i i

n x y x y

a

n x x

EJEMPLO

Reemplazando:

0 2

17700 378 350 190300.81793478

9 17700 350a

1 2

9 19030 350 3781.05896739

9 17700 350a

9

1

19030i i

i

x y

9

1

350i

i

x

9

1

378i

i

x

9

2

1

17700i

i

x

Se obtiene:

EJEMPLO

Reemplazando estos valores en el modelo lineal, se obtiene la ecuación de la recta de mejor ajuste:

0.81793478+1.05896739y x

0 1y a a x

2( / ) 0.81793478+1.05896739 minEsfuerzo a la tensión N cm tiempo

Remplazando y, x por los nombre reales de las variables, quedaría:

En la siguiente diapositiva se presenta una gráfica de los datos iniciales con la recta de regresión

EJEMPLO

Datos originales con la recta de regresión obtenida

y = 1,059x + 0,8179

0

10

20

30

40

50

60

70

80

90

0 10 20 30 40 50 60 70 80

esfuerzo a la tensión(N/cm2)

Tiempo(min)

Esfu

erzo

a la

tens

ión(

N/c

m2

EJEMPLO

En la siguiente figura se ilustra gráficamente la obtención del esfuerzo para tiempo=32 minutos

Para estimar el valor del esfuerzo a la tensión para un tiempo igual a 32 minutos, se utiliza la ecuación

obtenida:

( ) 0.813 793478+1.058967392 32Esfuerzo a la tensión

( ) 34.7048932 13Esfuerzo a la tensión

EJEMPLO

y = 1,059x + 0,8179

0

10

20

30

40

50

60

70

80

90

0 10 20 30 40 50 60 70 80

esfuerzo a la tensión(N/cm2)

Tiempo(min)

Esfu

erzo

a la

tens

ión(

N/c

m2

x=32

x=34.7048913