02 regresion polinomial

14
MÉTODOS NUMÉRICOS CAPÍTULO 4 : REGRESIÓN POR MÍNIMOS CUADRADOS. REGRESIÓN POLINOMIAL. Ing. Willians Medina. Maturín, Junio de 2015.

Transcript of 02 regresion polinomial

Page 1: 02 regresion polinomial

MÉTODOS NUMÉRICOS

CAPÍTULO 4: REGRESIÓN POR

MÍNIMOS CUADRADOS.

REGRESIÓN POLINOMIAL.

Ing. Willians Medina.

Maturín, Junio de 2015.

Page 2: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 36

4.3.- REGRESIÓN POLINOMIAL.

En la sección anterior se desarrolló un procedimiento para obtener la ecuación de

una línea recta por medio del criterio de mínimos cuadrados. En la ingeniería, aunque

algunos datos exhiben un patrón marcado, como el que se advierte en la figura 4.9, son

pobremente representados por una línea recta, entonces, una curva podrá ser más adecuada

para ajustarse a los datos.

Figura 4.9. Diagrama de dispersión. Tendencia no lineal.

Una alternativa es ajustar polinomios a los datos mediante regresión polinomial.

El procedimiento de mínimos cuadrados se puede extender fácilmente al ajuste de

datos con un polinomio de grado superior. Por ejemplo, suponga que ajustamos un

polinomio de segundo grado o cuadrático:

2

210 ii xaxaay (4.11)

En este caso, la suma de los cuadrados de los residuos es

0

10

20

30

40

50

60

70

0 1 2 3 4 5 6

y

x

Page 3: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 37

n

i

iiir xaxaayS1

22

210 )( (4.12)

Al seguir el procedimiento de la sección anterior, obtenemos la derivada de la ecuación

(4.12) con respecto a cada uno de los coeficientes desconocidos del polinomio,

n

i

iiir xaxaay

a

S

1

2

210

0

)(2

n

i

iiir xaxaayx

a

S

1

2

2210

1

)(2

n

i

iiir xaxaayx

a

S

1

2

2210

2

2

)(2

Estas ecuaciones se igualan a cero y se reordenan para desarrollar el siguiente conjunto de

ecuaciones normales:

n

i

i

n

i

i

n

i

i yaxaxan1

2

1

2

1

1

0 )()()(

n

i

ii

n

i

i

n

i

i

n

i

i yxaxaxax1

2

1

3

1

1

2

0

1

)()()(

n

i

ii

n

i

i

n

i

i

n

i

i yxaxaxax1

2

2

1

4

1

1

3

0

1

2 )()()( (4.13)

Observe que las tres ecuaciones anteriores son lineales y tienen tres incógnitas: 0a , 1a y 2a

. Los coeficientes de las incógnitas se evalúan de manera directa, a partir de los datos

observados.

En este caso, observamos que el problema de determinar un polinomio de segundo

grado por mínimos cuadrados es equivalente a resolver un sistema de tres ecuaciones

lineales simultáneas. En el capítulo 2 se estudiaron las técnicas para resolver tales

ecuaciones.

El error estándar se formula como

3/

n

SS r

xy (4.14)

Ejemplo 4.3.

Page 4: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 38

[DM] Los paneles laterales del interior de un aeroplano se hacen en una prensa de 1500

toneladas. El costo unitario de fabricación varía con el tamaño del lote de producción. Los

datos que se presentan a continuación muestran el costo promedio por unidad (en cientos de

dólares) de este producto (y) y el tamaño del lote de producción (x).

ix iy

20 1.81

25 1.70

30 1.65

35 1.55

40 1.48

50 1.40

60 1.30

65 1.26

70 1.24

75 1.21

80 1.20

90 1.18

a) Elabore un diagrama de dispersión.

b) Suponiendo que un polinomio de segundo orden puede ser apropiado, ajuste el modelo

de regresión que relacione el costo promedio por unidad (y) con el tamaño del lote de

producción (x).

c) ¿Cuál es la estimación del costo promedio por unidad cuando el tamaño del lote es 45?

d) Suponga que el tamaño del lote es 50. Calcule el valor ajustado de y y el residual

correspondiente.

e) Si el costo promedio por unidad es de 1.50 (en cientos de dólares), determine el tamaño

del lote.

f) Determine el coeficiente de determinación.

g) Determine el coeficiente de correlación.

Solución.

a) En la figura 4.10 se muestra el diagrama de dispersión de los datos.

Page 5: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 39

Figura 4.10. Diagrama de dispersión de los datos del ejemplo 4.3.

En la figura 4.10 se observa que los datos se ajustan a una curva parabólica.

b) Para encontrar la recta de mínimos cuadrados que aproxima a estos datos, extendemos la

tabla y sumamos las columnas como se muestra en las cinco últimas columnas de la tabla

i ix iy 2

ix 3

ix 4

ix ii yx ii yx 2

1 20 1.81 400 8000 160000 36.2 724

2 25 1.7 625 15625 390625 42.5 1062.5

3 30 1.65 900 27000 810000 49.5 1485

4 35 1.55 1225 42875 1500625 54.25 1898.75

5 40 1.48 1600 64000 2560000 59.2 2368

6 50 1.4 2500 125000 6250000 70 3500

7 60 1.3 3600 216000 12960000 78 4680

8 65 1.26 4225 274625 17850625 81.9 5323.5

9 70 1.24 4900 343000 24010000 86.8 6076

10 75 1.21 5625 421875 31640625 90.75 6806.25

11 80 1.2 6400 512000 40960000 96 7680

12 90 1.18 8100 729000 65610000 106.2 9558

640 16.98 40100 2779000 204702500 851.3 51162

1

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

10 20 30 40 50 60 70 80 90 100

Co

sto

pro

med

io p

or u

nid

ad

Tamaño del lote

Page 6: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 40

Todas las sumas anteriores se pueden obtener directamente con la calculadora CASIO fx-

570 ES PLUS a expensas de los cálculos indicados en la tabla anterior. El menú para las

sumas se encuentra con la siguiente secuencia de teclas:

AC SHIFT 1 3

Las ecuaciones normales (4.13) son:

98.164010064012 210 aaa

3.851277900040100640 210 aaa

51162204702500277900040100 210 aaa

En el capítulo 2 se explicó cómo resolver este sistema de ecuaciones en forma directa

utilizando la calculadora CASIO fx-570 ES PLUS.

Al resolver el sistema de tres ecuaciones con tres incógnitas anterior:

1982663.20 a

0225224.01 a

0001251.02 a

Estas constantes se pueden obtener directamente con la calculadora CASIO fx-570 ES

PLUS a expensas de la solución del sistema de ecuaciones. El menú para las constantes se

encuentra con la siguiente secuencia de teclas:

AC SHIFT 1 5

La mejor ecuación cuadrática en el sentido de mínimos cuadrados es, de acuerdo con la

ecuación (4.11):

2

210ˆ ii xaxaay (4.11)

20001251.00225224.01982663.2ˆ xxy

En la figura 4.11 se muestran los datos y la parábola de regresión.

Page 7: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 41

Figura 4.11. Diagrama de dispersión y parábola de mínimos cuadrados de los datos del ejemplo 4.3.

c) Costo promedio por unidad cuando 45x .

Aplicando la ecuación de regresión 20001251.00225224.01982663.2ˆ xxy , se

sustituye 45x , para obtener:

2)45(0001251.0)45(0225224.01982663.2ˆ y

2533275.00135080.11982663.2ˆ y

4380.1ˆ y

La tabla siguiente muestra los valores observados con los valores obtenidos usando

esta aproximación.

ix iy 20001251.00225224.01982663.2 xxy 2)( yyi 2)ˆ( yyi

20 1.81 1.7978452 0.156025 0.0001477

25 1.7 1.7133731 0.081225 0.0001788

30 1.65 1.6351542 0.055225 0.0002204

35 1.55 1.5631886 0.018225 0.0001739

40 1.48 1.4974763 0.004225 0.0003054

1

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

10 20 30 40 50 60 70 80 90 100

Co

sto

pro

med

io p

or u

nid

ad

Tamaño del lote

Page 8: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 42

50 1.4 1.3848113 0.000225 0.0002307

60 1.3 1.2971595 0.013225 0.0000081

65 1.26 1.2627134 0.024025 0.0000074

70 1.24 1.2345206 0.030625 0.0000300

75 1.21 1.2125811 0.042025 0.0000067

80 1.2 1.1968948 0.046225 0.0000096

90 1.18 1.1842820 0.055225 0.0000183

640 16.98 16.98 0.5265 0.0013371

d) El valor estimado para 50x es:

2)50(0001251.0)50(0225224.01982663.2 y

3848113.1y

con un valor residual.

3848113.14.1 e

0380858.0e

e) Para 50.1y , tendremos:

20001251.00225224.01982663.2ˆ xxy

20001251.00225224.01982663.250.1 xx

06982663.00225224.00001251.0 2 xx

Al resolver la ecuación de segundo grado anterior:

23.140x

80.39x

El tamaño del lote es 39.80.

El error estándar del estimado es, de acuerdo con la ecuación (4.14):

3/

n

SS r

xy (4.14)

312

0013371.0/

xyS

0121889.0/ xyS

f) El coeficiente de determinación es, de acuerdo con la ecuación (4.9):

Page 9: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 43

t

rt

S

SSr

2 (4.9)

5265.0

0013371.05265.02 r

9974604.02 r

g) El coeficiente de correlación es

2rr

9974604.0r

9999327.0r

En caso bidimensional se extiende con facilidad a un polinomio de m-ésimo grado

como sigue

m

m xaxaxaay 2

210 (4.15)

El análisis anterior se puede extender fácilmente a este caso más general.

El problema general de aproximar un conjunto de datos },...,2,1,0/),{( niyx ii , con un

polinomio

m

j

j

jm xaxP0

)( de grado nm usando el procedimiento de mínimos

cuadrados se ataca de manera similar y requiere de la elección de las constantes 0a , 1a ,…,

ma para minimizar el error de mínimos cuadrados.

n

i

imir xPyS0

2)]([(

n

i

im

n

i

iim

n

i

i xPyxPy0

2

00

2 )]([)(2

n

i

m

j

j

ij

n

i

i

m

j

j

ij

n

i

i xayxay0

2

00 00

2 )()(2

m

j

m

k

n

i

kj

ikj

m

j

n

i

j

iij

n

i

i xaaxyay0 0 00 00

2 )()(2

Page 10: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 44

Como en el caso lineal, para minimizar a rS , es necesario que 0

j

r

a

S para cada

mj ,,2,1,0 . Por lo tanto, para cada j,

m

k

n

i

kj

ik

n

i

j

ii

j

r xaxya

S

0 00

220

Esto da 1m ecuaciones para las 1m incógnitas, ja , que se conocen como ecuaciones

normales,

n

i

j

ii

m

k

n

i

kj

ik xyxa00 0

mj ,,2,1,0 .

Es conveniente escribir las ecuaciones como sigue:

n

i

ii

n

i

m

im

n

i

i

n

i

i

n

i

i xyxaxaxaxa0

0

00

2

2

0

1

1

0

0

0

n

i

ii

n

i

m

im

n

i

i

n

i

i

n

i

i xyxaxaxaxa0

1

0

1

0

3

2

0

2

1

0

1

0

n

i

n

ii

n

i

m

im

n

i

m

i

n

i

m

i

n

i

m

i xyxaxaxaxa00

2

0

2

2

0

1

1

0

0 (4.16)

Se puede demostrar que las ecuaciones normales tienen una solución única siempre que las

ix , para ni ,,2,1,0 sean distintas.

Así, se reconoce que la determinación de los coeficientes de un polinomio de m-ésimo

grado es equivalente a resolver un sistema de 1m ecuaciones lineales simultáneas. En

este caso, el error estándar se formula como sigue:

)1(/

mn

SS r

xy (4.17)

Esta cantidad se divide entre )1( mn , ya que )1( m coeficientes obtenidos de los datos

0a , 1a ,…, ma , se utilizaron para calcular rS ; hemos perdido 1m grados de libertad.

Además del error estándar, también se calcula un coeficiente de determinación para la

regresión polinomial con la ecuación (4.9).

Page 11: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 45

Ejercicios propuestos.

27. [CC] Ajuste una parábola a los datos

ix 0.75 2 2.5 4 6 8 8.5

iy 0.8 1.3 1.2 1.6 1.7 1.8 1.7

Grafique los datos y la ecuación, y determine el error estándar.

28. [CC] Ajuste una parábola a los datos

ix 0.4 0.8 1.2 1.6 2.0 2.3

iy 750 1000 1400 2000 2700 3750

Grafique los datos y la ecuación.

29. [BF] Encuentre un polinomio de mínimos cuadrados de grado 2 para los datos que se

muestran en el problema 2.

30. [BF] Construir la aproximación de mínimos cuadrados de grado dos para los datos del

problema 3 y calcular el error.

31. [BF] Construir la aproximación de mínimos cuadrados de grado dos para los datos del

problema 4 y calcular el error.

32. [CC] Use regresión polinomial para ajustar una parábola a los datos del problema 7.

Calcule el error estándar de la estimación y el coeficiente de correlación. Grafique los datos

y la parábola. Evalúe el ajuste. Compare los resultados con los del problema 7.

33. Utilice regresión por mínimos cuadrados para ajustar una parábola a los datos del

problema 8.

Ingeniería Química.

34. [CC] El volumen específico de un vapor sobrecalentado se presenta en las tablas de

vapor para diferentes temperaturas. Por ejemplo, a una presión de 2950 ln/in2, la

temperatura y el volumen específicos se relacionan como:

Fº ,T 700 720 740 760 780

m

3/lbft ,v 0.1058 0.1280 0.1462 0.1603 0.1703

Determine v a Fº750T .

Ingeniería Eléctrica.

Page 12: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 46

35. [CC] Usted mide la caída de voltaje V a través de una resistencia para diversos valores

de la corriente i. Los resultados son

i 0.25 0.75 1.25 1.5 2.0

V –0.45 –0.6 0.70 1.88 6.0

Use correlación polinomial para estimar la caída de voltaje para 1.1i . Interprete sus

resultados.

36. [CC] La corriente en un alambre se mide con gran precisión como función del tiempo:

t 0 0.1250 0.2500 0.3750 0.5000

i 0 6.2402 7.7880 4.8599 0.0000

Determine i a 22.0t .

Ingeniería Mecánica / Aeronáutica.

37. [CC] La viscosidad cinemática del agua, v , está relacionada con la temperatura de la

siguiente forma:

Cº,T 0 4 8 12 16 20 24

/scm , 2v 1.7923×10–2

1.5676×10–2

1.3874×10–2

1.2396×10–2

1.1168×10–2

1.0105×10–2

0.9186×10–2

Grafique estos datos.

Con regresión polinomial ajuste una parábola a los datos para predecir v a Cº5.7T .

38. [CC] La distancia requerida para frenar un automóvil es una función de su rapidez. Se

recabaron los siguientes datos experimentales para cuantificar esta relación:

Rapidez, mi/h 15 20 25 30 40 50 60

Distancia de frenado, ft 16 20 34 40 60 90 120

Estime la distancia de frenado para un automóvil que circula a 45 mi/h.

Page 13: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 47

RESPUESTA A LOS EJERCICIOS SELECCIONADOS.

27.

20.02432870.33907580.5967526ˆ xxy , 0.0894624/ xyS , 0.95880542 r ,

0.9791861r

28. 22726.7683268453.9903699854.659058ˆ xxy , 5112.701623/ xyS ,

0.99409072 r , 0.9970410r .

29. 21.14733030.32569881.0113410ˆ xxy , 0.0177506/ xyS , 0.99308072 r ,

0.9965344r .

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

0 2 4 6 8 10

y

x

0

500

1000

1500

2000

2500

3000

3500

4000

0 0.5 1 1.5 2 2.5

y

x

Page 14: 02 regresion polinomial

Capítulo 4. Regresión por mínimos cuadrados. Regresión polinomial.

Métodos Numéricos. Ing. Willians Medina. http://www.slideshare.net/asesoracademico/ 48

30. 26.61821091.14352341.2355604ˆ xxy , 0.0143572/ xyS , 0000000.12 r ,

0000000.1r .

31. 21.12942390.31140350.0851439ˆ xxy , 0.0219996/ xyS , 0.99956292 r ,

0.9997814r .

32. 20.48894444.806918716.0269615ˆ xxy , 2.1091337/ xyS , 0.71800672 r ,

0.8473527r .

33. 20.01545451.345757612.1666667ˆ xxy , 2.1504052/ xyS , 0.94763032 r ,

0.9734631r .

Ingeniería Química.

34. 20.00000510.00833863.2375114ˆ xxy , 0.0000239/ xyS , 0.99999962 r ,

0.9999998r . Para 750x , 0.1537475ˆ y .

Ingeniería Eléctrica.

35. 23.39445474.00929990.3885526ˆ iiV , 0.1318823/ xyS , 0.99881062 r ,

0.9994051r . Para 1.1i , 0.0856129ˆ V .

36. 27121.94788559.86970290.2428086ˆ tti , 0.6478762/ xyS , 0.98381232 r ,

0.9918731r . Para 22.0t , 7.5118655ˆ i .

Ingeniería Mecánica / Aeronáutica.

37.

20.00000810.00055120.0178410ˆ TTv , 0.0000946/ xyS , 0.99939072 r ,

0.9996953r . Para 5.7T , 0.0141608ˆ v .

38. 20.02323560.58175901.6438654ˆ xxy , 2.4191599/ xyS , 0.99736482 r ,

0.9986815r . Para 45x , 98.1107492ˆ y .

0.000000

0.002000

0.004000

0.006000

0.008000

0.010000

0.012000

0.014000

0.016000

0.018000

0.020000

0 5 10 15 20 25 30

y

x