Regresion Lineal y Regresion Poligonal

23
REGRESION LINEAL Y REGRESION POLIGONAL OBJETIVO MARCO TEORICO Regresión Lineal.- El ejemplo más simple de aproximación por mínimos cuadrados es ajustar una línea recta a un conjunto de observaciones definidas por puntos: La expresión matemática para la línea recta es: ao y a1 son coeficientes que representan la intersección con el eje “y” y la pendiente, respectivamente. e= es el error, o diferencia, entre el modelo y las observaciones, el cual se representa al reordenar la ecuación(17.1) como Datos con un error significativo e= y-a o -a 1 x

Transcript of Regresion Lineal y Regresion Poligonal

REGRESION LINEAL Y REGRESION POLIGONAL

OBJETIVO

MARCO TEORICO

Regresión Lineal.-

El ejemplo más simple de aproximación por mínimos cuadrados es ajustar una línea recta a un conjunto de observaciones definidas por puntos:

La expresión matemática para la línea recta es: ao y a1 son coeficientes que representan la intersección con el eje “y” y la pendiente, respectivamente. e= es el error, o diferencia, entre el modelo y las observaciones, el cual se representa al reordenar la ecuación(17.1) como

Datos con un error significativo

e= y-ao -a1 x

El error o residuo “e” es la discrepancia entre el valor verdadero de “y” y el valor aproximado “a0 + a1x”, el cual predijo la ecuación lineal

Si se minimiza la suma de los errores residuales de todos los datos disponibles se tiene una mejor línea de ajuste, es decir, ∑ ei = ∑ (yi – a0 – a1xi); las sumas van de i=1 hasta n=número de puntos Una mejor aproximación es minimizar la suma de los valores absolutos ∑ |ei| = ∑ | yi – a0 – a1xi |; para i=1 a n Los dos criterios anteriores, sin embargo, no son adecuados pues no dan un “único” mejor ajuste. Un mejor criterio es el “minimax”, en donde la línea de ajuste se elige para que se minimice la máxima distancia a la que se encuentra un

punto de la línea. Esta técnica tiene el inconveniente de que da excesiva influencia a puntos fuera del conjunto (un solo punto con un gran error). Minimax es una técnica adecuada para ajustar una función simple a una complicada. Consiste en minimizar la suma de los cuadrados de los residuos entre la “y” medida y la calculada con el modelo lineal

Sr = ∑ ei2 = ∑ (yi,medida-yi,modelo)2 = ∑ (yi – a0 – a1xi)2 , para i=1 a n

Ajuste polinomial oscilando mas allá del rango de los datos

Resultados más satisfactorios mediante el ajuste por mínimos cuadrados

Ajuste de una línea recta por mínimos cuadrados

Para determinar los valores de ao y a1 , se deriva con respecto a cada uno de los coeficientes:

Al igualar las derivadas a cero dará como resultado un Sr mínimo Ahora y expresamos las ecuaciones como un conjunto de dos ecuaciones lineales simultáneas ( con 2 incógnitas): Ecuaciones normales →

a1 =( n∑xiyi -∑xi∑yi) / (n∑xi2 – (∑xi)2)

a0 = prom(y) – a1prom(x); prom = promedio

Ejemplo:Ajuste a una línea recta los valores “x” y “y” en las primeras columnas de la tabla Tabla. Cálculos para el análisis de error en el ajuste lineal.

∂ Sr∂ ao

=−2∑ ( y i−a0−a1 x i )

∂ Sr∂ a1

=−2∑ [( yi−a0−a1 x i) x i ]

0=∑ y i−∑ a0−∑ a1 x i0=∑ y i x i−∑ a0 x i−∑ a1 x i

2

∑ yi=nao+(∑ x i)a1

∑ yi x i=(∑ x i) a0+(∑ x i2) a1

Cuantificación del error en la regresión lineal

Suma de Cuadrados:

Esto se puede interpretar por medio del principio de la máxima probabilidad y se determina como sigue:

St es la magnitud del error residual asociado con la variable dependiente antes de la regresión. Sr : Suma de los cuadrados. Suma Inexplicable de los cuadrados: St- Sr Con esto obtenemos:

Linealización de Relaciones No Lineales

En la regresión lineal no siempre se da el caso de que la relación entre las variables dependientes e independientes es lineal. Este es un dato que se debe averiguar siempre antes de realizar cualquier análisis de regresión. Por ejemplo, si los datos son curvilíneos, no se debe utilizar el método de regresión lineal por mínimos cuadrados .

Existen ocasiones en que los datos no son compatibles con la regresión lineal, por lo tanto, se debe recurrir a una transformación. Estas transformaciones matemáticas son capaces de manipular las ecuaciones para que resulten de una manera lineal, y después de esto aplicar el método de regresión lineal simple para ajustar las ecuaciones a los datos .

Ejemplo: Ecuación de Potencias

Como se trata de una ecuación de potencias se puede aplicar logaritmo a ambos lados de la ecuación. Tomando valores de a=0,5 y de b=1,75 se obtiene la siguiente ecuación.

En la siguiente Tabla se observan los datos por graficar de la ecuación de potencias sin logaritmo y con logaritmo.

x y logx logy

1 0,5 0 -0,301

2 1,7 0,301 0,226

3 3,4 0,477 0,534

4 5,7 0,602 0,753

5 8,4 0,699 0,922

y=axb

log y=1 ,75 log x−0 ,300

Curvilinea

0

1

2

3

4

5

6

7

8

9

0 1 2 3 4 5 6

Curvilinea

Gráfico de Y vrs X

Logaritmo

-0,4

-0,2

0

0,2

0,4

0,6

0,8

1

0 0,2 0,4 0,6 0,8

Logaritmo

Gráfica de log(y) vrs log(x)

Regresión Polinomial

Consiste en otra alternativa, para ajustar polinomios a los datos. Necesitamos ajustar a un polinomio de segundo grado ó cuadrático:

La suma de los cuadrados de los residuos es:

y=a0+a1 x+a2 x2+e

Sr=∑i=1

n

( y i−a0−a1 x i−a2 x i2)2

Derivamos Sr con respecto a a0:

Luego con respecto a a1:

Por último con respecto a a2:

Igualamos a 0, y reordenamos:

N, hasta

Tenemos un sistemas de ecuaciones, con 3 incógnitas (a0,a1,a2), entonces se puede extender un polinomio de m-ésimo grado como sigue:

El error estándar se calcula de la siguiente manera

−2∑ ( y i−a0−a1 x1−a2 x i2)

−2∑ x i( y i−a0−a1x1−a2x i2)

−2∑ xi2( y i−a0−a1 x i−a2 x i2

)

(n )a0+(∑ x i)a1+(∑ xi2 )a2=∑ yi

(∑ x i)a0+(∑ xi2)a1+(∑ x i

3 )a2=∑ x i y i

(∑ xi2 )a0+(∑ x

i3 )a1+(∑ x i

4 )a2=∑ xi2 y i

i=1

y=a0+a1 x+a2 x2+ .. .. . .am x

m+e

s y /x=√ srn−(m+1 )

PROCEDIMIENTO

REGRESION LINEAL REGRESION POLINOMIAL PLOTn X Y X^2 XY (Y-Ῡ)^2 ∑(Y-a-a1X)^2 X^3 X^4 X^2*Y (Y-

(a2*X^2+a1X+a0))^2

x y

1 0.250 -0.450 0.063 -0.113 0.203 1.528 0.016 0.004 -0.028125 0.001991948 0.750 -0.6002 0.750 -0.600 0.563 -0.450 0.360 0.472 0.422 0.316 -0.3375 0.011874188 0.250 -0.4503 1.500 1.880 2.250 2.820 3.534 0.752 3.375 5.063 4.23 0.017815576 1.250 0.7004 1.250 0.700 1.563 0.875 0.490 1.347 1.953 2.441 1.09375 0.000313954 1.500 1.8805 2.000 6.000 4.000 12.000 36.000 2.188 8.000 16.00

024 0.002809 2.000 6.000

∑ 5.750 7.530 8.438 15.133 40.587 6.288 13.766

23.824

28.958 0.035

media 1.150n 5a1 3.547a0 -2.573Sr 6.288St 40.587Sy/x 1.448r 0.919r^2 0.845

Ṣ Ṣ^2

POLINOMIALMATRIZ

5 5.750 8.438 a0 7.5305.750 8.438 13.766 a1 15.1338.438 13.766 23.824 a2 28.958

n ∑X ∑X^2 a0 ∑Y

∑X ∑X^2 ∑X^3 a1 ∑XY∑X^2 ∑X^3 ∑X^4 a2 ∑YX^2

a0 0.382a1 -3.9969a2 3.3897

POLINOMIAL

Sr 0.035St 40.587r 0.99957114r2 0.99914247Sy/x 0.1319179

0.000 0.500 1.000 1.500 2.000 2.500

-1.000

0.000

1.000

2.000

3.000

4.000

5.000

6.000

7.000

Series2Linear (Series2)

Axis Title

Axis Title

La covarianza

Cu(x) S (y) X-Xmed

Y-Ymed

(X-Xmed)2 (Y-Ymed)2 (X-Xmed)(Y-Ymed)

XY X2 lnx lnx)2 lny lnY lnX xLnY

0.1 0.0 -0.6433

-2.5944

0.4139 6.7308 1.6690 0.0010 0.0100 -2.3026

5.3019 -4.6052

10.6038

-0.4605

0.1 0.1 -0.6433

-2.5044

0.4139 6.2719 1.6111 0.0100 0.0100 -2.3026

5.3019 -2.3026

5.3019 -0.2303

0.1 0.2 - - 0.4139 5.7810 1.5468 0.0200 0.0100 - 5.3019 - 3.7059 -

0.6433 2.4044 2.3026 1.6094 0.16090.1 0.2 -

0.6433-2.4044

0.4139 5.7810 1.5468 0.0200 0.0100 -2.3026

5.3019 -1.6094

3.7059 -0.1609

0.1 0.2 -0.6433

-2.4044

0.4139 5.7810 1.5468 0.0200 0.0100 -2.3026

5.3019 -1.6094

3.7059 -0.1609

0.1 0.2 -0.6433

-2.4044

0.4139 5.7810 1.5468 0.0200 0.0100 -2.3026

5.3019 -1.6094

3.7059 -0.1609

0.1 0.2 -0.6433

-2.4044

0.4139 5.7810 1.5468 0.0200 0.0100 -2.3026

5.3019 -1.6094

3.7059 -0.1609

0.4 0.3 -0.3433

-2.3044

0.1179 5.3101 0.7912 0.1200 0.1600 -0.9163

0.8396 -1.2040

1.1032 -0.4816

0.1 0.3 -0.6433

-2.3044

0.4139 5.3101 1.4825 0.0300 0.0100 -2.3026

5.3019 -1.2040

2.7722 -0.1204

0.1 0.3 -0.6433

-2.3044

0.4139 5.3101 1.4825 0.0300 0.0100 -2.3026

5.3019 -1.2040

2.7722 -0.1204

0.1 0.3 -0.6433

-2.3044

0.4139 5.3101 1.4825 0.0300 0.0100 -2.3026

5.3019 -1.2040

2.7722 -0.1204

0.1 0.3 -0.6433

-2.3044

0.4139 5.3101 1.4825 0.0300 0.0100 -2.3026

5.3019 -1.2040

2.7722 -0.1204

0.7 0.4 -0.0433

-2.2044

0.0019 4.8593 0.0955 0.2800 0.4900 -0.3567

0.1272 -0.9163

0.3268 -0.6414

2.4 0.4 1.6567 -2.2044

2.7445 4.8593 -3.6519 0.9600 5.7600 0.8755 0.7664 -0.9163

-0.8022

-2.1991

0.4 0.4 -0.3433

-2.2044

0.1179 4.8593 0.7568 0.1600 0.1600 -0.9163

0.8396 -0.9163

0.8396 -0.3665

0.1 0.4 -0.6433

-2.2044

0.4139 4.8593 1.4181 0.0400 0.0100 -2.3026

5.3019 -0.9163

2.1098 -0.0916

0.1 0.5 -0.6433

-2.1044

0.4139 4.4284 1.3538 0.0500 0.0100 -2.3026

5.3019 -0.6931

1.5960 -0.0693

0.2 0.5 -0.5433

-2.1044

0.2952 4.4284 1.1434 0.1000 0.0400 -1.6094

2.5903 -0.6931

1.1156 -0.1386

0.1 0.6 - - 0.4139 4.0175 1.2895 0.0600 0.0100 - 5.3019 - 1.1762 -

0.6433 2.0044 2.3026 0.5108 0.05110.3 0.6 -

0.4433-2.0044

0.1965 4.0175 0.8886 0.1800 0.0900 -1.2040

1.4496 -0.5108

0.6150 -0.1532

0.1 0.7 -0.6433

-1.9044

0.4139 3.6266 1.2251 0.0700 0.0100 -2.3026

5.3019 -0.3567

0.8213 -0.0357

5.9 1.2 5.1567 -1.4044

26.5912 1.9723 -7.2419 7.0800 34.8100

1.7750 3.1505 0.1823 0.3236 1.0757

7.0 1.2 6.2567 -1.4044

39.1459 1.9723 -8.7867 8.4000 49.0000

1.9459 3.7866 0.1823 0.3548 1.2763

1.3 1.3 0.5567 -1.3044

0.3099 1.7014 -0.7261 1.6900 1.6900 0.2624 0.0688 0.2624 0.0688 0.3411

0.1 1.4 -0.6433

-1.2044

0.4139 1.4505 0.7748 0.1400 0.0100 -2.3026

5.3019 0.3365 -0.7748

0.0336

0.1 1.4 -0.6433

-1.2044

0.4139 1.4505 0.7748 0.1400 0.0100 -2.3026

5.3019 0.3365 -0.7748

0.0336

0.1 1.4 -0.6433

-1.2044

0.4139 1.4505 0.7748 0.1400 0.0100 -2.3026

5.3019 0.3365 -0.7748

0.0336

0.1 1.4 -0.6433

-1.2044

0.4139 1.4505 0.7748 0.1400 0.0100 -2.3026

5.3019 0.3365 -0.7748

0.0336

0.1 1.4 -0.6433

-1.2044

0.4139 1.4505 0.7748 0.1400 0.0100 -2.3026

5.3019 0.3365 -0.7748

0.0336

0.1 1.4 -0.6433

-1.2044

0.4139 1.4505 0.7748 0.1400 0.0100 -2.3026

5.3019 0.3365 -0.7748

0.0336

1.0 1.5 0.2567 -1.1044

0.0659 1.2196 -0.2835 1.5000 1.0000 0.0000 0.0000 0.4055 0.0000 0.4055

0.3 1.5 -0.4433

-1.1044

0.1965 1.2196 0.4896 0.4500 0.0900 -1.2040

1.4496 0.4055 -0.4882

0.1216

1.5 1.6 0.7367 -1.0044

0.5427 1.0088 -0.7399 2.3680 2.1904 0.3920 0.1537 0.4700 0.1843 0.6956

0.1 1.6 -0.6433

-1.0044

0.4139 1.0088 0.6461 0.1600 0.0100 -2.3026

5.3019 0.4700 -1.0822

0.0470

0.1 1.6 - - 0.4139 1.0088 0.6461 0.1600 0.0100 - 5.3019 0.4700 - 0.0470

0.6433 1.0044 2.3026 1.08220.1 1.6 -

0.6433-1.0044

0.4139 1.0088 0.6461 0.1600 0.0100 -2.3026

5.3019 0.4700 -1.0822

0.0470

2.7 2.4 1.9567 -0.2044

3.8285 0.0418 -0.3999 6.4800 7.2900 0.9933 0.9865 0.8755 0.8696 2.3638

0.1 2.9 -0.6433

0.2956 0.4139 0.0874 -0.1902 0.2900 0.0100 -2.3026

5.3019 1.0647 -2.4516

0.1065

0.1 3.6 -0.6433

0.9956 0.4139 0.9913 -0.6405 0.3600 0.0100 -2.3026

5.3019 1.2809 -2.9495

0.1281

0.7 3.8 -0.0433

1.1956 0.0019 1.4295 -0.0518 2.6600 0.4900 -0.3567

0.1272 1.3350 -0.4762

0.9345

0.2 6.0 -0.5433

3.3956 0.2952 11.5303 -1.8450 1.2000 0.0400 -1.6094

2.5903 1.7918 -2.8837

0.3584

1.4 7.6 0.6567 4.9956 0.4312 24.9563 3.2805 10.6400

1.9600 0.3365 0.1132 2.0281 0.6824 2.8394

1.2 8.2 0.4567 5.5956 0.2085 31.3110 2.5553 9.8400 1.4400 0.1823 0.0332 2.1041 0.3836 2.52500.9 8.8 0.1567 6.1956 0.0245 38.3858 0.9706 7.9200 0.8100 -

0.10540.0111 2.1748 -

0.22911.9573

0.7 9.0 -0.0433

6.3956 0.0019 40.9040 -0.2771 6.3000 0.4900 -0.3567

0.1272 2.1972 -0.7837

1.5381

0.6 9.2 -0.1433

6.5956 0.0205 43.5023 -0.9454 5.5200 0.3600 -0.5108

0.2609 2.2192 -1.1336

1.3315

1.9 16.6 1.1567 13.9956

1.3379 195.8775 16.1883 31.5400

3.6100 0.6419 0.4120 2.8094 1.8032 5.3379

1.4 18.3 0.6567 15.6956

0.4312 246.3526 10.3068 25.6200

1.9600 0.3365 0.1132 2.9069 0.9781 4.0697

35.6800

125.01

0.0000 0.0000 87.6683 764.6072 40.5049 133.4290

114.1904

-61.2717

157.8461

0.7198 40.7831

21.5433

0.7433

2.6044

0.0000 0.0000 1.8264 15.9293 0.8439 2.7798 2.3790 -1.2765

3.2885 0.0150 0.8496 0.4488

CONTAR 48

COVARIANZA 0.8438521

0.8439

MEDIA X 0.7433333

MEDIA Y 2.604375VARIANZA X 1.826422

2VARIANZA Y 15.92931

6MEDIA XY 2.779770

8MEDIA X2 2.3790STD X 1.351451

9STD Y 3.991154

8r 0.156447

0.0244757

a1 0.6244041

Cu S0.1000 0.01000.1000 0.10000.1000 0.20000.1000 0.20000.1000 0.20000.1000 0.20000.1000 0.20000.1000 0.30000.1000 0.30000.1000 0.30000.1000 0.30000.1000 0.40000.1000 0.50000.1000 0.60000.1000 0.70000.1000 1.40000.1000 1.40000.1000 1.40000.1000 1.40000.1000 1.40000.1000 1.40000.1000 1.60000.1000 1.60000.1000 1.60000.1000 2.90000.1000 3.60000.2000 0.50000.2000 6.00000.3000 0.6000

0.3000 1.50000.4000 0.30000.4000 0.40000.6000 9.20000.7000 0.40000.7000 3.80000.7000 9.00000.9000 8.80001.0000 1.50001.2000 8.2000 1.3000 1.30001.4000 7.60001.4000 18.30001.4800 1.60001.9000 16.60002.4000 0.40002.7000 2.40005.9000 1.20007.0000 1.2000

RESULTADO

CONCLUSIONES