Minimos Cuadrados

5
CAP ´ ITULO 3 etodo de m´ ınimos cuadrados En un experimento t´ ıpico que envuelve la medici´ on de varios valores de dos variables f´ ısicas es investigar la funcionalidad entre las dos variables. En t´ erminos generales, sea la variable de entrada x y la variable de salida y, por simplicidad, las dos est´ an relacionadas linealmente y que la incertidumbre en la medici´ on de x es mucho menor que la respectiva incertidumbre en y, e. d.: y[x]= a + bx (3.1) donde la pendiente b y el intercepto a son par´ ametros que deben determinarse mediante un criterio. La fig. 3.1 muestra la situaci´ on a estudiar. x y pendiente b a y i x i y i y[x i ] y[x] Figura 3.1: Gr´afico de datos asociados a un modelo lineal. La cantidad yi - y[xi] representa la desviaci´on de cada observaci´on de yi respecto del valor predicho por el modelo yi [xi ]. Cuando se hace una serie de medidas del tip descrito, se puede preguntar: 1. ¿C´ omo elegir ✭✭la mejor recta✮✮ que ajuste una serie de datos experimentales? 2. ¿Con qu´ e exactitud se determinan el intercepto a y la pendiente b? El m´ etodo anal´ ıtico de encontrar la mejor l´ ınea recta que ajuste una serie de datos experimentales se denomina regresi´ on lineal o etodo de m´ ınimos cuadrados y la exactitud de determinar a y b es a trav´ es de m´ etodos estad´ ısticos. La regresi´ on lineal consiste en suponer que la incertidumbre en una de las mediciones de las variables es despreciable frente a la otra. Esta suposici´ on es razonable ya que las incertidumbres en 3-1

description

En un experimento t´ıpico que envuelve la medici´on de varios valores de dos variables f´ısicas esinvestigar la funcionalidad entre las dos variables. En t´erminos generales, sea la variable de entrada xy la variable de salida y, por simplicidad,

Transcript of Minimos Cuadrados

  • CAPITULO 3

    Metodo de mnimos cuadrados

    En un experimento tpico que envuelve la medicion de varios valores de dos variables fsicas esinvestigar la funcionalidad entre las dos variables. En terminos generales, sea la variable de entrada xy la variable de salida y, por simplicidad, las dos estan relacionadas linealmente y que la incertidumbreen la medicion de x es mucho menor que la respectiva incertidumbre en y, e. d.:

    y[x] = a+ bx (3.1)

    donde la pendiente b y el intercepto a son parametros que deben determinarse mediante un criterio.La fig. 3.1 muestra la situacion a estudiar.

    x

    y

    pendiente b

    a

    yi

    xi

    yi y[xi]

    y[x]

    Figura 3.1: Grafico de datos asociados a un modelo lineal. La cantidad yi y[xi] representa la desviacion decada observacion de yi respecto del valor predicho por el modelo yi[xi].

    Cuando se hace una serie de medidas del tip descrito, se puede preguntar:

    1. Como elegir ((la mejor recta)) que ajuste una serie de datos experimentales?

    2. Con que exactitud se determinan el intercepto a y la pendiente b?

    El metodo analtico de encontrar la mejor lnea recta que ajuste una serie de datos experimentalesse denomina regresion lineal o metodo de mnimos cuadrados y la exactitud de determinar ay b es a traves de metodos estadsticos.

    La regresion lineal consiste en suponer que la incertidumbre en una de las mediciones de lasvariables es despreciable frente a la otra. Esta suposicion es razonable ya que las incertidumbres en

    3-1

  • 3-2

    una de las variables a menudo son mayores que en la otra y, por tanto, se pueden ignorar.Tambien seasume que las incertidumbres en una de las variables son todas del mismo orden, lo cual es razonableen muchos experimentos,pero no necesariamente cierta. Sea la variable x la que tiene incertidumbredespreciable y las mediciones de cada yi estan gobernadas por la distribucion (1.21), con el mismoparametro y para todas las mediciones.

    Si se conoce las constantes a y b,para cualquier valor dado de xi (que se ha asumido no tieneincertidumbre), se puede calcular el valor verdadero de la correspondiente ti,

    (valor verdadero de yi) = a+ bxi

    La desviacion entre el i-esimo valor experimental yi[xi] y la respectiva ordenada a+bxi en la supuestarecta de ajuste es:

    yi = yi (a+ bxi), con i = 1, 2, . . . , n (3.2)Entre todas las posibles rectas de intercepto a y pendiente b que ajusta a la serie de datos experiemt-nales, se escoge aquella para la cual tiene lugar el siguiente criterio:

    La suma de los cuadrados de las desviaciones yi debe ser mnima, es decir,

    ni=1

    (yi)2 = mn

    Teniendo en cuenta la relacion (3.2):

    ni=1

    (yi a bxi)2 = mn

    La condicion de existencia del mnimo de esta expresion exige que sus derivadas parciales con respectoa los parametros a y b se anulen, es decir:

    a

    (ni=1

    (yi a bxi)2)= 0 ;

    b

    (ni=1

    (yi a bxi)2)= 0

    Al realizar la operacion indicada, se obtiene

    ni=1

    (yi a bxi) = 0 ;ni=1

    (yi a bxi)xi = 0

    Estas dos ecuaciones pueden ser reescritas como ecuaciones simultaneas lineales para a y b:

    an+ b

    xi =

    yi ; a

    xi + b

    x2i =

    xiyi

    donde se ha omitido los lmites i = 1 a n en los signos de la sumatoria, por comodidad en la

    escritura de las ecuaciones. La solucion de este sistema es:

    a =

    x2i

    yi

    xi(xiyi)

    n

    x2i (

    xi)2 (3.3)

    b =n

    xiyi

    xi

    yi

    n

    x2i (

    xi)2 (3.4)

    De esta manera se encuentra el intercepto y la pendiente de la recta que minimiza la suma(yi)

    2.Del analisis estadstico, la incertidumbre en y es:

    sy =

    (yi a bxi)2

    n

  • 3-3

    pero este estimativo no es correcto porque los numeros a y b son los valores verdaderos desconocidos.En la practica, estos numeros deben reemplazarse por los mejores estimativos dados por (3.3) y 3.4,esto conduce a una reduccion en sy al reemplazar n n 2:

    sy =

    (yi a bxi)2

    n 2 (3.5)

    La razon es que se ha hecho n medidas pero se deben calcular dos cantidades a y b.Teniendo sy, las incertidumbres de a y b se obtienen de

    sa = sy

    x2i

    n

    x2i (

    xi)2 (3.6)

    sb = sy

    n

    n

    x2i (

    xi)2 (3.7)

    De esta forma, el metodo de mnimos cuadrados permite calcular de manera inequvoca las incer-tidumbres del intercepto a y de la pendiente b con base en los datos medidos y no en las apreciacionesbasadas en las incertidumbres de los valores medios de los datos.

    Que tan valido es aproximar un conjunto de datos mediante una dependencia lineal de la formacomo se ha planteado? La respuesta a esta pregunta se obtiene mediante el calculo del llamadocoeficiente de correlacion lineal, el cual se define de la siguiente manera:

    r =n

    xiyi

    xi

    yi(n

    x2i (

    xi)2

    )(n

    y2i (

    yi)2

    ) (3.8)

    Esta magnitud, en cierta medida caracteriza el grado de dependencia lineal de la variable y conrespecto a la variable x. Si r = 1, significa que la correlacion entre x e y es perfecta. Al contrario, sir = 0, entre x e y no hay correlacion. Una correlacion imperfecta significa que 0 < r < 1.

    Ejemplo 3.1 Se quiere investigar la dependencia de la resistencia R de un material con respecto ala temperatura T . Los resultados se muestran en la tabla 3.1 y la grafica en la fig. 3.2:

    T (C) 10 20 30 40 50 60 70 80R () 12,3 12,9 13,6 13,8 14,5 15,1 15,2 15,9

    Tabla 3.1: Datos de la temperatura T (C) y la resistencia R .

    Como suele suceder en muchos problemas, las variables no llamadas x e y, pero debe tenersecuidado enla identificacion de cada una. Para el presente caso, se tiene el reemplazo:

    xi Ti yi RiUn vistazo a la distribucion de estos datos permite afirmar que estos se pueden ajustar mediante unarecta. El objetivo es determinar dicha recta mediante el metodo de mnimos cuadrados. De acuerdocon las ecs. (3.3) y (3.4), se necesita conocer

    Ti,

    Ri,

    T 2i ,

    R2i y

    TiRi:Con base en estos valores, se puede determinar los valores de la pendiente b y el intercepto a:

    a =

    T 2i

    Ri

    Ti

    TiRi

    n

    T 2i (

    Ti)2 =

    (20 400)(113, 3) (360)(5 308)8(20 400) (360)2 = 11,91

    b =n

    TiRi

    Ti

    Ri

    n

    T 2i (

    Ti)2 =

    8(5 308) (360)(113, 3)8(20 400) (360)2 = 4, 98 10

    2 /C

  • 3-4

    0 15 30 45 60 75

    12

    13

    14

    15

    16

    Resistencia R ()

    Temperatura T (C)

    Figura 3.2: Grafica de los datos de la tabla 3.1.

    Ti Ri T2i R

    2i TiRi

    (C) () (C2) (2) (C )

    10 12,3 100 151.29 12320 12,9 400 166,41 25830 13,6 900 184,96 40840 13,8 1 600 190,44 55250 14,5 2 500 210,25 72560 15,1 3 600 228,01 90670 15,2 4 900 231,04 1 06480 15,9 6 400 252,81 1 272Ti

    Ri

    T 2i

    R2i

    TiRi

    60 13,3 20 400 1 615,21 5 308

    Tabla 3.2: Datos para calcular las ecs. (3.3) y (3.4).

    De los anteriores resultados, se puede determinar las magnitudes Ri = Ri (a+ bTi) y(Ri)

    2.Estos datos se encuentran en la tabla 3.3.

    Con base en estos valores, se puede determinar sy (3):

    sy =

    (yi)2

    n 2 =

    0, 15

    8 2 = 0, 16

    y as se puede determinar las desviaciones estandar de la pendiente y el intercepto:

    sa = sy

    x2i

    n

    x2i (

    nxi)2 = 0, 16

    20 400

    8(20 400) (360)2 = 0, 13

    sb = sy

    n

    n

    x2i (

    xi)2 = 0, 16

    8

    8(20 400) (360)2 = 2, 47 103 /C

    Por tanto, la recta R = a + bT que ajusta los datos de la fig. 3.2 de acuerdo con el criterio demnimos cuadrados tiene la forma:

    R[T ] = (11,9 0, 1) + (5, 0 0, 3) 102T

  • 3-5

    Ti Ri a+ bTi Ri (Ri)2

    (C) () () () (2)

    10 12,3 12,4 0.1 0,0120 12,9 12,9 0 030 13,6 13,4 0,2 0,0440 13,8 13,9 0,1 0,0150 14,5 14,4 0,1 0,0160 15,1 14,9 0,2 0,0470 15,2 15,4 0,2 0,0480 15,9 15,9 0 0

    (

    Ri)2

    0,15

    Tabla 3.3: Datos para calcular la magnitud sy dada por (3).

    0 15 30 45 60 75

    12

    13

    14

    15

    16

    Resistencia R ()

    Temperatura T (C)

    Figura 3.3: Regresion lineal usando el metodo de mnimos cuadrados de la fig 3.2.

    y se presenta en la fig. 3.3.Finalmente, para el coeficiente de correlacion se tiene:

    r =n

    xiyi

    xi

    yi(n

    x2i (

    xi)2

    )(n

    y2i (

    yi)2

    )

    =8(5 308) (360)(113, 3)

    8(20 400) (3602)8(1 615, 2) (113, 32)

    = 0, 9934

    lo cual indica que la resistencia del material considerado esta bien correlacionada con la temperatura.