Ajuste Por Mínimos Cuadrados

download Ajuste Por Mínimos Cuadrados

of 3

description

matematicas

Transcript of Ajuste Por Mínimos Cuadrados

Ajuste por mnimos cuadrados

Ajuste por mnimos cuadrados

Hasta ahora nos hemos ocupado de la manera de obtener el mejor valor de una magnitud a partir de una o varias medidas. Un problema ms general es determinar la relacin funcional entre dos magnitudes x e y como resultado de experimentos.

Supongamos que por razones tericas bien fundadas sabemos que entre x e y existe la relacin lineal

y=ax+b

y deseamos determinar los parmetros a y b a partir de n medidas de x e y. a es la pendiente de la recta, es decir, la tangente del ngulo que forma con el eje de abscisas, y b la ordenada en el origen, es decir la altura a la que corta la recta al eje de ordenadas. Para concretar, supongamos que los valores que han resultado de un experimento son los siguientes:

Ante un problema de este tipo, lo primero que conviene hacer es representar grficamente los resultados para observar si los valores medidos se aproximan a una recta o no. En la figura 3 se han representado las medidas anteriores.

Figura: Representacin de los pares de valores xi, yi correspondientes al experimento.

A la vista del grfico parece claro que las dos variables siguen una relacin lineal. La recta que parece representar mejor la relacin se ha dibujado ``a ojo''. Es importante darse cuenta de que los seis puntos dibujados no pasan todos por la misma recta. Esto es debido a los errores de las medidas, por lo que los puntos se distribuyen de forma ms o menos aleatoria en torno a esa recta. A pesar de ello es claramente visible la tendencia lineal de los puntos.

Para determinar la recta que mejor se adapta a los puntos se emplea el llamado mtodo de los mnimos cuadrados. Para un valor de x determinado, la recta de ajuste proporciona un valor diferente de y del medido en el experimento. Esta diferencia ser positiva para algunos puntos y negativa para otros, puesto que los puntos se disponen alrededor de la recta. Por este motivo, la suma de estas diferencias para todos los puntos es poco significativa (las diferencias negativas se compensan con las positivas).

Por ello, para medir la discrepancia entre la recta y los puntos, se emplea la suma de los cuadrados de las diferencias, con los que nos aseguramos de que todos los trminos son positivos. Esta suma tiene la forma:

(14)

De todas las posibles rectas que podemos trazar, caracterizadas por los parmetros a y b, la recta que mejor se ajusta a los puntos es la que hace mnima la suma expresada en la ecuacin 14. Esto es fcil de comprender, puesto que esta suma representa la discrepancia entre los puntos y la recta. Las condiciones de mnimo (primeras derivadas nulas) conducen a las ecuaciones

(15)

que se conocen como ecuaciones normales para la determinacin de a y b. n es el nmero de parejas de valores de que se parte para determinar la recta.

Las soluciones de las ecuaciones normales son

(16)

donde por claridad se han suprimido los lmites de los sumatorios.

Con los datos del ejemplo y aplicando las anteriores ecuaciones, resulta a=0.94 y b=0.65 que es la recta que mejor se ajusta a los datos segn el mtodo de los mnimos cuadrados.

El caso de una relacin lineal que hemos tomado como ejemplo no es tan especial como podra pensarse, porque muchas relaciones funcionales de inters pueden transformarse en lineales con un cambio de variable adecuado y/o tomando logaritmos.

Bondad de un ajuste

Queda por dilucidar, despus de obtenida la ecuacin de la recta que mejor se ajusta a un conjunto de datos, si el ajuste de los datos a una recta es realmente bueno o mediocre. Puede ayudar la inspeccin del grfico de los puntos, aunque es deseable disponer de un criterio objetivo al respecto. Un mtodo para determinar si dos variables estn relacionadas es mediante el llamado coeficiente de correlacin lineal, que puede calcularse con la siguiente expresin

(17)

Un coeficiente de correlacin prximo a la unidad indica una ajuste bueno, mientras que si es prximo a cero, el ajuste es pobre, es decir, no puede aceptarse que la relacin entre las variables sea lineal.