Estadística Montgomery Ejercicio 11.30

7
MODELO LINEAL Ejercicio 11,30 a- Qué tipo de diseño están usando los experimentadores. Los experimentadores están usando un diseño simplex centroide aumentado dado que se tenían valores de composición de 1 para cada componente, de 1/2 para cada mezcla binaria y de 1/3 para el punto central de la mezcla ternaria; además es aumentado porque tiene otros puntos interiores que corresponden a 2/3 y a 1/6. Analizar Mezcla - y, GPM Nombre del archivo: Ejercicio11_30.sgx Efectos Estimados del Modelo Completo para y, GPM Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Media 8169,95 1 8169,95 Lineal 3,92467 2 1,96233 10,64 0,0027 Cuadrático 0,297762 3 0,0992539 0,46 0,7188 Cúbico Especial 0,0000505303 1 0,0000505303 0,00 0,9890 Error 1,7318 7 0,247401 Total 8175,9 14 Resultados del Modelo Completo Modelo ES R-Cuadrada R-Cuadrada Ajd. Lineal 0,429547 65,91 59,72 Cuadrático 0,465276 70,91 52,74 Cúbico Especial 0,497394 70,91 45,98 El modelo lineal contiene términos de primer orden para cada componente. El modelo muestra un valor-P que demuestra que es estadísticamente significativo porque el valor-P es menor que 0.05, trabajando con un nivel de confianza del 95,0%. De acuerdo con este criterio, parece que el modelo lineal es adecuado para los datos. También se muestra el valor de R 2 y se compara este resultado con otros 2 modelos cuadrático y cubico especial, aparentemente el modelo lineal es el que tiene un valor de R 2 menor a los otros 2 modelos, pero en este caso esta tendencia se debe a que en los otros modelos se agregan productos cruzados que hacen que aumente ficticiamente este valor. Para determinar entonces el modelo que mejor se ajusta a los datos se debe analizar el R 2 Ajustado, acá se puede observar que efectivamente el mejor modelo es el lineal ya que tiene un mayor valor en comparación con el modelo cuadrático y cubico espacial. El valor-P y el R 2 Ajustado arrojan resultados concluyentes que indican que el modelo lineal es el que mejor se ajusta a los datos. ANOVA para y, GPM Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P Modelo Lineal 3,92461 2 1,9623 10,63 0,0027

description

Análisis Lineal

Transcript of Estadística Montgomery Ejercicio 11.30

Page 1: Estadística Montgomery Ejercicio 11.30

MODELO LINEAL Ejercicio 11,30a- Qué tipo de diseño están usando los experimentadores.

Los experimentadores están usando un diseño simplex centroide aumentado dado que se tenían valores de composición de 1 para cada componente, de 1/2 para cada mezcla binaria y de 1/3 para el punto central de la mezcla ternaria; además es aumentado porque tiene otros puntos interiores que corresponden a 2/3 y a 1/6.

Analizar Mezcla - y, GPMNombre del archivo: Ejercicio11_30.sgx

Efectos Estimados del Modelo Completo para y, GPMFuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-PMedia 8169,95 1 8169,95Lineal 3,92467 2 1,96233 10,64 0,0027Cuadrático 0,297762 3 0,0992539 0,46 0,7188Cúbico Especial 0,0000505303 1 0,0000505303 0,00 0,9890Error 1,7318 7 0,247401Total 8175,9 14

Resultados del Modelo CompletoModelo ES R-Cuadrada R-Cuadrada Ajd.Lineal 0,429547 65,91 59,72Cuadrático 0,465276 70,91 52,74Cúbico Especial 0,497394 70,91 45,98

El modelo lineal contiene términos de primer orden para cada componente. El modelo muestra un valor-P que demuestra que es estadísticamente significativo porque el valor-P es menor que 0.05, trabajando con un nivel de confianza del 95,0%. De acuerdo con este criterio, parece que el modelo lineal es adecuado para los datos.También se muestra el valor de R2 y se compara este resultado con otros 2 modelos cuadrático y cubico especial, aparentemente el modelo lineal es el que tiene un valor de R2 menor a los otros 2 modelos, pero en este caso esta tendencia se debe a que en los otros modelos se agregan productos cruzados que hacen que aumente ficticiamente este valor. Para determinar entonces el modelo que mejor se ajusta a los datos se debe analizar el R 2 Ajustado, acá se puede observar que efectivamente el mejor modelo es el lineal ya que tiene un mayor valor en comparación con el modelo cuadrático y cubico espacial. El valor-P y el R2 Ajustado arrojan resultados concluyentes que indican que el modelo lineal es el que mejor se ajusta a los datos.

ANOVA para y, GPMFuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-PModelo Lineal 3,92461 2 1,9623 10,63 0,0027Error total 2,02968 11 0,184516Total (corr.) 5,95429 13

R-cuadrada = 65,9123 porcientoR-cuadrada (ajustada por g.l.) = 59,7145 porcientoError estándar del est. = 0,429554Error absoluto medio = 0,342383Estadístico Durbin-Watson = 3,04661 (P=0,9773)Autocorrelación residual de Lag 1 = -0,569756

El StatAdvisorEsta tabla muestra un análisis de varianza para el modelo lineal actualmente seleccionado. Dado que el valor-P para este modelo es menor que 0,05, existe una relación estadísticamente significativa entre y, GPM y los componentes, con un nivel de confianza del 95,0%.

El estadístico R-Cuadrada indica que el modelo, así ajustado, explica 65,9123% de la variabilidad en y, GPM. El estadístico R-cuadrada ajustada, que es más adecuado para comparar modelos con diferente número de variables independientes, es 59,7145%. El error estándar del estimado muestra que la desviación estándar de los residuos es 0,429554. El error medio absoluto (MAE) de 0,342383 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) prueba los residuos para determinar si haya alguna correlación significativa basada en el orden en que se

Page 2: Estadística Montgomery Ejercicio 11.30

presentan los datos en el archivo. Puesto que el valor-P es mayor que 5,0%, no hay indicación de autocorrelación serial en los residuos con un nivel de significancia del 5,0%.

Lineal Resultados de Ajuste de Modelo para y, GPMError Estadístico

Parámetro Estimado Estándar T Valor-PA:X1 24,9305 0,249768B:X2 24,3505 0,249768C:X3 23,1905 0,249768

R-cuadrada = 65,9123 porcientoR-cuadrada (ajustada por g.l.) = 59,7145 porcientoError estándar del est. = 0,429554Error absoluto medio = 0,342383Estadístico Durbin-Watson = 3,04661 (P=0,9773)Autocorrelación residual de Lag 1 = -0,569756

El StatAdvisorEsta ventana muestra la ecuación del modelo lineal ajustado. La ecuación del modelo ajustado es

y, GPM = 24,9305*X1 + 24,3505*X2 + 23,1905*X3

en donde los valores de los componentes se especifican en pseudo-componentes. Para hacer que STATGRAPHICS evalúe esta función, seleccione Predicciones de la lista de Opciones Tabulares. Para graficar la función, seleccione Gráficas de Respuestas de la lista de Opciones Tabulares.

Matriz de Correlación para los Coeficientes Estimados

A:X1 B:X2 C:X3A:X1 1,0000 -0,1831 -0,1831B:X2 -0,1831 1,0000 -0,1831C:X3 -0,1831 -0,1831 1,0000

El StatAdvisorLa matriz de correlación muestra el grado de confusión entre los efectos. Un diseño perfectamente ortogonal mostrará una matriz diagonal con 1´s en la diagonal y 0´s fuera de ella. Cualquier término distinto de cero implica que los estimados de los efectos correspondientes a esa fila y columna estarán correlacionados. En este caso, hay 3 pares de efectos con interacción distinta de cero. No obstante, como ninguna es mayor o igual que 0,5, probablemente será capaz de interpretar los resultados sin mucha dificultad. NOTA: la confusión es normal en diseños de mezclas.

Resultados Estimados para y, GPMObservados Ajustados Inferior 95,0% Superior 95,0%

Fila Valores Valores para Media para Media1 24,5 24,9305 24,3807 25,48022 24,8 24,3505 23,8007 24,90023 22,7 23,1905 22,6407 23,74024 25,1 24,6405 24,2891 24,99185 24,3 24,0605 23,7091 24,41186 23,5 23,7705 23,4191 24,12187 24,8 24,1571 23,9044 24,40988 24,2 24,5438 24,1925 24,89529 23,9 24,2538 23,9025 24,605210 23,7 23,6738 23,3225 24,025211 25,1 24,9305 24,3807 25,480212 23,9 24,3505 23,8007 24,900213 23,6 23,1905 22,6407 23,7402

Page 3: Estadística Montgomery Ejercicio 11.30

14 24,1 24,1571 23,9044 24,4098

El StatAdvisorEsta tabla contiene información acerca de los valores de y, GPM generados usando el modelo ajustado. La tabla incluye:

(1) los valores observados de y, GPM (si alguno) (2) el valor predicho de y, GPM usando el modelo ajustado (3) intervalos de confianza del 95,0% para la respuesta media

Cada ítem corresponde a los valores de los componentes en una fila específica del archivo de datos. Para generar pronósticos para combinaciones adicionales de los componentes, agregue filas al final del archivo de datos. En cada fila, introduzca los valores para los componentes pero deje vacías las celdas para la respuesta. Cuando regrese a esta ventana, se habrán agregado pronósticos a la tabla para las nuevas filas pero el modelo no se verá afectado.

Optimizar RespuestaMeta: maximizar y, GPM

Valor óptimo = 24,9305

Factor Bajo Alto ÓptimoX1 0,0 1,0 1,0X2 0,0 1,0 0,0X3 0,0 1,0 0,0

El StatAdvisorEsta tabla muestra la combinación de los niveles de los factores, la cual maximiza y, GPM sobre la región indicada. Use el cuadro de diálogo de Opciones de Ventana para indicar la región sobre la cual se llevará a cabo la optimización. Puede establecer el valor de uno o más factores a una constante, estableciendo los límites alto y bajo en ese valor.

En la gráfica de superficie de respuesta se puede apreciar que las mezclas que contengan una mayor fracción de X1 y bajas concentraciones de X2 y X3 son las que optimizan las millas por

Page 4: Estadística Montgomery Ejercicio 11.30

galón, ya que al aumentar la concentración de X1 la mezcla obtendrá un valor máximo para Y; si se aumenta la concentración de X3 la mezcla obtendrá un valor mínimo para Y. Esto coincide con la tabla de la optimización en donde se indica que para maximizar las millas por galón la mezcla se debe componer únicamente de X1.

c- SEGÚN esta grafica de contornos de la superficie de respuesta se puede deducir que la composición de la mezcla que maximiza las millas por galón es X1 = 1, X2 = 0 y X3 = 0, esta composición es la que está marcada con un asterisco en el vértice superior del grafico de contornos.

Con el grafico de traza se puede evaluar la importancia de cada componente en la mezcla. Esta gráfica inicia con una mezcla de referencia (usualmente con el centroide de la región experimental), y va mostrando la manera en que la respuesta (y) se modifica conforme uno de los componentes aumenta o disminuye su participación en la mezcla. Cuando uno de los

Page 5: Estadística Montgomery Ejercicio 11.30

componentes cambia, el resto se incrementa o disminuye en forma proporcional. De esta manera, la forma del gráfico de trazas muestra la importancia relativa de los componentes. En este caso se puede apreciar que el efecto del componente X1 en la mezcla es muy positivo ya que al aumentar la concentración de este las millas por galón se maximizan. En cambio para X3 es todo lo contrario al aumentar su concentración en la mezcla las millas por galón se minimizan, indicando que tiene un efecto negativo en la mezcla, por lo tanto no debería incluirse en ella. Del componente X2 se puede decir que no causa mucho efecto en la mezcla, si se aumenta o disminuye su concentración los cambios en la variable Y no son muy grandes, aunque los aumenta un poco, pero aun así, su influencia en la mezcla no es muy fuerte, esto indica que es un componente innecesario en la mezcla. En conclusión la mezcla solo debe componerse de X1, lo que concuerda con los análisis hechos anteriormente.

En esta grafica ayuda a detectar cualquier heterocedastacidad en el modelo. Ya que en este caso los puntos no tienden a formar un embudo se concluye que no hay heterocedastacidad en los datos. Como se puede observar los datos se encuentran muy dispersos alrededor de la línea horizontal.