Analisis de Regresión y Superficie de Respuesta Chacin

76
Universidad Central de Venezuela Facultad de Agronomía W 1 FRANI¿LIN CHACIN

description

Libro con herramientas estadísticas, mas que todo de regresión lineal

Transcript of Analisis de Regresión y Superficie de Respuesta Chacin

Page 1: Analisis de Regresión y Superficie de Respuesta Chacin

Universidad Central de VenezuelaFacultad de Agronomía

W1

FRANI¿LIN CHACIN

Page 2: Analisis de Regresión y Superficie de Respuesta Chacin

CONTENIDO

CAPITULO 1.- OBJETIVOS Y FUNDAMENTOS DE LAMETODOLOGIA DE SUPERFICIES DERESPUESTA (MSR)

Introducción 1Fundamentos de la MSR 7Codificación de las variables controladas o regresoras 8Objetivos de la MSR 9Supuestos de la MSR 10

CAPITULO 2.- INTRODUCCION AL ALGEBRA DE MATRICESIntroducción 11Matriz- Conceptos y Definiciones 11

Matrices Iguales 12Traza de una Matriz 13Matriz Traspuesta 13

Operaciones con Matrices 14Suma y Resta de Matrices 14Producto de una Matriz por un Escalar 15Producto de Vectores 16Producto de Matrices 17

Tipos de Matrices : 18Matriz Nula 18Matriz Identidad 18Matriz Diagonal. 19Matriz Inversa 19

Determinantes 19Matriz Inversa 22Independencia Lineal de vectores 23Rango de una Matriz 23Matriz ortogonal.: 24Raíces y Vectores Característicos 24Forma Cuadrática Real 27Tipos de Formas Cuadráticas 29Diferenciación usando Matrices 31

Reglas de Derivación 32

Page 3: Analisis de Regresión y Superficie de Respuesta Chacin

Uso de Notación Matricial para Medias y Varianzas de VectoresAleatorios 33

Matriz de Varianza-Covarianza 33Algunas reglas para encontrar Medias y Varianzas 34

Fórmula de Taylor 35Fórmula de Taylor para una Variable con remanente 35Campo Escalar y Campo Vectorial ···········37Bolas Abiertas ·· ············ 37Gradiente de un Campo Escalar 37Continuidad para Campos Escalares 38Polínomío de Taylor en R · ·..·..·..·38Fórmula de Taylor de 2° orden para camposEscalares. Teorema 38

Ejercicios de Aplicación · ·..· ····· ..·..· 43

CAPITULO 4.- ANALISIS DE REGRESION 71Modelo de regresión lineal múltiple 71Descripción de los datos y del modelo 73Supuestos del modelo poblacional ·..· · 75Métodos de los mínimos cuadrados 76Prueba de hipótesis en el Modelo de Regresión 81Estimador de cr2 83Análisis de Residuales 85

Gráficos total de residuales 86Secuencia gráfica del tiempo 87Gráficos contra Y¡ 89Gráficos contra las variables independientes 91Otros Gráficos de residuales ·..92

Autocorrelación 93Definición 93Tipos de auto correlación 94Consecuencia de la autocorrelación 94Detección de la autocorrelación 95

Prueba de Durbin-Watson 95Prueba de las Rachas 97

Uso de transformaciones para corregir Autocorrelación .98Multicolinealidad 100Selección de variables en la ecuación de regresión múltiple 101

Modelo de regresión 102Consecuencias de la eliminación de variables 103Efectos de la especificación incorrecta del modelo sobrela estimación 107Consideraciones importantes 109

Usos de la ecuación de regresión 109Descripción y construcción de modelos 109Estimación y predicción 110Control 110

Criterios para seleccionar Ecuaciones de Regresión 111Coeficiente de Determinación Múltiple R2 113Coeficiente de Determinación Múltiple ajustado 114

. Cuadrado Medio de Residuales CMEp 116Uso del Estadístico Cp de Mallows 118

Interpretación Gráfica del Cp 124Métodos de Selección de Variables 125

Todas las Regresiones Posibles 126Procedimientos de Selección de Variables por Pasos(Forward, Backward, Stepwise) 129

Ventajas del uso de la distribución F 132Desventajas 132Pasos prácticos para la utilización del Método deSelección Progresiva 133Ventajas 135Desventajas 135

Selección Regresiva, eliminación hacia atrás(Backward) 136

Pasos prácticos del procedimiento 136Ventajas 136Desventajas 136

Selección paso a paso (Stepwise) 137Procedimientos básico 137

CAPITULO 3.- MODELO DE DISEÑO EXPERIMENTAL .45Definición A ·.·· ..··· 47

Estimación puntual ·..· ·..······· ..49Definición B · 50Teorema. Funciones estimables ·· ·..52

D finici C ..52e Clon , .Inversa generalizada , : 57

Algoritmo para el cálculo de la inversa generalizada 59Inversa generalizada de Moore- Penrose Ycondicional 61

Inversa de Moore-Penrose (Am) 61Inversa condicional (Ac) 64Matriz X'X ··..· · ··..··· 65

Page 4: Analisis de Regresión y Superficie de Respuesta Chacin

Uso de Notación Matricial para Medias y Varianzas de VectoresAleatorios 33

Matriz de Varianza-Covarianza 33Algunas reglas para encontrar Medias y Varianzas 34

Fórmula de Taylor 35Fórmula de Taylor para una Variable con remanente 35Campo Escalar y Campo Vectorial ···········37Bolas Abiertas ·· ············ 37Gradiente de un Campo Escalar 37Continuidad para Campos Escalares 38Polínomío de Taylor en R · ·..·..·..·38Fórmula de Taylor de 2° orden para camposEscalares. Teorema 38

Ejercicios de Aplicación · ·..· ····· ..·..· 43

CAPITULO 4.- ANALISIS DE REGRESION 71Modelo de regresión lineal múltiple 71Descripción de los datos y del modelo 73Supuestos del modelo poblacional ·..· · 75Métodos de los mínimos cuadrados 76Prueba de hipótesis en el Modelo de Regresión 81Estimador de cr2 83Análisis de Residuales 85

Gráficos total de residuales 86Secuencia gráfica del tiempo 87Gráficos contra Y¡ 89Gráficos contra las variables independientes 91Otros Gráficos de residuales ·..92

Autocorrelación 93Definición 93Tipos de auto correlación 94Consecuencia de la autocorrelación 94Detección de la autocorrelación 95

Prueba de Durbin-Watson 95Prueba de las Rachas 97

Uso de transformaciones para corregir Autocorrelación .98Multicolinealidad 100Selección de variables en la ecuación de regresión múltiple 101

Modelo de regresión 102Consecuencias de la eliminación de variables 103Efectos de la especificación incorrecta del modelo sobrela estimación 107Consideraciones importantes 109

Usos de la ecuación de regresión 109Descripción y construcción de modelos 109Estimación y predicción 110Control 110

Criterios para seleccionar Ecuaciones de Regresión 111Coeficiente de Determinación Múltiple R2 113Coeficiente de Determinación Múltiple ajustado 114

. Cuadrado Medio de Residuales CMEp 116Uso del Estadístico Cp de Mallows 118

Interpretación Gráfica del Cp 124Métodos de Selección de Variables 125

Todas las Regresiones Posibles 126Procedimientos de Selección de Variables por Pasos(Forward, Backward, Stepwise) 129

Ventajas del uso de la distribución F 132Desventajas 132Pasos prácticos para la utilización del Método deSelección Progresiva 133Ventajas 135Desventajas 135

Selección Regresiva, eliminación hacia atrás(Backward) 136

Pasos prácticos del procedimiento 136Ventajas 136Desventajas 136

Selección paso a paso (Stepwise) 137Procedimientos básico 137

CAPITULO 3.- MODELO DE DISEÑO EXPERIMENTAL .45Definición A ·.·· ..··· 47

Estimación puntual ·..· ·..······· ..49Definición B · 50Teorema. Funciones estimables ·· ·..52

D finici C ..52e Clon , .Inversa generalizada , : 57

Algoritmo para el cálculo de la inversa generalizada 59Inversa generalizada de Moore- Penrose Ycondicional 61

Inversa de Moore-Penrose (Am) 61Inversa condicional (Ac) 64Matriz X'X ··..· · ··..··· 65

Page 5: Analisis de Regresión y Superficie de Respuesta Chacin

Método del máximo coeficiente de determinación(Máximo R2) 137Método de mínimo coeficiente de determinación 138

Procesamiento electrónico 138. bl D o falsas 138Vana es ummy (ti ••••••••••••.•••••••••••••••.•••••

Uso de variables falsas en regresión múltiple 13:Variables falsas en un grupo de datos 13

Validación de modelos de regresión :141Procesamiento usados para validar modelos deRegresión : 142Chequeo de las predicciones Y coeficientes del

modelo 143Recolección de datos nuevos 144-Comparación de los resultados con la teoría y datossimulados 144Validación cruzada 145

. (O lier) id 1 .146Valores atipicos ut er y resr ua es .Outliers: Definición 14 6

Métodos gráficos para detectar outliers 147Procedimiento estadísticos para detectar

outliers 149Definición de residual · · 151Tipos de residuales 156Estadísticos utilizados para el análisis de

residuales 158. . d d .. , 162Criterios e eclslon .

Ejemplo ilustrativo del análisis de residuales 162, . trucci 164Modelos matemáticos y su cons ruccion .

Planificación del proceso de construcción de modelos 165Definición del problema 165Accesibilidad de las variables 166

. d Iaci 166Matnz e corre ación .Establecimiento de metas 166

Desarrollo del modelo matemático 167Recolección de datos ··..·..· ·..·167Validación del modelo matemático 167

Técnicas de validación 167Falta de ajustes sistemáticos 172Mantenimiento del modelo 172

Polinomios ortogonales 173Modelo supuesto cuando utilizamos polinomios

ortogonales 173

Determinación de los polinomios 176Ejemplo ilustrativo del uso de los polinomios

ortogonales en regresión. . 177Ejemplo ilustrativo. Construcción de un modelo de

predicción del rendimiento del cultivo de soya. .. 180

CAPITULO 5.- DETERMINACION DE LAS CONDICIONESOPTIMAS DE OPERACIÓN 209

Análisis de la Superficie Fijada 210Análisis Canónico 215Interpretación del Sistema 219

Ejemplo Ilustrativo 221Análisis de Aristas o Cordilleras 225Sistema de Lomas 227Métodos utilizados para estudiar Superficies de Respuesta y

determinar condiciones óptimas de operación 229Método del factor único 230

Ejemplo Ilustrativo 232Método del Ascenso más pronunciado oPendiente en ascenso 237Fundamentación teórica 237Ejemplo Ilustrativo 243

Método del experimento único 254Selección al azar de puntos de prueba 254Comparación de los métodos 255Método secuencial sugerido por el autorpara Experimentos agrícolas y otros camposde la ciencia 257

Ejemplo Ilustrativo 260Referencias Bibliográficas 269 j

1

Page 6: Analisis de Regresión y Superficie de Respuesta Chacin

Método del máximo coeficiente de determinación(Máximo R2) 137Método de mínimo coeficiente de determinación 138

Procesamiento electrónico 138. bl D o falsas 138Vana es ummy (ti ••••••••••••.•••••••••••••••.•••••

Uso de variables falsas en regresión múltiple 13:Variables falsas en un grupo de datos 13

Validación de modelos de regresión :141Procesamiento usados para validar modelos deRegresión : 142Chequeo de las predicciones Y coeficientes del

modelo 143Recolección de datos nuevos 144-Comparación de los resultados con la teoría y datossimulados 144Validación cruzada 145

. (O lier) id 1 .146Valores atipicos ut er y resr ua es .Outliers: Definición 14 6

Métodos gráficos para detectar outliers 147Procedimiento estadísticos para detectar

outliers 149Definición de residual · · 151Tipos de residuales 156Estadísticos utilizados para el análisis de

residuales 158. . d d .. , 162Criterios e eclslon .

Ejemplo ilustrativo del análisis de residuales 162, . trucci 164Modelos matemáticos y su cons ruccion .

Planificación del proceso de construcción de modelos 165Definición del problema 165Accesibilidad de las variables 166

. d Iaci 166Matnz e corre ación .Establecimiento de metas 166

Desarrollo del modelo matemático 167Recolección de datos ··..·..· ·..·167Validación del modelo matemático 167

Técnicas de validación 167Falta de ajustes sistemáticos 172Mantenimiento del modelo 172

Polinomios ortogonales 173Modelo supuesto cuando utilizamos polinomios

ortogonales 173

Determinación de los polinomios 176Ejemplo ilustrativo del uso de los polinomios

ortogonales en regresión. . 177Ejemplo ilustrativo. Construcción de un modelo de

predicción del rendimiento del cultivo de soya. .. 180

CAPITULO 5.- DETERMINACION DE LAS CONDICIONESOPTIMAS DE OPERACIÓN 209

Análisis de la Superficie Fijada 210Análisis Canónico 215Interpretación del Sistema 219

Ejemplo Ilustrativo 221Análisis de Aristas o Cordilleras 225Sistema de Lomas 227Métodos utilizados para estudiar Superficies de Respuesta y

determinar condiciones óptimas de operación 229Método del factor único 230

Ejemplo Ilustrativo 232Método del Ascenso más pronunciado oPendiente en ascenso 237Fundamentación teórica 237Ejemplo Ilustrativo 243

Método del experimento único 254Selección al azar de puntos de prueba 254Comparación de los métodos 255Método secuencial sugerido por el autorpara Experimentos agrícolas y otros camposde la ciencia 257

Ejemplo Ilustrativo 260Referencias Bibliográficas 269 j

1

Page 7: Analisis de Regresión y Superficie de Respuesta Chacin

PROLOGO

El presente texto es una contribución del autor al conocun.ientode la Teoría y Aplicaciones de la Metodología de la Superficie deRespuesta. Basado en los conocimientos impartidos en asignaturasque dicta el autor a nivel del Postgrado de Estadística, en los últimos10 años.

Fundamentalmente los cursos: Análisis de Regresión, Diseño yAnálisis de Experimentos 1 y Il y Metodología de la Superficie deRespuesta. Los estudiantes han ayudado mucho para poder adquirirlos conocimientos, incluso algunos de los ejercicios ilustrativos, hansido gracias a su colaboración. También el libro refleja los Métodos deSuperficies de Respuesta que han sido útiles al autor en su prácticaprofesional, como investigador y consultor en el área de Estadísticapara muchos profesionales en Venezuela.

Este libro "Análisis de Regresión y Superficies de Respuesta",puede ser útil para los investigadores y docentes con conocimientosdel Diseño y Análisis de Experimentos, Teoría Estadística y Análjsisde Regresión y para el primer curso de Postgrado en el área deSuperficies de Respuesta y Análisis de Regresión.

Se presentan algunos ejemplos prácticos ilustrativos que ayudana la compresión de los-aspectos teóricos.

Franklin. Chacín

Page 8: Analisis de Regresión y Superficie de Respuesta Chacin

Capítulo 1

DEFINICION, OBJETIVOSY FUNDAMENTOS DE LA METODOLOGIA

DE SUPERFICIES DE RESPUESTA

INTRODUCCION

La Metodología de Superficies de Respuesta tal como lo refiereBox y Hunter (1957), Myers (1971) y Martínez (1988), es un conjuntode métodos y procesamientos estadísticos y matemáticos, utilizadospor los investigadores para resolver ciertos tipos de problemascientíficos, procesos industriales y de ingeniería. Su mayor aplicaciónha sido en el área industrial, química y agrícola. En esta última áreatiene un futuro inmenso, por la situación particular de que es parte dela ciencia fáctica.

En la experimentación agrícola generalmente una o variasrespuestas están influenciadas por una gran cantidad de variablesregresoras. Por supuesto, la metodología debe considerar lascaracterísticas propias en este campo incluyendo una mayorvariabilidad y complejidad que en el campo industrial; es por eso, quees necesario introducir cambios evidentes en los procedimientos parala estimación válida y reducción del error experimental.

La variable' respuesta se mide normalmente en una escalacontinua e indudablemente representa la función de mayorimportancia en la metodología, lo cual no descarta la posibilidad de

Page 9: Analisis de Regresión y Superficie de Respuesta Chacin

2Chacín I Análisis de Regresión y Superficies de Res'puesta

Chacín I Análisis de Regresión y Superficies de Respuesta 3

estudiar varias respuestas. El procesamiento incluye las variablesindependientes o regresoras las cuales producen posibles efectos sobrelas respuestas y está sujeta al control del investigador, por consi-guiente, son variables experimentales o de tratamiento, manipuladaspor el investigador.

La Metodología de Superficies de Respuesta contiene o envuelveestrategias experimentales, métodos matemáticos e inferenciasestadísticas, las cuales al ser adecuadamente combinadas, capacitanal investigador para realizar una eficiente exploración empírica delsistema bajo estudio.

Box y Wilson (1951), introdujeron las ideas originales de laMetodología de Superficies de Respuesta (MSR), y ha ido exten-diéndose principalmente a través de Box, Wilson, Hunter, Draper yotros, y que han sido muy bien resumidas en Myers (1971), laspublicaciones de Box y sus asociados, Wilson, Hunter, Draper, y otros,constituyen las más poderosas fuentes de ideas en la investigación desuperficies de respuesta.

Box y Wilson (1951), discuten los diseños experimentales, con elfin de encontrar, usando el menor número posible de tratamientos, elpunto en el cual se obtiene la máxima respuesta. Estos autores,comparan algunos diseños experimentales e introducen el concepto dediseños compuestos por primera vez. Se refieren también al uso delMétodo del Ascenso más pronunciado en la búsqueda de la regiónestacionaria alrededor del óptimo. Box y Wilson confieren principalimportancia a los problemas de estimación de condiciones óptimas enla investigación química pero expresan la esperanza de que el métodosea de gran valor en otros campos donde la experimentación seasecuencial, y los errores pequeños, la más fructífera aplicación de losmétodos de Box y Wilson, ha sido en el campo de la química y en laingeniería química, donde los diseños experimentales y la técnica delascenso más pronunciado han sido usados.

Los biometrístas en la bioquímica y en las ciencias farmaco-lógicas han usado y desarrollado el método del ascenso más pronun-ciado. En contraste, las ideas de este método no se han utilizado enagricultura; y esto es obvio, ya que se sabe que en investigaciónagrícola, específicamente en experimentación de campo, los erroresson relativamente grandes, no cónsonos con los supuestos de laexperimentación secuencial; no obstante, muchos de los diseñosdesarrollados tienen sus raíces en los primeros diseños propuestos porBox y Wilson.

El supuesto principal del trabajo de Box y Wilson, se refiere aqu~ la respue~ta obtenida puede ser aproximada por un polinomio debajo ~rd~n. Diferentes diseños experimentales son luego comparadosen .termmos de la Matriz Varianza-Covarianza de los parámetrosestimados.

Las ideas de Box y Wilson fueron extendidas y discutidasadici?nalmente por Box (1954), Box y Youle (1955); en esos trabajos serefería .que aunque ~a experimentación fuera bajo un procesosecue~cIal, se tendría que definir claramente los períodosex~erlmentales durante los cuales, los procesos industriales estaríansujetos a experimentación completa.

Los principales desarrollos de interés general de los trabajos deBox y. sus colaboradores, fueron en la parte referente a los diseñosexperimentales donde Box y Wilson, sugieren el uso de los diseñoscomp~~stos. ~ox y Hunter (1957), introducen el concepto de lar~ta~illdad; sin embargo uno de los trabajos más importantes endiseños .de superfici~ de respuestas es el de Box y Draper (1959),donde .dlscuten las difer~ntes ~azones para elegir un diseño con el queposteriormente puedan investigar una "Superficie de Respuesta". Lasraz.ones., mcluy.en desde el simple interés en la superficie, lae~tlI~ac~on ~ficlente de ~os parámetros de un modelo, hasta posiblediscriminaciones entre diferentes ecuaciones.

Una de las más importantes y útiles investigaciones de laescuela de Box a partir de los modelos polínomiales, es la que hacenBox y Lucas (1959), ellos consideraron la fijación de una funciónge~~ral que envuelve "k" variables y "k" parámetros; el criteriout~zado para la selección de un diseño, es la minimización de lavarianza generalizada de los parámetros estimados.

.. Ex:,cuanto al estímulo que ha proveído la escuela de Box, en laU~iliz~cI.onde estos métodos, se puede expresar que en el campoblOmetn~o ~e han usado los nuevos métodos y, en particular losnuevos diseños, aunque no con la intensidad prevista.

En cuanto a las líneas de investigación estadísticas de la MSRse P~dr~a en P~imer término hacer referencia a la aproximació~estocástica, las ld~as originales aparecen en trabajos de Robbins y~?x:ro (1951) y Kiefe: ~ Wolfowitz (1952, 1959 y 1960), donde se

tili~an reglas de optimizar en la presencia de errores; éstas fueronreferidas por Box y Wilson y parecen aplicables a problemas prácticos

Page 10: Analisis de Regresión y Superficie de Respuesta Chacin

2Chacín I Análisis de Regresión y Superficies de Res'puesta

Chacín I Análisis de Regresión y Superficies de Respuesta 3

estudiar varias respuestas. El procesamiento incluye las variablesindependientes o regresoras las cuales producen posibles efectos sobrelas respuestas y está sujeta al control del investigador, por consi-guiente, son variables experimentales o de tratamiento, manipuladaspor el investigador.

La Metodología de Superficies de Respuesta contiene o envuelveestrategias experimentales, métodos matemáticos e inferenciasestadísticas, las cuales al ser adecuadamente combinadas, capacitanal investigador para realizar una eficiente exploración empírica delsistema bajo estudio.

Box y Wilson (1951), introdujeron las ideas originales de laMetodología de Superficies de Respuesta (MSR), y ha ido exten-diéndose principalmente a través de Box, Wilson, Hunter, Draper yotros, y que han sido muy bien resumidas en Myers (1971), laspublicaciones de Box y sus asociados, Wilson, Hunter, Draper, y otros,constituyen las más poderosas fuentes de ideas en la investigación desuperficies de respuesta.

Box y Wilson (1951), discuten los diseños experimentales, con elfin de encontrar, usando el menor número posible de tratamientos, elpunto en el cual se obtiene la máxima respuesta. Estos autores,comparan algunos diseños experimentales e introducen el concepto dediseños compuestos por primera vez. Se refieren también al uso delMétodo del Ascenso más pronunciado en la búsqueda de la regiónestacionaria alrededor del óptimo. Box y Wilson confieren principalimportancia a los problemas de estimación de condiciones óptimas enla investigación química pero expresan la esperanza de que el métodosea de gran valor en otros campos donde la experimentación seasecuencial, y los errores pequeños, la más fructífera aplicación de losmétodos de Box y Wilson, ha sido en el campo de la química y en laingeniería química, donde los diseños experimentales y la técnica delascenso más pronunciado han sido usados.

Los biometrístas en la bioquímica y en las ciencias farmaco-lógicas han usado y desarrollado el método del ascenso más pronun-ciado. En contraste, las ideas de este método no se han utilizado enagricultura; y esto es obvio, ya que se sabe que en investigaciónagrícola, específicamente en experimentación de campo, los erroresson relativamente grandes, no cónsonos con los supuestos de laexperimentación secuencial; no obstante, muchos de los diseñosdesarrollados tienen sus raíces en los primeros diseños propuestos porBox y Wilson.

El supuesto principal del trabajo de Box y Wilson, se refiere aqu~ la respue~ta obtenida puede ser aproximada por un polinomio debajo ~rd~n. Diferentes diseños experimentales son luego comparadosen .termmos de la Matriz Varianza-Covarianza de los parámetrosestimados.

Las ideas de Box y Wilson fueron extendidas y discutidasadici?nalmente por Box (1954), Box y Youle (1955); en esos trabajos serefería .que aunque ~a experimentación fuera bajo un procesosecue~cIal, se tendría que definir claramente los períodosex~erlmentales durante los cuales, los procesos industriales estaríansujetos a experimentación completa.

Los principales desarrollos de interés general de los trabajos deBox y. sus colaboradores, fueron en la parte referente a los diseñosexperimentales donde Box y Wilson, sugieren el uso de los diseñoscomp~~stos. ~ox y Hunter (1957), introducen el concepto de lar~ta~illdad; sin embargo uno de los trabajos más importantes endiseños .de superfici~ de respuestas es el de Box y Draper (1959),donde .dlscuten las difer~ntes ~azones para elegir un diseño con el queposteriormente puedan investigar una "Superficie de Respuesta". Lasraz.ones., mcluy.en desde el simple interés en la superficie, lae~tlI~ac~on ~ficlente de ~os parámetros de un modelo, hasta posiblediscriminaciones entre diferentes ecuaciones.

Una de las más importantes y útiles investigaciones de laescuela de Box a partir de los modelos polínomiales, es la que hacenBox y Lucas (1959), ellos consideraron la fijación de una funciónge~~ral que envuelve "k" variables y "k" parámetros; el criteriout~zado para la selección de un diseño, es la minimización de lavarianza generalizada de los parámetros estimados.

.. Ex:,cuanto al estímulo que ha proveído la escuela de Box, en laU~iliz~cI.onde estos métodos, se puede expresar que en el campoblOmetn~o ~e han usado los nuevos métodos y, en particular losnuevos diseños, aunque no con la intensidad prevista.

En cuanto a las líneas de investigación estadísticas de la MSRse P~dr~a en P~imer término hacer referencia a la aproximació~estocástica, las ld~as originales aparecen en trabajos de Robbins y~?x:ro (1951) y Kiefe: ~ Wolfowitz (1952, 1959 y 1960), donde se

tili~an reglas de optimizar en la presencia de errores; éstas fueronreferidas por Box y Wilson y parecen aplicables a problemas prácticos

Page 11: Analisis de Regresión y Superficie de Respuesta Chacin

ChacínI Análisisde RegresiónYSuperficiesde Respuesta4

.. .. n esta área desdede la MSR. Kiefer realizó vanas mvestlgaclOneS e1958 al 1962. 1

T bié se realizaron investigaciones teóricas sobre asam ien bilí t· D arrollo s poste-

diferentes formas de convergenc!~~o!~o~e: ~:¡ocá:~icas no contri-riores. en lo que se refiere ~ a~e la metodología de superficies de

~~::~~~ta~~:o lí~~::~:r;r;ctica dedinvesti~a~iÓnt'eSMlaucr~!:re:etel~!. , d urvas e crecimien o.

análisis y compa~aclOn e e d bid s a Rao (1958, 1959, 1965), eltrabajos en esta area fueron ~ 1 a, multivariada basada en la. . d ' una aproxlmacloninvestiga or genero . , li ios ortogonales Yfijación inicial de coeficientes de ~egreslOnde pOf·nomt de regresión.

álisi e inferenclas de esos coe icien essubsecuentes ana SlS f . 'n de respuesta esComo en otras investigaciones en MSR, la uncio li . de bajoasumida y sería adecuadamente descrita po~ ~n1PO(l~~~r Y Elstonorden; otros trabajos son los de Elston y rizz e(1964).

Otros aspectos teóricos desarrollados son l.os referentes .a dlaKi ~ WOlfOWltzen una serie e

teoría estadística, propuesta por eder y 11 h sido inevitable-trabaios entre 1958 Y 1962. Otros esarro os an . _ment~ extensiones. de previas investigaciones en el diseño de .ex~,e-. t tales como la forma de las superficies de respuesta, fijación

rimen os, b . , d d tosde curvas de respuesta y el campo general de o tencion e a .

Nuevas áreas de especial valía son tratadas por ~sc~mbe lTuk (1963) sobre residuales Y el desarrollo de ~eto os el

ey, '1 lí .t d gradlentes en eminimización de funciones sin el ca1cuo exp Clo e 1965)cual los trabajos más importantes son los de Powell. (1~64, ctu~Nelder y Mead (1965). Todos estos trabajos, ~an contnbUldo al a hd 11 d la MSR Los trabaj os postenores a estas etapas anesarro o e· . .. al t alhecho énfasis en modelos no lineales, debido ~rmcIp men edesarrollo de la computación electrónica ..qu.e,ha sido un factor muyimportante en la elección de métodos de fi)aCl0n

Los procedimientos han sido desarrollados en todos ~os camt~sdiscutidos anteriormente, pero hasta el presente. no ha sido post t eencontrar una nueva área de investigación teó~lca en ~ste a.spe~óo~Muchos de los trabajos recientes son trabajOS de .mvestlgaclaplicada en áreas específicas, los que han intr.oduc~do.conceptosnuevos. Nelder (1966) introdujo aportes sobre polinomios mv~~~ ~funciones de respuestas, Herzberg (1966), propiedades de rota .1 1 acilíndrica en algunos diseños de superficie de respuesta.' At~son yHunter (1968), diseños de experimentos para la estlmaclOn de

ChacínI Análisisde Regresióny Superficiesde Respuesta 5

los parámetros de modelos no lineales, Box (1971), sesgamiento enestimaciones no lineales, y Boyd (1972), en desarrollo de curvas derespuesta en estudios de fertilidad de suelos.

También en los últimos años se ha producido un buen númerode revisiones tales como la de Hill y Hunter (1966), sobre lametodología de superficies de respuesta, sin entrar a ·las definicionesreferidas con anterioridad por otros autores, Box y Draper (1959)describen la práctica de MSR y su filosofía; Wasan (1969), hace unarevisión bibliográfica de aproximación estocástica; Herzberh y Cox(1969) dan una revisión bibliográfica de recientes trabajos en diseñosde . experimentos con áreas específicamente concernientes aexploración de superficie de respuesta; Villasmil, Casanova y Timm(1972), presentan un trabajo sobre replicación del diseño rotablecentral compuesto en un ensayo de fertilización con el pasto guinea,en el que presentan el análisis estadístico del rotable replicado;Federer y Balaam (1973) dan una revisión de diseños experimentaleshasta al año 1968. Bliss (1970), discute el uso de funciones derespuesta con un magnífico rango de ejemplos; Finney (1964, 1965),da una revisión de ensayos biológicos. Sprent (1969), discute conalgún detalle el uso de funciones de respuesta en el análisis de curvasde crecimiento. Willey y Heath (1969), revisan métodos de fijación decurvas que muestran las relaciones entre poblaciones de plantas yrendimiento.

En el campo biométrico, la evidencia indica que la MSR se hautilizado poco hasta el momento. En el campo agronómico se havenido evidenciando un aumento progresivo en su uso, debido a losestudios cada vez mayores de varios factores en conjunto, Se handesarrollado inclusive varios diseños, tal es el caso de los diseños SanCristóbal (Rojas, 1962), específicamente para ser utilizados eninvestigación con fertilizantes, partiendo de la premisa principal deincluir un tratamiento testigo. Rojas (1962), presenta una descripcióny discusión de la eficiencia del diseño San Cristóbal considerandonecesario el establecimiento de una relación matemática entre elrendimiento y los nutrimentos agregados al suelo. Expresa en sutrabajo que el San Cristóbal presenta una "región de exploraciónmayor que la de un factorial completo 33"; aumentando su eficienciacuando el número de repeticiones es mayor o igual a 2. Explican quelos diseños rotables generados en la investigación química industrialno cumplen con ciertos requisitos agronómicos como el de no incluirun tratamiento testigo, al compararlo con el factorial 33 establece queeste diseño provee información sobre interacciones que no interesan.

Page 12: Analisis de Regresión y Superficie de Respuesta Chacin

ChacínI Análisisde RegresiónYSuperficiesde Respuesta4

.. .. n esta área desdede la MSR. Kiefer realizó vanas mvestlgaclOneS e1958 al 1962. 1

T bié se realizaron investigaciones teóricas sobre asam ien bilí t· D arrollo s poste-

diferentes formas de convergenc!~~o!~o~e: ~:¡ocá:~icas no contri-riores. en lo que se refiere ~ a~e la metodología de superficies de

~~::~~~ta~~:o lí~~::~:r;r;ctica dedinvesti~a~iÓnt'eSMlaucr~!:re:etel~!. , d urvas e crecimien o.

análisis y compa~aclOn e e d bid s a Rao (1958, 1959, 1965), eltrabajos en esta area fueron ~ 1 a, multivariada basada en la. . d ' una aproxlmacloninvestiga or genero . , li ios ortogonales Yfijación inicial de coeficientes de ~egreslOnde pOf·nomt de regresión.

álisi e inferenclas de esos coe icien essubsecuentes ana SlS f . 'n de respuesta esComo en otras investigaciones en MSR, la uncio li . de bajoasumida y sería adecuadamente descrita po~ ~n1PO(l~~~r Y Elstonorden; otros trabajos son los de Elston y rizz e(1964).

Otros aspectos teóricos desarrollados son l.os referentes .a dlaKi ~ WOlfOWltzen una serie e

teoría estadística, propuesta por eder y 11 h sido inevitable-trabaios entre 1958 Y 1962. Otros esarro os an . _ment~ extensiones. de previas investigaciones en el diseño de .ex~,e-. t tales como la forma de las superficies de respuesta, fijación

rimen os, b . , d d tosde curvas de respuesta y el campo general de o tencion e a .

Nuevas áreas de especial valía son tratadas por ~sc~mbe lTuk (1963) sobre residuales Y el desarrollo de ~eto os el

ey, '1 lí .t d gradlentes en eminimización de funciones sin el ca1cuo exp Clo e 1965)cual los trabajos más importantes son los de Powell. (1~64, ctu~Nelder y Mead (1965). Todos estos trabajos, ~an contnbUldo al a hd 11 d la MSR Los trabaj os postenores a estas etapas anesarro o e· . .. al t alhecho énfasis en modelos no lineales, debido ~rmcIp men edesarrollo de la computación electrónica ..qu.e,ha sido un factor muyimportante en la elección de métodos de fi)aCl0n

Los procedimientos han sido desarrollados en todos ~os camt~sdiscutidos anteriormente, pero hasta el presente. no ha sido post t eencontrar una nueva área de investigación teó~lca en ~ste a.spe~óo~Muchos de los trabajos recientes son trabajOS de .mvestlgaclaplicada en áreas específicas, los que han intr.oduc~do.conceptosnuevos. Nelder (1966) introdujo aportes sobre polinomios mv~~~ ~funciones de respuestas, Herzberg (1966), propiedades de rota .1 1 acilíndrica en algunos diseños de superficie de respuesta.' At~son yHunter (1968), diseños de experimentos para la estlmaclOn de

ChacínI Análisisde Regresióny Superficiesde Respuesta 5

los parámetros de modelos no lineales, Box (1971), sesgamiento enestimaciones no lineales, y Boyd (1972), en desarrollo de curvas derespuesta en estudios de fertilidad de suelos.

También en los últimos años se ha producido un buen númerode revisiones tales como la de Hill y Hunter (1966), sobre lametodología de superficies de respuesta, sin entrar a ·las definicionesreferidas con anterioridad por otros autores, Box y Draper (1959)describen la práctica de MSR y su filosofía; Wasan (1969), hace unarevisión bibliográfica de aproximación estocástica; Herzberh y Cox(1969) dan una revisión bibliográfica de recientes trabajos en diseñosde . experimentos con áreas específicamente concernientes aexploración de superficie de respuesta; Villasmil, Casanova y Timm(1972), presentan un trabajo sobre replicación del diseño rotablecentral compuesto en un ensayo de fertilización con el pasto guinea,en el que presentan el análisis estadístico del rotable replicado;Federer y Balaam (1973) dan una revisión de diseños experimentaleshasta al año 1968. Bliss (1970), discute el uso de funciones derespuesta con un magnífico rango de ejemplos; Finney (1964, 1965),da una revisión de ensayos biológicos. Sprent (1969), discute conalgún detalle el uso de funciones de respuesta en el análisis de curvasde crecimiento. Willey y Heath (1969), revisan métodos de fijación decurvas que muestran las relaciones entre poblaciones de plantas yrendimiento.

En el campo biométrico, la evidencia indica que la MSR se hautilizado poco hasta el momento. En el campo agronómico se havenido evidenciando un aumento progresivo en su uso, debido a losestudios cada vez mayores de varios factores en conjunto, Se handesarrollado inclusive varios diseños, tal es el caso de los diseños SanCristóbal (Rojas, 1962), específicamente para ser utilizados eninvestigación con fertilizantes, partiendo de la premisa principal deincluir un tratamiento testigo. Rojas (1962), presenta una descripcióny discusión de la eficiencia del diseño San Cristóbal considerandonecesario el establecimiento de una relación matemática entre elrendimiento y los nutrimentos agregados al suelo. Expresa en sutrabajo que el San Cristóbal presenta una "región de exploraciónmayor que la de un factorial completo 33"; aumentando su eficienciacuando el número de repeticiones es mayor o igual a 2. Explican quelos diseños rotables generados en la investigación química industrialno cumplen con ciertos requisitos agronómicos como el de no incluirun tratamiento testigo, al compararlo con el factorial 33 establece queeste diseño provee información sobre interacciones que no interesan.

Page 13: Analisis de Regresión y Superficie de Respuesta Chacin

6 Chacín I Análisis de Regresión y Superficies de Respuesta Chacin I Análisis de Regresión y Superficies de Respuesta 7

Rojas (1971) al presentar el San Cristóbal Ortogonalizadoexpresa que el diseño San Cristóbal no ortogonal hace más dificil elanálisis, pero no altera la validez de las conclusiones.

Martínez (1971), describe métodos para determinar dosiseconómicamente óptimas cuando se obtienen funciones de producciónanómalas. El método consiste en estimar las producciones paradiferentes combinaciones de los elementos dentro de la región deexploración y conseguir los beneficios netos que se generan,seleccionando los que provocan los mayores beneficios económicos.

Villasmil, Martínez y Segura (1972), presentan un trabajo sobreel diseño San Cristóbal y su utilización en ensayos de fertilización encaña de azúcar, realizan descripción del diseño, análisis económicos.yfunciones de producción anómalas que se obtuvieron.

Cochran y Cox (1980), presentan una descripción de algunosdiseños utilizados en el estudio de "superficies de respuesta";aparecen ejemplos de análisis estadísticos de diseños rotables desegundo orden para dos y tres variables.

En Latinoamérica y específicamente en Venezuela a partir de1970 se han realizado algunas investigaciones importantes, de lascuales referiremos las siguientes: Montano (1972), presenta unadiscusión general de un ejemplo del diseño rotable central compuestoen experimentos con fertilizantes en algodón. Se describen las carac-terísticas y la determinación de dosis ó.ptimas de fertilizantes, se so-meten al proceso 14 experimentos dando algunos respuesta y otros no.

Villasmil (1978b), hace una descripción del diseño San CristóbalOrtogonalizado, mencionando algunos planes experimentales con estediseño para diferentes números de variables. También realiza lacomparación del diseño con el factorial completo mediante el criteriode la eficiencia relativa. Las conclusiones a las que llega son lassiguientes:

c.- Los dos diseños son igualmente eficientes en la estimación de loscoeficientes de regresión que corresponden a las interacciones.

Villasmil (1978a), hace una descripción general de los diseños detratamiento compuesto central y diseño compuesto no central, laortogonalización del diseño compuesto central de donde se obtiene eldiseño compuesto central ortogonal. En el trabajo también aparecenlas varianzas y covarianzas de los estimadores en el diseño compuestocentral ortogonal y la comparación de este con el diseño factorialcompleto y con el diseño San Cristóbal ortogonalizado basado en elcriterio de la eficiencia relativa. De acuerdo con la comparación con elfactorial 33 expresa que el diseño compuesto central ortogonal esrecomendable para estimar un modelo polinómico de segundo orden.

Chacín (1980), presenta la descripción teórica de los diseñosrotables y la aplicación y análisis estadístico para el diseño noreplicado y replicado, con una proposición sobre la división de loserrores.

Ruiz (1981), presenta la construcción, propiedades ycomparaciones del Diseño Compuesto Central Doble Estrella.

Chacín y Villasmil (1983), presentan comparaciones teóricas yprácticas de varios diseños dé Superficies de Respuesta.

Chacín (1988), presenta algunas proposiciones sobre al análisisde los diseños de Superficies de Respuesta, para mediciones repetidas.

Machado y Chacín (1992), realizan comparaciones de variosdiseños de Superficies de Respuesta, incluyendo un nuevo diseño aldoble estrella con adición de un nuevo núcleo estrella propuesto porVillasmil (1986).

a.- El diseño San Cristóbal Ortogonalizado ( k = 3, a = 1, e = 2m = 1 ), es más eficiente que el factorial 33 en la estimación de loscoeficientes de regresión correspondientes a los efectos lineales.

b.- El diseño San Cristóbal Ortogonalizado ( k = 3, a = 1, e = 2,m = 1 ), es más eficiente que el factorial 33 en la estimación de loscoeficientes de regresión correspondientes a los términoscuadráticos.

FUNDAMENTOS DE LA METO DO LOGIADE SUPERFICIES DE RESPUESTA

Supongamos que el investigador esté interesado en examinaruna respuesta "11", la cual depende de las variables controladas oregresoras, SPS2'''''Sp bajo el control del experimentador y con unmínimo error se denota:

Page 14: Analisis de Regresión y Superficie de Respuesta Chacin

6 Chacín I Análisis de Regresión y Superficies de Respuesta Chacin I Análisis de Regresión y Superficies de Respuesta 7

Rojas (1971) al presentar el San Cristóbal Ortogonalizadoexpresa que el diseño San Cristóbal no ortogonal hace más dificil elanálisis, pero no altera la validez de las conclusiones.

Martínez (1971), describe métodos para determinar dosiseconómicamente óptimas cuando se obtienen funciones de producciónanómalas. El método consiste en estimar las producciones paradiferentes combinaciones de los elementos dentro de la región deexploración y conseguir los beneficios netos que se generan,seleccionando los que provocan los mayores beneficios económicos.

Villasmil, Martínez y Segura (1972), presentan un trabajo sobreel diseño San Cristóbal y su utilización en ensayos de fertilización encaña de azúcar, realizan descripción del diseño, análisis económicos.yfunciones de producción anómalas que se obtuvieron.

Cochran y Cox (1980), presentan una descripción de algunosdiseños utilizados en el estudio de "superficies de respuesta";aparecen ejemplos de análisis estadísticos de diseños rotables desegundo orden para dos y tres variables.

En Latinoamérica y específicamente en Venezuela a partir de1970 se han realizado algunas investigaciones importantes, de lascuales referiremos las siguientes: Montano (1972), presenta unadiscusión general de un ejemplo del diseño rotable central compuestoen experimentos con fertilizantes en algodón. Se describen las carac-terísticas y la determinación de dosis ó.ptimas de fertilizantes, se so-meten al proceso 14 experimentos dando algunos respuesta y otros no.

Villasmil (1978b), hace una descripción del diseño San CristóbalOrtogonalizado, mencionando algunos planes experimentales con estediseño para diferentes números de variables. También realiza lacomparación del diseño con el factorial completo mediante el criteriode la eficiencia relativa. Las conclusiones a las que llega son lassiguientes:

c.- Los dos diseños son igualmente eficientes en la estimación de loscoeficientes de regresión que corresponden a las interacciones.

Villasmil (1978a), hace una descripción general de los diseños detratamiento compuesto central y diseño compuesto no central, laortogonalización del diseño compuesto central de donde se obtiene eldiseño compuesto central ortogonal. En el trabajo también aparecenlas varianzas y covarianzas de los estimadores en el diseño compuestocentral ortogonal y la comparación de este con el diseño factorialcompleto y con el diseño San Cristóbal ortogonalizado basado en elcriterio de la eficiencia relativa. De acuerdo con la comparación con elfactorial 33 expresa que el diseño compuesto central ortogonal esrecomendable para estimar un modelo polinómico de segundo orden.

Chacín (1980), presenta la descripción teórica de los diseñosrotables y la aplicación y análisis estadístico para el diseño noreplicado y replicado, con una proposición sobre la división de loserrores.

Ruiz (1981), presenta la construcción, propiedades ycomparaciones del Diseño Compuesto Central Doble Estrella.

Chacín y Villasmil (1983), presentan comparaciones teóricas yprácticas de varios diseños dé Superficies de Respuesta.

Chacín (1988), presenta algunas proposiciones sobre al análisisde los diseños de Superficies de Respuesta, para mediciones repetidas.

Machado y Chacín (1992), realizan comparaciones de variosdiseños de Superficies de Respuesta, incluyendo un nuevo diseño aldoble estrella con adición de un nuevo núcleo estrella propuesto porVillasmil (1986).

a.- El diseño San Cristóbal Ortogonalizado ( k = 3, a = 1, e = 2m = 1 ), es más eficiente que el factorial 33 en la estimación de loscoeficientes de regresión correspondientes a los efectos lineales.

b.- El diseño San Cristóbal Ortogonalizado ( k = 3, a = 1, e = 2,m = 1 ), es más eficiente que el factorial 33 en la estimación de loscoeficientes de regresión correspondientes a los términoscuadráticos.

FUNDAMENTOS DE LA METO DO LOGIADE SUPERFICIES DE RESPUESTA

Supongamos que el investigador esté interesado en examinaruna respuesta "11", la cual depende de las variables controladas oregresoras, SPS2'''''Sp bajo el control del experimentador y con unmínimo error se denota:

Page 15: Analisis de Regresión y Superficie de Respuesta Chacin

8 Chacín I Análisis de Regresión y Superficies de Respuesta

Donde la forma de la función es muy complicada y/o esdesconocida, normalmente la función "j " desconocida se expresa entérminos de las variables especificadas Xi, X2, ... , Xp, las cuales sonfunciones lineales simples de las variables originales. Como la funcióngeneralmente se desconoce, es necesario y común que se aproxime entérminos de un polinomio de bajo orden; si la función se aproximamediante una función lineal de las variables independientes, entérminos de las variables codificadas, se crea una función derespuesta de primer orden y se puede escribir así:

Los modelos de primer orden, sólo son útiles cuando se exploreuna región relativamente pequeña de Xi , X2 , ... , Xp, dependiendo porsupuesto, del problema y de la región de exploración de las variablesbajo estudio; generalmente, estas regiones exhiben ninguna o muypoca curvatura. En caso contrario, es necesario aproximar, medianteun polinomio de segundo orden, denotado de la siguiente manera:

p p p p

11 = ~o + ¿ Pj X j + ¿ Pjj x~ + ¿ ¿ Pju X jXuj=1 je l j=1 ue l

j<u

En general, se puede utilizar polinomios de mayor orden, ya que" j " , se considera una función continua de Xi, X2, ... , Xp conderivadas sucesivas continuas, siendo posible obtener una expansiónde "f" de la serie de Taylor con respecto a Xi = 0, X2 = ° , ...,Xp = ° del orden deseado.

CODIFICACION DE LAS VARIABLESCONTROLADAS O REGRESO RAS

Los valores de las variables codificadas se eligen de modo que setenga:

i = 1,2, ..., nn

"X~= nL.,¡ lJ ';=1

j = 1, 2, ..., P

Chacín I Análisis de Regresión y Superficies de Respuesta 9

donde n es el número de puntos experimentales.

Para la codificación de valores, se toma:

i = 1,2, ..., n

j = 1,2, .", p

n kj -~j~2=¿

1 nSj y <;j = - ¿<;ij

i=l n n i=l

y esta forma se obtiene la condición deseada de los Xij

~n términos de las variables codificadas los n puntosexpenmentales pueden ser representados por la matriz de diseño:

OBJETIVOS DE LA METODOLOGIADE SUPERFICIES DE RESPUESTA

1.- Aproximar convenientemente la función f para usarla en lapredicción de Y.

2.- Optimizar a 11,a través de la función de Y.

3.- Describir la superficie de respuesta y estudiar su naturaleza.

SUPUESTOS DE LA METODOLOGIADE SUPERFICIES DE RESPUESTA

1.- La función j, debe ser conocida y compleja, o desconocida.

2.- La. función j, puede ser aproximada a un modelo polinómico debajo orden, como se demostrará, al estudiar la serie de Taylor.

Page 16: Analisis de Regresión y Superficie de Respuesta Chacin

8 Chacín I Análisis de Regresión y Superficies de Respuesta

Donde la forma de la función es muy complicada y/o esdesconocida, normalmente la función "j " desconocida se expresa entérminos de las variables especificadas Xi, X2, ... , Xp, las cuales sonfunciones lineales simples de las variables originales. Como la funcióngeneralmente se desconoce, es necesario y común que se aproxime entérminos de un polinomio de bajo orden; si la función se aproximamediante una función lineal de las variables independientes, entérminos de las variables codificadas, se crea una función derespuesta de primer orden y se puede escribir así:

Los modelos de primer orden, sólo son útiles cuando se exploreuna región relativamente pequeña de Xi , X2 , ... , Xp, dependiendo porsupuesto, del problema y de la región de exploración de las variablesbajo estudio; generalmente, estas regiones exhiben ninguna o muypoca curvatura. En caso contrario, es necesario aproximar, medianteun polinomio de segundo orden, denotado de la siguiente manera:

p p p p

11 = ~o + ¿ Pj X j + ¿ Pjj x~ + ¿ ¿ Pju X jXuj=1 je l j=1 ue l

j<u

En general, se puede utilizar polinomios de mayor orden, ya que" j " , se considera una función continua de Xi, X2, ... , Xp conderivadas sucesivas continuas, siendo posible obtener una expansiónde "f" de la serie de Taylor con respecto a Xi = 0, X2 = ° , ...,Xp = ° del orden deseado.

CODIFICACION DE LAS VARIABLESCONTROLADAS O REGRESO RAS

Los valores de las variables codificadas se eligen de modo que setenga:

i = 1,2, ..., nn

"X~= nL.,¡ lJ ';=1

j = 1, 2, ..., P

Chacín I Análisis de Regresión y Superficies de Respuesta 9

donde n es el número de puntos experimentales.

Para la codificación de valores, se toma:

i = 1,2, ..., n

j = 1,2, .", p

n kj -~j~2=¿

1 nSj y <;j = - ¿<;ij

i=l n n i=l

y esta forma se obtiene la condición deseada de los Xij

~n términos de las variables codificadas los n puntosexpenmentales pueden ser representados por la matriz de diseño:

OBJETIVOS DE LA METODOLOGIADE SUPERFICIES DE RESPUESTA

1.- Aproximar convenientemente la función f para usarla en lapredicción de Y.

2.- Optimizar a 11,a través de la función de Y.

3.- Describir la superficie de respuesta y estudiar su naturaleza.

SUPUESTOS DE LA METODOLOGIADE SUPERFICIES DE RESPUESTA

1.- La función j, debe ser conocida y compleja, o desconocida.

2.- La. función j, puede ser aproximada a un modelo polinómico debajo orden, como se demostrará, al estudiar la serie de Taylor.

Page 17: Analisis de Regresión y Superficie de Respuesta Chacin

10 Chacín I Análisis de Regresión y Superiicies de Respuesta

3.- Los valores Xi, Xs,..., Xp, deben ser variables controladas ymedidas con mínimo error, tan pequeño, que se puede decir quese mide sin error.

4.- Se pueden desarrollar experimentos para valores combinados delos X.obteniéndose un valor de Y "respuesta" para cada uno delas combinaciones, dependiendo de cuales niveles sonseleccionados, las combinaciones elegidas determinan el diseñode tratamiento a utilizar.

5.- Los coeficientes del modelo poblacional (parámetros) pueden serestimados a través de procedimientos de estimación deparámetros estadísticos (mínimos cuadrados ordinarios,estimadores máximo verosímiles, entre otros) sin embargo, seprefieren los estimadores mínimos cuadrados ordinarios, porsus características ventajosas en la fijación del Modelo deRegresión, los cuales se describen en capítulos posteriores.

6.- Mediante un análisis polinomial, se pueden encontrar algunascaracterísticas importantes en el modelo de superficie (el lectorpuede estudiar en capítulos posteriores estas características).

Capítulo 2

INTRODUCCION AL ALGEBRADE MATRICES

INTRODUCCION

El uso del álgebra de matrices es fundamental para comprenderlas técnicas de Superficie de Respuesta. En este capítulo se hará unarevisión general de algunas definiciones, propiedades y teoremasimportantes para desarrollar la MSR y básicamente estudiaremosaspectos del álgebra de matrices y la fórmula de Taylor.

CONCEPTOS Y DEFINICIONES

Matriz

Es un arreglo de números reales en forma rectángular

= lall al2 al31Azx 3

a2l a22 a23A = ( au ) = [aij

Page 18: Analisis de Regresión y Superficie de Respuesta Chacin

10 Chacín I Análisis de Regresión y Superiicies de Respuesta

3.- Los valores Xi, Xs,..., Xp, deben ser variables controladas ymedidas con mínimo error, tan pequeño, que se puede decir quese mide sin error.

4.- Se pueden desarrollar experimentos para valores combinados delos X.obteniéndose un valor de Y "respuesta" para cada uno delas combinaciones, dependiendo de cuales niveles sonseleccionados, las combinaciones elegidas determinan el diseñode tratamiento a utilizar.

5.- Los coeficientes del modelo poblacional (parámetros) pueden serestimados a través de procedimientos de estimación deparámetros estadísticos (mínimos cuadrados ordinarios,estimadores máximo verosímiles, entre otros) sin embargo, seprefieren los estimadores mínimos cuadrados ordinarios, porsus características ventajosas en la fijación del Modelo deRegresión, los cuales se describen en capítulos posteriores.

6.- Mediante un análisis polinomial, se pueden encontrar algunascaracterísticas importantes en el modelo de superficie (el lectorpuede estudiar en capítulos posteriores estas características).

Capítulo 2

INTRODUCCION AL ALGEBRADE MATRICES

INTRODUCCION

El uso del álgebra de matrices es fundamental para comprenderlas técnicas de Superficie de Respuesta. En este capítulo se hará unarevisión general de algunas definiciones, propiedades y teoremasimportantes para desarrollar la MSR y básicamente estudiaremosaspectos del álgebra de matrices y la fórmula de Taylor.

CONCEPTOS Y DEFINICIONES

Matriz

Es un arreglo de números reales en forma rectángular

= lall al2 al31Azx 3

a2l a22 a23A = ( au ) = [aij

Page 19: Analisis de Regresión y Superficie de Respuesta Chacin

12 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 13

donde: Traza de una matriz

i Y son sub índices Dada una matrizi = Fila

= Columna

El 2x3 indica el orden de la matriz, que de manera generalpodemos denotarlo con m x n, es decir:

A = [aij]m x nd 1 d

S.edefine l~ tr~za de una matriz como la suma de los elementose a iagonal prmclpal : .

Cuando se tiene una matriz de orden 1x n, se denomina comoVector Fila, pues solamente tendrá una fila. Así: Tr(A) = "a..¿ 1J

i=jA=[1348]

Cuando el orden es de m x 1, se denomina Vector Columna. Así:ejemplo:

A= [ilA ~ [; ~ :1

La traza de la matriz A será; Tr(A) =Propiedades de la traza de una matriz

1 + 5 + 9-= 15

Sea

Una matriz 1x 1se llama comúnmente escalar Tr(A+B)

Tr(A B)

= Tr( A) + Tr( B )

Tr( A) Tr( B)Si una matriz es de orden n x n entonces A será una matriz

cuadrada y se denotará como:

Matriz traspuesta

Matrices iguales Sea

Sean: A = [aij]

A =B SI

A = [aijJm x D

Se define la matriz traspuesta de A como:

A' = [aij Jnxm

Se cambian filas por columnas.

Page 20: Analisis de Regresión y Superficie de Respuesta Chacin

12 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 13

donde: Traza de una matriz

i Y son sub índices Dada una matrizi = Fila

= Columna

El 2x3 indica el orden de la matriz, que de manera generalpodemos denotarlo con m x n, es decir:

A = [aij]m x nd 1 d

S.edefine l~ tr~za de una matriz como la suma de los elementose a iagonal prmclpal : .

Cuando se tiene una matriz de orden 1x n, se denomina comoVector Fila, pues solamente tendrá una fila. Así: Tr(A) = "a..¿ 1J

i=jA=[1348]

Cuando el orden es de m x 1, se denomina Vector Columna. Así:ejemplo:

A= [ilA ~ [; ~ :1

La traza de la matriz A será; Tr(A) =Propiedades de la traza de una matriz

1 + 5 + 9-= 15

Sea

Una matriz 1x 1se llama comúnmente escalar Tr(A+B)

Tr(A B)

= Tr( A) + Tr( B )

Tr( A) Tr( B)Si una matriz es de orden n x n entonces A será una matriz

cuadrada y se denotará como:

Matriz traspuesta

Matrices iguales Sea

Sean: A = [aij]

A =B SI

A = [aijJm x D

Se define la matriz traspuesta de A como:

A' = [aij Jnxm

Se cambian filas por columnas.

Page 21: Analisis de Regresión y Superficie de Respuesta Chacin

14 Chacín I Análisis de Regresión Y Superficies de Respuesta Chacín I Análisis de Regresión y Superficíes de Respuesta 15

[; ;~] y B = [! ~~]A + B = [H:]

Propiedades de la suma de matrices

Ejemplo: Ejemplo:

A=

Propiedades de la matriz traspuesta

(A + B )' = A' + B'

( K A )' = K A'

(A' )' = A

( A B )' = B' A'

A+B = B+A

A + (B+C)=(A+B) +C

A+O= 0+ A=A

A + (-A) =( -A) + A = odonde Oes la Matriz Nula .

OPERACIONES CON MATRICESProducto de una matriz por escalar

Sean:

Suma y resta de matrices entonces:

Sean:A = (aij] m xn y B = (bij] ID x n

A±B=(aij)mxn ± (bij ]mxn

A ± B = (aij ± bij] mx n

Ejemplo:

A = [aij]m x n una matriz

y a un escalar donde a E R

a A = a [aij]m x n = [a a-- ]1) ID X n

A = [:~] y a = 2

Page 22: Analisis de Regresión y Superficie de Respuesta Chacin

14 Chacín I Análisis de Regresión Y Superficies de Respuesta Chacín I Análisis de Regresión y Superficíes de Respuesta 15

[; ;~] y B = [! ~~]A + B = [H:]

Propiedades de la suma de matrices

Ejemplo: Ejemplo:

A=

Propiedades de la matriz traspuesta

(A + B )' = A' + B'

( K A )' = K A'

(A' )' = A

( A B )' = B' A'

A+B = B+A

A + (B+C)=(A+B) +C

A+O= 0+ A=A

A + (-A) =( -A) + A = odonde Oes la Matriz Nula .

OPERACIONES CON MATRICESProducto de una matriz por escalar

Sean:

Suma y resta de matrices entonces:

Sean:A = (aij] m xn y B = (bij] ID x n

A±B=(aij)mxn ± (bij ]mxn

A ± B = (aij ± bij] mx n

Ejemplo:

A = [aij]m x n una matriz

y a un escalar donde a E R

a A = a [aij]m x n = [a a-- ]1) ID X n

A = [:~] y a = 2

Page 23: Analisis de Regresión y Superficie de Respuesta Chacin

16 Chacín I Análisis de Regresión YSuperficies de Respuesta

Producto de vectores

Si se tienen

Entonces A x B será:

bl

b2

A B = ( al az ... as ] b3

A B = [al bi + aa bs + ... + an bn )lxl = [Cij)

donde Cij es la suma de los productos de los elementoscorrespondientes en el vector fila (A) y el vector columna (B).

Ejemplo:

A=[1324] y B =

154

O

A x B = [1 x 1 + 3 x 5 + 2 x 4 + 4 x O ) = 24

Chacín I Análisis de Regresión y Superficies de Respuesta 17

Producto de matrices

Sean A Y B dos matrices, el producto de la misma (A x B ) esposible o está bien definido, solamente, si el número de columnas de Aes igual al número de filas de B; en cualquier otro caso, la operaciónno podrá definirse; es decir, cuando A = [ aij ] es de orden m x p yB = [ bu ] es de orden p x n entonces es posible definir la operación deproductos matricial, y resulta de orden mxn.

Ejemplo:

l: ;l l: O

:1Sean: A= y B =2

Como A es de orden 3x2 y B de orden 2x3, entonces es posiblerealizar el producto.

rCII e12

COllA x B. = e2l e22 e23

e3l e32 e33

donde:

cu = 1 xl + 3x4 = 13

C12 = 1xO + 3x2 = 6

C13 = 1x3 + 3x1 = 6

C21 = 4x1 + 2x4 = 12

C22 = 4xO + 2x2 = 4

C23 = 4x3 + 2x1 = 14

C3l = 6x1 + 1x4 = 10

C32 = 6xO + 1x2 = 2

C33 = 6x3 + 1 x 1 = 19

Page 24: Analisis de Regresión y Superficie de Respuesta Chacin

16 Chacín I Análisis de Regresión YSuperficies de Respuesta

Producto de vectores

Si se tienen

Entonces A x B será:

bl

b2

A B = ( al az ... as ] b3

A B = [al bi + aa bs + ... + an bn )lxl = [Cij)

donde Cij es la suma de los productos de los elementoscorrespondientes en el vector fila (A) y el vector columna (B).

Ejemplo:

A=[1324] y B =

154

O

A x B = [1 x 1 + 3 x 5 + 2 x 4 + 4 x O ) = 24

Chacín I Análisis de Regresión y Superficies de Respuesta 17

Producto de matrices

Sean A Y B dos matrices, el producto de la misma (A x B ) esposible o está bien definido, solamente, si el número de columnas de Aes igual al número de filas de B; en cualquier otro caso, la operaciónno podrá definirse; es decir, cuando A = [ aij ] es de orden m x p yB = [ bu ] es de orden p x n entonces es posible definir la operación deproductos matricial, y resulta de orden mxn.

Ejemplo:

l: ;l l: O

:1Sean: A= y B =2

Como A es de orden 3x2 y B de orden 2x3, entonces es posiblerealizar el producto.

rCII e12

COllA x B. = e2l e22 e23

e3l e32 e33

donde:

cu = 1 xl + 3x4 = 13

C12 = 1xO + 3x2 = 6

C13 = 1x3 + 3x1 = 6

C21 = 4x1 + 2x4 = 12

C22 = 4xO + 2x2 = 4

C23 = 4x3 + 2x1 = 14

C3l = 6x1 + 1x4 = 10

C32 = 6xO + 1x2 = 2

C33 = 6x3 + 1 x 1 = 19

Page 25: Analisis de Regresión y Superficie de Respuesta Chacin

18 Chacín I Análisis de Regresión Y Superficies de Respuesta

Propiedades del producto de matrices

AB

A ( B C )

"# BA

=(AB)C

Pre o postmultiplicación

En la operación BA ->

En la operación AB ->

B premultiplica a A

B postmultiplica a A

TIPO DE MATRICES

Matriz nula

O O ~lO OOmxn = ~jO O .. ,

Matriz identidad

1 O OO 1 O

In =O O 1

Chacín I Análisis de Regresión y Superficies de Respuesta 19

Matriz diagonal

d¡¡ O OO d22 O

Dn =

O O dnn

Matriz inversa

De acuerdo a las propiedades de los números reales, todo real bcorresponde -otro ( -b ) tal que b + ( -b ) = O. En cuanto a lamultiplicación, a cualquier número real que sea distinto de cero,

b ~ 0, corresponde otro b·l tal que b x b·l = 1 donde 1 es el elementoidentidad de la multiplicación.

En matrices; si B B·l = B·l B = 1 entonces B:' es inversa de By 1 = matriz identidad.

Propiedades de la matriz inversa

( Al )-1 = ( A-l )1

( Al )-1 = A

( A B )-1 = B-l A-1

( KA )-1 = ~. A-1K

DETERMINANTES

Existe un número real asociado a una matriz cuadrada que seconoce con el nombre de determinante y es denotado por I A l.

Considérense una matriz cuadrada 2 x 2

Page 26: Analisis de Regresión y Superficie de Respuesta Chacin

18 Chacín I Análisis de Regresión Y Superficies de Respuesta

Propiedades del producto de matrices

AB

A ( B C )

"# BA

=(AB)C

Pre o postmultiplicación

En la operación BA ->

En la operación AB ->

B premultiplica a A

B postmultiplica a A

TIPO DE MATRICES

Matriz nula

O O ~lO OOmxn = ~jO O .. ,

Matriz identidad

1 O OO 1 O

In =O O 1

Chacín I Análisis de Regresión y Superficies de Respuesta 19

Matriz diagonal

d¡¡ O OO d22 O

Dn =

O O dnn

Matriz inversa

De acuerdo a las propiedades de los números reales, todo real bcorresponde -otro ( -b ) tal que b + ( -b ) = O. En cuanto a lamultiplicación, a cualquier número real que sea distinto de cero,

b ~ 0, corresponde otro b·l tal que b x b·l = 1 donde 1 es el elementoidentidad de la multiplicación.

En matrices; si B B·l = B·l B = 1 entonces B:' es inversa de By 1 = matriz identidad.

Propiedades de la matriz inversa

( Al )-1 = ( A-l )1

( Al )-1 = A

( A B )-1 = B-l A-1

( KA )-1 = ~. A-1K

DETERMINANTES

Existe un número real asociado a una matriz cuadrada que seconoce con el nombre de determinante y es denotado por I A l.

Considérense una matriz cuadrada 2 x 2

Page 27: Analisis de Regresión y Superficie de Respuesta Chacin

20 Chacín I Análisis de Regresión y Superficies de Respuesta

En forma general, para una matriz cuadrada puede darse lafórmula siguiente:

IAI = fC-l)P+iapjIApilj~1

donde p toma un valor desde 1, 2, ..., n, y Apj representa, la matrizque se forma partiendo de A, eliminando la hilera i y la columna j deA. Como I A I es único, no importa el valor que se use para p.

Propiedades de los determinantes

i)

ii)

iii )

iv)

v)

vi)

IA'I =IAI

El intercambio de dos columnas ( o filas ) cualesquiera de Acambia el signo del determinante.

El determinante de una matriz con dos columnas ( o filas)iguales es cero.

Si cada elemento de una fila ( o columna) de A se multiplicapor la cantidad escalar A para que resulte una nueva matrizB, entonces:

IBI=AIAI

Si todos los elementos de una matriz Anxn se multiplican porA, entonces:

I A Al = An lA I

El menor de un determinante de orden n, es un determinantede orden n-1 que resulta de suprimir en el primero una fila yuna columna.

I Aij I -c-Notación para el determinante del menor de ordenn-1 que resulta de suprimir la fila i y la columna j

donde;

Chacín I Análisis de Regresión y Superficies de Respuesta 21vii) Cofactor de un determinante de orden n es el correspondiente

menor de -orden n - 1 con signo + ó - d dexpresión: e acuer o a la

viii)Cij = (-1 )i+j I A ij I

El ~alor del determinante no se altera cuando a cualquier fila

filoco umlna, se le suma un múltiple constante de cualquier otraa o co umna. Esto es:

all + A a2! a!2 + '\ a1\, 22

Ejemplo:

Sea A una matriz 3 x 3

Entonces:

IAI = (_1)1+1(3)1 Au ] + (-1)1+2 (1)IA121 +( -1 ) 1+3( O) IAl3 I

An ~ [~ ~JA" ~ G ~J

Page 28: Analisis de Regresión y Superficie de Respuesta Chacin

20 Chacín I Análisis de Regresión y Superficies de Respuesta

En forma general, para una matriz cuadrada puede darse lafórmula siguiente:

IAI = fC-l)P+iapjIApilj~1

donde p toma un valor desde 1, 2, ..., n, y Apj representa, la matrizque se forma partiendo de A, eliminando la hilera i y la columna j deA. Como I A I es único, no importa el valor que se use para p.

Propiedades de los determinantes

i)

ii)

iii )

iv)

v)

vi)

IA'I =IAI

El intercambio de dos columnas ( o filas ) cualesquiera de Acambia el signo del determinante.

El determinante de una matriz con dos columnas ( o filas)iguales es cero.

Si cada elemento de una fila ( o columna) de A se multiplicapor la cantidad escalar A para que resulte una nueva matrizB, entonces:

IBI=AIAI

Si todos los elementos de una matriz Anxn se multiplican porA, entonces:

I A Al = An lA I

El menor de un determinante de orden n, es un determinantede orden n-1 que resulta de suprimir en el primero una fila yuna columna.

I Aij I -c-Notación para el determinante del menor de ordenn-1 que resulta de suprimir la fila i y la columna j

donde;

Chacín I Análisis de Regresión y Superficies de Respuesta 21vii) Cofactor de un determinante de orden n es el correspondiente

menor de -orden n - 1 con signo + ó - d dexpresión: e acuer o a la

viii)Cij = (-1 )i+j I A ij I

El ~alor del determinante no se altera cuando a cualquier fila

filoco umlna, se le suma un múltiple constante de cualquier otraa o co umna. Esto es:

all + A a2! a!2 + '\ a1\, 22

Ejemplo:

Sea A una matriz 3 x 3

Entonces:

IAI = (_1)1+1(3)1 Au ] + (-1)1+2 (1)IA121 +( -1 ) 1+3( O) IAl3 I

An ~ [~ ~JA" ~ G ~J

Page 29: Analisis de Regresión y Superficie de Respuesta Chacin

22 Chacin I Análisis de Regresión Y Superficies de Respuesta

Al3 = l~~J(O x 4) (2 xl) = -2

IAnl =(2 x 4) (2 xl) = 6

I Al2 I =(2 xl) (O xl) = 2

I Al3 I =Por lo tanto

3 x ( -2 ) - 1 x 6 + O x 2 = -12I Al =

MATRIZ INVERSA

Sea A una matriz cuadrada entonces

Adj (A) = [cid'

La adjunta de A es la traspuesta de la matriz de cofactores.

Se puede definir a la matriz inversa como:

1 adj (A)A-l = -\A\

Ejemplo: sea A

U 2 31A 5 -:J IAI = 1=

-4

[-5 O

:JA-l = ~ -2 1ll_5 1

Chacín I Análisis de Regresión y Superficies de Respuesta 23

INDEPENDENCIA LINEAL DE VECTORES

Si se tiene un conjunto de vectores

{x, X2, ... .x, }donde

x, = { xs. Xi2, ... , Xin }

i = 1, 2, ..., m

Se dice que los vectores son linealmente independientes si laexpresión:

A.l Xi + A.2 X2 + ... + A.m Xm = 0n

ocurre solamente si A.l = A.2 = ... = A.n= O, de no ser así los vectores sonlinealmente dependientes

Donde;

o n = Vector n x 1 cuyos elementos son ceros

f... = números reales

RANGO DE UNA MATRIZ

Para una matriz m x n existe un número entero que representael número máximo de vectores columnas o hileras de la matriz quesean linealmente independientes y el cual denotaremos como r y quesignifica el rango de la matriz.

Page 30: Analisis de Regresión y Superficie de Respuesta Chacin

22 Chacin I Análisis de Regresión Y Superficies de Respuesta

Al3 = l~~J(O x 4) (2 xl) = -2

IAnl =(2 x 4) (2 xl) = 6

I Al2 I =(2 xl) (O xl) = 2

I Al3 I =Por lo tanto

3 x ( -2 ) - 1 x 6 + O x 2 = -12I Al =

MATRIZ INVERSA

Sea A una matriz cuadrada entonces

Adj (A) = [cid'

La adjunta de A es la traspuesta de la matriz de cofactores.

Se puede definir a la matriz inversa como:

1 adj (A)A-l = -\A\

Ejemplo: sea A

U 2 31A 5 -:J IAI = 1=

-4

[-5 O

:JA-l = ~ -2 1ll_5 1

Chacín I Análisis de Regresión y Superficies de Respuesta 23

INDEPENDENCIA LINEAL DE VECTORES

Si se tiene un conjunto de vectores

{x, X2, ... .x, }donde

x, = { xs. Xi2, ... , Xin }

i = 1, 2, ..., m

Se dice que los vectores son linealmente independientes si laexpresión:

A.l Xi + A.2 X2 + ... + A.m Xm = 0n

ocurre solamente si A.l = A.2 = ... = A.n= O, de no ser así los vectores sonlinealmente dependientes

Donde;

o n = Vector n x 1 cuyos elementos son ceros

f... = números reales

RANGO DE UNA MATRIZ

Para una matriz m x n existe un número entero que representael número máximo de vectores columnas o hileras de la matriz quesean linealmente independientes y el cual denotaremos como r y quesignifica el rango de la matriz.

Page 31: Analisis de Regresión y Superficie de Respuesta Chacin

24 Chacín I Análisis de Regresión Y Superficies de Respuesta

PropiedadesSea rango de A denotamos por p(A)

p(AB) s p(A)s p( B)

p(A+B) s peA) + p(B)Si A es una matriz de orden n y \A \ = O entonces p( A) < n

Sea Amx n

Si p (A) = m => Habrá m filas linealmente independientes

Si p (A) = n => Habrá n filas linealmente independientes

MATRIZ ORTOGONAL

l si lo si A' = A-ISea una matriz A, A es ortogona SI Y so o SI

RAICES y VECTORES CARACTERISTICOS

Una raíz característica ( RC. ) de una matriz An x n es unescalar Atal que AX = AXpara algún vector X *- O.

El vector X se denomina vector característico (V. C: ) de la

matrizA.De la ecuación anterior se sigue que:

AX - A X = O (A-Al) X=O

O, lo cualpolinomio

y para que tenga solución debe cumplirse \ A - A ~ \ =representa un polinomio de grado n en A, de.nommadocaracterístico. Sus raíces son las R C. ~e la matriz A:

El número de R C. *- O de una matriz es igual al rango de A

Si C es una matriz ortogonal Y Anx n se cumple:

RC (A) = RC (C' AC)

Chacín I Análisis de Regresión y Superficies de Respuesta 25Si A es simétrica (A' = A) las RC de A son reales.

Las RC de una matriz definida positiva son positivas (>0).

Las RC de una matriz semi-definida positiva son negativas (~O).

Para toda matriz simétrica A, hay una matriz ortogonal C talque C'AC = D, donde D es una matriz diagonal cuyos elementos en ladiagonal son las RC de A.

Sea Cnx ndada por:

CII CI2 cln cI

c= c2\ c22 c2n c2=

cn \ cn2 Con cn

C i es la i-ésima fila de e

e . es la traspuesta de ci, un vector columnaJ

Las condiciones necesarias y suficientes para que C seaortogonal son:

i) = O Vi*- jCi c.J

ü) Ci ci = 1 V i

Si A n x n y C n X n son dos matrices de orden n (\ C \ *- O), lasmatrices A, C -IAC, CACo!tienen las mismas RC. Los VC de unamatriz simétrica son ortogonales. Si una RC se presenta k veceshabrá k vectores característicos ortogonales correspondientes a esaRC.

Si se tiene los VC de A como columnas de una matriz X, y serealiza el producto X'AX se obtiene una matriz diagonal con las Re deA en la diagonal principal. Este proceso se conoce comodiagonalización de una matriz simétrica, y se cumple:

t r (X' AX) = ¿ Ai = t r (AXX' ) = t r ( A )

Page 32: Analisis de Regresión y Superficie de Respuesta Chacin

24 Chacín I Análisis de Regresión Y Superficies de Respuesta

PropiedadesSea rango de A denotamos por p(A)

p(AB) s p(A)s p( B)

p(A+B) s peA) + p(B)Si A es una matriz de orden n y \A \ = O entonces p( A) < n

Sea Amx n

Si p (A) = m => Habrá m filas linealmente independientes

Si p (A) = n => Habrá n filas linealmente independientes

MATRIZ ORTOGONAL

l si lo si A' = A-ISea una matriz A, A es ortogona SI Y so o SI

RAICES y VECTORES CARACTERISTICOS

Una raíz característica ( RC. ) de una matriz An x n es unescalar Atal que AX = AXpara algún vector X *- O.

El vector X se denomina vector característico (V. C: ) de la

matrizA.De la ecuación anterior se sigue que:

AX - A X = O (A-Al) X=O

O, lo cualpolinomio

y para que tenga solución debe cumplirse \ A - A ~ \ =representa un polinomio de grado n en A, de.nommadocaracterístico. Sus raíces son las R C. ~e la matriz A:

El número de R C. *- O de una matriz es igual al rango de A

Si C es una matriz ortogonal Y Anx n se cumple:

RC (A) = RC (C' AC)

Chacín I Análisis de Regresión y Superficies de Respuesta 25Si A es simétrica (A' = A) las RC de A son reales.

Las RC de una matriz definida positiva son positivas (>0).

Las RC de una matriz semi-definida positiva son negativas (~O).

Para toda matriz simétrica A, hay una matriz ortogonal C talque C'AC = D, donde D es una matriz diagonal cuyos elementos en ladiagonal son las RC de A.

Sea Cnx ndada por:

CII CI2 cln cI

c= c2\ c22 c2n c2=

cn \ cn2 Con cn

C i es la i-ésima fila de e

e . es la traspuesta de ci, un vector columnaJ

Las condiciones necesarias y suficientes para que C seaortogonal son:

i) = O Vi*- jCi c.J

ü) Ci ci = 1 V i

Si A n x n y C n X n son dos matrices de orden n (\ C \ *- O), lasmatrices A, C -IAC, CACo!tienen las mismas RC. Los VC de unamatriz simétrica son ortogonales. Si una RC se presenta k veceshabrá k vectores característicos ortogonales correspondientes a esaRC.

Si se tiene los VC de A como columnas de una matriz X, y serealiza el producto X'AX se obtiene una matriz diagonal con las Re deA en la diagonal principal. Este proceso se conoce comodiagonalización de una matriz simétrica, y se cumple:

t r (X' AX) = ¿ Ai = t r (AXX' ) = t r ( A )

Page 33: Analisis de Regresión y Superficie de Respuesta Chacin

26 Chacín / Análisis de Regresión y Superficies de Respuesta Chacín / Análisis de Regresión y Superficies de Respuesta 27

Sea Zn x 1 es un vector constituido por variables normalesindependientes con media O y varianza constante (j 2, es decir:

El V. C para A = 5 será:

E (Zi) = O

E ( Z~) = (j2i = 1,2, ...,n XI=

2.J5

i * j

1.J5j = 1,2, ...,n

La matriz de varianza-covarianza se define: El V. C. para A.= O es:

E (ZZ') =

I E(Z~)

I E(Z?Zl)

I ~lE(ZnZ1 )

E(ZlZn)]E(Z2Zn)

E(~!) J

1.J5

Ejemplo:

Al = 5Observe que X; X 2 = O => Los V. C. son ortogonales.

. [-1 2] {-X1+2X2=OSI Al = 5 ----> A - Al = 2 _ 4 ~ ~ Xi = 2Xz2X] - 4X2 = O

FORMA CUADRATICA REAL

En Xi = 2Xz hay un elemento arbitrario, en consecuencia si Xsatisface dicha igualdad, también la satisface kX.

Se puede normalizar el vector haciendo que su módulo sea launidad:

Defin~c~ón: una función f de "n" variables reales, digamos Xi,Xz, ... Xn definidas por:

f (x., x, ...,Xn) = I I;=1 j=I

= 11

-J5Se le conoce como forma cuadrática, donde:

X= r al2

a,"~A= a21 a22 a2n

anl an2... a:"

Page 34: Analisis de Regresión y Superficie de Respuesta Chacin

26 Chacín / Análisis de Regresión y Superficies de Respuesta Chacín / Análisis de Regresión y Superficies de Respuesta 27

Sea Zn x 1 es un vector constituido por variables normalesindependientes con media O y varianza constante (j 2, es decir:

El V. C para A = 5 será:

E (Zi) = O

E ( Z~) = (j2i = 1,2, ...,n XI=

2.J5

i * j

1.J5j = 1,2, ...,n

La matriz de varianza-covarianza se define: El V. C. para A.= O es:

E (ZZ') =

I E(Z~)

I E(Z?Zl)

I ~lE(ZnZ1 )

E(ZlZn)]E(Z2Zn)

E(~!) J

1.J5

Ejemplo:

Al = 5Observe que X; X 2 = O => Los V. C. son ortogonales.

. [-1 2] {-X1+2X2=OSI Al = 5 ----> A - Al = 2 _ 4 ~ ~ Xi = 2Xz2X] - 4X2 = O

FORMA CUADRATICA REAL

En Xi = 2Xz hay un elemento arbitrario, en consecuencia si Xsatisface dicha igualdad, también la satisface kX.

Se puede normalizar el vector haciendo que su módulo sea launidad:

Defin~c~ón: una función f de "n" variables reales, digamos Xi,Xz, ... Xn definidas por:

f (x., x, ...,Xn) = I I;=1 j=I

= 11

-J5Se le conoce como forma cuadrática, donde:

X= r al2

a,"~A= a21 a22 a2n

anl an2... a:"

Page 35: Analisis de Regresión y Superficie de Respuesta Chacin

28 Chacín I Análisis de Regresión Y Superficies de Respuesta

La matriz A de la forma cuadrática no es única.

Ejemplo:

Si X = y A=

Entonces:

X'AX = X~ + 3X2 Xi + 4XilXI + 2XlX2 + 8X~ + 9X3 X2 - Xi X32+ 2X2X3 - X3

X'AX = X~ + 5XI X2 + 3X3Xl + 8X; + 11X2 X3 - X;

2X'AX = X¡+ (8-3) x. X2 + (5-2) X3x, + 8X 2

2+ (7 + 4) X2 X3- X 3

X'AX = X ~ + 8X2 Xl - 3Xl X2+ 5X3X. - 2Xl X3 + 8X; + 7XzX3

X2.+ 4X3 X2 - 3

= X'BX

pero, A "* BSin embargo, si a los coeficientes de Xi X2, Xi X3 y X2 X3 los

dividimos por 2, se tiene que:

3 3 2- Xi X3 + - X3Xi + 8X 2 +2 2

5/28

11/2X'AX = i x, X2 Xa ]

Chacín I Análisis de Regresión y Superficies de Respuesta 29

Luego se puede afirmar que toda forma cuadrática X'AX tieneasociada una matriz A simétrica.

También una forma cuadrática puede escribirse de la siguientemanera:

n n

I I aijXi x,j=1 j=1

n n n

= I aii X; + I I (aij + aji) x. x,i=1 i=1 j=1

TIPOS DE FORMAS CUADRATICAS

El rango" r » de una forma cuadrática Q = X'AX es igual alnúmero de raíces características distintas de cero. También es elrango de la matriz A.

El índice" u" de una forma cuadrática Q es el número de raícespositivas de la ecuación característica de A.

Usando las definiciones anteriores, se tiene que:

L Cuando la ecuación característica de A contiene raícespositivas y negativas; esto es en términos de r y u, 1:S; u :s; r,la forma cuadrática Q es indefinida.

lI. Si Q es de rango r = n y además u = r = n entonces Q esdefinida positiva.

lII. Si Q es de rango r = n, pero u = 0, entonces Q es definidanegativa.

IV. Si r < n y además u = r, entonces Q es semidefinida positiva.

V. Si r < n y además u = 0, se dice que Q es semidefinida negati-va.

Page 36: Analisis de Regresión y Superficie de Respuesta Chacin

28 Chacín I Análisis de Regresión Y Superficies de Respuesta

La matriz A de la forma cuadrática no es única.

Ejemplo:

Si X = y A=

Entonces:

X'AX = X~ + 3X2 Xi + 4XilXI + 2XlX2 + 8X~ + 9X3 X2 - Xi X32+ 2X2X3 - X3

X'AX = X~ + 5XI X2 + 3X3Xl + 8X; + 11X2 X3 - X;

2X'AX = X¡+ (8-3) x. X2 + (5-2) X3x, + 8X 2

2+ (7 + 4) X2 X3- X 3

X'AX = X ~ + 8X2 Xl - 3Xl X2+ 5X3X. - 2Xl X3 + 8X; + 7XzX3

X2.+ 4X3 X2 - 3

= X'BX

pero, A "* BSin embargo, si a los coeficientes de Xi X2, Xi X3 y X2 X3 los

dividimos por 2, se tiene que:

3 3 2- Xi X3 + - X3Xi + 8X 2 +2 2

5/28

11/2X'AX = i x, X2 Xa ]

Chacín I Análisis de Regresión y Superficies de Respuesta 29

Luego se puede afirmar que toda forma cuadrática X'AX tieneasociada una matriz A simétrica.

También una forma cuadrática puede escribirse de la siguientemanera:

n n

I I aijXi x,j=1 j=1

n n n

= I aii X; + I I (aij + aji) x. x,i=1 i=1 j=1

TIPOS DE FORMAS CUADRATICAS

El rango" r » de una forma cuadrática Q = X'AX es igual alnúmero de raíces características distintas de cero. También es elrango de la matriz A.

El índice" u" de una forma cuadrática Q es el número de raícespositivas de la ecuación característica de A.

Usando las definiciones anteriores, se tiene que:

L Cuando la ecuación característica de A contiene raícespositivas y negativas; esto es en términos de r y u, 1:S; u :s; r,la forma cuadrática Q es indefinida.

lI. Si Q es de rango r = n y además u = r = n entonces Q esdefinida positiva.

lII. Si Q es de rango r = n, pero u = 0, entonces Q es definidanegativa.

IV. Si r < n y además u = r, entonces Q es semidefinida positiva.

V. Si r < n y además u = 0, se dice que Q es semidefinida negati-va.

Page 37: Analisis de Regresión y Superficie de Respuesta Chacin

30 Chacín I Análisis de Regresión y Superficies de Respuesta

Ejemplo:

a.- Para la matriz:

A= r ~ ~ -~ll-2 1 1

donde, Al = 4, A2= 2 Y A3= -2. El rango de Q = X'AX es de 3 y elíndice u es 2. Por lo tanto la forma cadrática Q = X'AX es indefinida.

b.- Para la matriz:

r2 ~JB= II5 H 5 -Hdonde, Al = + y A2 -2 2

Como r = n = 2 Y u = 2,

entonces la forma cuadrática P = X'BX es definida positiva.

Reducción de formas cuadráticas a formas canónicas

Una manipulación extremadamente útil en la descripción de lanaturaleza de una superficie de respuesta y localización de regionesde condiciones óptimas es la reducción de una forma cuadrática a unaforma canónica. El siguiente teorema describe la naturaleza de estaimportante transformación.

TEOREMA

Si Al, A2.... , An son raíces características (todas reales) de lamatriz simétrica A, existe una transformación ortogonal X = PW, talque la forma cuadrática real Q = X'AX es transformada en unaexpresión canónica:

Chacín I Análisis de Regresión y Superficies de Respuesta

[W¡ W2 ... Wn]

= 1¡ W2 + 1 w21\. 1 1\.2 2

31

oO

O

An Wn

2+ + AnWII

Esto es, la forma cuadrática Q es transformada en otra formacuadrática cuya matriz es diagonal, los elementos de la diagonal sonlas raíces caracteristicas de la matriz A.

DIFERENCIACION USANDO MATRICES

Supóngase que se requiere diferenciar f( Z¡, Z2, ..., Zn) con res-pecto a Zi, Z2, ... Zn. Considerando los Z' s en forma de vector, ésto es:

Z =

Zn

Por la derivada Oí / az, escribimos el vector columna:

8f-=8Z

Esto es, el vector columna de derivadas parciales. Por otro lado,( Oí / OZ ) I es el vector fila de derivadas parciales.

Page 38: Analisis de Regresión y Superficie de Respuesta Chacin

30 Chacín I Análisis de Regresión y Superficies de Respuesta

Ejemplo:

a.- Para la matriz:

A= r ~ ~ -~ll-2 1 1

donde, Al = 4, A2= 2 Y A3= -2. El rango de Q = X'AX es de 3 y elíndice u es 2. Por lo tanto la forma cadrática Q = X'AX es indefinida.

b.- Para la matriz:

r2 ~JB= II5 H 5 -Hdonde, Al = + y A2 -2 2

Como r = n = 2 Y u = 2,

entonces la forma cuadrática P = X'BX es definida positiva.

Reducción de formas cuadráticas a formas canónicas

Una manipulación extremadamente útil en la descripción de lanaturaleza de una superficie de respuesta y localización de regionesde condiciones óptimas es la reducción de una forma cuadrática a unaforma canónica. El siguiente teorema describe la naturaleza de estaimportante transformación.

TEOREMA

Si Al, A2.... , An son raíces características (todas reales) de lamatriz simétrica A, existe una transformación ortogonal X = PW, talque la forma cuadrática real Q = X'AX es transformada en unaexpresión canónica:

Chacín I Análisis de Regresión y Superficies de Respuesta

[W¡ W2 ... Wn]

= 1¡ W2 + 1 w21\. 1 1\.2 2

31

oO

O

An Wn

2+ + AnWII

Esto es, la forma cuadrática Q es transformada en otra formacuadrática cuya matriz es diagonal, los elementos de la diagonal sonlas raíces caracteristicas de la matriz A.

DIFERENCIACION USANDO MATRICES

Supóngase que se requiere diferenciar f( Z¡, Z2, ..., Zn) con res-pecto a Zi, Z2, ... Zn. Considerando los Z' s en forma de vector, ésto es:

Z =

Zn

Por la derivada Oí / az, escribimos el vector columna:

8f-=8Z

Esto es, el vector columna de derivadas parciales. Por otro lado,( Oí / OZ ) I es el vector fila de derivadas parciales.

Page 39: Analisis de Regresión y Superficie de Respuesta Chacin

32 Chacín I Análisis de Regresión y Superficies de Respuesta

REGLAS DE DERIVACION

REGLA 1: Dado el vector columna a conteniendo "n"constantes, y el vector Z también con "n" constantes consideremos elescalar a' Z;

aa'Z

aza

aa'Z-- = a' = [al, a2, ..., an]az'

REGLA 2:el escalar Z' Z;

Dado el vector Z con "n" elementos. Consideremos

.OZ'Z eaz2Z y -- = 2Z'

az'--=

az

REGLA 3: Consideremos el vector:

Z' = [Zl Z2 ... z, ]y la matriz A de orden "u". La derivada del escalar Z'AZ con respectoal vector columna Z es dada por:

a(Z'AZ) = AZ + A'Z = (A + A' ) Zaz

En particular, si A es simétrica (i. e. A = A' )

a(z' AZ) = 2 AZaz

Chacín I Análisis de Regresión y Superficies de Respuesta 33

USO DE NOTACION MATRICIAL PARA MEDIASY VAR1ANZAS DE VECTORES ALEATORIOS

Sea: y =

un vector aleatorio conteniendo "n" variables.

Media de Y

es decir, ¡.ti= E (Yr ), i = 1, 2, ..., n

Matriz de varianza covarianza

donde:V e Y) = E (Y. - ¡.ti )2

V e Y) = E e Y; ) - e ¡.ti )2

V e Y, ) = o ~ = e 2, 1 = 1 211 i , 'o .. , n

Coy e Y, , Yj ) = E [e Y, - ¡.ti) e Yj - ¡.tj)]

COy e v., Yj) = E e Y, Yj ) - ¡.ti J.!j

COy e Yr , Yj ) = crij, (i ~ j), j = 1, 2, ... , n

Page 40: Analisis de Regresión y Superficie de Respuesta Chacin

32 Chacín I Análisis de Regresión y Superficies de Respuesta

REGLAS DE DERIVACION

REGLA 1: Dado el vector columna a conteniendo "n"constantes, y el vector Z también con "n" constantes consideremos elescalar a' Z;

aa'Z

aza

aa'Z-- = a' = [al, a2, ..., an]az'

REGLA 2:el escalar Z' Z;

Dado el vector Z con "n" elementos. Consideremos

.OZ'Z eaz2Z y -- = 2Z'

az'--=

az

REGLA 3: Consideremos el vector:

Z' = [Zl Z2 ... z, ]y la matriz A de orden "u". La derivada del escalar Z'AZ con respectoal vector columna Z es dada por:

a(Z'AZ) = AZ + A'Z = (A + A' ) Zaz

En particular, si A es simétrica (i. e. A = A' )

a(z' AZ) = 2 AZaz

Chacín I Análisis de Regresión y Superficies de Respuesta 33

USO DE NOTACION MATRICIAL PARA MEDIASY VAR1ANZAS DE VECTORES ALEATORIOS

Sea: y =

un vector aleatorio conteniendo "n" variables.

Media de Y

es decir, ¡.ti= E (Yr ), i = 1, 2, ..., n

Matriz de varianza covarianza

donde:V e Y) = E (Y. - ¡.ti )2

V e Y) = E e Y; ) - e ¡.ti )2

V e Y, ) = o ~ = e 2, 1 = 1 211 i , 'o .. , n

Coy e Y, , Yj ) = E [e Y, - ¡.ti) e Yj - ¡.tj)]

COy e v., Yj) = E e Y, Yj ) - ¡.ti J.!j

COy e Yr , Yj ) = crij, (i ~ j), j = 1, 2, ... , n

Page 41: Analisis de Regresión y Superficie de Respuesta Chacin

34 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 35

El vector de variables aleatorias:

Y' = (Yl,Y2, ... .Ys ] FORMULA DE TAYLOR

donde las variables son normalmente distribuidas (conjuntamente)con vector media Jl y matriz de varianza-covarianza L, ésto es:

Y ~ N (Jl, L)El conocimiento de la Fórmula de Taylor es indispensable para

entender la metodología de la Superficie de Respuesta, ya que se haexpresado, como supuesto de la metodología, que el modelo real, quegeneralmente no se conoce o es muy complicado, es convenienteaproximarlo a un polinomio de bajo orden y esta demostración se basafundamentalmente en la Fórmula de Taylor.

. Los valores de funciones polinómicas se obtienen efectuando unnúmero finito de sumas y multiplicaciones. Estas funciones, llamadasanalíticas son derivables en un entorno ó en la vecindad de un punto"p" del dominio de la función. Uno de los métodos más utilizados paraaproximar una función por un polinomio es la Fórmula de Taylor.

Cuando las variables aleatorias no están correlacionadas ytienen igual varianza, es decir 0'2 In. entonces:

Y ~ N ( 1.1, 0'2 In)

Algunas reglas para encontrar medias y varianzas

REGLA 1: Dado el vector Y que contiene "n" variablesaleatorias, se cumple que entonces:

E ( AY ) = A JlFórmula de Taylor para una variable con remanente

donde A es cualquier matriz k x n de constantes.

REGLA 2: Dado un vector Y el cual tiene media O, matriz devarianza-covarianza 0'2 1, y una matriz simétrica B entonces:

E (y' BY) = 0'2 t r (B)

Si se tiene y = f (a) una función, tal que "f" y sus primerasderivadas existen en el intervalo cerrado [a, x].

También la función f(x)n+l existe para toda x en el intervaloabierto ( a, x ), luego existe un número x en el intervalo abierto (a, x)tal que:REGLA 3: Si Y es un vector de n-variables aleatorias con

media Jl , cov Y = L, y A una matriz k x n de constantes entonces,definiendo Z = AY,

CovZ = A L A'()' () (x-a) (x_a)2

f x = f a + -- fea) + f"(a) + ...1! 2!

En particular, para una combinación lineal de variablesaleatorias: a'Y, donde Y es un vector de n-variables aleatorias ya' = [ al, aa, ... , as ], tenemos que:

+ (x- a)" fn + -O.(x_-_a-,-t_+_1

f(x)n+ln! (a) Cn+n!

V (a' Y) = a' L af(x) = Pn(x) + Rn(x)

V(a'Y) = I a~O'¡2+2I Ia¡ajO'iji=l je I

i"j

Este teorema puede ser generalizado para funciones de variasvariables. Si se tiene por ejemplo una función de tres variables entorno al punto "p"( xi, yi, Zl)

en notación escalar se tiene que:

i=l

Page 42: Analisis de Regresión y Superficie de Respuesta Chacin

34 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 35

El vector de variables aleatorias:

Y' = (Yl,Y2, ... .Ys ] FORMULA DE TAYLOR

donde las variables son normalmente distribuidas (conjuntamente)con vector media Jl y matriz de varianza-covarianza L, ésto es:

Y ~ N (Jl, L)El conocimiento de la Fórmula de Taylor es indispensable para

entender la metodología de la Superficie de Respuesta, ya que se haexpresado, como supuesto de la metodología, que el modelo real, quegeneralmente no se conoce o es muy complicado, es convenienteaproximarlo a un polinomio de bajo orden y esta demostración se basafundamentalmente en la Fórmula de Taylor.

. Los valores de funciones polinómicas se obtienen efectuando unnúmero finito de sumas y multiplicaciones. Estas funciones, llamadasanalíticas son derivables en un entorno ó en la vecindad de un punto"p" del dominio de la función. Uno de los métodos más utilizados paraaproximar una función por un polinomio es la Fórmula de Taylor.

Cuando las variables aleatorias no están correlacionadas ytienen igual varianza, es decir 0'2 In. entonces:

Y ~ N ( 1.1, 0'2 In)

Algunas reglas para encontrar medias y varianzas

REGLA 1: Dado el vector Y que contiene "n" variablesaleatorias, se cumple que entonces:

E ( AY ) = A JlFórmula de Taylor para una variable con remanente

donde A es cualquier matriz k x n de constantes.

REGLA 2: Dado un vector Y el cual tiene media O, matriz devarianza-covarianza 0'2 1, y una matriz simétrica B entonces:

E (y' BY) = 0'2 t r (B)

Si se tiene y = f (a) una función, tal que "f" y sus primerasderivadas existen en el intervalo cerrado [a, x].

También la función f(x)n+l existe para toda x en el intervaloabierto ( a, x ), luego existe un número x en el intervalo abierto (a, x)tal que:REGLA 3: Si Y es un vector de n-variables aleatorias con

media Jl , cov Y = L, y A una matriz k x n de constantes entonces,definiendo Z = AY,

CovZ = A L A'()' () (x-a) (x_a)2

f x = f a + -- fea) + f"(a) + ...1! 2!

En particular, para una combinación lineal de variablesaleatorias: a'Y, donde Y es un vector de n-variables aleatorias ya' = [ al, aa, ... , as ], tenemos que:

+ (x- a)" fn + -O.(x_-_a-,-t_+_1

f(x)n+ln! (a) Cn+n!

V (a' Y) = a' L af(x) = Pn(x) + Rn(x)

V(a'Y) = I a~O'¡2+2I Ia¡ajO'iji=l je I

i"j

Este teorema puede ser generalizado para funciones de variasvariables. Si se tiene por ejemplo una función de tres variables entorno al punto "p"( xi, yi, Zl)

en notación escalar se tiene que:

i=l

Page 43: Analisis de Regresión y Superficie de Respuesta Chacin

36 Chacin I Análisis de Regresión y Superficies de Respuesta

El término general de la serie, puede interpretarse en función deuna diferencial enésima d=f, de la función f(x, y).

anfd=f = (X-Xl) a Xn +...

Para indicar la dependencia de d=f sobre xi, yi, Zl y lasdiferencias (x -xi), (y -yi), (Z -zi).

d=F = dnF( xi, yi, Zl, X -xi, y-yi, Z-Zl )

Cuando n = 1

d'F = d'F( xi, yi, zr, dx, dy, dz, )af af af= -dx+-dy+-dzax ay azZ - Zl = dzcon X - Xl = dx y - y i = dy

La serie puede escribirse como:

F( x, y, z ) = F( xi, yi, zi ) + dF( xr, Y1,Zl, X -xi, Y -yi, Z -zr )

1+ - d2F( xi, yi, zr, X -xi, Y -yi, Z -zr ) + ...2!1+ - dn F( xi, yi, Zl, X -xi, Y -yi, Z -zi)n!

Con Rn (X, y, Z)

+ Rn (X, y, Z)

1= ( \. dn+l F( x*, s", z", X -xi, Y -yl, Z -zr )n+ lJ!

Chacín I Análisis de Regresión y Superficies de Respuesta 37

Con:-x* = Xl + t* ( X -xi )

y* = Yl + t* ( Y -yi )

z* = Zl + t* ( Z -zi )

Donde:

o < t* < 1, el punto ( x*, s", z* ) se encuentra entre, (Xl, yi, zr )Y ( X, y, Z ).

Por lo tanto para n = 1 la fórmula se transforma en:

F ( x, y, z) = F( xi, yi, zi ) + (X - xi ) Fx( x*, s". z* )+( y v yr ) Fy( x*,y*,z*) + (z-z¡) Fz(z*,y*,z*)

que se conoce como teorema del valor medio para funciones de tresvariables.

Explicaremos algunos conceptos fundamentales para analizar elpolinomio de Taylor en el espacio R

Campo escalar y campo vectorial

Consideremos funciones con el dominio en el espacio R n-dimen-sional (Rn) y con recorrido en el espacio R m-dimensional (Rm); esdecir f: Rn ~ Rm; cuando n = m = 1, tal función se llama función realde variable real; cuando n =1 y m > 1, se llama función vectorial deuna variable real; cuando n> 1 y m =1, la función se llama funciónreal de una variable vectorial, o más brevemente, un campo escalar( f: Rn ~ R ) Y si n = 1 y m > 1, se llama campo vectorial (f: R ~ Rm).

Bolas abiertas

Sea "a" un punto dado en Rn y "x" un número positivo dado. Elconjunto de todos los puntos X E Rn, tales que 11 X - a 11 < r se llaman-bola abierta de radio r y centro a; y la denotamos por B(a ; r).

Gradiente de un campo escalar

El vector cuyas componentes son las derivadas parciales de unafunción escalar f, calculadas en el punto "a" se llama gradiente;

V fea) = (Dtf(a), ... , Dnf(a) )

Page 44: Analisis de Regresión y Superficie de Respuesta Chacin

36 Chacin I Análisis de Regresión y Superficies de Respuesta

El término general de la serie, puede interpretarse en función deuna diferencial enésima d=f, de la función f(x, y).

anfd=f = (X-Xl) a Xn +...

Para indicar la dependencia de d=f sobre xi, yi, Zl y lasdiferencias (x -xi), (y -yi), (Z -zi).

d=F = dnF( xi, yi, Zl, X -xi, y-yi, Z-Zl )

Cuando n = 1

d'F = d'F( xi, yi, zr, dx, dy, dz, )af af af= -dx+-dy+-dzax ay azZ - Zl = dzcon X - Xl = dx y - y i = dy

La serie puede escribirse como:

F( x, y, z ) = F( xi, yi, zi ) + dF( xr, Y1,Zl, X -xi, Y -yi, Z -zr )

1+ - d2F( xi, yi, zr, X -xi, Y -yi, Z -zr ) + ...2!1+ - dn F( xi, yi, Zl, X -xi, Y -yi, Z -zi)n!

Con Rn (X, y, Z)

+ Rn (X, y, Z)

1= ( \. dn+l F( x*, s", z", X -xi, Y -yl, Z -zr )n+ lJ!

Chacín I Análisis de Regresión y Superficies de Respuesta 37

Con:-x* = Xl + t* ( X -xi )

y* = Yl + t* ( Y -yi )

z* = Zl + t* ( Z -zi )

Donde:

o < t* < 1, el punto ( x*, s", z* ) se encuentra entre, (Xl, yi, zr )Y ( X, y, Z ).

Por lo tanto para n = 1 la fórmula se transforma en:

F ( x, y, z) = F( xi, yi, zi ) + (X - xi ) Fx( x*, s". z* )+( y v yr ) Fy( x*,y*,z*) + (z-z¡) Fz(z*,y*,z*)

que se conoce como teorema del valor medio para funciones de tresvariables.

Explicaremos algunos conceptos fundamentales para analizar elpolinomio de Taylor en el espacio R

Campo escalar y campo vectorial

Consideremos funciones con el dominio en el espacio R n-dimen-sional (Rn) y con recorrido en el espacio R m-dimensional (Rm); esdecir f: Rn ~ Rm; cuando n = m = 1, tal función se llama función realde variable real; cuando n =1 y m > 1, se llama función vectorial deuna variable real; cuando n> 1 y m =1, la función se llama funciónreal de una variable vectorial, o más brevemente, un campo escalar( f: Rn ~ R ) Y si n = 1 y m > 1, se llama campo vectorial (f: R ~ Rm).

Bolas abiertas

Sea "a" un punto dado en Rn y "x" un número positivo dado. Elconjunto de todos los puntos X E Rn, tales que 11 X - a 11 < r se llaman-bola abierta de radio r y centro a; y la denotamos por B(a ; r).

Gradiente de un campo escalar

El vector cuyas componentes son las derivadas parciales de unafunción escalar f, calculadas en el punto "a" se llama gradiente;

V fea) = (Dtf(a), ... , Dnf(a) )

Page 45: Analisis de Regresión y Superficie de Respuesta Chacin

38 Chacin I Análisis de Regresión y Superficies de Respuesta

Continuidad para campos escalares

Una función escalar f, se dice que es continua en un punto" a "si se cumple:

lim f( a + h y) = f( a )h~O

o equivalente

lim f( x) = f ( a )x~a

Polinomio de Taylor en R

La idea es tratar de aproximar una función f(x), la cual escontínua y derivable, por un polinomio de grado n, dado por:

pn(X)= f(a) + f'(a) (x-a) + f"(a) (x_a)2 + ...1! 2!

( rx-a+ fn( a)n!

donde el término error o residuo, viene dado por la fórmula:

fn+1(C) ( )n+1pn( x) - f( x) = En( x) = x- a ,

(n+ 1)!a < e < x

Fórmula de Taylor de segundo orden para camposescalares

TEOREMA: Si f es un campo escalar con derivadas segundas,Dij f, continuas en una n-Bola B (a; r ), entonces, para todo" y" de Rn,tal que a + y E B (a; r), tenemos que:

1 n n

f(a + y) - f(a) = V f(a) . y + - L L Dij f( a + e y ) yi yj2! ;=1 j=I

Chacin I Análisisde Regresión y Superficies de Respuesta 39

o equivalente

f( a + y ) - f( a )1

= Vf(a). y + -2!

+ 11 y 112 E2( a, y )

n, f( a)n n

LLj= l je l

donde E2( a, y ) ~ O cuando y ~ O

Prueba:

. Sea y, un vector definido por y = (yr, ..., yn ). Definimos unafunción g( I! ), para I! real, mediante la ecuación:

g( I!) = f( a + I! Y ); -1 s I! s 1

SI I! = 1, tenemos que:

g(1) = f( a + y )

SI I! = O, tenemos que:

g( O) = f( a)

por lo tanto,

g(1) - g( O) = f( a + y) - f( a )

ahora, como g es derivable y continua, por definición, entoncespodemos aplicar el polinomio de Taylor para números reales, en estecaso, el de grado uno, centrado en a:

(x- a)'g( x) = g( a) + g' ( a ) -- + Error.

1!

pero si a = O,entonces

g( x) = g( O) + g' ( O) x + Error

donde el error viene dado por la expresión

Eg(c)n+l (x- a)n+l

rror =(n+ 1)!

a < c < x

Page 46: Analisis de Regresión y Superficie de Respuesta Chacin

38 Chacin I Análisis de Regresión y Superficies de Respuesta

Continuidad para campos escalares

Una función escalar f, se dice que es continua en un punto" a "si se cumple:

lim f( a + h y) = f( a )h~O

o equivalente

lim f( x) = f ( a )x~a

Polinomio de Taylor en R

La idea es tratar de aproximar una función f(x), la cual escontínua y derivable, por un polinomio de grado n, dado por:

pn(X)= f(a) + f'(a) (x-a) + f"(a) (x_a)2 + ...1! 2!

( rx-a+ fn( a)n!

donde el término error o residuo, viene dado por la fórmula:

fn+1(C) ( )n+1pn( x) - f( x) = En( x) = x- a ,

(n+ 1)!a < e < x

Fórmula de Taylor de segundo orden para camposescalares

TEOREMA: Si f es un campo escalar con derivadas segundas,Dij f, continuas en una n-Bola B (a; r ), entonces, para todo" y" de Rn,tal que a + y E B (a; r), tenemos que:

1 n n

f(a + y) - f(a) = V f(a) . y + - L L Dij f( a + e y ) yi yj2! ;=1 j=I

Chacin I Análisisde Regresión y Superficies de Respuesta 39

o equivalente

f( a + y ) - f( a )1

= Vf(a). y + -2!

+ 11 y 112 E2( a, y )

n, f( a)n n

LLj= l je l

donde E2( a, y ) ~ O cuando y ~ O

Prueba:

. Sea y, un vector definido por y = (yr, ..., yn ). Definimos unafunción g( I! ), para I! real, mediante la ecuación:

g( I!) = f( a + I! Y ); -1 s I! s 1

SI I! = 1, tenemos que:

g(1) = f( a + y )

SI I! = O, tenemos que:

g( O) = f( a)

por lo tanto,

g(1) - g( O) = f( a + y) - f( a )

ahora, como g es derivable y continua, por definición, entoncespodemos aplicar el polinomio de Taylor para números reales, en estecaso, el de grado uno, centrado en a:

(x- a)'g( x) = g( a) + g' ( a ) -- + Error.

1!

pero si a = O,entonces

g( x) = g( O) + g' ( O) x + Error

donde el error viene dado por la expresión

Eg(c)n+l (x- a)n+l

rror =(n+ 1)!

a < c < x

Page 47: Analisis de Regresión y Superficie de Respuesta Chacin

40 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 41

si a = O Error = g"(c) x2

2!En particular, tenemos que:

O < e < xg' ( e) = V' f( a ). y

y SI X = 1, entonces: y si volvemos a derivar a g' tenemos que:

Error = gil (e), O < e < x V' f[ r(J.l) ]' .y + V' f [ r(J.l) ] . r"(J.l)

2!

g(1 )g' (O) g" (e)= g(O) +--+--

1! 2!

luego, tenemos que:

1g( 1) - g( O) = g' ( O) + - g" ( e )

2!

n . n

gil (u) = I I Dii f [ r( J.l) ] . Yi. Yiie l je I

Por otra parte, como g es una función compuesta dada por:II

y SI J.l = e, tenemos:

n n

g"(c) = I I Dii f[r(c)]. Yi.Yiie I j=l

O < e < 1g( U) = f [re J.l)], donde: r( J.l ) = a + J.lY

derivando mediante la regla de la cadena, tenemos que: .n n

= I I n, f( a + cy ). yi . vr : O < e < 1i=1 j=I

Por otra parte, tenemos que para demostrar el teorema se debedefinir E2 ( a, y ) por la ecuación:

pero es de notar que f: Rn ~ R y r: R ~ Rn y g = for : R ~ R; asíque:

1 n n

11y 112E2 (a, y) = 2! ~ ~ Dji f( a + cy) yi Yi

g' (J.l) = V' f [r(J.l) ]. y

= {Di f [r( J.l)], oo , D, f [r( J.l )]}. ( yi, oo., ye )

1 n n

2fI I Dii f( a ) YiYi• i=l j=l

n

= I Di f [ r( J.l) ] . Yij=1

si y '* O.

Despejando, nos queda:

1 n n .

2fI I n, f( a + e y ) yi Yi =• i=l j=1

con tal que r( J.l) E B (a; r ).

Page 48: Analisis de Regresión y Superficie de Respuesta Chacin

40 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 41

si a = O Error = g"(c) x2

2!En particular, tenemos que:

O < e < xg' ( e) = V' f( a ). y

y SI X = 1, entonces: y si volvemos a derivar a g' tenemos que:

Error = gil (e), O < e < x V' f[ r(J.l) ]' .y + V' f [ r(J.l) ] . r"(J.l)

2!

g(1 )g' (O) g" (e)= g(O) +--+--

1! 2!

luego, tenemos que:

1g( 1) - g( O) = g' ( O) + - g" ( e )

2!

n . n

gil (u) = I I Dii f [ r( J.l) ] . Yi. Yiie l je I

Por otra parte, como g es una función compuesta dada por:II

y SI J.l = e, tenemos:

n n

g"(c) = I I Dii f[r(c)]. Yi.Yiie I j=l

O < e < 1g( U) = f [re J.l)], donde: r( J.l ) = a + J.lY

derivando mediante la regla de la cadena, tenemos que: .n n

= I I n, f( a + cy ). yi . vr : O < e < 1i=1 j=I

Por otra parte, tenemos que para demostrar el teorema se debedefinir E2 ( a, y ) por la ecuación:

pero es de notar que f: Rn ~ R y r: R ~ Rn y g = for : R ~ R; asíque:

1 n n

11y 112E2 (a, y) = 2! ~ ~ Dji f( a + cy) yi Yi

g' (J.l) = V' f [r(J.l) ]. y

= {Di f [r( J.l)], oo , D, f [r( J.l )]}. ( yi, oo., ye )

1 n n

2fI I Dii f( a ) YiYi• i=l j=l

n

= I Di f [ r( J.l) ] . Yij=1

si y '* O.

Despejando, nos queda:

1 n n .

2fI I n, f( a + e y ) yi Yi =• i=l j=1

con tal que r( J.l) E B (a; r ).

Page 49: Analisis de Regresión y Superficie de Respuesta Chacin

42 Chacín I Análisis de Regresión y Superficies de Respuesta

sustituyendo se obtiene que:

g(1) - g(O) = f(a+y) - fea)

1 n n

= Vf( a ). y + - ¿ ¿ n, f( a ) Yi yj2' '. . 1• 1=1 J=

+ lIy112E2( a; y )

Ahora falta mostrar que E2( a; y ) ~ O, cuando y ~ O.

Por definición:

1 n n

11yl12E2( a, y) = - ¿ ¿ [Dij f( a + e y) - Dij f ( a) ]. yi . yj21. .• 1=1 J=1

1 n ns - ¿ ¿ 1Dij f ( a + c y ) - n, f ( a ) 11y.yj 1

2'· .• 1=1 J=1

por desigualdad: triangular:

1 n n::;,¿ ¿ I"Dij f( a + e y) - Dij f( a )111y 1122. i=1 j=1

y dividiendo por 11y 112,ya que asumimos v= O,obtenemos que:

1 n n

IE2(a, y )1s - ¿ ¿ 1 Dij f( a + e y) - Dij f ( a ) 12'· .·1=1 J=1

pero cada derivada Dij es continua. Por hipótesis en el punto a,tenemos que:

n, f ( a + e y) ~ Dij f ( a ), cuando y ~ O

por lo tanto, E2( a, y) ~ O, cuando y ~ O; demostrando así elteorema.

r_

Chacín I Análisis de Regresión y Superficies de Respuesta 43

EJERCICIOS DE APLICACION

Sea la siguiente función escalar

f ( x, Xz, X3) = /30+ fh Xl + /32X2+ /33X3+ /34X¡+ /35X;

3+ /36X3 + /37 Xi X3

donde:

8 f(a)8X¡

8fea)8X2

afea)8X3

y las derivadas segundas son:

82 fea)8 x2

1

=

=

82 fea)8 X¡ 8 X2

82 fea)8X¡8X3

82 fea)8X28X3

= O =

= /3782 fea)=

8X38X¡

O82 fea)= 8X38X2

=

Page 50: Analisis de Regresión y Superficie de Respuesta Chacin

42 Chacín I Análisis de Regresión y Superficies de Respuesta

sustituyendo se obtiene que:

g(1) - g(O) = f(a+y) - fea)

1 n n

= Vf( a ). y + - ¿ ¿ n, f( a ) Yi yj2' '. . 1• 1=1 J=

+ lIy112E2( a; y )

Ahora falta mostrar que E2( a; y ) ~ O, cuando y ~ O.

Por definición:

1 n n

11yl12E2( a, y) = - ¿ ¿ [Dij f( a + e y) - Dij f ( a) ]. yi . yj21. .• 1=1 J=1

1 n ns - ¿ ¿ 1Dij f ( a + c y ) - n, f ( a ) 11y.yj 1

2'· .• 1=1 J=1

por desigualdad: triangular:

1 n n::;,¿ ¿ I"Dij f( a + e y) - Dij f( a )111y 1122. i=1 j=1

y dividiendo por 11y 112,ya que asumimos v= O,obtenemos que:

1 n n

IE2(a, y )1s - ¿ ¿ 1 Dij f( a + e y) - Dij f ( a ) 12'· .·1=1 J=1

pero cada derivada Dij es continua. Por hipótesis en el punto a,tenemos que:

n, f ( a + e y) ~ Dij f ( a ), cuando y ~ O

por lo tanto, E2( a, y) ~ O, cuando y ~ O; demostrando así elteorema.

r_

Chacín I Análisis de Regresión y Superficies de Respuesta 43

EJERCICIOS DE APLICACION

Sea la siguiente función escalar

f ( x, Xz, X3) = /30+ fh Xl + /32X2+ /33X3+ /34X¡+ /35X;

3+ /36X3 + /37 Xi X3

donde:

8 f(a)8X¡

8fea)8X2

afea)8X3

y las derivadas segundas son:

82 fea)8 x2

1

=

=

82 fea)8 X¡ 8 X2

82 fea)8X¡8X3

82 fea)8X28X3

= O =

= /3782 fea)=

8X38X¡

O82 fea)= 8X38X2

=

Page 51: Analisis de Regresión y Superficie de Respuesta Chacin

44 Chacín I Análisis de Regresión y Superficies de Respuesta

por lo tanto:1 3 3

f( a + y) - f( a ) = Vf( a ). y + ,. I I Dij f( a ) Yiyj2. i=l je I

+ 11 y 112 E2( a, y )

= ( Pl + 2P4Xl + P7X3 ) yi + (pz + 2P5M ) yz + (P3 + 3P6X; + P7Xl ) ys

+ ~ (2~4Y ~ + P7 yi ys + 2P5 y; + P7 ya yi + 6P6X3Y ; )2!en particular si consideramos a = (1,2, O), entonces:

f [ ( 1, 2, O ) + ( yi, yz, Y3)] - f ( 1, 2, O) == (Pl + 2P4 ) yi + (pz + 4P5 ) yz + (P3 + P7) ys

+ ~ (2 P4 Y ~ + P7 yr Y3 + 2P5 y; .+ P7 Y3y: )2!que correspondería a la forma cuadrática que aproxima a f en elpunto (1, 2, O).

Capítulo 3

MODELO DE DISEÑO EXPERIMENTAL

Un modelo en estadística, es una descripción de una observaciónen términos de sus componentes, en otras palabras, consiste de unadescripción algebraica junto con los supuestos concernientes a loscomponentes. La consideración del modelo, conduce al cálculoapropiado, pruebas y procedimientos inferenciales.

Los modelos que se consideran en el diseño, corresponden amodelos aditivos que describen cada observación, como la suma deuna media y un componente aleatorio. La media, dependiendo delmodelo, consiste de una suma de componentes asociados con fuentesde variación.

Con los modelos, se trata de establecer relaciones entrecantidades. Desde este punto de vista existen cuatro tipos de modelos:

Modelos cuantitativos

Modelo de regresión

Modelo lineal general

Modelos cualitativos[

Modelo de diseño experimental

Modelo de componentes de varianza

Page 52: Analisis de Regresión y Superficie de Respuesta Chacin

44 Chacín I Análisis de Regresión y Superficies de Respuesta

por lo tanto:1 3 3

f( a + y) - f( a ) = Vf( a ). y + ,. I I Dij f( a ) Yiyj2. i=l je I

+ 11 y 112 E2( a, y )

= ( Pl + 2P4Xl + P7X3 ) yi + (pz + 2P5M ) yz + (P3 + 3P6X; + P7Xl ) ys

+ ~ (2~4Y ~ + P7 yi ys + 2P5 y; + P7 ya yi + 6P6X3Y ; )2!en particular si consideramos a = (1,2, O), entonces:

f [ ( 1, 2, O ) + ( yi, yz, Y3)] - f ( 1, 2, O) == (Pl + 2P4 ) yi + (pz + 4P5 ) yz + (P3 + P7) ys

+ ~ (2 P4 Y ~ + P7 yr Y3 + 2P5 y; .+ P7 Y3y: )2!que correspondería a la forma cuadrática que aproxima a f en elpunto (1, 2, O).

Capítulo 3

MODELO DE DISEÑO EXPERIMENTAL

Un modelo en estadística, es una descripción de una observaciónen términos de sus componentes, en otras palabras, consiste de unadescripción algebraica junto con los supuestos concernientes a loscomponentes. La consideración del modelo, conduce al cálculoapropiado, pruebas y procedimientos inferenciales.

Los modelos que se consideran en el diseño, corresponden amodelos aditivos que describen cada observación, como la suma deuna media y un componente aleatorio. La media, dependiendo delmodelo, consiste de una suma de componentes asociados con fuentesde variación.

Con los modelos, se trata de establecer relaciones entrecantidades. Desde este punto de vista existen cuatro tipos de modelos:

Modelos cuantitativos

Modelo de regresión

Modelo lineal general

Modelos cualitativos[

Modelo de diseño experimental

Modelo de componentes de varianza

Page 53: Analisis de Regresión y Superficie de Respuesta Chacin

46 ChacínI Análisisde Regresióny Superficiesde Respuesta

En los modelos de regresión es de interés primordial encontraruna ecuación que permita predecir los valores de un factor en estudio,mediante otros factores relacionados con él. Por ejemplo, predecir elrendimiento de un cultivo como maíz, a partir de factores tales como:número de mazorcas, número de granos por mazorca, peso de losgranos, etc. En este caso el modelo sería:

En el caso de los modelos de diseño experimental, existe unasituación diferente, ya que el interés no se centra en predecir el valorde un factor sino en comparar el efecto de dos o más factores.

Por ejemplo, el modelo de diseño para tres tratamientos Y dosrepeticiones, podría escribirse de la siguiente manera:

Yll ~ + TI + cllY12 = ~ + TI + c12Y21 ~ + T2 + c21Y22 = ~ + T2 + c22Y31 = ~ + T3 + c31Y32 = ~ + T3 + c32

donde:

es la j-ésima observación del i-ésimo tratamiento

media poblacional

efecto del i-ésimo tratamiento

cij error aleatorio no observable.

En un modelo de diseño, se le puede incluir la restricción de:

(

I Ti = O ~ ti + t2 + ts;=}

[~~ Yii]~ = E ~~-i=l je l n

O y

El modelo se expresa en forma más compacta de la siguientemanera:

~ + Ti + cij

ChacínI Análisisde Regresióny Superficiesde Respuesta 47

donde:

i= 1, 2, 3 -

j = 1, 2

Con notación matricial, esta ecuación puede ser escrita de lasiguiente forma:

Yll 1 1 O O cll

Y12 1 1 O O

[f:l +

c12

Y21 1 O 1 O 1>21

Y22 1 O 1 O c22

Y31 1 O O 1 c31

Y32 1 O O 1 c32

Donde y es un vector 6 x 1 de observaciones, Ü es un vector 4 x 1de parámetros desconocidos, Q es un vector 6 x 1 de errores noobservables y X es una matriz cuyos elementos son ceros y unos. Alcalcular, se tendrá que X es una matriz de rango 3 (incompleto), yenconsecuencia, carecerá de inversa, lo cual constituye cierta dificultadque en general no se plantea en la teoría de Modelos LinealesGenerales.

Definición A: Sea y un vector aleatorio observable n x 1 talque:

Y=Xü-+...Q

Donde X es una matriz n x p conocida que contiene sólo ceros yunos; 12 es un vector de parámetros desconocidas y f¡ un vector devariables aleatorias no observables. Por definición este es un modelode Diseño Experimental. Dado que el rango de X no es completotampoco lo será el de X'X, por lo que esta última no tendrá inversa.En general, un modelo de Diseño Experimental se escribirá de lasiguiente forma:

yij...m = Jlij...m + c ij...m

Page 54: Analisis de Regresión y Superficie de Respuesta Chacin

46 ChacínI Análisisde Regresióny Superficiesde Respuesta

En los modelos de regresión es de interés primordial encontraruna ecuación que permita predecir los valores de un factor en estudio,mediante otros factores relacionados con él. Por ejemplo, predecir elrendimiento de un cultivo como maíz, a partir de factores tales como:número de mazorcas, número de granos por mazorca, peso de losgranos, etc. En este caso el modelo sería:

En el caso de los modelos de diseño experimental, existe unasituación diferente, ya que el interés no se centra en predecir el valorde un factor sino en comparar el efecto de dos o más factores.

Por ejemplo, el modelo de diseño para tres tratamientos Y dosrepeticiones, podría escribirse de la siguiente manera:

Yll ~ + TI + cllY12 = ~ + TI + c12Y21 ~ + T2 + c21Y22 = ~ + T2 + c22Y31 = ~ + T3 + c31Y32 = ~ + T3 + c32

donde:

es la j-ésima observación del i-ésimo tratamiento

media poblacional

efecto del i-ésimo tratamiento

cij error aleatorio no observable.

En un modelo de diseño, se le puede incluir la restricción de:

(

I Ti = O ~ ti + t2 + ts;=}

[~~ Yii]~ = E ~~-i=l je l n

O y

El modelo se expresa en forma más compacta de la siguientemanera:

~ + Ti + cij

ChacínI Análisisde Regresióny Superficiesde Respuesta 47

donde:

i= 1, 2, 3 -

j = 1, 2

Con notación matricial, esta ecuación puede ser escrita de lasiguiente forma:

Yll 1 1 O O cll

Y12 1 1 O O

[f:l +

c12

Y21 1 O 1 O 1>21

Y22 1 O 1 O c22

Y31 1 O O 1 c31

Y32 1 O O 1 c32

Donde y es un vector 6 x 1 de observaciones, Ü es un vector 4 x 1de parámetros desconocidos, Q es un vector 6 x 1 de errores noobservables y X es una matriz cuyos elementos son ceros y unos. Alcalcular, se tendrá que X es una matriz de rango 3 (incompleto), yenconsecuencia, carecerá de inversa, lo cual constituye cierta dificultadque en general no se plantea en la teoría de Modelos LinealesGenerales.

Definición A: Sea y un vector aleatorio observable n x 1 talque:

Y=Xü-+...Q

Donde X es una matriz n x p conocida que contiene sólo ceros yunos; 12 es un vector de parámetros desconocidas y f¡ un vector devariables aleatorias no observables. Por definición este es un modelode Diseño Experimental. Dado que el rango de X no es completotampoco lo será el de X'X, por lo que esta última no tendrá inversa.En general, un modelo de Diseño Experimental se escribirá de lasiguiente forma:

yij...m = Jlij...m + c ij...m

Page 55: Analisis de Regresión y Superficie de Respuesta Chacin

Chacín I Análisis de Regresión y Superficies de Respuesta 4948 Chacín I Análisis de Regresión y Superficies de Respuesta

Así por ejemplo se tendrá:

a.- Para un diseño completamente aleatorio:También se tiene que:

b.- Para un diseño de bloques al azar:

I.l.ij = I.l. + Ti + ~j

Los estimadores máximos verosímiles, tienen las siguientespropiedades:

1.- Estimadores asintóticamente eficientes y óptimos, ·asintomáti-camente normales.

2.- Estimadores consistentes simples y consistentes con error cua-drático.

3.- Tienen la propiedad de ser estadísticos suficientes, mínimos,además de poseer la propiedad de invarianza.

Los estimadores mínimos cuadrados, presentan las siguientespropiedades:

1.-Estimadores insesgados.

2.- Con varianzas mínimas.

c.- Para un diseño en bloques al azar con submuestreo:

d.- Para un diseño cuadrado latino:

Se plantean entonces dos hipótesis:

A.- eij son variables aleatorias, normales, no correlacionadas, conmedia cero y varianza 0-2.

B.- eij son variables aleatorias, correlacionadas ( no necesariamentenormales) con media Oy varianza 0-2.

Estimación puntual: Tanto si se utiliza máxima verosimilituden el caso A, como si se emplea mínimos cuadrados ordinarios en elcaso B, se obtiene el mismo sistema de ecuaciones al igualar a cero lasderivadas respecto a ~j.

Deducciones:

Al deducir las ecuaciones normales para él, nos encontramoscon que X'X carece de inversa (ya que es de rango incompleto).Cuando X'X tiene inversa, las ecuaciones normales poseen soluciónúnica, que son las estimaciones de los elementos de ~. Cuando X'Xno tiene inversa, se presentan dos situaciones:

1.- No existe ningún vector ~ que satisfaga la ecuación:X~ + e(Y X~)'Y'Y - Y'X~- (X~ )'Y + (X~)'(X~)

s'e Y'Y 2 (X~ )'Yderivando con respecto a ~

Y X'X~ X'Ye'e = (Y - X~)

2.- Existe un número infinito de vectores que satisfacen la ecuación.

Puede demostrarse que se verifica el último caso. Esto seprueba, utilizando un teorema de álgebra de matrices en el cual, siuna matriz cuadrada X'X no tiene inversa y su rango es igual al de lamatriz aumentada X'XIX'Y, existe entonces un número infinito devectores que satisfacen la ecuación X'X~ = X'Y. La matriz X'XIX'Yes la propia matriz X'X con X'Y comocolumna adicional.

El hecho de que existan infinito números de vectores, quesatisfagan la ecuación, no es una situación muy satisfactoria, ya queaún utilizando el mismo modelo e idénticas observaciones, llega-

=

&' e = - 2X'Y + 2X'X~ Oo~X'X 6 X'Y Ecuaciones Normales

Page 56: Analisis de Regresión y Superficie de Respuesta Chacin

Chacín I Análisis de Regresión y Superficies de Respuesta 4948 Chacín I Análisis de Regresión y Superficies de Respuesta

Así por ejemplo se tendrá:

a.- Para un diseño completamente aleatorio:También se tiene que:

b.- Para un diseño de bloques al azar:

I.l.ij = I.l. + Ti + ~j

Los estimadores máximos verosímiles, tienen las siguientespropiedades:

1.- Estimadores asintóticamente eficientes y óptimos, ·asintomáti-camente normales.

2.- Estimadores consistentes simples y consistentes con error cua-drático.

3.- Tienen la propiedad de ser estadísticos suficientes, mínimos,además de poseer la propiedad de invarianza.

Los estimadores mínimos cuadrados, presentan las siguientespropiedades:

1.-Estimadores insesgados.

2.- Con varianzas mínimas.

c.- Para un diseño en bloques al azar con submuestreo:

d.- Para un diseño cuadrado latino:

Se plantean entonces dos hipótesis:

A.- eij son variables aleatorias, normales, no correlacionadas, conmedia cero y varianza 0-2.

B.- eij son variables aleatorias, correlacionadas ( no necesariamentenormales) con media Oy varianza 0-2.

Estimación puntual: Tanto si se utiliza máxima verosimilituden el caso A, como si se emplea mínimos cuadrados ordinarios en elcaso B, se obtiene el mismo sistema de ecuaciones al igualar a cero lasderivadas respecto a ~j.

Deducciones:

Al deducir las ecuaciones normales para él, nos encontramoscon que X'X carece de inversa (ya que es de rango incompleto).Cuando X'X tiene inversa, las ecuaciones normales poseen soluciónúnica, que son las estimaciones de los elementos de ~. Cuando X'Xno tiene inversa, se presentan dos situaciones:

1.- No existe ningún vector ~ que satisfaga la ecuación:X~ + e(Y X~)'Y'Y - Y'X~- (X~ )'Y + (X~)'(X~)

s'e Y'Y 2 (X~ )'Yderivando con respecto a ~

Y X'X~ X'Ye'e = (Y - X~)

2.- Existe un número infinito de vectores que satisfacen la ecuación.

Puede demostrarse que se verifica el último caso. Esto seprueba, utilizando un teorema de álgebra de matrices en el cual, siuna matriz cuadrada X'X no tiene inversa y su rango es igual al de lamatriz aumentada X'XIX'Y, existe entonces un número infinito devectores que satisfacen la ecuación X'X~ = X'Y. La matriz X'XIX'Yes la propia matriz X'X con X'Y comocolumna adicional.

El hecho de que existan infinito números de vectores, quesatisfagan la ecuación, no es una situación muy satisfactoria, ya queaún utilizando el mismo modelo e idénticas observaciones, llega-

=

&' e = - 2X'Y + 2X'X~ Oo~X'X 6 X'Y Ecuaciones Normales

Page 57: Analisis de Regresión y Superficie de Respuesta Chacin

50 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 51

ríamos a las mismas ecuaciones normales, pero con estimaciones ~j

diferentes.

Es interesante ver si los estimadores ~j son insesgados, y por lotanto observar si las soluciones de las ecuaciones normales sonestimadores insesgados.

Cualquier solución de X'X~ = X'Y debe ser una función linealde las Y por lo que se escribiría:

Particionando la matriz X en la forma:

~ = AY

E(a'Y) = A'~

Donde X, es un vector 1 x p que forma la i-ésima fila de X.Interesa saber si Xi~ es estimable para toda i. Por la definición B elconjunto de Xl~, X2~, ..., Xn~ constituye un conjunto de funcionesestimables, si existen n vectores Al, A2,..., An tales que:

donde A es una matriz de orden p x n constante, la cual puededepender de los elementos de X.

Por ser insesgadas, se debería cumplir la condición:

~ = E (~) = E (A Y) = EA (X~ + E) = E (AX~) + E (AE)

~ = AX~ + AE (E) = AX~ Ya que E (E) = O

Luego AX se cumple para todos los valores de ~j por lo queAX = 1. Pero I es la matriz identidad p x p cuyo rango es p, y el rangodel producto de dos matrices no puede ser mayor que la decualquiera de ambos. De acuerdo ala definición A, el rango de X es k< p por lo tanto, el rango de X es menor que el rango de A tal que E(AY) *- ~ y por lo tanto, no hay un estimador insesgado de ~.

En la mayoría de los casos, en el diseño del ModeloExperimental se está interesado en estimar ciertas combinacioneslineales de los parámetros, por lo tanto:

Definición B: sea A un vector de p x 1 de constantes conocidas,se dirá que la combinación lineal de ~ dada por

En otras palabras, si existe una matriz A, de dimensión n x p,tal que E(AY) = X~, ya que si A, es la i-ésima fila de A y Xi~ esestimable, se tendrá:

E (AY)= E

E(A1Y)

E(A2Y)E(AY)=

n

X'~= IXi ~ii=1

Xl~ Xl

E(AY) = EX2~ X2

~=

Xn~ Xn

será una función estimable, si existe una combinación lineal de las Ycuyo valor esperado sea A~, en otras palabras A' ~ es estimable siexiste un vector a de dimensión n x 1 tal que:

Si A = 1entonces:

E (I Y) es = E (Y)= E(X~ + E)= E (X~)+ E (E)= X~

Page 58: Analisis de Regresión y Superficie de Respuesta Chacin

50 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 51

ríamos a las mismas ecuaciones normales, pero con estimaciones ~j

diferentes.

Es interesante ver si los estimadores ~j son insesgados, y por lotanto observar si las soluciones de las ecuaciones normales sonestimadores insesgados.

Cualquier solución de X'X~ = X'Y debe ser una función linealde las Y por lo que se escribiría:

Particionando la matriz X en la forma:

~ = AY

E(a'Y) = A'~

Donde X, es un vector 1 x p que forma la i-ésima fila de X.Interesa saber si Xi~ es estimable para toda i. Por la definición B elconjunto de Xl~, X2~, ..., Xn~ constituye un conjunto de funcionesestimables, si existen n vectores Al, A2,..., An tales que:

donde A es una matriz de orden p x n constante, la cual puededepender de los elementos de X.

Por ser insesgadas, se debería cumplir la condición:

~ = E (~) = E (A Y) = EA (X~ + E) = E (AX~) + E (AE)

~ = AX~ + AE (E) = AX~ Ya que E (E) = O

Luego AX se cumple para todos los valores de ~j por lo queAX = 1. Pero I es la matriz identidad p x p cuyo rango es p, y el rangodel producto de dos matrices no puede ser mayor que la decualquiera de ambos. De acuerdo ala definición A, el rango de X es k< p por lo tanto, el rango de X es menor que el rango de A tal que E(AY) *- ~ y por lo tanto, no hay un estimador insesgado de ~.

En la mayoría de los casos, en el diseño del ModeloExperimental se está interesado en estimar ciertas combinacioneslineales de los parámetros, por lo tanto:

Definición B: sea A un vector de p x 1 de constantes conocidas,se dirá que la combinación lineal de ~ dada por

En otras palabras, si existe una matriz A, de dimensión n x p,tal que E(AY) = X~, ya que si A, es la i-ésima fila de A y Xi~ esestimable, se tendrá:

E (AY)= E

E(A1Y)

E(A2Y)E(AY)=

n

X'~= IXi ~ii=1

Xl~ Xl

E(AY) = EX2~ X2

~=

Xn~ Xn

será una función estimable, si existe una combinación lineal de las Ycuyo valor esperado sea A~, en otras palabras A' ~ es estimable siexiste un vector a de dimensión n x 1 tal que:

Si A = 1entonces:

E (I Y) es = E (Y)= E(X~ + E)= E (X~)+ E (E)= X~

Page 59: Analisis de Regresión y Superficie de Respuesta Chacin

52 Chacin I Análisis de Regresión y Superficies de Respuesta Chacin I Análisis de Regresión y Superficies de Respuesta 53

Teorema Suponiendo que se tienen k funciones estimables linealmenteindependientes;dadas por:

A.- Xp representa un conjunto de n funciones estimables, es decircada elemento de E(Y) es estimable. El teorema expresa queE (Yij... m) es estimable. Si E( Yij) es estimable para toda i y i.J..I. + ti, J..I. + tz, J..I. + ts son estimables.

B.- (X'XP) representa un conjunto de p funciones estimables.

Este conjunto puede escribirse así:

X'

Demostración

X'=

x'1X·

2

Donde e' es una matriz k x p de rango k < r. Por las definicionesB y C existe una matriz A de dimensión kxn, tal que E(AY) = e' p.Sin embargo E(AY) = AXP, por lo tanto AX = e', pero AX tiene rangomenor o igual que el rango r de X, lo que contradice el supuesto deque k < r. Queda así demostrado el siguiente teorema:

En el modelo lineal general Y = Xp + e, existen exactamenter funciones estimables, linealmente independientes, si r es lacaracterística de X.

Si se particiona la matriz X' de dimensión p x n, en p filas; ysea Xiel vector que figura como i-ésima fila, entonces:

X·n

E( X*Y) = X* E( Y) = X* (X P) = X*Xp

Ejemplo:

Suponiendo que partimos de un diseño completamentealeatorizado con dos tratamientos y dos repeticiones.

Los modelos serían:

Yu J..I. + TI + su

Y12 = J..I. + TI + e12

Y21 J..I. + T2 + e21

y22 = J..I. + T2 + e22

desarrollando la ecuación:

En consecuencia:

• • X·Luego X¡ Xp es estimable, puesto que E( X¡ y ) = ¡Xp, pero

el i-ésimo elemento de X'Xp, es X;Xp por lo tanto X'Xp forma partede p funciones estimables.

Definición C: Sean el, e2, ..., et vectores p x 1 tales que elp,ezp, ..., etp, son estimables y que la característicade la matriz de orden p x t (t ::; p) es t

Se dice entonces que e1~, e2p, ..., etp, son funciones estimableslinealmente independientes. Esto es, puesto que X'Xp es un conjuntode p funciones estimables y dado que XIX posee rango t < p, en elmodelo lineal general hay al menos t funciones estimables lineal-mente independientes.

y. = X12 + ~

Page 60: Analisis de Regresión y Superficie de Respuesta Chacin

52 Chacin I Análisis de Regresión y Superficies de Respuesta Chacin I Análisis de Regresión y Superficies de Respuesta 53

Teorema Suponiendo que se tienen k funciones estimables linealmenteindependientes;dadas por:

A.- Xp representa un conjunto de n funciones estimables, es decircada elemento de E(Y) es estimable. El teorema expresa queE (Yij... m) es estimable. Si E( Yij) es estimable para toda i y i.J..I. + ti, J..I. + tz, J..I. + ts son estimables.

B.- (X'XP) representa un conjunto de p funciones estimables.

Este conjunto puede escribirse así:

X'

Demostración

X'=

x'1X·

2

Donde e' es una matriz k x p de rango k < r. Por las definicionesB y C existe una matriz A de dimensión kxn, tal que E(AY) = e' p.Sin embargo E(AY) = AXP, por lo tanto AX = e', pero AX tiene rangomenor o igual que el rango r de X, lo que contradice el supuesto deque k < r. Queda así demostrado el siguiente teorema:

En el modelo lineal general Y = Xp + e, existen exactamenter funciones estimables, linealmente independientes, si r es lacaracterística de X.

Si se particiona la matriz X' de dimensión p x n, en p filas; ysea Xiel vector que figura como i-ésima fila, entonces:

X·n

E( X*Y) = X* E( Y) = X* (X P) = X*Xp

Ejemplo:

Suponiendo que partimos de un diseño completamentealeatorizado con dos tratamientos y dos repeticiones.

Los modelos serían:

Yu J..I. + TI + su

Y12 = J..I. + TI + e12

Y21 J..I. + T2 + e21

y22 = J..I. + T2 + e22

desarrollando la ecuación:

En consecuencia:

• • X·Luego X¡ Xp es estimable, puesto que E( X¡ y ) = ¡Xp, pero

el i-ésimo elemento de X'Xp, es X;Xp por lo tanto X'Xp forma partede p funciones estimables.

Definición C: Sean el, e2, ..., et vectores p x 1 tales que elp,ezp, ..., etp, son estimables y que la característicade la matriz de orden p x t (t ::; p) es t

Se dice entonces que e1~, e2p, ..., etp, son funciones estimableslinealmente independientes. Esto es, puesto que X'Xp es un conjuntode p funciones estimables y dado que XIX posee rango t < p, en elmodelo lineal general hay al menos t funciones estimables lineal-mente independientes.

y. = X12 + ~

Page 61: Analisis de Regresión y Superficie de Respuesta Chacin

54 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 55

entonces:

Yll 1 1 O

[~ 1En

YI2 1 1 O EI2= +Y21 1 O 1 E2IY22 1 O 1 E22

de acuerdo a la ecuación normal

X'X~ = X'Ytenemos que:

[i ~]11 O

r~ ~]1 1 21 1 O

X'X = 1 O = 2101

O 1 O101

- [4~+2tl+2t2Jl f¿¿Yij 121l+2tl = ¿Y1i j2ft+2t2 ¿Y2i

Aplicando la restricción I Ti = O ---+ ti + t2 = OEntonces:

~ =Y..

lo cual implica tI = Yii - Y.. Y t2 = Y2i - Y..

Sustituyendo:

Yn =!l + TI +Eu = Y + ·(Ylj-Y'.) + En

Y12 = !l + TI + É12 = Y + (Ylj - y ..) + E12

Y21 = !l + T2 + E21 = Y + (Y2j - Y..) + E21

Y22 = !l + T2 + E22 = Y + (Y2j - Y ..) + E22

II(Yij)= IIY.. + II(Y.j + Y..)+ IIcij

II(Yij) == II[Y .. + (y.j - Y..)+ Cij]

El determinante de esta matriz es cero, por lo tanto, carece deinversa.

r~2 ~]r '12 l~~X'YO t2J

donde:

ri1 1 ~]Y;l [IIY;;lYI2X'Y = 1 O = ¿YljO 1

Y21¿Y2jY22

desarrollando tenemos:

Restando a cada término y ..y elevando al cuadrado; tenemos:

Page 62: Analisis de Regresión y Superficie de Respuesta Chacin

54 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficies de Respuesta 55

entonces:

Yll 1 1 O

[~ 1En

YI2 1 1 O EI2= +Y21 1 O 1 E2IY22 1 O 1 E22

de acuerdo a la ecuación normal

X'X~ = X'Ytenemos que:

[i ~]11 O

r~ ~]1 1 21 1 O

X'X = 1 O = 2101

O 1 O101

- [4~+2tl+2t2Jl f¿¿Yij 121l+2tl = ¿Y1i j2ft+2t2 ¿Y2i

Aplicando la restricción I Ti = O ---+ ti + t2 = OEntonces:

~ =Y..

lo cual implica tI = Yii - Y.. Y t2 = Y2i - Y..

Sustituyendo:

Yn =!l + TI +Eu = Y + ·(Ylj-Y'.) + En

Y12 = !l + TI + É12 = Y + (Ylj - y ..) + E12

Y21 = !l + T2 + E21 = Y + (Y2j - Y..) + E21

Y22 = !l + T2 + E22 = Y + (Y2j - Y ..) + E22

II(Yij)= IIY.. + II(Y.j + Y..)+ IIcij

II(Yij) == II[Y .. + (y.j - Y..)+ Cij]

El determinante de esta matriz es cero, por lo tanto, carece deinversa.

r~2 ~]r '12 l~~X'YO t2J

donde:

ri1 1 ~]Y;l [IIY;;lYI2X'Y = 1 O = ¿YljO 1

Y21¿Y2jY22

desarrollando tenemos:

Restando a cada término y ..y elevando al cuadrado; tenemos:

Page 63: Analisis de Regresión y Superficie de Respuesta Chacin

56 Chacín I Análisis de Regresión y Superficies de RespuestaChacín I Análisis de Regresión y Superficie de Respuestas 57

Restando a cada término Y.. y elevando al cuadrado; tenemos:Este pue~e ser escrito en notación matricial como AX

donde:B,

[a"al2

A = a~1 a22

ami am2

... aln 1

... :~"mn mxn

Suma decuadrados

total

= Suma de +cuadrados detratamiento

Suma decuadrados

del error exp.

de manera que AXes conformable en el producto.

Podemos además considerar los siguientes casos respecto a m yn, esto es:

I.- Si m = n, A es una matriz n x n (ó m x m), una matriz cuadrada,que tendrá SOLUCION UNICA si y solo si su determinante esdistinto de cero, esto es:

det. (A) "# O. la función es X = AI.B

n. Si m> n y rango de A es "n" y además I A'A I "# O el sistematiene solución única dada por:

X = (A'A)'!. A'B, este resultado es fácil de ver ya que AX = B,multiplicamos ambos lados de la ecuación por A', ésto es A'AX= A'B, como I A'A I "# O, A'A posee inversa" ordinaria" , porlo tanto:

La restricción LTi- = O puede obviarse hallando la inversa de lamatriz X'X mediante la inversa generalizada o por algún otroprocedimiento para resolver matrices de rango incompleto.

INVERSA GENERALIZADA(A'A)-l_(A'A) X = (A'A)-l. A'B ~ IX = (A'A)-l. A'B

Considérese el siguiente sistema de ecuaciones lineales:

anXl + alzM + a13Xa + + alnXn = biaZlXl + aZ2M + a23X3 + + aznXn = ba

amlXl + am2X2 + am3Xa + + amnXn =bm

En el sistema de ecuaciones dado, si existe alguna relación entreecuaciones, también debe existir entre los términos independientesdel sistema para que tenga solución, ésto define un sistema"CONSISTENTE". Enunciemos el siguiente teorema:

Teorema: Un conjunto de ecuaciones lineales puede serresuelto si solo si, es "consistente".

Ocurre que en muchos problemas o situaciones se nos presentaun sistema de ecuaciones de la forma (matricial) AX = B, donde A esde orden m x n, no cuadrada, y es necesario encontrar su "inversa";ésta ya no es la inversa "ordinaria", sino la inversa "generalizada".

Un procedimiento alternativo que se puede utilizar pararesolver sistemas de ecuaciones cuyas matrices sean de rangoincompleto es el de la inversa generalizada, que se describe acontinuación.

Page 64: Analisis de Regresión y Superficie de Respuesta Chacin

56 Chacín I Análisis de Regresión y Superficies de RespuestaChacín I Análisis de Regresión y Superficie de Respuestas 57

Restando a cada término Y.. y elevando al cuadrado; tenemos:Este pue~e ser escrito en notación matricial como AX

donde:B,

[a"al2

A = a~1 a22

ami am2

... aln 1

... :~"mn mxn

Suma decuadrados

total

= Suma de +cuadrados detratamiento

Suma decuadrados

del error exp.

de manera que AXes conformable en el producto.

Podemos además considerar los siguientes casos respecto a m yn, esto es:

I.- Si m = n, A es una matriz n x n (ó m x m), una matriz cuadrada,que tendrá SOLUCION UNICA si y solo si su determinante esdistinto de cero, esto es:

det. (A) "# O. la función es X = AI.B

n. Si m> n y rango de A es "n" y además I A'A I "# O el sistematiene solución única dada por:

X = (A'A)'!. A'B, este resultado es fácil de ver ya que AX = B,multiplicamos ambos lados de la ecuación por A', ésto es A'AX= A'B, como I A'A I "# O, A'A posee inversa" ordinaria" , porlo tanto:

La restricción LTi- = O puede obviarse hallando la inversa de lamatriz X'X mediante la inversa generalizada o por algún otroprocedimiento para resolver matrices de rango incompleto.

INVERSA GENERALIZADA(A'A)-l_(A'A) X = (A'A)-l. A'B ~ IX = (A'A)-l. A'B

Considérese el siguiente sistema de ecuaciones lineales:

anXl + alzM + a13Xa + + alnXn = biaZlXl + aZ2M + a23X3 + + aznXn = ba

amlXl + am2X2 + am3Xa + + amnXn =bm

En el sistema de ecuaciones dado, si existe alguna relación entreecuaciones, también debe existir entre los términos independientesdel sistema para que tenga solución, ésto define un sistema"CONSISTENTE". Enunciemos el siguiente teorema:

Teorema: Un conjunto de ecuaciones lineales puede serresuelto si solo si, es "consistente".

Ocurre que en muchos problemas o situaciones se nos presentaun sistema de ecuaciones de la forma (matricial) AX = B, donde A esde orden m x n, no cuadrada, y es necesario encontrar su "inversa";ésta ya no es la inversa "ordinaria", sino la inversa "generalizada".

Un procedimiento alternativo que se puede utilizar pararesolver sistemas de ecuaciones cuyas matrices sean de rangoincompleto es el de la inversa generalizada, que se describe acontinuación.

Page 65: Analisis de Regresión y Superficie de Respuesta Chacin

58 Chacin I Análisis de Regresión y Superficie de Respuestas Chacin I Análisis de Regresión y Superficie de Respuestas 59

Enunciemos el teorema siguiente:

TEOREMA: AG es una inversa generalizada de A si y solo siAAGA=A.

Probaremos este teorema y para ello particionemos la matriz Acomo sigue:

De aquí se puede definir lo siguiente:

DEFINICIÓN: una inversa generalizada de A que tambiénsatisface AGAAG= AGse denomina inversa generalizada "Reflexiva".

¿Cuando AG es UNICA? Se dice que AG es única si satisfaceademás las condiciones siguientes:

1.- AAGA = A

2.- AGAAG = AG (Reflexiva)

3.- (AAG)' = AAG

4.- (AGA), = AGA

all al2 a1n

a21 a22 ~nde manera que A =

ami am2 amn

TEOREMA: Toda matriz A tiene inversa generalizada (AG)UNICA.es una columna de A con i = 1, 2, ... , n

Hágase AX = a, con i = 1,2,3, ..., n, de tal manera que siexiste alguna relación lineal entre las filas de la matriz A tambiéndebe existir entre las filas del vector ai.

Probemos en este sentido:'

1.- Supóngase que AGes una inversa generalizada de A entonces porser AX = a. consistente para todo i, se tiene que AGAX = AGai,Vi ~ X = AGaitiene solución.

Multiplicando ambos miembros por A, tenemos que AX = AAGai~ A=AAGA.

2.- Supóngase que AAGA = A Y AX = Y es consistente.

AAGA = A ~ AAG(AX)= AX, como AX = Y, AAGY = AX; elloindica que Al existe ya que AX = Y es consistente.

Así Al AAGY = Al AX ~ IAGY = IX ~ AGY = X, donde AGYes una solución del problema, así AGes una inversa "generalizada".

Hagamos la siguiente observación: Si AG es una matriz quesatisface solo AAGA= A (no es única).

1.- Si A es cuadrada y además I A I "# O, entonces posee inversa"ordinaria" Al = AG (UNICA).

2.- Si A = Onxm,entonces AG = Omxn.Se puede probar aquí lapropiedad AAGA= A

3.- Si Amx ny el rango de A es r, se hace una factorización de rangocompleto:

A = Al. A2, donde Al(m x r) rango completo por columnas yA2(r x n) rango completo por filas.

Como I A~. Al I "# O, existe (A~ Al ).1, además

I A~. A2 I "# O Y existe (A~ As):'

Algoritmo para el cálculo de la inversa generalizada

Para calcular la inversa generalizada de una matriz A (noúnica), veamos el siguiente algoritmo sencillo:

Sea A una matriz de orden m x n y r (A) = r particionemos a lamatriz A como sigue:

[A 11 A 12 ] / / dA= A A 'supongase I Au I "# O Y es de orden r, esto es e

21 22

rango completo (r), en caso contrario se hacen operaciones fundamen-

Page 66: Analisis de Regresión y Superficie de Respuesta Chacin

58 Chacin I Análisis de Regresión y Superficie de Respuestas Chacin I Análisis de Regresión y Superficie de Respuestas 59

Enunciemos el teorema siguiente:

TEOREMA: AG es una inversa generalizada de A si y solo siAAGA=A.

Probaremos este teorema y para ello particionemos la matriz Acomo sigue:

De aquí se puede definir lo siguiente:

DEFINICIÓN: una inversa generalizada de A que tambiénsatisface AGAAG= AGse denomina inversa generalizada "Reflexiva".

¿Cuando AG es UNICA? Se dice que AG es única si satisfaceademás las condiciones siguientes:

1.- AAGA = A

2.- AGAAG = AG (Reflexiva)

3.- (AAG)' = AAG

4.- (AGA), = AGA

all al2 a1n

a21 a22 ~nde manera que A =

ami am2 amn

TEOREMA: Toda matriz A tiene inversa generalizada (AG)UNICA.es una columna de A con i = 1, 2, ... , n

Hágase AX = a, con i = 1,2,3, ..., n, de tal manera que siexiste alguna relación lineal entre las filas de la matriz A tambiéndebe existir entre las filas del vector ai.

Probemos en este sentido:'

1.- Supóngase que AGes una inversa generalizada de A entonces porser AX = a. consistente para todo i, se tiene que AGAX = AGai,Vi ~ X = AGaitiene solución.

Multiplicando ambos miembros por A, tenemos que AX = AAGai~ A=AAGA.

2.- Supóngase que AAGA = A Y AX = Y es consistente.

AAGA = A ~ AAG(AX)= AX, como AX = Y, AAGY = AX; elloindica que Al existe ya que AX = Y es consistente.

Así Al AAGY = Al AX ~ IAGY = IX ~ AGY = X, donde AGYes una solución del problema, así AGes una inversa "generalizada".

Hagamos la siguiente observación: Si AG es una matriz quesatisface solo AAGA= A (no es única).

1.- Si A es cuadrada y además I A I "# O, entonces posee inversa"ordinaria" Al = AG (UNICA).

2.- Si A = Onxm,entonces AG = Omxn.Se puede probar aquí lapropiedad AAGA= A

3.- Si Amx ny el rango de A es r, se hace una factorización de rangocompleto:

A = Al. A2, donde Al(m x r) rango completo por columnas yA2(r x n) rango completo por filas.

Como I A~. Al I "# O, existe (A~ Al ).1, además

I A~. A2 I "# O Y existe (A~ As):'

Algoritmo para el cálculo de la inversa generalizada

Para calcular la inversa generalizada de una matriz A (noúnica), veamos el siguiente algoritmo sencillo:

Sea A una matriz de orden m x n y r (A) = r particionemos a lamatriz A como sigue:

[A 11 A 12 ] / / dA= A A 'supongase I Au I "# O Y es de orden r, esto es e

21 22

rango completo (r), en caso contrario se hacen operaciones fundamen-

Page 67: Analisis de Regresión y Superficie de Respuesta Chacin

60 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficie de Respuestas 61

tales por fila, para obtener una matriz Bn tal que I BnEntonces definase AGcomo:

* o. II.- Si r(A) = m (rango completo por filas) entonces:-

AG = A'(AA')·l y AAG = AA' (AA')·l = 1

Con estos teoremas expuestos y demostrados, se tiene laherramienta para resolver sistemas de ecuaciones donde la matriz decoeficientes no es cuadrada.

Otra consideración es como calcular la inversa generalizada deun producto de dos matrices, digamos B.C, donde Bmxry r(B) = r,Crxny r(C) = r. Bajo estas condiciones (BC)G = CG.BG.

La utilización de este tipo de inversa es muy común enproblemas de regresión y modelos lineales donde con frecuencia sehace necesario su uso para estimaciones de parámetros.

[A-lO]AG = 11O O

Inversa generalizadas Moore-Penrose y condicional

AAGA=[Al1 AI2]A21 . A21A~11AI2

Dado que existe una matriz de escalares digamos K, tal que K[AnA12] = [AztAz2] -~ KAn = Azl y KAl2 = Az2, pero como A~i

existe, implica que K = AzI. A~i por lo tanto Az2 = A21 A~i. A12.

Ahora bien, si no es posible particionar a A de manera queI An I * 0, entonces de tomar las matrices P y Q no singulares tal que:

PAQ = [Bu B12 J, con Bn de orden r x r, y I Bll I * 0, asíB21 B22

La dependencia lineal entre los vectores columnas de la matrizX'X, ha traído como resultado que ella sea no ortogonal, impidiendola solución a las ecuaciones lineales de la forma y = X~ + ,ª, para laestimación, ~ = (X'X)·l X'Y, en los modelos de regresión múltiple.

Esto se debe, particularmente, a que la matriz de X'X no poseeinversa regular, por ser singular y/o rectangular; sin embargo, se handesarrollado procedimientos algebraicos capaces de resolver elproblema a través del cálculo de inversa generalizada, las cualesjuegan un papel importante en muchas aplicaciones estadísticas.

Inversa Moore-Penrose ( Am )

unica En 1995 Penrose desarrolló la experiencia de una matriz inversaúnica Ampara cualquier matriz A dada.

Definición. Sea A una matriz de orden p x q y Amuna matrizinversa única de A de orden q x p; tal que satisface las siguientescondiciones:

Consideremos a la matriz Amxn y enunciemos el siguienteteorema:

TEOREMA: Sea Arox n, entonces:

1.- Si r (A) = n (rango completo por columnas) entonces:

AG= (A'A)·lA' AGA = 1, por otro lado;

1.- AAmA = A

(3.1)

IIL- AAm es simétrica

Page 68: Analisis de Regresión y Superficie de Respuesta Chacin

60 Chacín I Análisis de Regresión y Superficies de Respuesta Chacín I Análisis de Regresión y Superficie de Respuestas 61

tales por fila, para obtener una matriz Bn tal que I BnEntonces definase AGcomo:

* o. II.- Si r(A) = m (rango completo por filas) entonces:-

AG = A'(AA')·l y AAG = AA' (AA')·l = 1

Con estos teoremas expuestos y demostrados, se tiene laherramienta para resolver sistemas de ecuaciones donde la matriz decoeficientes no es cuadrada.

Otra consideración es como calcular la inversa generalizada deun producto de dos matrices, digamos B.C, donde Bmxry r(B) = r,Crxny r(C) = r. Bajo estas condiciones (BC)G = CG.BG.

La utilización de este tipo de inversa es muy común enproblemas de regresión y modelos lineales donde con frecuencia sehace necesario su uso para estimaciones de parámetros.

[A-lO]AG = 11O O

Inversa generalizadas Moore-Penrose y condicional

AAGA=[Al1 AI2]A21 . A21A~11AI2

Dado que existe una matriz de escalares digamos K, tal que K[AnA12] = [AztAz2] -~ KAn = Azl y KAl2 = Az2, pero como A~i

existe, implica que K = AzI. A~i por lo tanto Az2 = A21 A~i. A12.

Ahora bien, si no es posible particionar a A de manera queI An I * 0, entonces de tomar las matrices P y Q no singulares tal que:

PAQ = [Bu B12 J, con Bn de orden r x r, y I Bll I * 0, asíB21 B22

La dependencia lineal entre los vectores columnas de la matrizX'X, ha traído como resultado que ella sea no ortogonal, impidiendola solución a las ecuaciones lineales de la forma y = X~ + ,ª, para laestimación, ~ = (X'X)·l X'Y, en los modelos de regresión múltiple.

Esto se debe, particularmente, a que la matriz de X'X no poseeinversa regular, por ser singular y/o rectangular; sin embargo, se handesarrollado procedimientos algebraicos capaces de resolver elproblema a través del cálculo de inversa generalizada, las cualesjuegan un papel importante en muchas aplicaciones estadísticas.

Inversa Moore-Penrose ( Am )

unica En 1995 Penrose desarrolló la experiencia de una matriz inversaúnica Ampara cualquier matriz A dada.

Definición. Sea A una matriz de orden p x q y Amuna matrizinversa única de A de orden q x p; tal que satisface las siguientescondiciones:

Consideremos a la matriz Amxn y enunciemos el siguienteteorema:

TEOREMA: Sea Arox n, entonces:

1.- Si r (A) = n (rango completo por columnas) entonces:

AG= (A'A)·lA' AGA = 1, por otro lado;

1.- AAmA = A

(3.1)

IIL- AAm es simétrica

Page 69: Analisis de Regresión y Superficie de Respuesta Chacin

62 Chacín I Análisis de Regresión y Superficie de Respuestas Chacín I Análisis de Regresión y Superficie de Respuestas 63IV.- AmAes simétrica

Una manera de obtener Amestá basada en la factorización de A,de orden p x q, como:

(3.5)

A = KL (3.2)

Donde K y L tienen rangos completos por columnas y filasrespectivamente, igual al x«

Entonces Am se defme como:

Entonces de (3.4) y (3.5) se obtiene que:

Am = L' (K'AV)·l K' (3.3)Aai = TAnA12 = AuHcomo I An ] *

&2 = TA12A22 = A12H,respectivamente

O existe A~ll por lo tanto;Para obtener K y L utilizamos el siguiente procedimiento:

Dada la matriz

rall al2 a1q l

a21 a12 a2q IA= I I

lap1 ap2 apq J

(3.6)

ahora:

A

Para hallar la matriz inversa s», es necesario obtener K y L através de la factorización de rango completo. Para ello, supóngase queAp x q tiene rango r y luego particionemos a la matriz A en :

A (3.7)

A12] ., donde Au es de orden r y I Al1 I * O

A22 •

Donde "K" es de orden p x r y de rango r y "L" de orden r x qde rango r.

Propiedades de Am:

1.- La inversa de la traspuesta de A, es la traspuesta de la inversaAmdeA:

Como las filas [A21 A22] son dependientes de las filas [An A12],existe una matriz T única de escalares tal que:

= T (3.4)

[A12l

De manera similar como las columnas A22

J son dependientes

rAlllde las columnas l J ; una matriz H, de escalares única, tal que:A12

2.- La inversa de Ames igual a A:

3.- El rango de la inversa de A es igual al rango de A:

r (Am) = r (A)

Page 70: Analisis de Regresión y Superficie de Respuesta Chacin

62 Chacín I Análisis de Regresión y Superficie de Respuestas Chacín I Análisis de Regresión y Superficie de Respuestas 63IV.- AmAes simétrica

Una manera de obtener Amestá basada en la factorización de A,de orden p x q, como:

(3.5)

A = KL (3.2)

Donde K y L tienen rangos completos por columnas y filasrespectivamente, igual al x«

Entonces Am se defme como:

Entonces de (3.4) y (3.5) se obtiene que:

Am = L' (K'AV)·l K' (3.3)Aai = TAnA12 = AuHcomo I An ] *

&2 = TA12A22 = A12H,respectivamente

O existe A~ll por lo tanto;Para obtener K y L utilizamos el siguiente procedimiento:

Dada la matriz

rall al2 a1q l

a21 a12 a2q IA= I I

lap1 ap2 apq J

(3.6)

ahora:

A

Para hallar la matriz inversa s», es necesario obtener K y L através de la factorización de rango completo. Para ello, supóngase queAp x q tiene rango r y luego particionemos a la matriz A en :

A (3.7)

A12] ., donde Au es de orden r y I Al1 I * O

A22 •

Donde "K" es de orden p x r y de rango r y "L" de orden r x qde rango r.

Propiedades de Am:

1.- La inversa de la traspuesta de A, es la traspuesta de la inversaAmdeA:

Como las filas [A21 A22] son dependientes de las filas [An A12],existe una matriz T única de escalares tal que:

= T (3.4)

[A12l

De manera similar como las columnas A22

J son dependientes

rAlllde las columnas l J ; una matriz H, de escalares única, tal que:A12

2.- La inversa de Ames igual a A:

3.- El rango de la inversa de A es igual al rango de A:

r (Am) = r (A)

Page 71: Analisis de Regresión y Superficie de Respuesta Chacin

64 Chacín / Análisis de Regresión y Superficie de Respuestas

4.- Si A es una matriz simétrica, la inversa Ames también simétrica,es decir:

Si A' = A ~ (Am)' = Am

Se ha demostrado que la inversa generalizada de una matrizposee varias de las propiedades de la inversa de una matriz nosingular. Estas propiedades pueden ser muy usadas en varias áreasde la estadística, especialmente en la solución de sistemas deecuaciones lineales. Así, la teoría de sistemas de ecuaciones linealesjuega un papel muy importante en estadística como en muchos otroscampos científicos. Se puede discutir otro tipo de inversa, la cual esllamada inversa condicional Ac (también llamada inversa genera-lizada normalizada). Una inversa condicional Ac de una matriz, esgeneralmente más fácil de calcular que la inversa Moore-Penrose(A»).

Inversa condicional ( A e )

Anteriormente se definió la matriz Am,a través de las cuatrocondiciones de Moore-Penrose. En las ecuaciones (3.1) se define Am,como la matriz inversa única de A, pero existen muchas matrices Acque sólo satisfacen:

AAcA=A (3.8)

La inversa de Moore-Penrose de una matriz A, es también unainversa condicional de A, pero una inversa condicional de A nonecesariamente es la inversa Moore-Penrose de A.

Una inversa condicional se caracteriza por ser no-única y sólosatisface la condición I en (3.1).

A continuación daremos dos derivaciones de la matriz inversacondicional a través de un algoritmo sencillo y otro en forma general.Supóngase que en Apxqla submatriz principal Ai i es no singular derango rAentonces, la inversa generalizada condicional se obtiene apartir de la partición de A como:

(3.9)

donde las matrices nulas en Ac tienen órdenes apropiados para hacerque Acsea de orden q x p.

Page 72: Analisis de Regresión y Superficie de Respuesta Chacin

64 Chacín I Análisis de Regresión y Superficie de Respuestas Chacín I Análisis de Regresión y Superficie de Respuestas 65

4.- SiAes una matriz simétrica, la inversa Ames también simétrica,es decir:

No es necesario que la submatriz no singular de orden estéubicada en la posición An , ésta puede estar en cualquier lugar en A.El siguiente algoritmo, entonces, puede ser desarrollado:i A' = A ~ (Am)' = Am

Se ha demostrado que la inversa generalizada de una matrizposee vmas de las propiedades de la inversa de una matriz nosingular, Estas propiedades pueden ser muy usadas en varias áreasde la estadística, especialmente en la solución de sistemas deecuacioIJeslineales. Así, la teoría de sistemas de ecuaciones linealesjuega UJ¡ papel muy importante en estadística como en muchos otroscampos ientíficos. Se puede discutir otro tipo de inversa, la cual esllamada inversa condicional Ac (también llamada inversa genera-lizada I¡ormalizada). Una inversa condicional Ac de una matriz, esgenerallllente más fácil de calcular que la inversa Moore-Penrose(A»).

En A encuentre cualquier submatriz de orden igual al rango de A.Denótelo mediante W.

Invierta y transponga (W-1),.

Inversa condicional ( A e )

A teriormente se definió la matriz Am, a través de las cuatrocondiciones de Moore-Penrose. En las ecuaciones (3.1) se define Am,como la matriz inversa única de A, pero existen muchas matrices Acque sólosatisfacen:

En A reemplace cada elemento de W mediante los elementoscorrespondientes de (W-1),.

Reemplace todos los otros elementos de A por ceros.

Transponga la matriz resultante.

El resultado es Ac,una inversa generalizada de A.

La matriz XIX

(3.8)

La matriz (X'X) tiene una función importante en losprocedimientos estadísticos donde se utilizan ecuaciones mínimascuadráticas X'Xb = X'y, las' siguientes, son las propiedades de. lainversa condicional de X'X,esto es; (X'X)c:

L&inversa de Moore-Penrose de una matriz A, es también unainversa condicional de A, pero una inversa condicional de A nonecesar'amente es la inversa Moore-Penrose de A.

Ulla inversa condicional se caracteriza por ser no-única y sólosatisface la condición 1 en (3.1).

A Continuación daremos dos derivaciones de la matriz inversacondiciOnala través de un algoritmo sencillo y otro en forma generaLSupóngase que en Apxqla submatriz principal An es no singular deran~o rA.entonces, la inversa generalizada condicional se obtiene apartir de la partición de A como:

[ «W-1),)c]' es también una inversa condicional de X'X.

X(X'X)c X'X = X;por lo tanto (X'X)c es una inversa generalizada deX.

X(X'X)cX' es simétrica, si (X' X)clo es.

Ejemplo

es A e = [All -1 00]qxp O (3.9)

Se tienen los resultados de un experimento donde elrendimiento en fruto es una función de la materia seca en hojas (Xi) yen raíces (X2). Se desea estimar un modelo de regresión múltiple.

donde 1 s matrices nulas en Ac tienen órdenes apropiados para hacerque Ac¡¡¡eade orden q x p.

Page 73: Analisis de Regresión y Superficie de Respuesta Chacin

66 Chacin I Análisis de Regresión y Superficie de Respuestas

Expresado matricialmente:

y = X~ + ~

20551928188721812602194019003322200026702550202119462042246222203121191419811830

y.J,

=

x.J,

1 5 101 6 121481 8 161 7 141 5 101481 8 161 5 101 7 141 6 121 4 121 5 101 5 101 6 121 5 101 7 141481 5 101 6 12

[::] +

Chacín I Análisis de Regresión y Superficies de Respuesta 67

Modelo estimadó:A

~ = (X'X)-l X'Y (3.10)

donde:

X'X = [1~~224

112658

1316

224J13162632

Verificamos que:

20 112 22~112 658 1316224 1316 263

IX' Xl =

IX'XI = 34.637.120 + 33.015.808 + 33.015.808

(33.015.808 + 33.015.808 + 34.637.120) = O

Como IX'Xl = O,supone dependencia lineal entre las columnasde la matriz 3 x 3, en consecuencia la inversa de X'X:

O ol-1232]

616

1(X'X)-l = --¡X'X¡ .C 2464

-1232

donde C es la matriz de cofactores. Evidentemente, (X' X)-l seráindeterminado, por lo tanto, la matriz así formada no tendrá inversaregular. En este caso se puede resolver el sistema de ecuacionesdesarrollando el uso de la matriz inversa generalizada de Moore-Penrose o condicional.

Page 74: Analisis de Regresión y Superficie de Respuesta Chacin

66 Chacin I Análisis de Regresión y Superficie de Respuestas

Expresado matricialmente:

y = X~ + ~

20551928188721812602194019003322200026702550202119462042246222203121191419811830

y.J,

=

x.J,

1 5 101 6 121481 8 161 7 141 5 101481 8 161 5 101 7 141 6 121 4 121 5 101 5 101 6 121 5 101 7 141481 5 101 6 12

[::] +

Chacín I Análisis de Regresión y Superficies de Respuesta 67

Modelo estimadó:A

~ = (X'X)-l X'Y (3.10)

donde:

X'X = [1~~224

112658

1316

224J13162632

Verificamos que:

20 112 22~112 658 1316224 1316 263

IX' Xl =

IX'XI = 34.637.120 + 33.015.808 + 33.015.808

(33.015.808 + 33.015.808 + 34.637.120) = O

Como IX'Xl = O,supone dependencia lineal entre las columnasde la matriz 3 x 3, en consecuencia la inversa de X'X:

O ol-1232]

616

1(X'X)-l = --¡X'X¡ .C 2464

-1232

donde C es la matriz de cofactores. Evidentemente, (X' X)-l seráindeterminado, por lo tanto, la matriz así formada no tendrá inversaregular. En este caso se puede resolver el sistema de ecuacionesdesarrollando el uso de la matriz inversa generalizada de Moore-Penrose o condicional.

Page 75: Analisis de Regresión y Superficie de Respuesta Chacin

68 Chacin I Análisis de Regresión y Superficie de RespuestasChacín I Análisis de Regresión y Superficie de Respuestas 69

(X'X) = A, por lo tanto:112944 379680J

- Y K'AL' = l76384 2240700

(X'X)m =L' (K'X'XLT1 K' entonces la matriz X'X = A, puede serparticionada:

[20 112J ~ A-1

112 658 11

A21= [224 1316] Y

a través de (3.6) obtenemos T y H

T1x2 =[224 1316lx2

[20 112J-1

112 658

ahora, la partición de X' X = A quedará

K =(

20

11~

[ J-l

20 112112 658

así de (3.3)

A- = (X'X)- = [~ 1,045-0,035

-0,177]0,006 [

20 112 O2]

112 658

r224]

A12 =1316

por lo tanto, obtenemos una inversa única de (X'X):

r 1,068 0,527

l-0,036 -0,018-0,073 -0,035

-0,354l

j0,0120,024

(X'X)m =

[ ]

-120 112

112 658 2x2

Se deja como ejercicio probar que AAmA= A.

La solución de 3.10 será:= [O 2] r 1,068

l-0,036-0,073

0~27 -0~54] [ 44572]-0,018 0,012· 257203-0,035 0,024 514406

1. P =

[224J

. 1316

~ = r8::::~198,55J

Así el Modelo de Regresión múltiple estimado es:A

Y = 849,94 + 49,27Xl + 98,55X2

[1 H] = [~O ~lL =1

entonces:

al 11

rl20 112 loK' = 2J L'=112 658 lo

No hay duda que los valores obtenidos de los ~, dependerán de lainversa generalizada que se utilice, por esta razón los coeficientesPO,Pl,P2, serán estimaciones sesgadas de ~o, ~1 y ~2 respectivamente.Es de notar que en este problema se truncaron el número dedecimales en su transcripción. Se recomienda al estudiante utilizartodos los decimales posibles para mayor exactitud al chequear lasrespuestas.

Page 76: Analisis de Regresión y Superficie de Respuesta Chacin

68 Chacin I Análisis de Regresión y Superficie de RespuestasChacín I Análisis de Regresión y Superficie de Respuestas 69

(X'X) = A, por lo tanto:112944 379680J

- Y K'AL' = l76384 2240700

(X'X)m =L' (K'X'XLT1 K' entonces la matriz X'X = A, puede serparticionada:

[20 112J ~ A-1

112 658 11

A21= [224 1316] Y

a través de (3.6) obtenemos T y H

T1x2 =[224 1316lx2

[20 112J-1

112 658

ahora, la partición de X' X = A quedará

K =(

20

11~

[ J-l

20 112112 658

así de (3.3)

A- = (X'X)- = [~ 1,045-0,035

-0,177]0,006 [

20 112 O2]

112 658

r224]

A12 =1316

por lo tanto, obtenemos una inversa única de (X'X):

r 1,068 0,527

l-0,036 -0,018-0,073 -0,035

-0,354l

j0,0120,024

(X'X)m =

[ ]

-120 112

112 658 2x2

Se deja como ejercicio probar que AAmA= A.

La solución de 3.10 será:= [O 2] r 1,068

l-0,036-0,073

0~27 -0~54] [ 44572]-0,018 0,012· 257203-0,035 0,024 514406

1. P =

[224J

. 1316

~ = r8::::~198,55J

Así el Modelo de Regresión múltiple estimado es:A

Y = 849,94 + 49,27Xl + 98,55X2

[1 H] = [~O ~lL =1

entonces:

al 11

rl20 112 loK' = 2J L'=112 658 lo

No hay duda que los valores obtenidos de los ~, dependerán de lainversa generalizada que se utilice, por esta razón los coeficientesPO,Pl,P2, serán estimaciones sesgadas de ~o, ~1 y ~2 respectivamente.Es de notar que en este problema se truncaron el número dedecimales en su transcripción. Se recomienda al estudiante utilizartodos los decimales posibles para mayor exactitud al chequear lasrespuestas.