Superficie de respuesta. Métodos y diseños

29
SUPERFICIES DE RESPUESTA. MÉTODOS Y DISEÑOS. Carmen Dolores Fernández Melcón Montserrat Piñeiro Barcia

Transcript of Superficie de respuesta. Métodos y diseños

Page 1: Superficie de respuesta. Métodos y diseños

SSUUPPEERRFFIICCIIEESS DDEE RREESSPPUUEESSTTAA.. MMÉÉTTOODDOOSS YY DDIISSEEÑÑOOSS..

Carmen Dolores Fernández Melcón Montserrat Piñeiro Barcia

Page 2: Superficie de respuesta. Métodos y diseños

SSUUPPEERRFFIICCIIEESS DDEE RREESSPPUUEESSTTAA.. MMÉÉTTOODDOOSS YY DDIISSEEÑÑOOSS..

§ 1. INTRODUCCIÓN A LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA

La Metodología de Superficies de Respuesta (RSM) es un conjunto de técnicas

matemáticas utilizadas en el tratamiento de problemas en los que una respuesta de interés está

influida por varios factores de carácter cuantitativo. El propósito inicial de estas técnicas es

diseñar un experimento que proporcione valores razonables de la variable respuesta y, a

continuación, determinar el modelo matemático que mejor se ajusta a los datos obtenidos. El

objetivo final es establecer los valores de los factores que optimizan el valor de la variable

respuesta.

Cuando decimos que el valor real esperado, η, que toma la variable de interés considerada

está influido por los niveles de k factores cuantitativos, X1, X2, ..., Xk, esto significa que existe

alguna función de X1, X2, ..., Xk (que se supone continua en Xi, ∀ i = 1, ..., k) que proporciona el

correspondiente valor de η para alguna combinación dada de niveles:

η = f (X1, X2, ..., Xk)

de tal forma que la variable respuesta puede expresarse como:

Y = η + ε = f (X1, X2, ..., Xk) + ε

donde ε es el error observado en la respuesta.

La relación η = f (X1, X2, ..., Xk) existente entre η y los niveles de los k factores puede

representarse a través de una hipersuperficie (subconjunto de un espacio euclídeo (k+1)-

dimensional) a la que llamaremos superficie de respuesta.

Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de

respuesta tridimensional consiste en representar la gráfica de contornos de la superficie, en la

que se trazan las denominadas líneas de contorno, que son curvas correspondientes a valores

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 1

Page 3: Superficie de respuesta. Métodos y diseños

1. Introducción a la Metodología de Superficies de Respuesta

constantes de la respuesta sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por

los niveles X1 y X2 de los factores). Geométricamente, cada línea de contorno es una proyección

sobre el plano X1X2 de una sección de la superficie de respuesta al intersecar con un plano

paralelo al X1X2. La gráfica de contornos resulta útil para estudiar los niveles de los factores en los

que se da un cambio en la forma o altura de la superficie de respuesta.

La existencia de gráficas de contorno no está limitada a 3 dimensiones a pesar de que en el

caso en que haya más de 3 factores de influencia no es posible la representación geométrica. No

obstante, el hecho de poder representar gráficas de contorno para problemas en que haya 2 o 3

factores permite visualizar más fácilmente la situación general.

[EJEMPLO.-] Un agricultor quiere maximizar su producción de almendras

(medida en Kg./Ha.) en función de las cantidades (medidas en Kg./Ha.) de dos tipos de

fertilizante, A y B, que utiliza. Una superficie de respuesta para la producción de almendras viene

dada por la gráfica siguiente:

Fig 1.1.- Superficie de respuesta tridimensional en la que se observa la producción esperada de almendras (η) en función de las cantidades de fertilizante A (X1) y fertilizante B (X2) utilizadas.

En este ejemplo, dado que hay dos factores de influencia (k = 2), la superficie de respuesta se

visualiza en un espacio tridimensional en el que la tercera dimensión representa la producción

esperada de almendras sobre el plano bidimensional definido por las combinaciones de los niveles

de los dos factores, X1 y X2.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 2

Page 4: Superficie de respuesta. Métodos y diseños

1. Introducción a la Metodología de Superficies de Respuesta

Para generar la gráfica de contornos correspondiente se secciona la superficie de respuesta usando

planos paralelos al X1X2 en ciertos valores de respuesta considerados, por ejemplo:

Fig 1.2.- Sección de la superficie de respuesta por planos paralelos al plano X1X2, en los valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9.

Cada línea de contorno representa un número infinito de combinaciones de las cantidades de los

dos fertilizantes, para las producciones de almendras esperadas consideradas. La producción

máxima, que es de 14.12 Kg./Ha. se localiza en el centro de la elipse más pequeña y corresponde

a los niveles X1 = 170.06 del fertilizante A y X2 = 246.65 del fertilizante B.

Fig 1.3.- Gráfica de contornos de la superficie de respuesta con líneas de contorno correspondientes a los valores esperados de producción: 11.5, 12.1, 12.7, 13.3, 13.9.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 3

Page 5: Superficie de respuesta. Métodos y diseños

2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

La gráfica de contornos correspondiente a la superficie de respuesta del ejemplo que estamos

considerando nos indicaría que ésta tiene forma de loma.

A la hora de planificar el programa de experimentación que nos va a permitir llevar a

cabo el estudio acerca del efecto de los factores sobre la variable respuesta, el primer paso que

debemos dar es la elección de los factores que usaremos en el experimento. Una vez

determinados, el siguiente paso es seleccionar los rangos de valores de cada factor que se

considerarán, pues aunque en el experimento es posible explorar la región correspondiente al

espacio completo de los factores de influencia o región operativa, lo más frecuente consiste en

explorar únicamente una región de interés limitada, la región experimental, contenida en la

región general. De este modo, durante la ejecución del experimento, sólo se utilizarán niveles de

los factores correspondientes a valores que caigan en esta región, a menos que se descubra,

durante el conjunto inicial de experimentos, que pueda ser necesario explorar niveles que estén

más allá de los límites de la región considerada.

§ 2. SUPERFICIES DE RESPUESTA POLINÓMICAS. MODELOS DE PRIMER Y

SEGUNDO ORDEN

La forma de la función f que determina la relación entre los factores y la variable respuesta

es, en general, desconocida, por lo que el primer objetivo de la RSM consiste en establecer

experimentalmente una aproximación apropiada de la función f. Para ello, se propone un modelo

de ecuación, generalmente polinómico, en los k factores X1, X2, ..., Xk y se selecciona un conjunto

de tratamientos sobre los que realizar las observaciones experimentales, que se utilizarán tanto

para obtener estimaciones de los coeficientes en el modelo propuesto (por ejemplo, a través del

método de mínimos cuadrados) como para obtener una estimación de la variación del error

experimental (para lo que es necesario tener al menos 2 observaciones por cada tratamiento). Se

realizan, entonces, contrastes sobre las estimaciones de los parámetros y sobre el ajuste del

modelo y si el modelo se considera adecuado, puede utilizarse como función de aproximación. En

tal caso, el estudio de la superficie de respuesta se hace en términos de la superficie ajustada, pues

su análisis será aproximadamente equivalente al del sistema real.

Los polinomios usados más frecuentemente como funciones de aproximación son los de

órdenes uno y dos, que nos proporcionan, respectivamente los siguientes modelos:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 4

Page 6: Superficie de respuesta. Métodos y diseños

2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

modelo de primer orden ≡ Y ε Xβ β i

k

1ii0 ++= ∑

=

modelo de segundo orden ≡ ε X Xβ Xβ Xβ β Y ji

jiji,

ij2i

k

1iiii

k

1ii0 ++++= ∑∑∑

<==

§ 2.1. UTILIZACIÓN DE VARIABLES CODIFICADAS

En la construcción de modelos de superficies de respuesta, es muy común la codificación

de los valores reales de los niveles de los factores, pues las distancias medidas sobre los ejes de las

variables codificadas en el espacio k-dimensional se convierten en estándar, lo que facilita

considerablemente los cálculos que deben llevarse a cabo para obtener el modelo de

aproximación e incrementa el ajuste en la estimación de los coeficientes.

Una fórmula que suele resultar útil para codificar los valores de los factores es la siguiente:

( )

X- X

X - X

X- X

2

X X - X

xiNInfiNSup

ii

iNInfiNSup

iNSupiNInfi

i

~=

+

= i = 1, 2, ..., k

donde XiNInf ≡ valor del nivel más bajo del factor i y XiNSup ≡ valor del nivel más alto del factor i y

, 2

X X X iNSupiNInf

i

+=~ es la media entre los valores más alto y más bajo del nivel i = 1, ...,n. La

fórmula anterior verifica que y transforma las medias 0 xk

1ii =∑

=k1 X ..., X

~,~ en el punto

(x1, ..., xk) = (0, ..., 0) al que se denomina centro del diseño.

La fórmulas empleadas para la codificación dan lugar a transformaciones biyectivas entre

variables reales y codificadas, de manera que cualquier ecuación polinómica en los valores de xi se

puede expresar equivalentemente como una ecuación polinómica del mismo grado en los valores

de Xi. Por tanto, a partir de ahora se trabajará con las variables codificadas, pues las conclusiones

que se obtengan sobre éstas pueden extrapolarse a las variables reales.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 5

Page 7: Superficie de respuesta. Métodos y diseños

2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

§ 2.2. MODELOS DE PRIMER ORDEN

Cuando no se tiene suficiente información acerca de la forma que presenta la superficie de

respuesta, el primer intento de ajuste se hace, generalmente, aproximando a través de un modelo

de primer orden.

La forma general de un modelo de primer orden con k factores, X1, X2, ..., Xk, es:

ε Xβ β Y i

k

1ii0 ++= ∑

=

(2.1)

variable

respuesta parámetros

desconocidos error

aleatorio

o, equivalentemente, en forma matricial:

Y = X β + ε

donde la matriz X puede escribirse alternativamente como X = [ 1 : D ], con D la matriz de

combinaciones de niveles de los factores, denominada matriz de diseño.

Si la matriz X es de rango completo, entonces el estimador de β obtenido por el método

de mínimos cuadrados es b = (X’ X)-1 X’ Y (que es, de hecho, el mejor estimador lineal insesgado

de β) y la matriz de varianzas-covarianzas de b viene dada por Var(b) = (X’ X)-1 σ2.

El modelo de primer orden ajustado es, entonces:

i

k

1ii0 Xb b Y ∑

=

+=ˆ

Si el modelo está bien ajustado, la parte no aleatoria del modelo representa la respuesta

real esperada y ε es el error experimental. Sin embargo, si el modelo no está ajustado a la función

respuesta real, lo que ocurre cuando la relación entre la respuesta y los factores está demasiado

simplificada, ε contiene, además del error experimental, una parte de error no aleatorio que se

debe a la falta de ajuste.

§ 2.3. MODELOS DE SEGUNDO ORDEN

Cuando existe curvatura en la superficie de respuesta, el modelo de primer orden no es

una aproximación adecuada y es necesario utilizar un modelo que ajuste mejor. Se emplea

entonces un modelo de segundo orden.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 6

Page 8: Superficie de respuesta. Métodos y diseños

2. Superficies de Respuesta Polinómicas. Modelos de Primer y Segundo Orden

La forma general de un modelo de segundo orden con k factores, X1, X2, ..., Xk es:

ε XX β Xβ Xβ β Y ji

1-k

1i

k

ij2j

ij2i

k

1iiii

k

1ii0 ++++= ∑∑∑∑

=>===

(2.2)

variable

respuesta parámetros desconocidos error

aleatorio

De manera análoga a como se hizo para los modelos de primer orden se obtiene que el

modelo ajustado de segundo orden es:

ji

1-k

1i

k

ij2j

ij2i

k

1iiii

k

1ii0 XX b Xb Xb b Y ∑∑∑∑

=>===

+++=ˆ

§ 2.4. NATURALEZA SECUENCIAL DE LA METODOLOGÍA DE SUPERFICIES DE RESPUESTA

La RSM es una técnica secuencial. A menudo, la estimación inicial de las condiciones

óptimas de operación está alejada del óptimo real, así que el objetivo es, usando un método lo

más simple y menos costoso posible, moverse rápidamente hacia las cercanías del óptimo.

En general, se sabe muy poco o nada acerca de la relación existente entre la variable

respuesta y los factores, así que, en un principio, se propone el modelo de aproximación más

simple posible, el de primer orden, que suministra la base para ejecutar un conjunto inicial de

experimentos que proporcionarán datos correspondientes a los puntos del diseño de primer

orden. Si los datos recogidos permiten hacer una estimación de la varianza del error, se puede

llevar a cabo un contraste para evaluar el ajuste del modelo. Esto nos lleva a una segunda etapa,

que consiste en localizar áreas de la región experimental en las que se sospeche que puedan estar

los valores más deseables de la variable respuesta. El plan que vamos a seguir, que nos llevará

hacia valores máximos en la respuesta, se conoce como método de máxima pendiente en

ascenso (en descenso si lo que queremos es minimizar los valores de la respuesta).

MÉTODO DE MÁXIMA PENDIENTE EN ASCENSO

El método de máxima pendiente en ascenso consiste en ejecutar una secuencia de

experimentos a lo largo de la línea de máximo incremento de la respuesta. Si el modelo ajustado

de primer orden es adecuado, la información que éste proporciona se utiliza para determinar una

dirección en la cual se espere observar mayores valores de la variable respuesta. A medida que se

avanza sobre la superficie ajustada en la dirección en que se incrementan los valores de la

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 7

Page 9: Superficie de respuesta. Métodos y diseños

3. Diseños de superficies de respuesta

respuesta y se va llegando a una región en la que haya curvatura en la superficie real, el

incremento en la respuesta se estabilizará en el punto más alto de la superficie ajustada. Si se

continúa en esta dirección y la altura de la superficie disminuye, se lleva a cabo un nuevo conjunto

de experimentos y se ajusta de nuevo el modelo de primer orden. Se determina una nueva

dirección hacia valores crecientes de la respuesta y se ejecuta otra secuencia de experimentos en la

dirección determinada. Este proceso continúa hasta que se hace evidente que a partir del método

no se puede obtener un incremento en la respuesta o éste es muy pequeño.

Si los tests de ajuste detectan que puede haber curvatura en la superficie, se aumenta un

grado al modelo añadiéndole los términos del producto cruzado y/o los términos cuadráticos

puros y se completa el diseño de primer orden añadiéndole los puntos necesarios para ajustar el

nuevo modelo de segundo orden. Si el modelo de segundo orden se ajusta adecuadamente, se

utiliza para describir la forma de la superficie a través de la gráfica de contornos en la región

experimental. Se utiliza entonces el modelo ajustado de segundo orden para localizar, en el lugar

en el que la pendiente de la superficie ajustada es cero, las coordenadas del punto estacionario,

que es el punto que proporciona el valor óptimo de la variable respuesta y, si se detecta que éste

se encuentra dentro de los límites de la región experimental, se pasa a determinar su naturaleza (si

es máximo, mínimo o punto de silla). Si, por el contrario, el punto estacionario no se halla dentro

de la región experimental, hemos de realizar una nueva experimentación en la dirección en la que

éste se encuentra. Una vez que se ha localizado el punto que proporciona valores óptimos de la

variable respuesta, se describe la superficie en un entorno próximo a éste.

§ 3. DISEÑOS DE SUPERFICIES DE RESPUESTA

La elección de un diseño adecuado del experimento a realizar es fundamental para

modelar y explorar la superficie de respuesta usada para ajustar un modelo polinómico al

conjunto de datos recogidos en los puntos del diseño. Así pues, sería deseable que el diseño

tuviera, de las características que se enumeran a continuación, y dado que algunas de ellas resultan

conflictivas entre sí, las que más sirvan al interés del experimento:

1. Generar una distribución razonable de puntos y, por tanto, de información, en toda la

región de interés, pero utilizando el menor número posible de puntos experimentales.

2. Asegurar que, para cada punto x, el valor ajustado, Ŷ(x), está tan cerca como sea posible

del valor real, Y(x).

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 8

Page 10: Superficie de respuesta. Métodos y diseños

3. Diseños de superficies de respuesta

3. Permitir la detección de falta de ajuste en el modelo.

4. Permitir la ejecución de los experimentos en bloques.

5. Permitir la construcción secuencial de diseños de orden creciente.

6. Proporcionar una estimación interna de la varianza del error.

7. Asegurar simplicidad en los cálculos de las estimaciones de los parámetros del modelo.

Además de las propiedades mencionadas, sería muy conveniente que el diseño elegido

fuera ortogonal y/o invariante por rotación:

Un diseño ortogonal es aquel en el que los términos del modelo ajustado son

incorrelados y, por tanto, también las estimaciones de los parámetros lo son, en cuyo caso, la

varianza de la respuesta esperada en cualquier punto de la región experimental se puede expresar

como la suma ponderada de las varianzas de los parámetros estimados del modelo.

Por otro lado, en un diseño invariante por rotación, la varianza de Ŷ(x), que depende de

la situación del punto x, es función únicamente de la distancia del punto al centro del diseño, lo

que significa que es la misma en todos los puntos equidistantes del centro del diseño. Teniendo

en cuenta que el objetivo de la RSM es la optimización de la respuesta y que se desconoce la

localización del óptimo antes de ejecutar el experimento, esta propiedad resulta muy interesante,

puesto que garantiza que el diseño proporciona estimaciones igualmente precisas en todas las

direcciones.

§ 3.1. DISEÑOS DE PRIMER ORDEN

Si el modelo (2.1) es una representación adecuada de la respuesta real esperada, entonces

el diseño elegido para estimar los parámetros debe proporcionar valores razonables de la

respuesta sobre la región de interés. Los diseños considerados con el propósito de recoger datos

para ajustar un modelo de primer orden se conocen como diseños de primer orden.

Un criterio razonable para la elección de un diseño de primer orden adecuado es la

minimización de Var(Ŷ), lo que se logra minimizando la varianza de los estimadores de los

parámetros βi, i = 1, ..., k. Hay una única clase de diseños que lo consiguen, los ortogonales, que

en los modelos de primer orden son aquellos para los que se verifica que los elementos de fuera

de la diagonal principal de la matriz X’X son cero, lo que nos permite determinar de manera

independiente los efectos de los k factores (medidos a través de los valores de bi, i = 1, ..., k).

Además, se verifica que todo diseño ortogonal de primer orden es invariante por rotación. Por

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 9

Page 11: Superficie de respuesta. Métodos y diseños

3. Diseños de superficies de respuesta

tanto, consideraremos únicamente aquellos diseños de primer orden que son ortogonales y, en

particular, los diseños factoriales 2k y las fracciones de diseños factoriales 2k.

DISEÑOS FACTORIALES 2K

En un diseño factorial 2k, para cada factor se consideran dos niveles, que pueden

codificarse en los valores +1 (para el más alto) y –1 (para el más bajo). Considerando todas las

posibles combinaciones de los niveles de los k factores, se obtiene una matriz de diseño de 2k

filas, cada una de las cuales representa un tratamiento.

Los diseños factoriales 2k presentan el inconveniente de que, salvo que se repitan algunas

observaciones, no permiten la estimación del error experimental. Una técnica habitual para incluir

repeticiones consiste en aumentar el diseño con algunas observaciones en el centro, pues esto no

influye sobre las estimaciones de los parámetros y no altera la ortogonalidad del diseño, aunque

como resultado, la estimación de β0 es la media de todas las observaciones.

FRACCIONES DE DISEÑOS FACTORIALES 2K

Estamos considerando los diseños factoriales 2k para ajustar los modelos de primer orden,

pero si se recogen datos en todos los puntos es posible, en realidad, estimar todos los coeficientes

de un modelo de la forma:

ε x ... x x β ... x x x β x x β xβ β Y k2112...klj

k

lj1iiijlj

k

j1iiiji

k

1ii0 ++++++= ∑∑ ∑∑∑∑

<<=<==

en el que los términos adicionales de mayor orden están asociados con las interacciones entre los

factores. De esta manera, el número de puntos del diseño, y por tanto, el número de

observaciones, junto con el número de posibles términos del modelo con parámetros estimables,

se incrementan rápidamente a medida que aumenta el número k de factores.

Así pues, hay que valorar, en función del coste del experimento, si para ajustar un modelo

de primer orden es necesario llevar a cabo las 2k combinaciones, o si es más conveniente omitir

algunas utilizando únicamente un subconjunto de los puntos de un diseño factorial 2k. Se puede

considerar en este último caso una fracción 2-m de un diseño 2k que consiste en 2k-m tratamientos

(k ≥ m), siempre y cuando el diseño resultante tenga, al menos, k+1 puntos, que es el número de

parámetros que han de estimarse y mantenga las mismas propiedades que las del factorial

completo, en particular, sea ortogonal.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 10

Page 12: Superficie de respuesta. Métodos y diseños

3. Diseños de superficies de respuesta

§ 3.2. DISEÑOS DE SEGUNDO ORDEN

Los diseños utilizados para recoger observaciones que permitan estimar los parámetros de

los modelos de segundo orden se denominan diseños de segundo orden. Éstos deben tener, al

menos, (k+1)(k+2)/2 puntos, que es precisamente el número de coeficientes del modelo que se

necesita estimar y deben involucrar, como mínimo 3 factores, dado que el modelo contiene

términos cuadráticos puros. Por otro lado, sería conveniente, por las razones que se han

comentado, que fueran ortogonales y/o invariantes por rotación. Así pues, se van a considerar los

diseños factoriales 3k, que son ortogonales, pero no invariantes por rotación, y los diseños

compuestos centrales, que verifican ambas propiedades.

DISEÑOS FACTORIALES 3K

En los diseños factoriales 3k cada uno de los k factores presenta 3 niveles, de manera que

el número de observaciones experimentales es N = 3k. Este número puede hacerse excesivamente

grande, especialmente cuando se están estudiando muchos factores, de manera que en ocasiones

conviene más considerar diseños fraccionales 3k-m de los diseños factoriales 3k, tal y como se hizo

para los diseños factoriales 2k.

Los diseños 3k y sus fracciones presentan el inconveniente de que, aunque son

ortogonales, no son invariantes por rotación, lo que hace que no sean muy buena elección como

diseños de superficies de respuesta de segundo orden.

DISEÑOS COMPUESTOS CENTRALES

Los diseños compuestos centrales se presentan como una alternativa a los diseños

factoriales 3k.

Un diseño compuesto central consiste en:

1. parte factorial: un diseño factorial 2k, completo o fraccional, en el que los niveles

están codificados en la forma habitual como ±1 ,

2. n0 ( ≥ 1) puntos centrales,

3. parte axial: dos puntos axiales en los ejes correspondientes a cada uno de los

factores, situados a una distancia α del centro del diseño.

de manera que el número total de puntos del diseño es N = 2k + 2k + n0.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 11

Page 13: Superficie de respuesta. Métodos y diseños

3. Diseños de superficies de respuesta

En principio, los diseños compuestos centrales así definidos no tienen por qué ser ni

ortogonales ni invariantes por rotación. Se convierten en invariantes por rotación mediante una

elección adecuada del valor de α, que debe depender del número de puntos de la parte factorial

del diseño para conseguirlo. Por otro lado, a través de una elección apropiada de n0 el diseño

puede hacerse ortogonal o incluso de precisión uniforme (diseño que verifica que Var(Ŷ) en el

origen es la misma que en un punto a una distancia unitaria del origen), que permite mayor

protección que un diseño ortogonal contra el sesgo de los coeficientes de regresión producido

por la presencia de términos de orden mayor que 2 en la superficie real. Se muestra a

continuación una tabla con los valores que deben tomar α y n0, según el número de factores del

modelo, para que el diseño correspondiente sea ortogonal o de precisión uniforme:

2 3 4 5 5 6 6 7 8 k

½ rep. ½ rep. ½ rep. ½ rep.

puntos factoriales

4 8 16 32 16 64 32 64 128

puntos axiales

4 6 8 10 10 12 12 14 16

DISEÑO ORTOGONAL

n0 8 9 12 17 10 24 15 22 33

N 16 23 36 59 36 100 59 100 177

DISEÑO DE PRECISIÓN UNIFORME

n0 5 6 7 10 6 15 9 14 20 N 13 20 31 52 32 91 53 92 164

α 1.414 1.682 2 2.378 2 2.828 2.378 2.828 3.364

Una propiedad muy interesante de los diseños centrales compuestos es que se pueden

construir a partir de un diseño de primer orden (el 2k) sin más que agregar los puntos axiales y

quizá algunos puntos centrales.

Por todas las propiedades que verifican, los diseños compuestos centrales son

posiblemente los más utilizados para ajustar superficies de respuesta de segundo orden.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 12

Page 14: Superficie de respuesta. Métodos y diseños

4. Algunas consideraciones finales

§ 4. ALGUNAS CONSIDERACIONES FINALES

BLOQUES

En los diseños de superficies de respuesta es frecuente que, por diversas causas, se haga

necesaria la utilización de bloques para asegurar la homogeneidad de las condiciones de trabajo.

Por ejemplo:

si se ha de trabajar con varias remesas de material, diferentes entre sí por cuestiones de

composición, procedencia u otras características cualesquiera, resulta conveniente hacer

bloques para asegurar la homogeneidad del material,

cuando se construye un diseño de segundo orden a partir de uno de primer orden, puede

ocurrir que las condiciones de trabajo se vean modificadas durante el tiempo que transcurre

entre la ejecución de los experimentos iniciales y la ejecución de los experimentos

complementarios, lo que hace necesaria la formación de bloques,

si el número de factores es tan elevado como para necesitar que una gran cantidad de

observaciones se lleven a cabo bajo las mismas condiciones y esto no es posible, la creación

de bloques garantiza la homogeneidad de las condiciones de trabajo.

EXPERIMENTOS DE MEZCLA

Los desarrollos acerca de la RSM que se han llevado a cabo en los epígrafes anteriores se

han hecho bajo la suposición de que los niveles de cada factor son independientes de los niveles

de los demás factores. Sin embargo, puede ocurrir que esto no sea así, como es el caso de los

experimentos de mezcla, en los que los factores son ingredientes de una mezcla y sus niveles

no son independientes. En este caso, se supone que la variable respuesta depende únicamente de

las proporciones relativas de los componentes presentes en la mezcla.

En los experimentos de mezcla, el propósito del programa experimental es modelar la

superficie a través de una función que permita, por un lado, determinar empíricamente los

valores esperados de la variable respuesta para alguna combinación de ingredientes y, por otro,

obtener alguna medida de la influencia de cada componente sobre la variable respuesta, tanto

por separado como en combinación con los otros ingredientes.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 13

Page 15: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

EVOP

En muchas ocasiones puede resultar inviable, por diversas razones, llevar a cabo los

procedimientos experimentales de la RSM en procesos de producción a gran escala. En estos

casos es frecuente que la RSM se aplique a operaciones en plantas piloto, para posteriormente

extrapolar las conclusiones obtenidas a los procesos a escala normal. El problema que plantean

estos procedimientos es que el paso del entorno de trabajo de la planta piloto al real puede llevar

aparejada una distorsión en las condiciones óptimas, pues aunque la planta a escala normal

comienza su operación con niveles óptimos, generalmente se desvía de estos niveles como

consecuencia de la variación en las condiciones del entorno de trabajo. El objetivo en estos casos

es hacer un seguimiento del proceso en su escala normal que permita ir redirigiendo las

condiciones de operación hacia el óptimo o, en todo caso, permita hacer un seguimiento de las

desviaciones que aparezcan. Con este fin se emplean los métodos de operación evolutiva o

EVOP, que consisten en introducir sistemáticamente pequeños cambios en los niveles de los

factores de tal manera que no se provoquen alteraciones importantes en el rendimiento, calidad

o cantidad, pero que permitan la detección de potenciales mejoras en el desempeño del proceso.

Para llevarlas a cabo se emplean, en general, diseños factoriales 2k.

§ 5. UN EJEMPLO NUMÉRICO

El rendimiento (Y) de un determinado proceso químico se puede medir en términos de

la cantidad de material residual eliminado durante la reacción, resultando así una medida de la

pureza del producto final, y se conoce que depende, entre otros factores, de la temperatura (X1)

y el tiempo de reacción (X2). El proceso opera actualmente en un rango de porcentaje de pureza

entre el 55% y el 75%, pero se cree que es posible un mayor porcentaje de rendimiento, así que

un investigador, interesado en determinar si efectivamente esto es así, decide llevar a cabo un

experimento variando la temperatura y el tiempo de reacción pero manteniendo fijos el resto de

los factores. Para el conjunto inicial de experimentos, considera dos niveles de temperatura (70º

C y 90º C) y dos niveles de tiempo (30 seg. y 90 seg.) y realiza dos observaciones de cada una de

las posibles combinaciones temperatura-tiempo. Los datos recogidos, que se muestran en la tabla

5.1., se utilizarán para ajustar el modelo bifactorial Y = α0 + α1 X1 + α2 X2.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 14

Page 16: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Tiempo(seg.)

Temp. (º C)

30 90

49.8 65.7

70

48.1 69.4 57.3 73.1

90 52.3 77.8

(5.1.)

Se codifican las variables X1 y X2 utilizando las transformaciones siguientes:

1080- X x 1

1 = 30

60- X x 22 =

que nos proporcionan los siguientes valores codificados: X1 x1 X2 x2

70 -1 30 -1

90 1 90 1

La localización de los cuatro puntos del diseño sobre la región completa de combinaciones

temperatura-tiempo se muestra a continuación:

Fig 5.1.- Valores observados en los cuatro tratamientos iniciales sobre la región experimental definida por los niveles de los dos factores que influyen en el porcentaje de rendimiento del proceso químico considerado.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 15

Page 17: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Los valores del porcentaje de rendimiento, expresados en función de las variables codificadas,

vienen dados a través del siguiente modelo:

Y = β0 + β1 x1 + β2 x2 + ε (5.2)

en el que los parámetros β0, β1, β2 son función de α0, α1, α2:

β0 = α0 + 80 α1 + 60 α2 β1 = 10 α1 β2 = 30 α2

y el término ε representa el error aleatorio.

En notación matricial:

Y = X β + ε

+

=

8

7

6

5

4

3

2

1

2

1

0

εεεεεεεε

βββ

11111111-111-11-111-111-1-11-1-1

8.771.734.697.653.523.571.488.49

donde εi, i = 1, 2, ..., k, se suponen independientes e igualmente distribuidos según una

distribución N(0,σ2).

Los estimadores de los parámetros del modelo de primer orden se obtienen resolviendo la

ecuación normal:

X’X b = X’Y ⇒ b = (X’X)-1 X’Y

=

78.527.5

493.5

bbb

800080008

2

1

0

=

=

9.81253.437561.6875

78.527.5493.5

8100

0810

0081

bbb

2

1

0

Por tanto, el modelo ajustado de primer orden en las variables codificadas es:

Ŷ ( x ) = 61.6875 + 3.4375 x1 + 9.8125 x2 (5.3)

y el modelo equivalente en las variables originales es:

Ŷ ( x ) = 14.5625 + 0.3437 X1 + 0.3271 X2 (5.4)

Las sumas de cuadrados necesarias para llevar a cabo el análisis de la varianza se calculan como

sigue:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 16

Page 18: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

g.l.7 con 898.749 8Y)(1'

- YY' S.C.Total 2

==

g.l.2 con 864.812 8Y)(1'

- YX'b' iónS.C.Regres2

==

g.l.5 con 33.936 YX'b' - YY' al S.C.Residu ==

( ) ( ) ( ) ( )[ ]4 g.l. con 31.835

77.8 - 73.1 69.4 - 65.7 52.3 - 57.3 48.1 - 49.8 21 S.C.Error

=

=+++= 2222

g.l.1 con 2.101SCError -SCResidual AjustedeS.C.Falta ==

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Fuente Suma de

cuadrados gl Media

cuadrática F Regresión 864,812 2 432,406 63,709 Residual 33,936 5 6,787 Falta de Ajuste 2,101 1 2,101 0,264 Error 31,835 4 7,959 Total 898,749 7

El primer paso consiste en determinar si el modelo ajustado es adecuado. En vista de los datos

contenidos en la tabla, dado que FFalta de ajuste = 0.264 < F0.05,1,4 = 7.71, podemos considerar que el

modelo ajustado es una buena aproximación de la superficie de respuesta en la región

experimental en que estamos trabajando.

Al no descubrir evidencia de la falta de ajuste del modelo, el siguiente paso es determinar si el

modelo ajustado explica una cantidad significativa de la variación de los valores de rendimiento

observado. Para ello se realiza el siguiente contraste:

H0 : β1 = β2 = 0 ⇔ la temperatura y el tiempo no influyen sobre el rendimiento del proceso

H1 : β1 ≠ 0 o β2 ≠ 0 ⇔ la temperatura y/o el tiempo influyen sobre el rendimiento del proceso

Los datos contenidos en la tabla, dado que Fregresión= 63.71 > F0.01,2,5 = 13.27, nos llevan a rechazar

la hipótesis nula, lo que significa que uno de los parámetros β1 o β2, o ambos, son no nulos en la

ecuación (5.2.).

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 17

Page 19: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Como consecuencia de la conclusión a la que hemos llegado, el siguiente paso que debemos dar

es ejecutar contrastes por separado para determinar los efectos que, sobre el rendimiento, pueden

tener la temperatura y el tiempo:

1. H01 : β1 = 0 ⇔ la temperatura no tiene efecto sobre el rendimiento del proceso

2. H02 : β2 = 0 ⇔ el tiempo no influye sobre el rendimiento del proceso

para los que se calcula el valor de 2 1, i)]Est[Var(b

0 - b ti

ii == , utilizando que:

2 1, 0, i0.8484 Est.[σ 81 Est.[Var(b 6.7873 SC Est.[σ 2

iResiduos2 ===⇒== ])]]

De esta manera obtenemos que t1 = 3.73 > t0.025,5 = 2.571 y t2 = 10.75 > t0.025,5 = 2.571, lo que

nos lleva a rechazar la hipótesis nula en ambos casos. Esto significa que tanto la temperatura

como el tiempo tienen efecto sobre el porcentaje de rendimiento. Es más, dado que tanto b1

como b2 son positivos, los efectos de x1 y x2 son positivos, lo que significa que si se eleva la

temperatura o se aumenta el tiempo, se produce un incremento significativo en el rendimiento del

proceso.

El modelo ajustado (5.4.) puede utilizarse ahora para representar, a través de una gráfica de

contornos, valores de la superficie de respuesta estimada sobre la región experimental, tal y como

se muestra a continuación:

Fig 5.2.- Gráfica de contornos de la superficie de respuesta dada por la ecuación (5.4.). La flecha, perpendicular a las líneas de contorno de la superficie ajustada, indica la dirección de máximo ascenso.

La flecha perpendicular a las líneas de contorno de la superficie ajustada apunta hacia arriba y

hacia la derecha, lo que indica que los valores más altos de la respuesta se espera que se consigan

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 18

Page 20: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

aumentando los valores de x1 y x2 por encima de 1, acción que correspondería a aumentar la

temperatura por encima de 90º C y el tiempo de reacción por encima de 90 seg.

Por tanto, en la región de las condiciones iniciales de que partíamos hemos ajustado una

superficie de respuesta plana, que nos indica que es posible una mejora en el rendimiento, en

términos de un mayor valor de la variable respuesta. Así que, llegados a este punto, resulta natural

preguntarse que, si es posible ejecutar experimentos adicionales, con qué valores de tiempo y

temperatura deberían realizarse. Esto nos lleva a la segunda etapa en el proceso secuencial de

experimentación que estamos llevando a cabo, que es determinar qué estrategia seguir que nos

permita movernos en la dirección que indicaba la flecha de la gráfica anterior. Para ello recurrimos

al método de máxima pendiente en ascenso.

Dado que b2 > 0 en el modelo ajustado (5.3.), sabemos que la superficie crece en altura a medida

que aumenta el valor de x2, esto es, para valores de tiempo mayores de 60 seg. Vamos a buscar

ahora el valor del multiplicador de Lagrange µ que corresponde a un incremento arbitrario en el

tiempo (X2) de ∆2 = 45 seg., incremento que en las variables codificadas corresponde a un

aumento de 45/30 = 1.5 unidades. Por tanto:

0.536 3.27 2

3.4375 µ2

b x 3.27 1.5 2

9.8125 x2

b µ 11

2

2 =⋅

=⋅

=⇒=⋅

=⋅

=

de manera que el cambio incremental en la temperatura es ∆1 = 0.53 · 10 = 5.3ºC

El primer punto en la pendiente de máximo ascenso se localiza, por tanto, en las coordenadas

(x1, x2) = (0.53, 1.5) (que corresponde, en las variables originales a (X1, X2) = (85.3, 105)). Para

comprobar si es de esperar aquí un incremento en el valor de la variable respuesta, se compara la

estimación del modelo en dicho punto con la estimación en el centro del diseño:

Ŷ(0.53, 1.5) –Ŷ(0, 0) = 78.2281 - 61.6875 = 16.5406

Aunque la estimación Ŷ(0.53, 1.5) corresponde a un punto de fuera de la región experimental,

parece que, dado que la diferencia es positiva, sería posible observar valores de la respuesta más

altos en la dirección especificada por el punto (x1, x2) = (0.53, 1.5).

Así pues, se ejecutan experimentos a lo largo de la pendiente de máximo ascenso en puntos

correspondientes a incrementos de la distancia de 1.5∆i, 2∆i, 3∆i y 4∆i, i = 1, 2, cuyas

coordenadas, junto con los correspondientes valores observados de porcentaje de rendimiento se

muestran en la tabla siguiente:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 19

Page 21: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

DIRECCIÓN 1

Temperatura (ºC)

Tiempo (seg.)

Porcentaje de rendimiento

Centro 80.0 60 ∆i 5.3 45 Centro + ∆i 85.3 105 74.3 Centro + 1.5 ∆i 87.95 127.5 78.6 Centro + 2 ∆i 90.6 150 83.2 Centro + 3 ∆i 95.9 195 84.7 Centro + 4 ∆i 101.2 240 80.1

Los valores observados de porcentaje de rendimiento crecen hasta un valor de 84.7% para valores

de temperatura de 95.9º C y de tiempo de 195 seg. y entonces el valor cae hasta 80.1% para

valores de temperatura de 101.2º C y de tiempo de 240 seg. Esto nos lleva a pensar que o bien

101.2º C es una temperatura demasiado alta o bien 240 seg. es un tiempo demasiado largo para la

reacción. Así pues, no sería útil ejecutar experimentos adicionales a lo largo de la pendiente para

valores más altos de X1 y X2. Lo que se hace entonces es llevar a cabo un nuevo grupo de

experimentos para intentar ajustar de nuevo un modelo de primer orden, tal y como se hizo en un

primer momento, pero tomando como centro de diseño el punto (X1, X2) = (95.9, 195), pues es

aquí donde se ha observado un mayor rendimiento. Por tanto, se codifican nuevamente las

variables X1 y X2 pero utilizando ahora las siguientes transformaciones:

1095.9- X

x 11 =

30195- X

x 22 =

que nos proporcionan los siguientes valores reales para los valores estándar de las variables

codificadas: x1 X1 x2 X2

-1 85.9 -1 165

1 105.9 1 225

Se realiza entonces un nuevo experimento en el que se llevan a cabo 2 observaciones en cada

uno de los puntos del nuevo diseño, más el centro. Los datos recogidos se muestran en la tabla

(5.5.):

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 20

Page 22: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Tiempo (seg.)

Temp. (º C)

165 195 225

85.9 82.9 81.4 74.6

77.0

95.9 84.7 81.9

105.9 87.4 89.5 84.5

83.1

(5.5.)

El modelo ajustado de primer orden en las variables codificadas, obtenido tal y como se hizo para

el conjunto inicial de observaciones, es:

Ŷ ( x ) = 82.7 + 3.575 x1 – 2.750 x2 (5.6)

y el modelo equivalente en las variables originales es:

Ŷ ( x ) = 66.2908 + 0.3575 X1 - 0.0917 X2 (5.7)

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Fuente Suma de

cuadrados gl Media

cuadrática F Regresión 162,745 2 81,373 42,334 Residual 13,455 7 1,922 Falta de Ajuste 2,345 2 1,173 0,53 Error 11,110 5 2,222 Total 176,200 9

Nuevamente, el primer paso consiste en determinar si el modelo ajustado es adecuado, de

acuerdo con los datos contenidos en la tabla. Dado que Ffalta de ajuste = 0.53 < F0.05,2,5 = 5.79,

podemos considerar que el modelo ajustado es una buena aproximación de la superficie de

respuesta en la región experimental en que estamos trabajando actualmente.

Ahora, como el test de significación genera un valor Fregresión= 42.34 altamente significativo, la

información obtenida del modelo ajustado (5.6.) puede utilizarse para obtener una nueva

dirección en la cual ejecutar experimentos adicionales en busca de valores más altos de porcentaje

de rendimiento, tal y como se hizo con el primer modelo de primer orden que se utilizó. Se indica

a continuación, de manera esquemática, el proceso seguido:

Dado que b1 > 0 en el modelo ajustado (5.6.), sabemos que la superficie crece en altura a medida

que aumenta el valor de x1, esto es, para valores de temperatura mayores de 95.9º C. Para un

incremento en la temperatura (X1) de ∆1 = 10º C, incremento que en las variables codificadas

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 21

Page 23: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

corresponde a un aumento de 1 unidad y que supone un incremento en el tiempo de

∆2 = -077 · 30 = -23.1 seg. El primer punto en la pendiente de máximo ascenso se localiza, por

tanto, en las coordenadas (x1, x2) = (1, -0.77) (que corresponde, en las variables originales a

(X1, X2) = (105.9, 171.9)). Dado que la diferencia Ŷ(1, -0.77) –Ŷ(0, 0) = 5.6925 es positiva, sería

posible observar valores de la respuesta más altos en la dirección especificada por el punto (x1, x2).

Así, el modelo ajustado (5.7.) puede utilizarse para representar, a través de una gráfica de

contornos, valores de la superficie de respuesta estimada sobre la región experimental, tal y como

se muestra a continuación:

Fig 5.3.- Gráfica de contornos de la superficie de respuesta dada por la ecuación (5.7.). La flecha, perpendicular a las líneas de contorno de la superficie ajustada, indica la dirección de máximo ascenso.

La flecha perpendicular a las líneas de contorno de la superficie ajustada apunta ahora

hacia abajo y hacia la derecha, indicando la dirección en la que se espera obtener valores más altos

de porcentaje de rendimiento. Así pues, se ejecutan experimentos a lo largo de la pendiente de

máximo ascenso en puntos correspondientes a incrementos de la distancia de ∆i, 2∆i, 3∆i y 4∆i,

i = 1, 2, cuyas coordenadas, junto con los correspondientes valores observados de porcentaje de

rendimiento se muestran en la tabla siguiente:

Paso DIRECCIÓN 2

Temperatura(ºC)

Tiempo (seg.)

Porcentaje de rendimiento

Centro 95.9 195 ∆i 10 -23.1

1 Centro + ∆i 105.9 171.9 89.0 2 Centro + 2 ∆i 115.9 148.8 90.2 3 Centro + 3 ∆i 125.9 125.7 87.4 4 Centro + 4 ∆i 1 35.9 102.6 82.6

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 22

Page 24: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Los valores observados de rendimiento crecen hasta un valor de 90.2%, en el punto

(X1, X2) = (115.9, 148.8) y luego vuelven a caer.

Esta secuencia de experimentos ejecutada a lo largo de la nueva dirección se muestra en la gráfica

siguiente:

Fig 5.4.- Secuencia de experimentos realizados a lo largo de la dirección indicada por la segunda pendiente de máximo ascenso.

Para verificar los altos valores de rendimiento observados se lleva a cabo una nueva serie de

observaciones, cuyos resultados se muestran en la siguiente tabla y cuya forma de ejecución se

detalla a continuación:

Paso DIRECCIÓN 3

Temperatura(ºC)

Tiempo (seg.)

Porcentaje de rendimiento

5 Centro + 2∆i 115.9 148.8 91.0 6 Centro + 3 ∆i 125.9 171.9 93.6 7 Centro + 4 ∆i 135.9 195 96.2 8 Centro + 5 ∆i 1 45.9 218.1 92.9

En primer lugar, se lleva a cabo una nueva observación (paso 5) en el punto (115.9, 148.8), que

era el que correspondía, en el anterior grupo de experimentos, a un mayor porcentaje de

rendimiento. El valor obtenido en esta nueva observación confirma el alto valor observado en

aquel momento. Se realiza entonces (paso 6) una observación en la que se espera obtener un valor

más alto de rendimiento, incrementando los valores tanto de temperatura como de tiempo a

partir del punto (115.9, 148.8). De hecho, en el paso 6 las variables codificadas de las

combinaciones de tiempo y temperatura son +1 en ambos casos, en una replicación 3/4 de un

factorial 22 consistente en los puntos de los pasos 1, 3 y 6 con el punto 5 como centro. Dado que

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 23

Page 25: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

en el paso 6 se observa un mayor rendimiento que en el paso 5, se ejecutan experimentos

adicionales (pasos 7 y 8) a partir de una tercera dirección definida por la línea que une los puntos

de los pasos 5 y 6. La elección de esta tercera dirección representa una desviación de la

aproximación convencional de la pendiente de máximo ascenso, pero se toma en un intento de

reducir el trabajo que supondría hacer un experimento correspondiente a un diseño factorial 22

completo con centro en el punto del paso 5 y el consiguiente ajuste de un nuevo modelo de

primer orden.

Como el valor observado en el paso 8 es más bajo que el del paso 7, se decide no ir más allá del

paso 8, así que se establece un nuevo diseño usando como centro el punto del paso 7, (X1, X2) =

(135.9, 195). Por tanto, se codifican nuevamente las variables X1 y X2 pero utilizando ahora las

siguientes transformaciones:

10135.9- X

x 11 =

23.1195- X x 2

2 =

Se realiza una serie de observaciones hasta completar un diseño 22 aumentado con observaciones

en el centro, lo que nos proporciona la siguiente tabla de datos:

Tiempo (seg.)

Temp. (º C)

171.9 195 218.1

125.9 93.6 91.7

135.9 96.2 97.0

145.9 92.5 92.9

(5.8.)

A partir de estos datos, el modelo de primer orden ajustado que se obtiene es el siguiente:

Ŷ ( x ) = 93.983 + 0.025 x1 – 0.375 x2 (5.9)

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Fuente Suma de

cuadrados gl Media

cuadrática F Regresión ,565 2 ,282 ,038 Residual 22,183 3 7,394 Falta de Ajuste 21,863 2 10,931 34,159 Error 0,320 1 0,320 Total 22,748 5

La secuencia de experimentos completa hasta llegar a este último modelo ajustado de primer

orden se muestra en la gráfica siguiente:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 24

Page 26: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Fig 5.5.- Secuencia completa de experimentos realizados a lo largo de las direcciones indicadas por las sucesivas pendientes de máximo ascenso que se han ido obteniendo, sobre la gráfica de contornos del último modelo de primer orden ajustado.

Resulta obvio de los datos contenidos en la tabla ANOVA que, dado que Fregresion = 0,038, el

modelo ajustado (5.9) no explica una cantidad significativa de toda la variación en el porcentaje de

rendimiento. Así pues, debemos recurrir a un ajuste de la superficie de respuesta a través de un

modelo de segundo orden:

Y = β0 + β1 x1 + β2 x2 +β11 x12 + β22 x2

2 +β12 x1 x2 + ε (5.10)

Se considera entonces el último diseño de primer orden que habíamos considerado, del que ya

disponemos de datos, y se completa con observaciones en los puntos axiales (x1, x2) = (±√2, 0) y

(x1, x2) = (0, ±√2) para conseguir un diseño central compuesto. Los datos recogidos se muestran

en la siguiente tabla:

Tiempo (seg.)

Temp. (º C)

162.3 171.9 195 218.1 227.7

121.75 92.7

125.9 93.6 91.7

135.9 93.4 96..2 97.0 92.7

145.9 92.5 92.9

150.04 92.8

(5.11.)

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 25

Page 27: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

A partir de estos datos, el modelo de segundo orden ajustado que se obtiene es el siguiente:

Ŷ ( x ) = 96.60 + 0.03 x1 – 0.31 x2 – 1.98 x12 – 1.83 x2

2 + 0.58 x1 x2 (5.12)

El análisis de la varianza (ANOVA) se muestra en la siguiente tabla:

Fuente Suma de

cuadrados gl Media

cuadrática F Regresión 25,447 5 5,089 44,447 Residual ,458 4 ,115 Falta de Ajuste ,138 3 ,046 0,144 Error ,320 1 ,320 Total 25,905 9

El test para comprobar el ajuste del modelo (5.12.) proporciona un valor F < 1 que es claramente

no significativo y las estimaciones de los coeficientes cuadráticos puros son todas altamente

significativas (p < 0.0001), lo que indica que existe curvatura en la superficie ajustada y que ésta es

una buena aproximación de la superficie de respuesta real. Entonces se representa en la región

experimental la gráfica de contornos asociada a la superficie ajustada:

Fig 5.6.- Puntos del diseño utilizados para ajustar la superficie de segundo orden, sobre la gráfica de contornos de la superficie ajustada de segundo orden.

Las líneas de contorno son elípticas y el punto de respuesta máxima, esto es el punto estacionario,

se hallará en el centro de la elipse más pequeña. El siguiente paso consiste, entonces, en

determinar las coordenadas del punto estacionario. Para ello, representamos la ecuación (5.12) en

notación matricial:

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 26

Page 28: Superficie de respuesta. Métodos y diseños

5. Un ejemplo numérico

Ŷ(x) = b0 + x’ b + x’ B x

[ ] [ ]

−+

+=

2

121210

2

1

xx

20.58

20.581.98-

xx 0.31-

0.03 xx b

)(xY)(xY

83.1ˆˆ

Se igualan a cero las derivadas parciales de Ŷ(x) con respecto a x1 y x2, y resolviendo para los

valores de los xi se obtiene que las coordenadas del punto estacionario vienen dadas de la

siguiente manera:

=

=

0.08568-0.0486-

2b B -

xx

x-1

02

010

que en las variables originales corresponden al punto X0 = (x10, x20) = (135.85, 193.02), que se

muestra en la gráfica siguiente:

Fig 5.7.- Punto estacionario del sistema, representado sobre la gráfica de contornos de la superficie ajustada.

Así pues, el máximo valor de porcentaje de rendimiento se alcanza, según nos indican las

coordenadas del punto estacionario, para una temperatura de 135.85º C y un tiempo de reacción

de 193.02 seg. Si nos alejamos de este punto, aumentando o disminuyendo los valores de

temperatura o tiempo, el valor esperado de la variable respuesta decrece. Por tanto, para alcanzar

un porcentaje de rendimiento óptimo en el proceso químico que estamos considerando, debemos

trabajar con los valores de temperatura y tiempo que nos indica el punto estacionario, esto es,

135.85º C y 193.02 seg.

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 27

Page 29: Superficie de respuesta. Métodos y diseños

6. Bibliografía

Carmen D. Fernández Melcón. Montserrat Piñeiro Barcia 28

§ 6. BIBLIOGRAFÍA

[ 1 ] RESPONSE SURFACES. DESIGN AND ANALYSES. Khuri, André I., Cornell, John A. Statistics: Textbooks and monographs. 81. Marcel Dekker, 1987. New York.

[ 2 ] DISEÑO DE EXPERIMENTOS. Kuehl, Robert O. International Thomson, 2001.

[ 3 ] DISEÑO Y ANÁLISIS DE EXPERIMENTOS. Montgomery, Douglas C. Grupo Editorial Iberoamérica, 1991.