Uso de Software computacional Disenos Estadistica

13
Generalidades Diseño de Bloques: En muchos problemas experimentales, es necesario diseñar el experimento de tal manera que la variabilidad proveniente de otras fuentes pueda ser sistemáticamente controlada. Si esta variabilidad no es controlada, el error experimental reflejará tanto el error experimental como la variación adicional de otras fuentes. Lo que queremos es que el error experimental sea tan pequeño como sea posible. Un diseño que nos ayuda a contabilizar y remover esta fuente adicional de variación es el Diseño de bloques completamente al azar (DBCA). En el DBCA, las unidades experimentales están agrupadas primero en grupos homogéneos llamados bloques y los tratamientos están asignados al azar dentro de los bloques. Es llamado completo debido a que cada bloque recibe todos los tratamientos. La variabilidad no controlada por las fuentes extrañas es ahora controlada por el bloqueo. Esta estrategia de diseño puede mejorar la exactitud de las comparaciones entre tratamientos reduciendo la variabilidad entre las unidades experimentales. En el Diseño en cuadro latino (DCL) se controlan dos factores de bloque y uno de tratamientos; los tres factores tienen la misma cantidad de niveles; en el Diseño en cuadro Grecolatino (DCGL) se controlan tres factores de bloque y un factor de tratamiento, los cuatro factores utilizan la misma cantidad de niveles; por su sencillez, se expone un ejemplo de Diseño en cuadro latino, el proceso es idéntico si se quiere resolver un ANOVA con DBCA o DCGL. Generalidades Diseños Factoriales: En algunas ocasiones se está interesado en estudiar la influencia de dos (o más) factores tratamiento, para ello se hace un diseño de filas por columnas. En este modelo es importante estudiar la posible interacción entre los dos factores. Si en cada casilla se tiene una única observación no es posible estudiar la interacción entre los dos factores, para hacerlo hay que replicar el modelo, esto es, obtener n observaciones en cada casilla, donde n es el número de réplicas. Generalizar los diseños completos a más de dos factores es relativamente sencillo desde un punto de vista matemático, pero en su aspecto práctico tiene el inconveniente de que al aumentar el número de factores aumenta muy rápidamente el número de observaciones necesario para estimar el modelo. Los diseños factoriales 2 k son diseños en los que se trabaja con k factores, todos ellos con dos niveles (se suelen denotar + y -). Estos diseños son adecuados para tratar el tipo de problemas descritos porque permiten trabajar con un número elevado de factores y son válidos para estrategias secuenciales. Para fines prácticos este tutorial dilucida el método para obtener el ANOVA de un diseño factorial con dos factores, se sigue el mismo procedimiento para el diseño factorial con 3 factores.

Transcript of Uso de Software computacional Disenos Estadistica

Page 1: Uso de Software computacional Disenos Estadistica

Generalidades Diseño de Bloques:

En muchos problemas experimentales, es necesario diseñar el experimento de tal manera

que la variabilidad proveniente de otras fuentes pueda ser sistemáticamente controlada. Si esta

variabilidad no es controlada, el error experimental reflejará tanto el error experimental como la

variación adicional de otras fuentes. Lo que queremos es que el error experimental sea tan pequeño

como sea posible. Un diseño que nos ayuda a contabilizar y remover esta fuente adicional de

variación es el Diseño de bloques completamente al azar (DBCA).

En el DBCA, las unidades experimentales están agrupadas primero en grupos homogéneos

llamados bloques y los tratamientos están asignados al azar dentro de los bloques. Es llamado

completo debido a que cada bloque recibe todos los tratamientos. La variabilidad no controlada por

las fuentes extrañas es ahora controlada por el bloqueo. Esta estrategia de diseño puede mejorar la

exactitud de las comparaciones entre tratamientos reduciendo la variabilidad entre las unidades

experimentales.

En el Diseño en cuadro latino (DCL) se controlan dos factores de bloque y uno de

tratamientos; los tres factores tienen la misma cantidad de niveles; en el Diseño en cuadro

Grecolatino (DCGL) se controlan tres factores de bloque y un factor de tratamiento, los cuatro

factores utilizan la misma cantidad de niveles; por su sencillez, se expone un ejemplo de Diseño en

cuadro latino, el proceso es idéntico si se quiere resolver un ANOVA con DBCA o DCGL.

Generalidades Diseños Factoriales:

En algunas ocasiones se está interesado en estudiar la influencia de dos (o más) factores

tratamiento, para ello se hace un diseño de filas por columnas. En este modelo es importante

estudiar la posible interacción entre los dos factores. Si en cada casilla se tiene una única

observación no es posible estudiar la interacción entre los dos factores, para hacerlo hay que

replicar el modelo, esto es, obtener n observaciones en cada casilla, donde n es el número de

réplicas.

Generalizar los diseños completos a más de dos factores es relativamente sencillo desde un

punto de vista matemático, pero en su aspecto práctico tiene el inconveniente de que al aumentar el

número de factores aumenta muy rápidamente el número de observaciones necesario para estimar

el modelo.

Los diseños factoriales 2k son diseños en los que se trabaja con k factores, todos ellos con

dos niveles (se suelen denotar + y -). Estos diseños son adecuados para tratar el tipo de problemas

descritos porque permiten trabajar con un número elevado de factores y son válidos para

estrategias secuenciales.

Para fines prácticos este tutorial dilucida el método para obtener el ANOVA de un diseño

factorial con dos factores, se sigue el mismo procedimiento para el diseño factorial con 3 factores.

Page 2: Uso de Software computacional Disenos Estadistica

Ejemplo Diseño en cuadro latino:

Se ilustra el siguiente ejemplo para dar un entendimiento general del uso del software estadístico:

MINITAB 15 concerniente a bloqueos.

Comparación de 4 marcas de llantas

“Una compañía de mensajería está interesada en determinar cuál marca de llantas tiene mayor

duración en términos del desgaste. Para ello se planea un experimento en cuadro latino, en el que se

comparan las 4 marcas de llantas sometiéndolas a una prueba de 32 000 km de recorrido utilizando

4 diferentes tipos de auto y las 4 posiciones posibles de las llantas de auto. Así, el factor de interés es

el tipo de llanta o marca, y se controlan dos factores de bloques: tipo de carro y posición de la llanta

en el carro.

A partir de un cuadro latino inicial se aleatorizan las columnas y los renglones; después las diferentes

marcas de llanta se asignan de manera aleatoria a las letras latinas que denotan los niveles del

“factor de interés”

Carro

Posición 1 2 3 4

1 C=12 D=11 A=13 B=8

2 B=14 C=12 D=11 A=3

3 C=17 B=14 C=10 D=9

4 D=13 A=14 B=13 C=9

a) ¿Existe alguna llanta que sea mejor? Argumente su respuesta

b) ¿Existe efecto en la posición de las llantas?

c) ¿Hay diferencias entre los cuatro tipos de carro?

d) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Los pasos para obtener el ANOVA se explican a continuación:

Las combinaciones de prueba, así como la respuesta observada se capturan manualmente en el

editor de datos. Se requiere una columna por cada factor controlado en el experimento, más la

columna de la variable de respuesta. En este caso del DCL se requieren 4 columnas:

Factor llanta

Factor de Bloque Posición

Factor de Bloque Carro

Respuesta

1) Se insertan los datos en una hoja de trabajo, agrupados en columnas (C1, C2, C3 y C4), cada

columna identifica un factor distinto además de la de la respuesta, se les ha nombrado

“Llanta”, “Posición”, “Carro” y “Respuesta”.

Page 3: Uso de Software computacional Disenos Estadistica

Se debe tener sumo cuidado de colocar las combinaciones de valores en forma correcta como se

muestra:

Se aprecia que para Posición 1 con Carro 1 la llanta “C” tiene un valor de 12; para el carro 1,

posición 2 y llanta “B” tiene un valor de 14 y así sucesivamente hasta completar las 16

combinaciones del ejemplo. Nótese que los datos pueden ser introducidos como el

experimentador crea conveniente al igual que el orden de las columnas, siempre y cuando

estén en su correcta combinación: el orden de los factores no altera el producto, en este

caso, el ANOVA.

2) Se accede a la secuencia:

Estadisticas►ANOVA ►Modelo lineal general

En el cuadro de dialogo que aparece situarse en Respuestas y elegir “C4 Respuesta” y dar clic en

Seleccionar, hacer el mismo procedimiento para llenar Modelo con Llanta, Posición y Carro:

Page 4: Uso de Software computacional Disenos Estadistica

3) A continuación hacer clic en Graficas y verificar “Cuatro en uno”, clic en Aceptar.

4) Nos devuelve al cuadro de Dialogo “Modelo Lineal General” ahora hacer clic en Graficas de

Factores, como lo que nos interesa es saber la efectividad de las llantas, bajo Grafica de efectos principales, en Factores seleccionamos “Llanta” y Aceptar

5) Finalmente clic en “Aceptar” en cuadro de dialogo “Modelo lineal general” para que Minitab

se encargue de realizar los cálculos correspondientes a los atributos marcados y generar las gráficas seleccionadas.

Page 5: Uso de Software computacional Disenos Estadistica

6) Interpretemos el ANOVA:

Modelo lineal general: Respuesta vs. Llanta, Posición, Carro Factor Tipo Niveles Valores

Llanta fijo 4 A, B, C, D

Posición fijo 4 1, 2, 3, 4

Carro fijo 4 1, 2, 3, 4

Análisis de varianza para Respuesta, utilizando SC ajustada para pruebas

Fuente GL SC sec. SC ajust. MC ajust. F P

Llanta 3 5.688 5.688 1.896 0.37 0.775

Posición 3 16.187 16.187 5.396 1.07 0.431

Carro 3 103.688 103.688 34.563 6.83 0.023

Error 6 30.375 30.375 5.062

Total 15 155.938

S = 2.25 R-cuad. = 80.52% R-cuad.(ajustado) = 51.30%

El único efecto significativo se encuentra en el factor de bloque “carro” ya que su valor-p 0.023 es

menor que α=0.05 y los otros dos no, por lo tanto se concluye que al aceptar la Hipótesis nula en

estos dos factores, se consideran estadísticamente iguales ergo no se hacen más pruebas con cada

llanta, que es lo que interesaba medir eficiencia; si se quiere obviar este dato se puede revisar la

gráfica de Interacciones principales obtenida para decidirse por cual marca de llanta decantarse:

Dado que a mayor desgaste resulta peor la llanta, de esta grafica se puede ver que la de la Marca “B”

es la que no conviene y en cambio la de marca “C” es la que se propone comprar.

Page 6: Uso de Software computacional Disenos Estadistica

7) Para comprobar los supuestos del modelo abrimos la “Grafica de Residuos para Respuesta”

En la gráfica de probabilidad normal los datos tienden a ajustarse a la línea recta, y en la

contigua vs. Ajustes no se observan patrones, se considera un modelo con calidad de ajuste

aceptable.

En conclusión se responden las preguntas:

¿Existe alguna llanta que sea mejor? Argumente su respuesta

No, todas resultan iguales ante el método ANOVA por eso no se puede decir que una sea

mejor.

¿Existe efecto en la posición de las llantas?

No, no importa la posición.

¿Hay diferencias entre los cuatro tipos de carro?

Si, los carros con que se hiso el experimento influyen en la respuesta, pero este factor solo

es de bloqueo por lo que no era de importancia vital.

Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Se cumplen ambos, se puede confiar en nuestras conclusiones.

Page 7: Uso de Software computacional Disenos Estadistica

Ejemplo Diseño factorial con dos factores:

Factorial 4x3. Consideremos un experimento en el que se quiere estudiar el efecto de los factores

A: Profundidad de corte sobre el acabado de un metal

B: Velocidad de alimentación

Se decide correr un factorial completo 4 x 3 con tres replicas, que permitirá obtener toda la

información relevante en relación al efecto de estos factores sobre el acabado. Al aleatorizar las 36

pruebas se obtienen los datos:

B: Velocidad

0.20 0.25 0.30

A: Profundidad

0.15 74 64 60

92 86 88

99 98 102

0.18 79 68 73

98 104 88

104 99 95

0.21 82 88 92

99 108 95

108 110 99

0.24 99 104 96

104 110 99

114 111 107

El acabado (Y) está en unidades de gramos e interesa minimizar su valor.

Lo que nos interesa es saber si los efectos principales (A y B) y la interacción (AB) son significativos,

esto se comprueba contrastando las hipótesis:

H0 = Efecto de profundidad (A) = 0

HA = Efecto de profundidad (A) ≠ 0

H0 = Efecto de velocidad (B) = 0

HA = Efecto de velocidad (B) ≠ 0

H0 = Efecto profundidad x velocidad (AB) = 0

HA = Efecto profundidad x velocidad (AB) ≠ 0

Pasos para realizar el ANOVA y graficas que interesan:

1) En un hoja de trabajo nueva, se accede a la secuencia:

Estadisticas►DOE ►Factorial►Crear diseño factorial

Page 8: Uso de Software computacional Disenos Estadistica

2) Consecuencia de lo anterior, debe aparecer la siguiente pantalla “Crear Diseño Factorial”

(CDF) donde hay que verificar “Diseño factorial completo general” y de la lista desplegable

de numero de factores, seleccionar “2”, como se muestra en la figura:

3) En CDF Hacer clic en “Diseños” hay que dar nombre a los efectos (para fines prácticos se

deja “A” y “B”, son profundidad y velocidad, respectivamente) e introducir número de

niveles, a continuación se elige “3” en número de réplicas, que son el número de corridas

que se hiso en el experimento con factor A y B. Clic en Aceptar después de introducir los

datos.

Page 9: Uso de Software computacional Disenos Estadistica

4) En pantalla CDF Ahora, hacer clic en “Factores”, donde seleccionaremos ambos de tipo

“Numerico” e ingresaremos los “Valores de nivel" acorde a los impuestos por el problema,

clic “Aceptar”.

5) Por último en pantalla Crear diseño factorial (CDF), ahora hacer clic en “Opciones” y

desactivar la casilla de verificación “Aleatorizar corridas”, esto con el fin de poder introducir

la información de manera más eficaz; Aceptar.

6) Aceptar en pantalla CDF y el programa crea las columnas de los tratamientos, lo único que usted

tiene que ingresar a MINITAB es una columna con la respuesta del experimento (Acabado).

Page 10: Uso de Software computacional Disenos Estadistica

7) Proceda entonces a ingresar los datos en columna “Acabado” (note que los tratamientos

siguen un patrón, esto es consecuencia de quitar la opción <<Randomize Runs>>) de

acuerdo con la tabla del problema, igualmente que con diseño en bloques, cuidar de

insertarlos en su combinación correcta, en este caso son 36 réplicas (AxBxn = 4x3x3 = 36)

En esta figura solo se ven los primero 13 datos, ingrese los 23 restantes.

8) Ya introducidos todos los datos, procedemos a la cadena:

Estadisticas►DOE ►Factorial►Analizar diseño factorial

9) En pantalla resultante “Analizar diseño factorial” (ADF) hacer clic en C7 Acabado y

“Seleccionar”.

Page 11: Uso de Software computacional Disenos Estadistica

10) Después clic en Graficas y marcar “Cuatro en uno” -> Aceptar en Graficas y Aceptar en ADF.

11) Minitab expondrá antes que nada las gráficas de residuos, en las cuales al parecer se

cumplen los supuestos del modelo descritos antes, minimizarla para ver el ANOVA.

12) En la ventana de Sesión, inicialmente aparecerá un resumen de todos los atributos del modelo (Factores, Corridas base, replicas, etc) pero lo que nos interesa es el ANOVA:

Análisis de varianza para Acabado, utilizando SC ajustada para pruebas

Fuente GL SC sec. SC ajust. MC ajust. F P

A 3 2125.11 2125.11 708.37 24.66 0.000

B 2 3160.50 3160.50 1580.25 55.02 0.000

A*B 6 557.06 557.06 92.84 3.23 0.018

Error 24 689.33 689.33 28.72

Total 35 6532.00

S = 5.35931 R-cuad. = 89.45% R-cuad.(ajustado) = 84.61%

Ahora podemos afirmar que los tres efectos (A,B,AB) son significativos (están activos o influyen en el acabado). Dado que el efecto de interacción AB está activo prácticamente toda la información relevante del experimento se aprecia en una representación gráfica.

Page 12: Uso de Software computacional Disenos Estadistica

13) Para visualizar la gráfica de interacción, se procede a:

Estadisticas►DOE ►Factorial►Graficas factoriales

Marcar la casilla de “interacción” y a continuación clic en “configuración”

14) Seleccionar C7 Acabado en “Respuestas” y escoger “A” y “B” como <<Factores a incluir en

Graficas>>

Posterior a ello clic en Aceptar de este cuadro de dialogo y después Aceptar en el de graficas factoriales.

Page 13: Uso de Software computacional Disenos Estadistica

15) Interpretación de Grafica de Interacción:

Nótese que aparecen tantas líneas como niveles tenga el factor que se dibuja en la parte de

arriba, que en este caso es la profundidad con sus cuatro niveles (0.15, 0.18, 0.21, 0.24). La

significancia de la interacción detectada por el ANOVA se observa en el hecho que las líneas

en la figura tienen pendientes relativamente diferentes.

Conclusión:

Como lo que interesa es minimizar la variable de respuesta, se observa que a mayor

velocidad y profundidad hay una tendencia a obtener peores acabados. Además se puede

ver que cuando se tiene velocidad alta el efecto de profundidad es menor, por tanto, las

condiciones de operación o tratamiento que convienen es profundidad y velocidad bajas

(A=0.15 y B=0.20)

Resolución General

En un diseño aleatorizado por bloques disponemos de dos valores de F para contrastar: uno

relativo a la influencia del tratamiento y otro para la influencia del bloque; aunque el

contraste en el que seguramente estamos interesados es solo el primero, ya que de entrada

se supone que el bloque sí que influye en la variable medida y precisamente por eso se ha

acudido a este tipo de diseño.

Los denominados diseños factoriales permiten al investigador planificar un trabajo para

evaluar el efecto combinado de dos o más variables de forma simultánea en el resultado

medido, obteniéndose también información en cuanto a la posible interacción entre los

diversos factores.