M1_DOE_T1-7

110
Diseño de Experimentos Tema Módulo 1 Módulo 1. Conceptos fundamentales de diseño de experimentos Tema 1. Introducción al diseño de experimentos Para resolver situaciones de falla en un proceso industrial, es cada día más frecuente realizar una planeación de mantenimiento predictivo basado en mediciones y estadísticas generadas a partir de los datos recabados. Para determinar el proceso a seguir en este tipo de mantenimiento es necesario determinar los parámetros del proceso con base en el diseño de algún experimento. Así como en este proceso, el diseño de experimentos es necesario también ante otras situaciones que están sujetas a variables aleatorias. Checkpoint: Los conceptos de experimento, modelo y variable. El concepto de diseño de experimentos. 1.1 Conceptos básicos Un experimento es una serie de pasos a través de los cuales se trata de probar una o varias posibilidades en la que se encuentra una determinada situación. A través de una o varias pruebas se determinan los parámetros estadísticos que nos muestren la aproximación entre el modelo supuesto del proceso (industrial u otro) y el mundo real, conocido aproximadamente a través de datos obtenidos por mediciones. Tipo del modelo, puede ser: a. Una relación funcional, en general a través de una ecuación que aproxime la relación entre las variables (x, y), de tal forma que y = f(x) y algún indicador que nos muestra qué tan ajustada es la aproximación del modelo con el proceso físico. b. Simplemente un conjunto de indicadores estadísticos, como la media, la varianza, la propia distribución de probabilidad de la población estudiada, etc. Así que, tomando en cuenta los conceptos anteriormente expuestos, un diseño estadístico de experimentos se refiere al proceso que hay que seguir para determinar las relaciones entre el modelo supuesto y el fenómeno físico real. En este proceso diferentes autores presentan etapas a seguir para realizar el diseño experimental, la metrología necesaria para recabar datos que nos den información relevante y el proceso de experimentación, propiamente dicho. Las variables escogidas para realizar el experimento deben ser significativas ; esto es, tomar en cuenta las variables que son relevantes en el fenómeno en cuestión: hay [Escriba aquí] Pág. 1 de 110

description

calidad

Transcript of M1_DOE_T1-7

Diseo de ExperimentosTema 8Mdulo 2

Mdulo 1. Conceptos fundamentales de diseo de experimentosTema 1. Introduccin al diseo de experimentosPara resolver situaciones de falla en un proceso industrial, es cada da ms frecuente realizar una planeacin de mantenimiento predictivo basado en mediciones y estadsticas generadas a partir de los datos recabados. Para determinar el proceso a seguir en este tipo de mantenimiento es necesario determinar los parmetros del proceso con base en el diseo de algn experimento.As como en este proceso, el diseo de experimentos es necesario tambin ante otras situaciones que estn sujetas a variables aleatorias.Checkpoint: Los conceptos de experimento, modelo y variable. El concepto de diseo de experimentos.

1.1 Conceptos bsicosUn experimento es una serie de pasos a travs de los cuales se trata de probar una o varias posibilidades en la que se encuentra una determinada situacin.A travs de una o varias pruebas se determinan los parmetros estadsticos que nos muestren la aproximacin entre el modelo supuesto del proceso (industrial u otro) y el mundo real, conocido aproximadamente a travs de datos obtenidos por mediciones.Tipo del modelo, puede ser: a. Una relacin funcional, en general a travs de una ecuacin que aproxime la relacin entre las variables (x, y), de tal forma que y = f(x) y algn indicador que nos muestra qu tan ajustada es la aproximacin del modelo con el proceso fsico.b. Simplemente un conjunto de indicadores estadsticos, como la media, la varianza, la propia distribucin de probabilidad de la poblacin estudiada, etc. As que, tomando en cuenta los conceptos anteriormente expuestos, un diseo estadstico de experimentos se refiere al proceso que hay que seguir para determinar las relaciones entre el modelo supuesto y el fenmeno fsico real.En este proceso diferentes autores presentan etapas a seguir para realizar el diseo experimental, la metrologa necesaria para recabar datos que nos den informacin relevante y el proceso de experimentacin, propiamente dicho.Las variables escogidas para realizar el experimento deben ser significativas; esto es, tomar en cuenta las variables que son relevantes en el fenmeno en cuestin: hay que tomar en cuenta que estas variables son muy probablemente la causa de la variabilidad del proceso: Variables de control (de entrada al proceso) Variables del proceso Variables aleatorias externas al proceso, que interfieren con el resultado esperado y que no son controlables al 100%; por ejemplo, aspectos ambientales como la temperatura, la humedad, el ruido, etc. 1.2 Definiciones elementalesDiseo de experimentos: Se refiere al proceso de planear el experimento de tal forma que se recaben datos adecuados que puedan analizarse con mtodos estadsticos que llevarn a conclusiones vlidas y objetivas (Montgomery, 2005).Esta planeacin ha de tener tambin las siguientes caractersticas:1. Que sea desde un enfoque cientfico2. Que llegue a conclusiones nuevas3. Que incluya mtodos propios de ingeniera

Figura 1.1 Diagrama de control de un proceso

Experimento: Es un cambio en las condiciones de operacin de un sistema o proceso, que se hace con el objetivo de medir el efecto del cambio sobre una o varias propiedades del producto o resultado (Gutirrez, 2008).Proceso (estocstico): aquel que es influido por variables (de entrada y salida), factores (que influyen en el estudio) y perturbaciones aleatorios.Unidad experimental: es el conjunto de elementos de muestra, los equipos para tomar dicha muestra y la metodologa que se sigue para que los resultados sean confiables.

Variables

De entrada Dado que se busca una relacin y = f(x) es necesario identificar tambin las variables de entrada (independientes) x, que influyen principalmente en la salida.De salida Dado que se busca una relacin y = f(x) es necesario identificar las variables de salida (dependientes) y, que se medirn en cada experimento.

Factores:

Controlables Son todas las variables que pueden llegar a ser motivo de estudio, ya que forman parte del proceso en experimentacin. El control que se tenga sobre ellas depende del tipo de variable manejada: elctrica, mecnica, qumica, dureza, etc.MensurandoSe refiere a la variable en particular, que va a ser motivo de estudio durante el experimento

Perturbaciones:

RuidoSe refiere a las variables aleatorias, de diferente naturaleza a la variable en estudio, externas al proceso en estudio y que por lo tanto no son controlables; sin embargo, al llegar a determinar su influencia en el proceso, con el adecuado sistema de control se puede llegar a darle estabilidad al experimentoInterferenciaSe refiere a las variables aleatorias de la misma naturaleza a la variable en estudio, externas al proceso en estudio y que por lo tanto no son controlables; sin embargo, al llegar a determinar su influencia en el proceso, con el adecuado sistema de control se puede llegar a darle estabilidad al experimento.DistorsinSe refiere a las variables aleatorias internas al proceso en estudio, y que aunque tampoco pueden ser totalmente controlables, pueden ser disminuidas con un rediseo del proceso.

Factores:

Niveles:Son los coeficientes que acompaan a cada variable o factor involucrado en el proceso, y que va ser estudiado en un diseo experimental.ejemplo, si tenemos los elementos del proceso compuesto de las variables v1 y v2 y los factores f1 y f2, cada uno de ellos puede ser acompaado de un factor a, b, c o d, quedando las variables: av1 y bv2 y los factores cf1 y df2.Tratamientos:Una combinacin de niveles de todos los factores.ejemplo, si el proceso est determinado por la funcin y = f(x), y es una funcin lineal, entonces la combinacin de variables y factores puede quedar como y = av1 + bv2 + cf1 + df2

Ejemplo: determinar las variables y factores, a diversos niveles, que intervienen en el proceso de la extrusin del plstico: Figura 1.2 Mquina extrusoraProceso: mquina extrusora

VariableFactor controlableFactor de ruidoNivel

Velocidad del husilloSINODado por el proceso

Temperatura del canSINODado por el proceso

Presin en el moldeSINODado por el proceso

ColorSINODado por el proceso

Calidad del plsticoNOSIDentro de las especificaciones del proveedor

Temperatura ambientalNOSISemicontrolada por ventiladores

Humedad ambientalNOSISin control

Tabla 1: Mquina extrusora

Otro concepto importante en la medicin es la incertidumbre de la medicin, cuando son varios los factores que intervienen en el proceso. La incertidumbre es un parmetro que nos indica la variabilidad del proceso, debida a varios factores involucrados.1.3 Usos de los modelos experimentalesUna caracterstica de un experimento bien realizado es que sigue un modelo de diseo. El modelo se debe escoger de acuerdo a las caractersticas que se desean observar. Para ello es necesario tomar en cuenta, entre otros, los siguientes cuestionamientos: Los factores a diversos niveles, qu efecto tienen sobre las variables de salida? Al utilizar varios factores, se van a comparar entre s? Coinciden el valor mximo o mnimo del modelo con los valores del proceso? Se desea redisear el modelo? Se desea controlar factores, no ruido?Comparaciones simples:

Comparaciones simples

Cierre: Todo anlisis y diseo est fundamentado en la aplicacin que va a tener una teora bien fundamentada. Es por esto que debemos tener claros los conceptos involucrados en nuestro experimento, a travs del cual se pretende probar una o varias hiptesis.Igualmente, si pretendemos generar o analizar un modelo, debemos definir una serie de trminos y variables que nos ayuden a caminar por el proceso de experimentacin.Referencias bibliogrficas Gutirrez, H. y De la Vara, R. (2008). Anlisis y diseo de experimentos (2 ed.). Mxico: McGraw Hill. Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico: Limusa Wiley.

Tema 2. Modelos experimentalesEl diseo de experimentos es vital para que la ciencia obtenga avances significativos y la sociedad incremente su nivel de vida. Sin embargo, al aplicar el mtodo cientfico surgen infinidad de posibles maneras de agrupar la informacin; una gran cantidad de posibles modos de obtener mediciones y datos concretos. En este tema vers que existen diversas etapas en el diseo experimental que te permiten definir con claridad los procedimientos para el logro exitoso de un experimento; estudiars el proceso para lograr estas etapas y su aplicacin prctica.Por ejemplo, al automatizar la lnea de armado de los automviles se incluyen brazos robticos para el ensamble de las partes, y es necesario realizar un monitoreo de la precisin con que realizan su trabajo, ya que con el tiempo se van desajustando. Existen muchos sistemas para realizar este monitoreo y para elegir el mejor, se sugiere realizar un proceso de experimentacin siguiendo todas sus etapas.Checkpoint: Las etapas del diseo experimental y sus principios bsicos. El proceso de experimentacin.

2.1 Metrologa: etapas del diseo experimental (7 etapas): Montgomery (2012) propone 7 etapas para el diseo de experimentos:Etapa 1

Etapa 1. Reconocer y establecer el problemaAnte una situacin de mantenimiento o mejora de un proceso, el primer paso que debe dar el experimentador es identificar una serie de problemas a resolver para lograr los objetivos propuestos. De entre ellos hay que elegir aquel problema que ms impacte en el mantenimiento o la mejora del proceso

Etapa 2, 3

Etapa 2. Seleccin de factores, niveles y rangosEtapa 3. Seleccin de la variable de respuestaComo en el paso anterior, el experimentador identifica las variables de salida del proceso para elegir aquella o aquellas que sean ms significativas.Una vez identificadas las variables se procede a la seleccin de los factores que influyan a las variables; a continuacin se han de asignar los niveles y rangos que deben tener los factores.

Etapa 4

Etapa 4. Seleccin del diseo experimentalUna vez que se termina la planeacin previa al experimento, hay que determinar:a. Tamao de la muestrab. Orden de ejecucinc. RestriccionesEl diseo experimental tambin puede ser realizado utilizando algn paquete estadstico, que decidir el mejor diseo en funcin de datos de entrada como son los factores, niveles y rangos

Etapa 5Etapa 5. Realizar el experimentoAl realizar el experimento se ha de seguir el plan previamente realizado; sin embargo, si al realizar el experimento se ve conveniente redefinir el plan, este debe ser redefinido.

Etapa 6Etapa 6. Anlisis estadstico de los datosComo en la etapa 4, para realizar el anlisis estadstico de los datos el diseo experimental puede utilizar algn paquete estadstico, que realizar clculos y grficas de forma automtica

Etapa 7Etapa 7. Conclusiones y recomendacionesPara concluir es necesario que el experimentador que particip en la realizacin del experimento muestre sus propias conclusiones, y de acuerdo a estas y a problemas que quedaron pendientes de especificar realice las recomendaciones que crea conveniente.

Las primeras tres etapas son en realidad una planeacin previa al experimento. Las etapas 2 y 3 pueden realizarse simultneamente o en orden inverso (primero la etapa 3 y despus la etapa 2).

2.2 Principios bsicos del diseo experimental: Gutirrez (2008) propone los siguientes principios bsicos para el diseo de experimentos:ObservabilidadCualquier cosa observada se aprecia con variabilidad, as lo que se observa una vez no puede ser observado de la misma manera en una segunda o tercera vez.

Aleatorizacin:Para conseguir la independencia de los errores, el proceso de aleatorizacin se debe seguir en las corridas, materiales y equipos utilizados en el experimento.

Repeticin:Es correr ms de una vez un tratamiento o combinacin de factores, cuidando de no cambiar factores como son el experimentador, el equipo de medicin, etc. Si se cambia alguno de ellos estamos hablando de reproducibilidad, y no de repetitividad.

Bloqueo:Ya seleccionados los factores que se relacionan con la variable de salida, hay que controlar los niveles de ellos, desde el mnimo nivel de cero (la anulacin del factor) hasta el mximo nivel.

2.3 Proceso de experimentacinUn experimento es una serie de pasos a travs de los cuales se trata de probar una o varias posibilidades en la que se encuentra una determinada situacin.A travs de una o varias pruebas se determinan los parmetros estadsticos que nos muestren la aproximacin entre el modelo supuesto del proceso (industrial u otro) y el mundo real, conocido aproximadamente a travs de datos obtenidos por mediciones.El modelo puede ser: 1. Una relacin funcional, en general a travs de una ecuacin que aproxime la relacin entre las variables (x, y), de tal forma que y = f(x) y algn indicador que nos muestra qu tan ajustada es la aproximacin del modelo con el proceso fsico.2. Simplemente un conjunto de indicadores estadsticos, como la media, la varianza, la propia distribucin de probabilidad de la poblacin estudiada, etc.As que, tomando en cuenta los conceptos anteriormente expuestos, un diseo estadstico de experimentos se refiere al proceso que hay que seguir para determinar las relaciones entre el modelo supuesto y el fenmeno fsico real.En este proceso diferentes autores presentan etapas a seguir para realizar el diseo experimental, la metrologa necesaria para recabar datos que nos den informacin relevante y el proceso de experimentacin, propiamente dicho.Las variables escogidas para realizar el experimento deben ser significativas; esto es, tomar en cuenta las variables que son relevantes en el fenmeno en cuestin: hay que tomar en cuenta que estas variables son muy probablemente la causa de la variabilidad del proceso:1. Variables de control (de entrada al proceso)2. Variables del proceso3. Variables aleatorias externas al proceso, que interfieren con el resultado esperado y que no son controlables al 100%; como por ejemplo aspectos ambientales como la temperatura, la humedad, el ruido, etc.

Cierre: Es necesario seguir etapas bien definidas para llevar a cabo un experimento: las primeras etapas para realizar una planeacin previa al experimento; y las etapas subsecuentes para llevarlo a cabo. Terminando con las conclusiones y recomendaciones pertinentes al proceso llevado, siempre cuidando que durante todo el proceso de experimentacin se respeten los principios bsicos del diseo experimental.Referencias bibliogrficas: Gutirrez, H. y De la Vara, R. (2008). Anlisis y diseo de experimentos (2 ed.). Mxico: McGraw Hill. Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico: Limusa Wiley.

Tema 3. Conceptos bsicos para la prueba de hipotesisPara la correcta utilizacin de un modelo experimental hay que tomar en cuenta los parmetros estadsticos bsicos.Por lo que en este tema se presentarn los principales estadsticos que utilizaremos, como la media, varianza, desviacin estndar, histogramas, grficas de caja, muestreos, etc.Si por ejemplo en una escuela quieres saber si existe un buen nivel de lectura y redaccin en el grupo de quinto de primaria, puedes calcular la media y compararla con la media del nivel de lectura y redaccin de otras escuelas.Estadsticos ms especializados se repasarn a lo largo del curso.Checkpoint: Las caractersticas que deben tener los parmetros del muestreo. La representacin grfica de los diferentes tipos de distribuciones muestrales.

3.1 Conceptos bsicos de estadsticaMedia o valor esperado:

Para un conjunto de datos discretos x1, x2, ..., xn, con probabilidad p(xi ), se calcula con la sumatoria mostrada a continuacin:

Para un conjunto de datos continuos representados por su funcin de probabilidad, f(x), se calcula con la integral mostrada a continuacin:

Varianza: equivale a la media del error cuadrtico; el error cuadrtico de cada i-simo valor est dado por (xi- )2.

Para un conjunto de datos discretos x1, x2, ..., xn, con probabilidad p(xi ), se calcula como la suma de todos los errores respecto a la media poblacional (donde n es el nmero de datos):

Para un conjunto de datos continuos representados por su funcin de probabilidad f(x), se calcula con la integral mostrada a continuacin:

Desviacin estndar: es la raz cuadrada de la varianza.

Histograma: es una grfica en forma de barras, en la que el rea de cada barra es proporcional a la frecuencia con que se repite una variable (Ver el ejemplo).Distribucin de probabilidad continua: dado que una variable continua tiene infinidad de valores posibles, no se puede deducir la probabilidad de un valor especfico de la variable. Es por esto que la probabilidad se calcula a partir del intervalo dentro de la distribucin de probabilidad (ver el siguiente Ejemplo).

Grfica de caja: es una grfica, dividida en cuarteles. Al rectngulo se le llama caja y a los dos brazos se les llama bigotes. El valor central es la mediana (ver el Ejemplo 1).Durante 10 das, se tomaron 200 muestras (20 por da) del denier de rafia de polipropileno producido por una mquina extrusora de plstico.Notas:1 denier = 1 gramo por 9.000 metrosRafia (los hilos que salen del proceso de extrusin)Obtener:a. La media del denierb. La desviacin estndar del denierc. El histograma del denier con ajuste a la distribucin normald. La grafica de caja (denier vs da)

Solucin: utilizando el programa Minitab se obtuvieron los siguientes resultados (resaltando con negritas los solicitados en el ejemplo):VariableNN*mediaMedia del error estndarDesv.Est.MnimoQ1|Mediana

Denier20002499.73.7953.624002456.02503.0

Figura 3.1 Histograma de Denier Figura 3.2 Grfica de caja de Denier

3.2 MuestreoMuestreo aleatorio: de acuerdo a Montgomery, D. (2012), se le llama al proceso en el cual una muestra de tamao n puede ser sacada de una poblacin de tamao N con un nmero de combinaciones sin repeticin:Muestreo aleatorioPor ejemplo: una muestra de tamao n = 3 sacada de una poblacin de tamao N = 100, se puede realizar de:

Dada la gran cantidad de muestras posibles es necesario disponer de algn mecanismo para obtener dicha muestra: este mecanismo puede ser el uso de tablas de nmeros aleatorios o la utilizacin de funciones de alguna hoja de datos.Por ejemplo: con Excel podemos incluir la frmula =FACT(100)/(FACT(100-3)*FACT(3)) y as obtener el resultado

Media o valor esperado:

De acuerdo a Montgomery, D. (2012), para un conjunto de datos muestrales x1, x2, ..., xnse calcula como la suma de todos los valores dividida entre n grados de libertad (donde n es el nmero de datos):

Varianza:

Equivale a la media del error cuadrtico; el error cuadrtico de cada i-simo valor est dado por (xi - )2Para un conjunto de datos discretos x1, x2, ..., xn, se calcula como la suma de todos los errores respecto a la media muestral , dividida entre n - 1 grados de libertad (donde n es el nmero de datos):

Desviacin estndar: es la raz cuadrada de la varianza:

Por ejemplo: deseamos obtener la media y la desviacin estndar de una muestra n = 20:x1234567891011121314151617181920

y2833262627272828302532262530292732273131

Utilizando Excel, obtenemos = 28.4 y S = 2.458

3.3 Distribuciones mustralesHistograma: es una grfica en forma de barras en la que el rea de cada barra es proporcional a la frecuencia con que se repite una variable.La distribucin normal: Para Montgomery, D. (2012), la siguiente es la expresin de la distribucin normal de una variable aleatoria x, perteneciente a una poblacin de media y varianza 2:

Si la media = 0 y la varianza 2 = 1 tenemos la distribucin normal estndar. Si sustituimos:

Queda la siguiente frmula:

Figura 3.3 Grfica de distribucinTeorema del lmite central: si x1, x2, ..., xn,es una muestra de n variables aleatorias e independientes, con media , extradas de una poblacin con media y varianza 2, entonces existe una variable aleatoria z que tiende a la normalidad (distribucin gaussiana) cuando n :

Determinar el grado de normalidad que tienen:a. Los nmeros aleatorios generados con una hoja de clculo (en este ejemplo con Excel)b. El promedio de los mismos nmeros Nota: la prueba de normalidad de Anderson-Darling la presenta Minitab al realizar el anlisis. No es inters de este tema demostrar dicha prueba.

a. Generamos en una hoja de datos 300 muestras aleatorias (3 columnas de 100 valores cada una) con la funcin = 100*ALEATORIO()b. Obtenemos la media ,con la funcin = PROMEDIO (nmero 1: nmero 300) y la desviacin estndar ,con la funcin = DESVEST (nmero 1: nmero 300)c. En una cuarta columna calculamos el promedio de tres muestras, ,con la funcin = PROMEDIO (nmero 1: nmero 3)d. En la quinta columna calculamos los correspondientes valores de z con la ecuacin

e. Copiamos los 300 valores de x a una columna de Minitabf. Copiamos los 100 valores de z a otra columna de Minitabg. Realizamos la prueba de normalidad de Anderson-Darling con la siguiente secuencia de funciones de Minitab: Estadsticas > Estadsticas bsicas > Resumen grfico

Figura 3.4 Diagrama de control de un procesoh. Observamos los resultados: la distribucin de los 300 nmeros x tiene un A-cuadrado = 4.44, por lo tanto se aleja de la normalidad; la distribucin de los 100 nmeros z tiene un A-cuadrado = 0.23, por lo tanto se acerca a la normalidad.

La distribucin Ji cuadrada (): La siguiente, segn Montgomery, D. (2012), es expresin de la distribucin Ji cuadrada para una muestra de tamao n: x1, x2, ..., xn

Determinar el valor de X2a partir de una muestra de tamao n = 100 obtenida de una poblacin de varianza conocida = 3.

a. Generamos en una hoja de datos una columna con 100 muestras aleatorias =10*ALEATORIO()b. Obtenemos la media , con lo datos de la primera columna utilizando la funcin = PROMEDIO (nmero 1: nmero 100) = 4.658c. En la segunda columna calculamos los correspondientes valores de (xi - )2d. Obtenemos la suma , con lo datos de la segunda columna utilizando la funcin: = SUMA (nmero 1: nmero 100) = 668.9e. Calculamos el valor de , con la frmula = 223

La distribucin t para dos muestras, es segn Montgomery, D. (2012):

Determinar el valor de t0 a partir de dos muestra de tamao n1= 10 y n2 = 12 obtenidas de dos poblaciones de varianza desconocida.

a. Generamos en una hoja de datos una columna con 10 muestras aleatorias =10*ALEATORIO(),b. Generamos en una hoja de datos otra columna con 12 muestras aleatorias =9*ALEATORIO(),c. Obtenemos la media 1, con lo datos de la primera columna utilizando la funcin = PROMEDIO (nmero 1: nmero 10) = 4.880. d. Obtenemos la media 2, con lo datos de la segunda columna utilizando la funcin = PROMEDIO (nmero 1: nmero 12) = 3.9517.e. Obtenemos la varianza S1, con lo datos de la primera columna utilizando la funcin = VAR (nmero 1: nmero 10) = 6.534. f. Calculamos la varianza combinada con n1 + n2 2 grados de libertad con la expresin: = 7.403 g. Calculamos el valor de t0 con la frmula: = 0.7968.

Cierre: Aunque, como se indic en la introduccin, los estadsticos necesarios para cada tema se repasarn a lo largo del curso, aqu se presentaron los estadsticos ms utilizados para el diseo de experimentos. Hay que familiarizarse con algn programa de probabilidad y estadstica que nos ayude a resolver los problemas y que nos presente resultados en forma de tablas o grficas. Adems es una herramienta bsica para comprobar resultados.Referencia bibliogrfica: Montgomery, D. (2012). Diseo de experimentos (2a ed.). Mxico: Limusa Wiley.

Tema 4. Pruebas de hiptesis 2Un paso muy importante en el anlisis y diseo de experimentos, despus de la planeacin preexperimental, es la seleccin del diseo experimental, en el cual hay que seleccionar la prueba de hiptesis que ms convenga para el caso en estudio. Por lo que hay que tener a la mano el abanico de posibilidades. En este tema veremos las pruebas respecto a la media de la poblacin o de la muestra, segn convenga.Este anlisis se realiza de acuerdo a si queremos comparar la media con un valor preestablecido o si lo queremos hacer comparando dos medias.Checkpoint: Cmo distinguir entre utilizar una prueba de medias con varianza conocida o varianza desconocida. Cmo distinguir entre utilizar una prueba de dos colas o de una cola.

4.1 Pruebas de hiptesis sobre dos mediasPara realizar las pruebas de hiptesis sobre dos medias, existen dos procedimientos en general, las que se refieren a las pruebas con varianza conocida y con varianza desconocida, las que se estudiarn en los siguientes apartados.Suponiendo que tomamos dos muestras, desde diferentes poblaciones, calculamos sus medias y sus desviaciones estndar. Iniciamos nuestro modelado suponiendo que tienen distribucin normal, as que graficamos ambas distribuciones para ver grficamente sus relaciones:

Figura 4.1 Distribuciones estadsticas de dos muestrasUna prueba estadstica para verificar con mejor precisin la relacin que existe entre las dos poblaciones desde las cuales se extrajeron las muestras, puede ser la verificacin respecto a la diferencia de ambas medias:Llamamos la hiptesis nula a la igualdad entre las medias en estudio: 1 = 2Llamamos la hiptesis alterna o alternativa a la desigualdad entre las medias en estudio.Puede ser de tres tipos de hiptesis: Cuando suponemos que son simplemente diferentes Cuando suponemos que una de ellas es mayor que la otra Cuando suponemos que una de ellas es menor que la otraDespus hay que fijar un criterio para aceptar o rechazar la hiptesis nula. Si aceptamos la hiptesis nula significa que rechazamos la alterativa, y si rechazamos la hiptesis nula significa que aceptamos la alternativa. (no tiene error y si tiene error)Se acepta la hipostesisSe rechaza la hiptesis

Error tipo alfa Error tipo Beta

Intervalo de confianza: Segn Montgomery (2012) un intervalo de confianza se fija de acuerdo al coeficiente de confianza (1 - ). Si tomamos una muestra aleatoria de tamao n, con media de una poblacin con varianza conocida 2, entonces el intervalo de confianza est dado por la expresin:

4.2 Pruebas de hiptesis sobre dos medias con varianza conocidaEl estadstico de prueba, sobre una media poblacional 0, con varianza 2conocida respecto a otra media , de una muestra de tamao n:

Esta frmula se utiliza en las siguientes pruebas:Prueba sobre una media

PruebaH0:H1:Criterio de rechazo

1 = 0 0

2 > 0

3 < 0

El estadstico de prueba, sobre una media 1, de tamao n1con varianza 12conocida, respecto a otra media 2, de tamao n2con varianza, 22conocida:

Se utiliza en las siguientes pruebas:Prueba sobre dos medias

PruebaH0:H1:Criterio de rechazo

11 = 21 2

21 > 2

31 < 2

EjemploProbar la hiptesis de que H0: 1 = 2 y H1: 1 > 2 respecto a dos poblaciones de varianzas conocidas 12 = 8.4 y 22 = 7.2.

Solucin

1. Se toman dos muestras iguales: n1 = 10 y n2 = 10.2. Se calculan las medias muestrales: 1 = 102.5 y 2 = 99.63. Se calcula: 4. Se determina: para = 0.055. Se realiza la comparacin: >

4.3 Pruebas de hiptesis sobre dos medias con varianza desconocida: Para Montgomery (2012) el estadstico de prueba sobre una media poblacional , con varianza desconocida respecto a otra media , de tamao n, se representa con la siguiente frmula:

Esta frmula se utiliza en las siguientes pruebas:Prueba sobre una media

PruebaH0:H1:Criterio de rechazo

1 (dos colas) = 0 0

2 (una cola) > 0

3 (una cola) < 0

El estadstico de prueba, sobre una muestra de media 1, de tamao n1y con varianza S12, respecto a otra muestra de media 2, de tamao n2y con varianza, S22, representa los grados de libertad.

Esta frmula se utiliza en la siguiente prueba:Prueba sobre dos medias

PruebaH0:H1:Criterio de rechazo

11 = 21 < 2

21 > 2

Si en el caso anterior S12 = S22 = Sel estadstico de prueba, sobre una muestra de media 1, de tamao n1respecto a otra muestra de media 2, de tamao n2, representa los grados de libertad.

= n1 + n2 - 2Esta frmula se utiliza en la siguiente prueba:Prueba sobre dos medias

PruebaH0:H1:Criterio de rechazo

11 = 21 2

EjemploProbar la hiptesis de que H0: 1 = 2 y H1: 1 > 2 respecto a dos poblaciones de varianzas desconocidas.

Solucin

1. Se toman dos muestras iguales: n1 = 10 y n2 = 10.2. Se calculan las medias muestrales: 1 = 102.5 y 2 = 99.63. Se calculan las varianzas muestrales: S1 = 8.4 y S2 = 7.24. Se calcula: 5. Se determina: para = 0.056. Se realiza la comparacin: < -

Cierre: Al tener clasificadas las diversas pruebas de hiptesis, se tomarn decisiones con mayor certeza al seleccionar la prueba que ms convenga para el caso en estudio. De aqu que hay que tener a la mano la variedad de pruebas que pueden ser realizadas. De acuerdo al proceso en estudio, se extraen las variables que se desean verificar.Referencia bibliogrfica: Montgomery, D. (2012). Diseo de experimentos (2a ed.). Mxico: Limusa Wiley.

Tema 5. Pruebas de hiptesis 3Un paso muy importante en el anlisis y diseo de experimentos, despus de la planeacin preexperimental, es la seleccin del diseo experimental; en el cual hay que seleccionar la prueba de hiptesis que ms convenga para el caso en estudio. Debido a lo anterior, es necesario tener a la mano el abanico de posibilidades. En este tema veremos las pruebas respecto a la varianza de la poblacin o de la muestra, segn convenga.Este anlisis se realiza de acuerdo a si queremos comparar la varianza con un valor preestablecido o si lo queremos hacer comparando dos varianzas.Checkpoint: Cmo distinguir entre utilizar una prueba sobre una varianza o sobre dos varianzas. Cmo distinguir entre utilizar una prueba de dos colas o de una cola.

5.1 Pruebas de hiptesis sobre una varianza: De acuerdo a Montgomery, D. (2012), el estadstico de prueba, sobre una varianza poblacional (02)conocida, respecto a otra varianza S2, obtenida de una muestra de tamao n:

Esta frmula se utiliza en las siguientes pruebas:Prueba sobre una media

PruebaH0:H1:Criterio de rechazo

12 = 02 02

22 > 02

32 < 02

EjemploProbar la hiptesis de que H0: 2 = 02 y H1: 2 > 02 respecto a una poblacin con distribucin normal con varianza 2 = 2.4 si 02 = 1.3.

Solucin:1. Se toman una muestras: n = 102. Se calcula la varianza muestral: S2 = 1.9 3. Se calcula: = 4. Se determina: para = 0.05 en la tabla de Tstudent de cola a la derecha con 9 de libertad y = 0.05 el valor es: 1.833Falta encontral el limite de control para despes comparar5. Se realiza la comparacin:

5.2 Pruebas de hiptesis sobre dos varianzas: Para Montgomery, D. (2012) el estadstico de prueba, sobre una varianza S12, obtenida de una muestra de tamao n1, respecto a otra varianza S22, obtenida de una muestra de tamao n2es:

Esta frmula se utiliza en las siguientes pruebas:Prueba sobre una media

PruebaH0:H1:Criterio de rechazo

1

2

3

EjemploProbar la hiptesis de que H0: 12 = 22 y H1: 12 > 22 respecto a dos poblaciones con distribucin normal.

Solucin:

1. Se toman dos muestras iguales: n1 = 10 y n2 = 102. Se calculan las varianzas muestrales: S1 = 8.4 y S2 = 7.23. Se calcula 4. Se determina para = 0.055. Se realiza la comparacin

5.3 Prueba de hiptesis sobre dos poblaciones: El objetivo de este tema tiene dos partes:1. Recapitular, en forma de diagramas de flujo, las pruebas de hiptesis estudiadas en los temas anteriores.2. Reflexionar sobre la dependencia e independencia de las variables, as como de su correspondiente intervalo de confianza. Parte 1. Diagramas de flujo de las pruebas de hiptesis (medias varianzas conocidas, distribucin normal)Diagrama de flujo 5.1 Pruebas de hiptesis sobre las medias

Diagrama de flujo 5.2 Pruebas de hiptesis sobre las varianzas

Parte 2. Reflexionar sobre la dependencia e independencia de las variables, as como de su correspondiente intervalo de confianza:

a. Definicin: dos o ms muestras son dependientes si se han obtenido de entre los mismos individuos.b. Diferencia de medias en dos muestras dependientes: Para Juan, A. (s. f.) el intervalo de confianza a nivel de confianza = 1 - , para d = A - Bviene dado por la ecuacin:

En la que es el valor que, en una t-Student con n-1 grados de libertad, deja a su derecha un rea ; y Sd es la desviacin estndar muestral de la variable aleatoria dependiente.c. Diferencia de medias en dos muestras independientesEl intervalo de confianza, a nivel de confianza = 1 - , para A - Bviene dado por la ecuacin:

Donde es el valor que, en una t-Student con los grados de libertad indicados, deja a su derecha un rea, y SA, SB son las desviaciones estndar de las muestras.

Cierre: Adems de las pruebas mostradas en el apartado anterior, aqu se presentaron diversas pruebas de hiptesis para la toma de decisiones, tambin con mayor certeza al seleccionarla para prueba que ms convenga para el caso en estudio.As pues, con estas pruebas se ampla el elenco necesario de pruebas que pueden ser realizadas y que hay que tener a la mano cuando, de acuerdo al proceso en estudio, se desee probar la variabilidad de alguna de sus variables.Referencias bibliogrficas Juan, A. (s. f.). Contraste de hiptesis de dos poblaciones. Recuperado de http://www.uoc.edu/in3/emath/docs/CH_2Pob.pdf Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico: Limusa Wiley.

Tema 6. Diseo completamente aleatorio 1El diseo completamente aleatorio se ha popularizado en ambientes de la industria qumica, con animales y con produccin de plantas de diversas ndoles. Actualmente, ha tomado impulso en otras clases de ambientes industriales, como productoras de derivados del polipropileno o la industria metalmecnica, ya que en ellas tambin se pueden hacer los arreglos necesarios para aplicar sus tcnicas: La asignacin de los tratamientos completamente al azar a las muestras del experimento, ya sean elementos individuales o grupos de individuos (de animales, plantas, tornillos o parmetros mtricos). La homogeneidad de las muestras para disminuir el error inherente al experimento. La aplicacin de tcnicas del anlisis de covarianza. La utilizacin con arreglos de tratamiento de tipo factorial. Adems, hay que considerar que en este tipo de diseo se asume que los datos son obtenidos de una poblacin con distribucin normal.Checkpoint: Las etapas para el diseo de experimentos de Montgomery y Gutirrez. Los conceptos: tratamiento, observacin, factor de efectos fijos balanceados, estimacin puntual y estimacin por intervalo.

6.1 Caractersticas de diseo y notacinCaractersticas: Como se describi en el mdulo anterior, Montgomery (2012) presenta siete etapas para el diseo de experimentos.A su vez, Gutirrez y De la Vara (2008) incluyen bsicamente las siete etapas mencionadas, sin embargo, al dividir el proceso en once etapas, presenta con un mayor detalle las caractersticas de cada una de ellas, como se presenta a continuacin: Seccin 1: Planeacin y diseo

a. Definir el problema o el objetivo. b. Hacer un esquema del estudio donde se seale el problema planteado.c. Determinar los factores que deben investigarse, de acuerdo a su posible impacto en el problema. d. Elegir las variables de respuesta que sern medidas en cada punto del diseo, y verificar que se miden de manera confiable. e. Seleccionar el diseo experimental adecuado a los factores que se tienen y al objetivo del experimento.f. Planear y organizar el trabajo experimental.g. Realizar el experimento.

Seccin 2: Anlisis e interpretacin

h. Hacer un anlisis detallado de los resultados experimentales.i. Interpretar resultados.j. Hacer corridas confirmatorias del proceso en el mejor tratamiento.

Seccin 3: Conclusiones finalesk. Cerrar y concluir el proyecto adecuadamente.

NotacinAl considerar varios tratamientos, la representacin de las variables, los factores, los estadsticos, de manera abreviada y no con toda la extensin de la palabra, tiene una representacin especial.Existe un tipo de notacin consistente en colocar en el subndice un punto. En este tipo de notacin, el punto significa que se est realizando la suma sobre la variable mostrada en el mismo subndice.Algunas de estas representaciones son las siguientes: i es el nmero del tratamiento que se est realizando de entre k tratamientos y puede tener el valor: i = 1, 2, , k. j es el nmero de observacin que se est tomando de entre las ni observaciones a llevar a cabo dentro de cada uno de los k tratamientos; esto es, estamos dentro del i-simo tratamiento, y puede tener el valor: j = 1, 2, , ni. Yij es la j-sima observacin en el tratamiento i. Yi es la suma de las observaciones del tratamiento i, y se calcula con la frmula siguiente:

es la media de las observaciones del i-simo tratamiento, y se calcula con la frmula siguiente:

Y es la suma total de las N = n1 + n2 + + nk mediciones, y se calcula con la frmula siguiente:

es la media global o promedio de todas las observaciones, y se calcula con la frmula siguiente:

Ejemplo Para realizar un experimento, se toman 3 tratamientos. Para cada tratamiento existen las observaciones mostradas en la siguiente tabla:TratamientoObservaciones

1107, 1, 3, 5, 8, 2, 3, 5, 6, 1

2124, 4, 3, 2, 1, 5, 7, 1, 1, 8, 2, 5

381, 6, 8, 4, 4, 2, 3, 1

Tabla 1. Tratamientos y observaciones1. Qu valor tiene k?2. Si consideramos el tratamiento i = 3, qu valor tiene n?3. Qu valor tiene Y36?4. Para las condiciones de la pregunta 2, qu valor tiene Yi? Solucin:1. Dado que existen 3 tratamientos, k = 3.2. Dado que el tratamiento i = 3, tiene 8 observaciones, n = 83. Dado que en el tratamiento k = 3, el 6 elemento es un 2, Y36 = 24. Dado que la suma de todos los elementos de la muestra del tratamiento k = 3: 1+ 6+ 8+ 4+ 4+ 2+ 3+ 1 = 29, resulta que Y3 = 29

6.2 Modelo de un factor de efectos fijos balanceadosSeleccionar el diseo experimental adecuado a los factores que se tienen y al objetivo del experimento es la decisin central, tanto en la etapa 4 de Montgomery como en la etapa 5 de Gutirrez.As, a lo largo del mdulo 1 se aplicaron mtodos estadsticos para el diseo de experimentos, basados en la comparacin de dos poblaciones diferentes, tanto en su comparacin de medias (con varianza conocida o desconocida), como en su comparacin de varianzas (bajo el supuesto de normalidad en la distribucin de las poblaciones puestas a prueba).Tambin podemos realizar nuestras comparaciones, si consideramos no ya dos factores a comparar, sino un solo factor pero con dos o ms niveles.As, cuando las observaciones, que siguen el modelo (dependen de la media poblacional de los tratamientos, y del error, debido a la medicin), se observan despus de utilizar todos los tratamientos posibles, decimos que se trata de un modelo de efectos fijos.Este modelo se utiliza cuando son pocos los tratamientos, de tal forma que se puedan utilizar todos ellos. Al utilizar todos los tratamientos, los parmetros de nuestra ecuacin se ajustarn mejor a la realidad.Notacin

SSTr es la varianza del error entre tratamientos, y se obtiene con la expresin:

SSE es la varianza del error dentro de los tratamientos, y se obtiene con la expresin:

SST = SSTr + SSE MSTr = SSTr / (a - 1) donde a - 1 son los grados de libertad.MSE = SSE / (N - a) donde N - ason los grados de libertad.

Ejemplo:Una empresa productora de bolsas de plstico est interesada en probar si una nueva cantidad de carbonato de calcio (CaCO3) para una nueva aplicacin hace que aumente la dureza (Mohs) de las bolsas. En pruebas anteriores se ha observado que la modificacin en la cantidad de carbonato hace variar la dureza, y se sospecha que a mayor cantidad de carbonato, la dureza aumenta. Por la experiencia se sabe que para el tipo de bolsa realizada hasta el momento (PEAN-APM) una cantidad del 8% al 15% es suficiente, pero para el nuevo tipo de bolsa (PEBDL) aumentar la dureza de 14 al 20%.

Solucin:

Se decide realizar un experimento con:1. Cuatro niveles a = 4.2. Tres pruebas n = 3, para cada uno de los cuatro niveles, a*n = 12.3. Esto nos da que hay que realizar 12 corridas, a*n = 12, como se muestra en las columnas 2, 3 y 4 de la Tabla 2.4. En orden aleatorio, como se muestra en las columnas 5, 6 y 7 de la misma tabla. As, la corrida experimental 12 ser la primera en ser realizada, despus ser la corrida 6, etc., y al final la corrida 11. La generacin de nmeros aleatorios se realiz utilizando Minitab: Calc > Datos aleatorios > Muestreo por columnas.% de CaCO3Corrida ExperimentalOrden de ejecucin (aleatorio)

14123357

164561182

18789496

2010111210121

Tabla 2. Corridas experimentales

% de CaCO3Prueba

123TotalPromedio

149104237.667

168312237.667

185163248

209411248

Suma: 947.834

Tabla 3. Resultados

6.3 Estimacin puntual de los efectos y de la variable de respuestaUna poblacin se define por sus parmetros estadsticos: 1. La media, cuyo smbolo es la letra griega .2. La desviacin estndar, cuyo smbolo es la letra griega s, o en su caso por la varianza, cuyo smbolo es la letra griega .3. La proporcin de artculos defectuosos, cuyo smbolo es la letra p. Sin embargo, es frecuente que, ante un proceso industrial, estos parmetros sean desconocidos; lo que dificulta la toma de decisiones.La alternativa es realizar una estimacin de estos estadsticos, para lo cual se cuenta con dos procedimientos.1. Estimacin puntual

Se estiman los parmetros por medio de una muestra de tamao n, siguiendo los siguientes procedimientos: La media se estima por medio de la media de la muestra , que se representa con el smbolo . La varianza se estima por medio de la varianza de la muestra S2, que se representa con el smbolo . La proporcin p se estima por medio de la proporcin de elementos defectuosos x, tomados de una muestra de tamao n, en la que .

Ejemplo: se cuenta con una mquina de empaquetado de caf en bolsas de 1 kg, pero no se conocen los parmetros estadsticos, por lo que se desea realizar un experimento para conocerlos.Solucin: Para conocer los datos estadsticos de la mquina de empaquetado automtico de caf, se sigui el siguiente procedimiento: a. Se registr el peso de 100 paquetes de caf: n = 100.b. Se calcul la media de la muestra: 1.00382 kg. Esta media se puede utilizar como una estimacin puntual de la media del proceso.c. Se calcul la varianza de la muestra: S2 = 0.000545 kg, la cual se puede utilizar como una estimacin puntual de la varianza del proceso.d. Se registr el nmero de bolsas defectuosas x = 2. Se hace una estimacin puntual de la proporcin de defectuosos del proceso = x/n = 2/100 = 0.02.

2. Estimacin por intervalo

Para verificar los datos estadsticos de la mquina de empaquetado automtico de caf se repiti el procedimiento, registrando el peso de 100 paquetes de caf: n = 100, obteniendo los siguientes resultados: Se calcul la media de la muestra: =1.00243 kg., as como la varianza de la misma: S2 =0.000504 kg. Como se puede observar, al repetir el procedimiento anterior para estimar puntualmente los estadsticos, es probable que no se obtengan los mismos resultados. El propsito es generar un parmetro desconocido , de tal forma que este se encuentre dentro de un intervalo de confianza 100() %, y determinar dos valores (L y U), de tal forma que la probabilidad de que se encuentre entre estos dos valores sea igual a , que puede ser expresado por medio de la ecuacin:

Cierre: Aunque se tengan los escalones de la escalera de la experimentacin perfectamente ensamblados, no todo experimento se resuelve en forma automtica. Existe el riesgo de querer subir de dos en dos y saltar escalones intermedios.Diversos autores nos han presentado una ruta a seguir para proceder al anlisis y diseo de experimentos. Sin embargo, si no se tiene bien planteado el problema a analizar, adems de las variables involucradas y los factores de mayor impacto con todos sus niveles, va a ser muy deficiente el planteamiento del diseo experimental y, por lo tanto, su solucin. Al dar mal el primer paso va a ser muy difcil corregir una vez avanzado el proceso.Adems, hay que tener a la mano los conceptos estadsticos para realizar un correcto anlisis y una acertada interpretacin.Referencias bibliogrficas: Gutirrez, H. y De la Vara, R. (2008).Anlisis y diseo de experimentos (2 ed.). Mxico: McGraw-Hill. Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico. Limusa Wiley.

Tema 7. Diseo completamente aleatorio 2

En el tema anterior se analiz el modelo de un factor de efectos fijos balanceados, considerando un solo factor con dos o ms niveles y con diversos tratamientos. Para ellos hay tres formas de representar los resultados del anlisis: 1. Utilizando una tabla, como se vio en el tema anterior.2. Determinando una ecuacin que nos relacione las variables dependientes con las independientes. Este tema se enfoca en esta representacin y, a su vez, sirve como una introduccin analtica al concepto de anlisis de varianza.3. Utilizando diagramas. En matemticas por lo general las grficas nos presentan las relaciones funcionales de las variables y=f(x), ya en el campo de la probabilidad y estadstica. Esta representacin grfica va ms all, como se analizar en la segunda y tercer seccin de este tema.Checkpoint: Las representaciones por medio de ecuaciones lineales y los modelos ANOVA, medias y efectos. Los conceptos de error aleatorio de la medicin, valor esperado, diagrama de cajas, datos mtricos, datos categricos y datos ordenados por rango, las grficas de medias, las grficas de intervalos y las grficas de valores individuales.

7.1 Anlisis de varianza (One Way ANOVA)Adems de presentar los resultados del anlisis en una tabla o por medio de una grfica, es posible representarlos con un modelo, una ecuacin que relacione los resultados. Por ejemplo, se toma una muestra y, y se presenta en la siguiente tabla:x12345

y124816

Se analizan los datos y se determina que y es una funcin de x dada por la ecuacin y=0.5 (2x), la cual puede ser representada con la siguiente grfica:

Si queremos relacionar la ij_sima observacin yij con la media obtenida en el tratamiento i y con la muestra j, la forma ms sencilla de realizar esta relacin est dada por medio de la siguiente ecuacin:Ecuacin lineal 1

En la que es el error aleatorio de la medicin.Esta ecuacin es un modelo de medias.Si consideramos que la media de los errores es cero, entonces el valor esperado de la ij_sima observacin ser: .

Una forma alternativa es relacionar la observacin con , el efecto del i_simo tratamiento, en lugar del error aleatorio. Tomando esto en consideracin, otra forma lineal y, por lo tanto, la forma ms sencilla de realizar esta relacin est dada con la siguiente ecuacin:Ecuacin lineal 2

Esta ecuacin es entonces un modelo de efectos.Desde luego, esta ecuacin supone que:

Dado que en estas ecuaciones lineales, 1 y 2, la variable dependiente yij depende de una sola variable independiente (desde el punto de vista de la definicin de una funcin), ya sea el error aleatorio, para la primera ecuacin, o del efecto del i_simo tratamiento, para la segunda ecuacin, son llamadas como anlisis de varianza de un solo factor (tratamiento) o de una sola va.En estos modelos observamos dos parmetros:1. La media que viene a ser el valor esperado de la observacin. 2. El error aleatorio de la medicin que es la diferencia entre medicin y el valor esperado y los parmetros asociados a los tratamientos .

Como se va a ver en los siguientes temas, el anlisis de varianza (ANOVA) es el mtodo ms utilizado en el anlisis experimental. Est basado en el estadstico F, que viene a ser la relacin entre dos variables aleatorias ji cuadradas divididas entre sus correspondientes grados de libertad. A su vez, el estadstico ji cuadrado depende de un solo parmetro: sus grados de libertad. Por lo que se concluye que ANOVA simplifica mucho las decisiones.7.2 Diagrama de cajasLos datos pueden ser de tres formas: mtricos, ordenados por rango y categricos. Esto lo podemos ver ejemplificado durante una competencia deportiva de carreras: Se toma con bastante precisin el tiempo de los recorridos (datos mtricos). Pero lo que interesa al final de cuentas es ver quien lleg en primer lugar, quin en segundo, hasta ver quin lleg al ltimo (datos ordenados por rango). Al final de cuentas, lo que importa es si subiste o no al podio, y si fue medalla de oro, de plata o de cobre (datos categricos).As, los estadsticos, segn esta clasificacin, son los siguientes:1. La media y la varianza para una observacin se obtienen sobre datos mtricos. Las distribuciones de probabilidad, en sus diversas formas, y las grficas de medias se obtienen a partir de este tipo de datos.2. Las proporciones para una observacin se obtienen sobre datos categricos. Claro que una observacin puede ser mtrica y ms adelante organizarla por categoras. Pasando por un histograma, se puede aproximar este tipo de datos a algn tipo de distribucin de probabilidad.3. La mediana y los cuartiles para una observacin se obtienen sobre datos ordenados por rango. Igual que en el caso anterior, una observacin puede ser mtrica y ms adelante ordenarla por rangos y, posiblemente, ms adelante por categoras.Undiagrama de cajaes una forma grfica de representar la mediana, los cuarteles y los extremos de los datos. La distancia entre la media y los cuarteles se representan por un rectngulo o caja, y la distancia entre los cuarteles y los valores extremos se representan por lneas rectas que se conocen como bigotes por la apariencia que da en los diagramas.

Ejemplo: Realiza el diagrama de caja, con los datos de los tres tratamientos del ejemplo de la seccin 6.1 de este curso, registrados en la Tabla 1 (Tratamientos y observaciones).

Solucin: Sobre una tabla: 1. Registramos los datos.2. Ordenamos por rango (de menor a mayor).3. Observamos y registramos el mnimo, el mximo y la mediana.4. Para el tratamiento 1, observamos y calculamos Q1=2-0.25=1.75 y Q3=6+0.25=6.25. 5. Para el tratamiento 2, observamos y calculamos Q1=1.5-0.25=1.25 y Q3=5.6. Para el tratamiento 3, observamos y calculamos Q1 = 1.5-0.25=1.25 y Q3=5. 7. Copiamos los datos a Minitab, generando tres columnas.8. Comprobamos los resultados: Estadsticas > Estadsticas bsicas > Mostrar estadsticas descriptivas. 9. Generamos el diagrama de caja: Grfica > Grfica de caja. TratamientoDatosOrdenados por rangoMnimoQ1Q2: MedianaQ3Mximo

113582356111233 | 55678 = 11.7546.258

2443215711825111 | 223 | 445 | 57811.253.558

31684423111 | 23 | 44 | 6811.253.558

Tabla 1. Pasos para realizar el diagrama de caja10. Estadsticas descriptivas generadas con Minitab:

11. Diagrama de caja:

Grfica de caja 7.3 Grficas de mediasAdems de presentar los datos mtricos en una tabla o por medio de una frmula lineal, existen otras opciones que pueden ser muy significativas.La grfica de intervalos: se utiliza para graficar medias e intervalos de confianza o barras de error para una o ms variables. Una grfica de intervalo ilustra una medida de la tendencia central y la variabilidad de los datos.Nota: por opcin predeterminada, Minitab muestra intervalos de confianza de 95%. Para cambiar el tipo de presentacin o la configuracin de una grfica especfica, utilice Editor > Editar barra de intervalo > Opciones. Para cambiar el tipo de presentacin o la configuracin de todas las grficas de intervalo futuras, utilice Herramientas > Opciones > Grficas individuales > Grficas de intervalo. Tambin se pueden generar con las instrucciones: Estadsticas > ANOVA > Grficas de intervalo.Grfica > Grfica de intervalos.

Grfica de intervalosLa grfica de valores individuales: se utiliza para evaluar y comparar las distribuciones de muestra, al graficar valores individuales para cada variable o grupo en una columna vertical, con lo cual resulta ms fcil detectar valores atpicos y ver la distribucin (ayuda de Minitab). Nota: si varios puntos tienen el mismo valor, por opcin predeterminada Minitab los desplaza simtricamente desde el centro, de modo que cada punto idntico se pueda ver.Grfica > Grfica de valores individuales.

Grfica de valores individuales Cierre: La utilizacin de tablas, ecuaciones o diagramas para representar nuestros datos es importante, pero hay que recordar que la interpretacin de los datos involucrados es el objetivo principal del investigador. No hay que perderse en el proceso, sino ir al fondo del contenido de la informacin.Recuerda, no es que nos interese conocer unos datos perfectamente organizados yij, una ecuacin que nos represente funcionalmente las variables dependientes en funcin de las independientes y=f(x), o una grfica que visualmente nos impresione la pupila, lo que nos interesa es conocer y comprender la informacin contenida en esas representaciones.

Diseo de ExperimentosTema Mdulo 1

[Escriba aqu]Pg. 29 de 73Tema 8. Pruebas de rangos mltiples

Si observamos la siguiente grfica, se ve que tiene un crecimiento exponencial; pero si repetimos el experimento, se ver igual el resultado?, o bien, al cambiar el tratamiento con el que se realiz, se ver igual?Cuando se trata de comparar pares de medias de tratamientos, disponemos de las siguientes pruebas:1. De comparaciones mltiples (LSD-Least Significant Difference) 2. De Tukey 3. De rangos de Duncan En este tema trataremos estas pruebas para hacer una adecuada interpretacin de datos que nos lleve a la toma de decisin correcta.Checkpoint: La varianza del error entre, dentro y total, y los grados de libertad para los tratamientos. Las pruebas de comparaciones mltiples (LSD, Least Significant Difference), de Tukey y Rangos de Duncan.

ExplicacinPara los ejemplos de los subtemas 8.1, 8.2 y 8.3, utilizaremos las siguientes tablas: Suma de cuadradosGrados de libertadCuadrados mediosEstadstico F0

TratamientoSSTr =62320.66671.7841727

ErrorSSE = 92.6667811.5833

TotalSST =154.66711

Tabla 1. Resultados del ANOVAEn la que:a. SSTr es la varianza del error entre tratamientos, y se obtiene con la frmula:

b. SSE es la varianza del error dentro de los tratamientos, y se obtiene con la frmula:

c. SST = SSTr + SSE es la varianza del error total, y se obtiene con la frmula:SST = SSTr + SSE j =n =

123PromedioSuma

i =1A 14171214.333343

2B 1010161236

3C 1019101339

a =4D 1718191854

Tabla 2. Clculos previos

8.1 Pruebas de comparaciones mltiples (LSD least significant difference / diferencia mnima significativa) O PRUEBA DE FISHER

La prueba de comparaciones mltiples tambin conocida como mtodo Fisher de diferencia mnima significativa (Least Significant Difference) consiste en probar que las medias de dos poblaciones con a tratamientos son significativamente diferentes. De tal forma que la hiptesis nula se plantea con la expresin siguiente:

Realizamos una prueba de una cola, de tal forma que la hiptesis alterna se plantea con la expresin siguiente:

El procedimiento para realizar la prueba es el siguiente:1. Una vez obtenidos los datos en la tabla del modelo de un factor de efectos fijos balanceados (ver tema 6.2).2. Definir el nivel de significancia para realizar la prueba.3. Obtener a partir de una tabla. Por ejemplo la Tabla A.4 de Walpole (2012).4. Calcular MSE.5. Calcular el valor del estadstico LSD: Si las muestras son del mismo tamao, n = n1 = n2, es decir, el diseo est balanceado, calculamos el estadstico LSD con la siguiente frmula:

Si el diseo no est balanceado, es decir, para muestras de tamao diferente n1 y n2, calculamos el estadstico LSD con la siguiente frmula:

6. A continuacin realizamos una tabla con el valor absoluto de las diferencias entre tratamientos:

7. Aceptamos la hiptesis nula s:

Ejemplo Probar que las medias de dos poblaciones con 4 tratamientos son significativamente diferentes si ya disponemos de las medias de los 4 tratamientos realizados en un experimento anterior: ver Tabla 1 (Resultados del ANOVA). Suma de cuadradosGrados de libertadCuadrados mediosEstadstico F0

TratamientoSSTr =62320.66671.7841727

ErrorSSE = 92.6667811.5833

TotalSST =154.66711

Solucin:1. Tabla del modelo de un factor de efectos fijos balanceados con N = a*n = 12: Ver Tabla 2 (Clculos previos). j =n =

123PromedioSuma

i =1A 14171214.333343

2B 1010161236

3C 1019101339

a =4D 1718191854

2. Definimos que , por lo tanto .3. De la Tabla A.4 de Walpole (2012) obtenemos que .4. MSE = 11.5833.5. Calcular el valor del estadstico LSD: 6. Tabla con el valor absoluto de las diferencias entre tratamientos (sin repeticin):| 12 13 |1< 9.526Se acepta

| 12 14 |2< 9.526Se acepta

| 12 18 |2< 9.526Se acepta

| 13 14 |1< 9.526Se acepta

| 13 18 |5< 9.526Se acepta

| 14 18 |4< 9.526Se acepta

Tabla 3. Tabla de Resultados7. Rechazamos la hiptesis nula y, por lo tanto, aceptamos la hiptesis alterna s:

8.2 Prueba de TukeyLa prueba de Tukey consiste en probar que las medias de dos poblaciones con a tratamientos son significativamente diferentes. De tal forma que la hiptesis nula se plantea con la expresin siguiente:

Realizamos una prueba de dos colas, de tal forma que la hiptesis alterna se plantea con la expresin siguiente:

El procedimiento para realizar la prueba es el siguiente:1. Una vez obtenidos los datos en la tabla del modelo de un factor de efectos fijos balanceados (ver tema 6.2).2. Definir el nivel de significancia para realizar la prueba.3. Obtener a partir de una tabla. Por ejemplo, la Tabla VIII de Montgomery (2012), en la que f son los grados de libertad asociados con MSE.4. Calcular MSE.5. Calcular el valor del estadstico con la siguiente frmula:

6. A continuacin realizamos una tabla con el valor absoluto de las diferencias entre tratamientos:

7. Rechazamos la hiptesis nula y, por lo tanto, aceptamos la hiptesis alterna s:

EjemploProbar que las medias de dos poblaciones con 4 tratamientos son significativamente diferentes si ya disponemos de las medias de los 4 tratamientos realizados en un experimento anterior; ver Tabla 1 (resultados del ANOVA).Solucin:1. Tabla del modelo de un factor de efectos fijos balanceados con N = a*n = 12: Tabla 2. (clculos previos).2. Definimos que: .3. De la Tabla VIII obtenemos que .4. MSE = 11.58335. .6. Tabla con el valor absoluto de las diferencias entre tratamientos: | 12 13 |1< 8.91Se acepta

| 12 14 |2< 8.91Se acepta

| 12 18 |2< 8.91Se acepta

| 13 14 |1< 8.91Se acepta

| 13 18 |5< 8.91Se acepta

| 14 18 |4< 8.91Se acepta

Tabla 4. Tabla de Resultados7. Rechazamos la hiptesis nula y, por lo tanto, aceptamos la hiptesis alterna s: ; ver resultados en la Tabla 1. Tabla de Resultados.NOTA: se observa que los resultados coinciden con la prueba LSD.

8.3 Prueba de rangos de DuncanLa prueba de rangos de Duncan consiste en probar que las medias de dos poblaciones con a tratamientos son significativamente diferentes a travs de los rangos mnimos significativos (LSR, Least Significant Ranges).El procedimiento para realizar la prueba es el siguiente:1. Una vez obtenidos los datos en la tabla del modelo de un factor de efectos fijos balanceados (ver tema 6.2).2. Se ordenan por rango (de menor a mayor).3. Se calcula MSE.4. Calcular el error estndar con la siguiente frmula:

5. Definir el nivel de significancia para realizar la prueba.6. Obtener, para p = 2,3,,a partir de una tabla. Por ejemplo, la Tabla VII de Montgomery (2012).7. Calcular los n - 1 LSR con la siguiente frmula:

8. A continuacin realizamos una tabla con las diferencias entre las medias de los tratamientos (mayor menos menor): e incluimos en cada lnea la comparacin con los Rp. 9. Rechazamos la hiptesis nula y, por lo tanto, aceptamos la hiptesis alterna si existen diferencia significativas:

EjemploProbar que las medias de dos poblaciones con 4 tratamientos son significativamente diferentes si ya disponemos de las medias de los 4 tratamientos realizados en un experimento anterior; ver Tabla 1 (resultados del ANOVA).Solucin:1. Tabla del modelo de un factor de efectos fijos balanceados con N = a*n = 12; ver la Tabla 2. (Clculos previos).2. Se ordenan por rango (de menor a mayor); ver la Tabla 5 (clculos).

Paso 2:Paso 6:Paso 7: LSRsPaso 8: Diferencias y comparaciones

R0.05(2,8) =3.26R2 = 3.26*1.965 =6.414 vs.3: 18-14.34=4.34 < 6.413 vs.2: 14.34-3=1.34 < 6.412 vs.1: 13-12=1 F

Modelo40098.003.0013366.0039.07< 0.0001significant

A-A430.0015408.331.0015408.3345.040.0002

B-B526.0023056.331.0023056.3367.40< 0.0001

AB140.001633.331.001633.334.770.0604

Error2736.678.00342.08

Total42834.6711.00

Tabla 6. Tabla ANOVA con los resultados de la prueba del experimento a base de diseos factoriales 22Conclusiones: 1. Dado que el valor_p del modelo es menor a 0.05 es significante.2. Dado que el valor_p de A es menor a 0.05 es significante.3. Dado que el valor_p de B es menor a 0.05 es significante.4. Dado que el valor_p de AB es mayor a 0.05 no es significante.Es el proceso de los diseos factoriales 22 ms complicado que, por ejemplo, los cuadros latinos? Dado que este tipo de problemas se resuelve a travs de un cuadro ANOVA, la complejidad viene a ser la misma. Adems, al utilizar software como el Design Expert los clculos se simplifican muchsimo. Esto no quiere decir que el problema no se pueda resolver con una hoja de clculo.Sin embargo, utilizando Design Expert es posible obtener otros resultados:1. En forma de ecuacin como por ejemplo el modelo de regresin.2. En forma de tabla como por ejemplo, los valores para el modelo de regresin.3. En forma grfica como por ejemplo: la curva normal de los residuos o los residuos en funcin de los predecibles o de contorno o en 3D para superficies de respuesta. 13.2 Diseos factoriales 23 Aunque el caso ms general es cuando tenemos solo dos factores, A y B, se pueden dar dos situaciones:1. Se puede desear estimar la respuesta al aumentar un factor adicional. 2. De origen el problema presenta no dos sino tres factores. Por ejemplo: la velocidad del motor del automvil depende del octanaje de la gasolina, de la chispa de las bujas y del grado de mezcla con el aire.De tal suerte que la combinacin de ellos estar dada por su correspondiente producto: .De aqu que este tipo de diseo experimental es llamado diseo factorial 23.Como en todo sistema binario, los niveles pueden ser designados como 0 (cero) o 1 (uno), alto o bajo, + o -, A o B, etc.IABCABACBCABC

(1)+---+++-

a++----++

b+-+--+-+

ab+++-+---

c+--++--+

ac+-+-+--

bc-++--+-

abc+++++++

Tabla 2. Signos para calcular los efectos en el diseo factorial 22Fuente de variacinSuma de cuadradosGrados de libertadGrados mediosF0Valor_P

A

B

C

AB

AC

BC

ABC

Error

Total

Tabla 3. Tabla ANOVA para realizar la prueba de un experimento a base de diseos factoriales 22Fuente de variacinContraste

A

B

C

AB

AC

BC

ABC

Tabla 4. Contrastes para realizar la prueba de un experimento a base de diseos factoriales 23

Tabla 5. Frmulas para los conceptos de la tabla ANOVA Ejemplo: Babu, Katha y Mar (2000) nos presentan un ejemplo del diseo factorial 23 a travs de un diseo experimental para mejorar la clasificacin de las imgenes de circuitos impresos con componentes o sin ellos, cuando son inspeccionados por un sistema visual automatizado de inspeccin.Solucin:Los factores y sus niveles estn descritos en la siguiente tabla:FactorNivelesUnidad

AltoBajo

AApertura del iris1.62.8Nmero de detencin

Bngulo de iluminacin9045Grados

CCorriente0.60.3Amperes

Tabla 6. Los factores y sus niveles estn descritos en la siguiente tablaLa ecuacin de regresin obtenida con el Design Expert se muestra a continuacin:

Imagen obtenida de http://www.wiley.com/../ Solo para fines educativosEl ANOVA obtenida con el Design Expert se muestra a continuacin:

Tabla 7. Tabla ANOVA con los resultados de la prueba del experimento a base de diseos factoriales 23Imagen obtenida de http://www.wiley.com/../ Solo para fines educativosPara un anlisis ms detallado se recomienda consultar el documento original.Para que nuestro anlisis no necesite ser remolcado por no dotarlo de los requerimientos necesarios como un auto al que no se le puso suficiente gasolina, carga de batera, bomba de agua en buen estado, etc., es muy recomendable seguir los pasos del anlisis en forma adecuada.1. Contrastes2. Efectos3. Suma de cuadrados4. ANOVALos dos primeros son responsabilidad plena del diseador y los dos ltimos pueden ser resueltos por un buen programa de computadora, pero el diseador no se aparta de la eleccin correcta de los parmetros, de la introduccin en orden de los datos y de la correcta interpretacin de los resultados. 13.3 Diseos factoriales Pareciera que andar en bicicleta es solo un deporte de pista o de montaa, pero adems de lo deportivo Qu experimentacin puede realizarse pedaleando una bicicleta?Sera prcticamente interminable si nos ponemos a contar los factores que afectan la velocidad de una bicicleta y por lo tanto el tiempo del recorrido. Afortunadamente se cuenta con diseos factoriales mayores a o a .Este es el diseo factorial en la que se supone que k es mayor a tres.Significa k factores con 2 niveles cada uno.efectos.Montgomery (2012) propone el siguiente procedimiento para realizar el anlisis :1Estima los efectos de los factores

2Forma el modelo inicial

3Realiza la prueba estadstica

4Refina el modelo

5Analiza resultados

6Interpreta resultados

Tabla 8. Procedimiento de anlisis para un diseo 2kEl clculo del k_simo contraste se calcula con la frmula:

La fuente de variacin, la suma de cuadrados y los grados de libertad para el diseo se presentan en la siguiente tabla:Fuente de variacinSuma de cuadradosGrados de libertad

Tabla 9. Tabla ANOVA para un diseo 2k(parcial)Ejemplo: Kandaswamy y Selvaraj (2000) nos presentan un ejemplo del diseo factorial 2k para k=4 a travs de un diseo experimental que determina los factores que afectan el tiempo para andar en bicicleta a travs de un experimento bicicletero.Solucin:Los factores y sus niveles estn descritos en la siguiente tabla:FactorNivelesUnidad

BajoAlto

APresin en las llantas4060psi

BEngranajeBajoAlto

CAltura del asiento3642Pulgadas

DDireccin del vientoEn contraA favor

Tabla 11. Los factores y sus niveles estn descritos en la siguiente tablaLa ecuacin de regresin obtenida con el Design Expert se muestra a continuacin:

Tiempo = 134.55 - 6.34*A 9.69*B 4.49*C 2.16*D 2.41*AB 1.52*BD

El ANOVA obtenida con el Design Expert se muestra a continuacin:Suma deGrados deCuadradosValorProb > F

FuenteCuadradoslibertadMediosF

Bloque6.566406316.56640625

Modelo2674.19846445.699739687.76338< 0.0001significant

A644.017511644.0175063126.8144< 0.0001

B1502.143811502.143806295.7893< 0.0001

C322.831061322.831056363.56913< 0.0001

D74.952306174.9523062514.758970.0049

AB93.074256193.0742562518.327390.0027

BD37.179506137.179506257.321070.0268

Residuos40.627485.078425

Total2721.392215

Tabla 12. Tabla ANOVA con los resultados de la prueba del experimento a base de diseos factoriales 24Conclusiones: Dado que todos los valores de (Prob > F) < 0.05 se concluye que todos los factores son significativos.Se recomienda consultar a Kandaswamy y Selvaraj (2000) para un anlisis ms detallado de:1. Media grfica normal.2. Grfica normal de residuos.3. Grfica de residuos contra corridas.4. Grfica de residuos contra predichos.5. Grfica de residuos contra presin del aire.6. Grfica de residuos contra engranaje.7. Grfica de residuos contra altura del asiento.8. Grfica de residuos contra presin del aire.9. Grfica de residuos contra direccin del viento.10. Grficas de interacciones.11. Tabla de factores R.

CierreAs que no solo se pedalea por deporte o por diversin, tambin nos podemos detener y pedalear para el avance de la ciencia.Aunque en estos ejemplos se ha estado utilizando el programa Design Expert para resolver los problemas, hay que aclarar que otros programas de cmputo tambin nos pueden servir como el Minitab o el SPSS o an el Excel.Despus de analizar este ejemplo de aplicacin del diseo factorial2k para k = 4, te invito a voltear a tu derredor y ver que el mundo se presenta ya no como un todo, sino como un conjunto de componentes que dependen de varios factores Cules identificas? Referencias bibliogrficas Babu, P., Katha, S., y Mar, L. (2000). An experimental design for improving the accurate classification of the images of present and absent components in printed circuit boards when inspected by an automated visual inspection system. Recuperado de: http://www.wiley.com/legacy/college/engin/montgomery316490/proj/automated_visual_inspection.doc Gutirrez, H. y De la Vara, R. (2008).Anlisis y diseo de experimentos (2 ed.). Mxico: McGraw Hill. Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico. Limusa Wiley. Kandaswamy, P. y Selvaraj, V. (2000). Estudio de los factores que afectan el tiempo para andar en bicicleta a travs de un experimento bicicletero. Recuperado de http://www.wiley.com/legacy/college/engin/montgomery316490/proj/bikes.doc

Tema 14. Diseos factoriales 3kUn diseo factorial en el que se tengan ms de 2 factores con ms de 3 niveles, puede ser resuelto con un diseo factorial 3k. As que, si deseamos fabricar un pastel de ms de 2 pisos y con ms de 10 ingredientes diferentes puede ser que la receta 2k no sea suficiente, as que optamos por cambiar de opcin: el diseo factoriales 3k.Igual que con el diseo 2k los diseos factoriales 3k se utilizan s:1. Hay ms factores que en el 2k. 2. Deseamos conocer la respuesta en funcin de la combinacin de varios factores.3. Si existen factores cuantitativos y cualitativos.Si consideramos tres niveles en cada factor y tomamos k factores en consideracin, la combinacin de ellos estar dada por su correspondiente producto: .Checkpoint: Los conceptos relacionados con los diseo factoriales 3k. Los procedimientos para realizar el anlisis del diseo factorial 32 , 33 y 3k y su solucin con el software Design Expert.

14.1 Diseos factoriales 32significa que el experimento se realiza con 2 factores (A y B) y con 3 niveles cada uno (0, 1 y 2). Para este diseo el nmero de efectos se calcula con la frmula:

El siguiente dibujo nos muestra las posibles combinaciones y los efectos:

Dibujo 1. Combinacin de tratamientos en un diseo 32 Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico. Limusa Wiley.Para este tipo de diseo en la siguiente tabla se presentan los grados de libertad:FuenteGrados de

libertad

A-A2

B-B2

AB4

Error

Total

Tabla 1. Grados de libertad en un diseo 32

Las sumas de cuadrados A-A, B-B y AB pueden ser calculadas con las frmulas presentadas en temas anteriores.Ejemplo: Pitarque (2003) nos presenta el siguiente ejemplo del diseo factorial 32 a travs de un diseo experimental donde se manipula por un lado un grupo control y dos grupos tratamentales y por otro lado el sexo. Es decir estamos hablando de un diseo factorial inter 32 donde asignamos al azar 5 sujetos a cada uno de los 6 tratamientos.Solucin:Para resolver este problema se utiliz el programa SPSS siguiendo la secuencia de comandos:Analizar modelo general lineal univariante dependientes (colocar VD) factores fijos (VI) opciones:1. Test de homogeneidad.2. Pruebas post hoc sobre los efectos principales.3. Medias para las 2 VI.4. Medias para la interaccin de las 2 VI.Los resultados obtenidos fueron los siguientes:Grupo 1(control)Grupo 2(experimental)Grupo 3(experimental)TOTAL

Mujeres5.28.410.27.9

Hombres3.63.01.62.7

TOTAL4.45.75.9

Tabla 1. Resultado de MediasUnivariate Homogenity of Variance Test

Cochrans C(4;6) = ,25000, P = 1,000 (approx.)

Bartlett-Box F(5;741) = ,35076, P = ,882

Tabla 2. Resultado de pruebas de homogeneidad

Fuente de variacinSuma de cuadradosGrados de libertadCuadrados mediosFValor_P

Dentro+residuos27,20241,13

Grupo13,2726,635,85,009

Sexo202,801202,80178,94,000

Grupo por sexo61,40230,7027,09,000

(Modelo)277,47555,4948,96,000

(Total)304,672910,51

Tabla 3. Resultado del ANOVAConclusiones: dado que todos los valores de (Valor_P) < 0.05 se concluye que todos los factores son significativos.Se recomienda consultar el documento original (Pitarque, 2003), para un anlisis ms detallado.

14.2 Diseos factoriales 33significa 3 factores con 3 niveles cada uno, efectos.

Dibujo 1. Combinacin de tratamientos en un diseo 33 Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico: Limusa Wiley.

Grados de libertad:1. Observamos que existen 27 combinaciones de tratamientos lo que nos da 26 grados de libertad.2. Cada efecto medio tiene 2 grados de libertad.3. Cada interaccin de dos factores tiene 4 grados de libertad.4. Cada interaccin de tres factores tiene 8 grados de libertad.5. En total existen grados de libertad para n rplicas.6. Para el error existen grados de libertad.Ejemplo: Purvis y Gallagher (2000) nos presentan el siguiente ejemplo del diseo factorial 33 a travs de un diseo experimental para establecer unos valores nuevos de la potencia, la presin y la relacin de gas que sern utilizados en un nuevo ajuste de 1.2cm.

Solucin:Se establecen los niveles bajo, medio y alto:FactorNivelesUnidad

BajoMedioAlto

APotencia600750900W

BPresin300385470mT

CCF4:CHF31.82.22.6

Tabla 4. Los factores y sus niveles estn descritos en la siguiente tabla.

Se introducen los datos en el Design Expert obteniendo el siguiente resultado:Fuente de variacinSuma de cuadradosGrados de libertadCuadrados mediosFValor_p

Bloque43560.00143560.00

Modelo9.315E+00624.657E+006242.93< 0.0001significativo

A1.674E+00611.674E+00687.340.0002

B7.640E+00617.640E+006398.53< 0.0001

Curvatura4120-9014120-900.210.6624NO significativo

Residuos95855.00519171.00

Cor Total9.458E+0069

Tabla 5. Resultado del ANOVA Se genera el modelo de regresin:

Conclusiones:1. Dado que (Valor_p del Modelo) < 0.01 se concluye que es significativo.2. Dado que (Valor_p de A) < 0.01 se concluye que es significativo.3. Dado que (Valor_p de B) < 0.01 se concluye que es significativo.4. Dado que (Valor_p de la Curvatura) > 0.01 se concluye que es no es significativo.Se recomienda consultar el documento original (Purvis y Gallagher, 2000) para un anlisis ms detallado.

14.3 Diseos factoriales 3ksignifica k factores con 3 niveles cada uno. efectos.Lo estudiado en los diseos 32 y 33 puede ser utilizado para el diseo factorial 3k.Montgomery (2012) nos indica que en el caso de k = 4, se utiliza la notacin 0120 para la combinacin de tratamientos con los factores A y D a los niveles bajos, B al nivel medio y C al nivel alto.Existen combinaciones de tratamientos.Existen grados de libertad entre ellos.

Ejemplo: Crear un diseo factorial para k = 4.Solucin:Utilizando Minitab, seguimos la secuencia:Estadsticas DOE Factorial Crear diseo factorial:1. Diseo factorial completo general2. Nmero de factores = 43. Diseos:a. Nmero de niveles (A=3; B=3; C=3; D=3)b. Nmero de rplicas = 1c. Aceptar4. Factores:a. Introducir los 12 valoresb. Aceptar5. Resultadosa. Tabla de resumen y tabla de diseob. Aceptar6. Aceptar

Resultados:Diseo factorial de mltiples niveles Factores: 4 Rplicas: 1Corridas base: 81 Total de corridas: 81Bloques base: 1 Total de bloques: 1Nmero de niveles: 3, 3, 3, 3Tabla de diseo (aleatorizada)Una vez organizado el diseo se procede al anlisis de varianza, como se ha visto en los temas anteriores.CierreAhora s, a volar!, Ahora ya cuentas con las herramientas necesarias para resolver problemas de la vida cotidiana con diseos de mltiples factores como el que se presenta en la fbrica de pasteles.Referencias bibliogrficas Montgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico: Limusa Wiley. Pitarque, A. (2003). Mtodos y diseos de investigacin. Recuperado de http://www.uv.es/pitarque/TRANSPARENCIAS.pdf Purvis, D. y Gallagher, M. (2000). Plasma etch tool gap distance DOE final report. Recuperado de http://www.wiley.com/legacy/college/engin/montgomery316490/proj/plasma_text.doc

Tema 15. Diseos factoriales fraccionadosSi en el diseo del experimento existiera el problema de que hay demasiados factores y niveles, existe la opcin de fraccionar el problema y llegar a tomar decisiones con muy buen nivel de significancia.No es necesario, como vamos a ver, tomar todos los factores involucrados, as que podemos tomar:1. La fraccin del diseo 2k.2. La fraccin del diseo 2k.3. Y an decidir por un diseo factorial fraccionado general 2k-p si la cantidad de factores y sus relaciones lo justifican. 4. Checkpoint: Los conceptos: fraccin del diseo 2k, 2k-p corridas, fuente de variacin, suma de cuadrados, grados de libertad, el estadstico F y el valor_p. 5. Los conceptos relacionados con los diseos factoriales fraccin del diseo, con 2k-p corridas. 6. Los procedimientos para realizar el anlisis del diseo factorial fraccin del diseo 2k, fraccin del diseo 2k, diseo factorial fraccionado general 2k-p y su solucin con el software Design Expert.

15.1 Fraccin del diseo 2kCuando crece el nmero de factores, de tal forma que por ejemplo si k = 6 se necesitan 64 corridas con 63 grados de libertad distribuidos de la siguiente forma:1. 6 para los efectos medios.2. 15 para las interacciones entre dos factores.3. 42 para las interacciones entre tres factores. Podemos observar que la mayora de los grados de libertad corresponden a las interacciones entre tres factores (42), de tal forma que el diseador puede llegar a considerar que no son significativos y realizar el diseo solo con los efectos medios y las interacciones entre dos factores; a este tipo de diseo se le conoce como fraccin del diseo 2kDebido a que la fraccin del diseo 2k contiene 2k-1 corridas se le conoce como diseo factorial fraccionado 2k-1.Ejemplo: Null, Shiau, Skinner y Wee (2000) se dieron a la tarea de determinar los factores que afectan la altura de un pastel y realizaron el anlisis que se presenta a continuacin:Se determinaron los factores y sus niveles, mostrados en la siguiente tabla: se establecen los niveles bajo, medio y alto.FactorNivelesUnidad

BajoMedioAlto

ATemperatura del horno275350425Grados

BLevadura1/161/81/4Cucharadita

CLeche1/35/121/2Taza

DHarina1/21 1/42Cucharadita

Tabla 1. Los factores y sus niveles. Se introducen los datos en el Design Expert considerando un diseo 24-1 (2k-1 para k = 4) con una rplica, obteniendo el siguiente resultado:Ecuacin de regresin

Fuente de variacinSuma de cuadradosGrados de libertadCuadrados mediosFValor_p

Efectos medios17.52344.3814.130.099NO significativo

Interacciones dobles0.15530.0520.050.984NO significativo

Error residual4.24441.061

Curvatura4.00314.00349.920.006significativo

Error puro0.24130.080

Total21.92211

15.2 Fraccin del diseo 2kOtro diseo factorial para un gran nmero de factores es el de la fraccin del diseo 2k.Debido a que la fraccin del diseo 2k contiene 2k-2 corridas se le conoce como diseo factorial fraccionado 2k-2.Ejemplo: Tomando como referencia el ejemplo que presenta Montgomery (2012), se decide hacer un diseo para determinar los factores que influyen en la merma del proceso de inyeccin por molde.Solucin:Primero determin los factores a analizar:1. A: Temperatura del molde.2. B: Velocidad del tonillo.3. C: Tiempo de retencin.4. D: Tiempo del ciclo.5. E: Tamao de la compuerta.6. F: Presin de sujecin. Como segundo paso decidi realizar un diseo Primero se realiza la tabla para la construccin del diseo con los Generadores I=ABCE e I=BCDF:

CorridaDiseo BsicoE=ABCF=BCDMerma (x10)

ABCD

-------

-+---+-

--+--++

+++---+

+--+-++

++-+--+

+-++---

8+++-+-

9---+-+

10+--+++

11-+-++-

12++-+--

13--+++-

14+-++--

15-+++-+

16++++++

Tabla 2. Construccin del diseo con los Generadores I=ABCE e I=BCDFMontgomery, D. (2012). Diseo de experimentos (2 ed.). Mxico: Limusa Wiley.

A continuacin se realizan las observaciones de la merma y se registran en la columna Merma (x10).Se introducen los datos a nuestro sistema de clculo y obtenemos los resultados:1. Funcin de regresin:

2. Para un anlisis ms detallado de los Efectos, Suma de Cuadrados y los dems Coeficientes de Regresin se recomienda consultar la referencia de Montgomery (2012).

15.3 Diseo factorial fraccionado general 2k-pDebido a que la fraccin del diseo 2k contiene 2k-p corridas se le conoce como diseo factorial fraccionado 2k-p.Ejemplo: Se desea realizar un diseo experimental para simular la manufactura de semiconductores.Solucin:Rasmidatta, Tseng y Rastogi (2013) identifican los siguientes 8 factores con sus correspondientes niveles:FactorNivelRango

Operador

1OP_DIFF224

2OP_PHOTO224

3OP_ETCH235

4OP_WET224

5OP_MOVE23555

6Release Rate218k19k

7Dispatching Rules2FIFOSame Setup

8Stockers Qty.224

Tabla 3. Factores con sus correspondientes niveles.

Dado que k=8, se decide disminuir a 4 el exponente del diseo, por lo que se realizar el experimento basado en un diseo factorial fraccionado 28-4 ( 2k-p con k=8 y p=4).Adems se decide tomar como variables de salida:1. El tiempo promedio por ciclo.2. El rendimiento.Se introducen los datos del experimento y se realizan los clculos, dando los siguientes resultados en las tablas:1. ANOVA para el tiempo promedio por ciclo.2. ANOVA para el rendimiento.

Fuente de variacinSuma de cuadradosGrados de libertadCuadrados mediosFValor_p

Modelo3094696.4031031565.472238.82