Apuntes Doe

72
Diseño de Experimentos M.C. Roberto Romero López i UNIDAD I Diseño de experimentos 1.1.- Introducción………………………………………………………………….. 1.2.- Conceptos básicos…………………………………………………………… 1.3.- Principios básicos……………………………………………………………. 1.3.1.- Realización de replicas o repetición………………………………………….. 1.3.2.- Aleatorización………………………………………………………………… 1.3.3.- Formación de bloques o bloqueo……………………………………………... 1.4.- Metodología para el diseño de experimentos……………………………….. 1.4.1.- Planeación…………………………………………………………………….. 1.4.2.- Análisis……………………………………………………………………….. 1.4.3.- Interpretación…………………………………………………………………. 1.4.4.- Conclusiones finales.................................................................................... 1.5.- Aplicaciones típicas del diseño de experimentos……………………………. 1.6.- Casos………………………………………………………………………… 1.6.1.- Caracterización de un proceso……………………………………………….. 1.6.2.- Optimización de un proceso………………………………………………….. 1.6.3.- Ilustración del diseño de un producto………………………………………… UNIDAD II Inferencia Estadística 2.1.- Introducción…………………………………………………………………. 2.2.- Conceptos básicos de estadística…………………………………………… 2.3.- Pruebas de hipótesis ………………………………………………………… 2.3.1.- Hipótesis estadísticas: Conceptos generales………………………………….. 2.3.2.- Hipótesis nula y alternativa…………………………………………………… 2.3.3.- Criterio de rechazo …………………………………………………………… 2.3.4.- Errores tipo I y tipo II en la prueba de hipótesis……………………………… 2.4.- Prueba con respecto a una sola media con varianza (σ2) conocida…………. 2.5.- Prueba con respecto a una sola media con varianza (σ2) desconocida……... 2.6.- Prueba para la varianza con una muestra…………………………………… 2.7.- Hipótesis para dos medias con distribución normal.………………………… 2.8.- Hipótesis para dos medias utilizando distribución T-student……………….. 2.8.1.- Caso 1: Pruebas para diferencias de medias con varianzas iguales y desconocidas.………………………………………………………………….. 2.8.2.- Caso 2: Pruebas para diferencias de medias con varianzas diferentes y desconocidas……………………………………………………………………. 2.9.- Prueba para la igualdad de varianzas………………………………………... UNIDAD III Análisis de varianza (ANOVA) 3.1.- Experimentos de un solo factor: procedimiento de prueba para la igualdad de medias poblacionales…………………………………………… 3.2.- Diseño completamente aleatorizado, muestras iguales……………………3.3.- Análisis de varianzas para muestras diferentes……………………………… 3.4.- Análisis de varianza bilateral (dos factores)…………………………………. 3.4.1.- Notación para experimentos de dos factores………………………………….. 3.4.2.- Variaciones para experimentos de dos factores………………………………. 3.4.3.- Experimento de dos factores con repetición………………………………….. 1 2 4 4 4 5 5 5 7 7 7 8 9 9 10 11 14 14 17 17 18 19 20 22 25 27 29 31 31 33 35 37 38 41 43 43 44 48

Transcript of Apuntes Doe

Page 1: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                i 

UNIDAD I Diseño de experimentos

1.1.- Introducción………………………………………………………………….. 1.2.- Conceptos básicos…………………………………………………………… 1.3.- Principios básicos…………………………………………………………….

1.3.1.- Realización de replicas o repetición………………………………………….. 1.3.2.- Aleatorización………………………………………………………………… 1.3.3.- Formación de bloques o bloqueo……………………………………………...

1.4.- Metodología para el diseño de experimentos……………………………….. 1.4.1.- Planeación…………………………………………………………………….. 1.4.2.- Análisis……………………………………………………………………….. 1.4.3.- Interpretación…………………………………………………………………. 1.4.4.- Conclusiones finales....................................................................................

1.5.- Aplicaciones típicas del diseño de experimentos……………………………. 1.6.- Casos…………………………………………………………………………

1.6.1.- Caracterización de un proceso……………………………………………….. 1.6.2.- Optimización de un proceso…………………………………………………..

1.6.3.- Ilustración del diseño de un producto…………………………………………

UNIDAD II Inferencia Estadística

2.1.- Introducción…………………………………………………………………. 2.2.- Conceptos básicos de estadística…………………………………………… 2.3.- Pruebas de hipótesis …………………………………………………………

2.3.1.- Hipótesis estadísticas: Conceptos generales………………………………….. 2.3.2.- Hipótesis nula y alternativa…………………………………………………… 2.3.3.- Criterio de rechazo …………………………………………………………… 2.3.4.- Errores tipo I y tipo II en la prueba de hipótesis………………………………

2.4.- Prueba con respecto a una sola media con varianza (σ2) conocida…………. 2.5.- Prueba con respecto a una sola media con varianza (σ2) desconocida……... 2.6.- Prueba para la varianza con una muestra…………………………………… 2.7.- Hipótesis para dos medias con distribución normal.………………………… 2.8.- Hipótesis para dos medias utilizando distribución T-student………………..

2.8.1.- Caso 1: Pruebas para diferencias de medias con varianzas iguales y desconocidas.…………………………………………………………………..

2.8.2.- Caso 2: Pruebas para diferencias de medias con varianzas diferentes y desconocidas…………………………………………………………………….

2.9.- Prueba para la igualdad de varianzas………………………………………...

UNIDAD III Análisis de varianza (ANOVA)

3.1.- Experimentos de un solo factor: procedimiento de prueba para la igualdad de medias poblacionales……………………………………………

3.2.- Diseño completamente aleatorizado, muestras iguales…………………….... 3.3.- Análisis de varianzas para muestras diferentes……………………………… 3.4.- Análisis de varianza bilateral (dos factores)………………………………….

3.4.1.- Notación para experimentos de dos factores………………………………….. 3.4.2.- Variaciones para experimentos de dos factores………………………………. 3.4.3.- Experimento de dos factores con repetición…………………………………..

1 2 4 4 4 5 5 5 7 7 7 8 9 9 10 11 

14 14 17 17 18 19 20 22 25 27 29 31  

31  

33 35 

37 38 41 43 43 44 48  

Page 2: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                ii 

UNIDAD IV Diseño factorial Completo

4.1.- Definición de experimento factorial…………………………………………. 4.2.- Ventajas de los Diseños Factoriales.………………………………………… 4.3.- Representación del efecto de interacción……………………………………. 4.4.- Diseño factorial de dos factores……………………………………………...

UNIDAD V Diseños factoriales fraccionados 2k-p

5.1.- Diseño factorial fraccionado 2k-1…………………………………………… 5.1.1.- Diseño factorial fraccionado 23-1…………………………………………….

5.1.2.- Representación geométrica del diseño 23-1……………………………6 5.2.- El concepto de resolución……………………………………………………

5.2.1.- Construcción de fracciones 2k-1………………………………………………. 5.3.- Diseños factoriales fraccionados 2k-2…………………………………………

5.3.1.- Construcción en dos pasos de diseño 2k-2……………………………………. 5.4.- Diseño factorial fraccionado 2k-p…………………………………………….

Bibliografía……………………………………………………………………..……72

53 53 55 56 

62 62 63 64 65 66 66 67 

Page 3: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                1 

UNIDAD I Diseño de Experimentos

 

1.1 Introducción.-

Prácticamente en todos los campos de estudio se llevan a cabo experimentos, por lo general para descubrir algo acerca de un proceso o sistema particular. En ingeniería, la experimentación desempeña un papel importante en el diseño de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos.

El diseño estadístico de experimentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados que puedan analizarse con métodos estadísticos que llevaran a conclusiones válidas y objetivas; es la forma eficaz de hacer pruebas en los procesos, ya que proporciona la técnica y la estrategia necesarias para llevar de manera eficaz los procesos a mejores condiciones de operación. Cuando el problema incluye datos que están sujetos a errores experimentales, la metodología estadística es el único enfoque objetivo de análisis. Por lo tanto, cualquier problema experimental incluye dos aspectos: el diseño de experimento y el análisis estadístico de los datos. El diseño de experimentos consiste en determinar cuáles pruebas y cómo es que se deben realizar, para obtener datos que al analizarlos estadísticamente se obtengan conclusiones y decisiones que deriven en mejoras del desempeño del proceso.

  En general, los experimentos se usan para estudiar el desempeño se procesos y sistemas. El proceso puede por lo general visualizarse como una combinación de máquinas, métodos, personas u otros recursos que transforman cierta entrada (en la mayoría un material) en una salida que tiene una o más respuestas observables. Algunas variables del proceso x1, x2,…, xp son controlables, mientras que otras z1, z2,…, zp son no controlables. El Esquema de un proceso se aprecia en la figura 1 que se muestra delante. Los objetivos de los experimentos podrían comprender los siguientes:

1. Determinar cuales son las variables que tienen mayor influencia sobre la respuesta y.

2. Determinar cuál es el ajuste de las x que tiene mayor influencia para que y esté casi siempre cerca del valor nominal deseado.

3. Determinar cuál es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea reducida.

4. Determinar cuál es el ajuste de las x que tiene mayor influencia para que los efectos de las variables no controlables z1, z2,…, zq sean mínimos.

Page 4: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                2 

1.2 Conceptos básicos.- Experimento.

Se puede definir como una prueba o serie de pruebas en las que se hacen cambios deliberados en las condiciones de operación (variables de entrada) de un proceso o sistema para observar e identificar las razones de los cambios sobre una o varias propiedades del producto que pudieran observarse (respuesta de salida), lo cual nos permite aumentar el conocimiento acerca del sistema.

Diseño de experimentos. Consiste en planear un conjunto de pruebas experimentales, de tal manera que

los datos obtenidos se puedan analizar de una manera estadística para obtener conclusiones válidas y objetivas acerca del sistema o proceso.

Unidad experimental. Es la muestra de artículos que es necesario producir en una condición de

operación del proceso para obtener una medición o dato representativo de lo que allí ocurre. Una parte importante en el momento de hacer el diseño de experimento es definir con cuidado la unidad experimental, que puede ser una pieza o un conjunto de piezas producidas, todo depende del proceso que se estudia.

Variables, factores y niveles.

Variable de respuesta. Es la característica, variable de salida o propiedad del producto, cuyo valor interesa mejorar. Esté valor determina algún aspecto de la calidad del producto.

Factores controlables. Variables de proceso que se pueden fijar en un punto o en un nivel de operación.

Algunos se controlan en la operación normal del proceso, lo que los distingue es que para cada uno de ellos hay una manera de manipular su nivel de operación. Esto es lo que hace que se pueda experimentar con ellos.

  También se les llama variables de entrada, condiciones de proceso, variables de diseño, parámetros del proceso, o factores.

  Factores no controlables o de ruido. Variables que no se pueden controlar durante la operación normal del proceso. Algunos factores que no son controlables pueden ser variables ambientales (luz, temperatura, partículas, ruido, etc), el ánimo de los operadores, la calidad del material que se recibe del proveedor y los diversos usos que el cliente pueda dar al producto.

Page 5: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                3 

Factores estudiados. Son las variables que se investigan en el experimento, cómo influyen o afectan a la variable de respuesta. Pueden ser factores controlables o no controlables. Para que sea un factor estudiado, es necesario que durante el experimento se haya probado en al menos dos niveles o condiciones.  

  Cualquier factor puede influir en la variable de respuesta, por lo que en un diseño de experimentos se seleccionan factores que puedan tener efectos sobre la respuesta de interés. Parte de lo que se tiene que superar durante el diseño es ver la manera de controlar un factor que normalmente es no controlable.

Niveles y tratamientos. Los niveles son los valores que se le pueden asignar a cada factor estudiado en un diseño de experimentos. Una combinación de niveles de todos los factores se llama tratamiento o punto de diseño.

Cuando se experimenta con un solo factor podemos decir que la combinación de niveles es a la vez un tratamiento.

Error aleatorio y error experimental. En cualquier experimento realizado, las variables que se observan no las podemos explicar siempre por medio de los factores estudiados. Siempre habrá un remanente de variabilidad que se debe a causas comunes o aleatorias, que hacen una variabilidad natural del proceso. Esta variabilidad es el error aleatorio, que es una variabilidad no explicada. Los errores graves que comete el experimentador durante el experimento es el llamado error experimental.

 

 

 

 

 

 

 

 

Figura 1.1 Modelo general de un proceso o sistema.

Page 6: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                4 

1.3 Principios básicos.-

En el diseño de experimentos se tratan fenómenos que podemos observar y que se repiten. Lo que observamos siempre lo apreciamos con una variabilidad, nada ocurre exactamente de la misma manera dos veces. Hay preguntas que no podemos contestar sin el pensamiento estadístico como:

• ¿Qué quiere decir cuando la ciencia demanda una observación sea repetible? • ¿Qué repetición es repetición? • ¿Cuándo un resultado es el mismo o difiere en confirmación o contradicción?

Para empezar correctamente la planeación del diseño de experimentos se tienen que aplicar los tres principios básicos que son la realización de replicas, la aleatorización y la formación de bloques o bloqueo, donde la validez del análisis de los datos se apoya en estos principios.

1.3.1 Realización de réplicas.-

Por realización de réplicas se entiende la repetición (no consecutiva) del experimento básico. En este principio lo que se hace es correr más de una vez un tratamiento o combinación de factores dada. Repetir es volver a correr el proceso, empezar desde las condiciones de operación, para obtener un nuevo producto, hasta medir el resultado de la corrida del proceso.

La realización de réplicas posee dos propiedades importantes. Primera, permite al experimentador obtener una estimación del error experimental. Esta estimación del error se convierte en una unidad de medición básica para determinar las diferencias observadas en los datos que son en realidad estadísticamente diferentes. Segunda, si se usa la media muestral (ỹ) para estimar el efecto de un factor en el experimento, la realización de réplicas permite al experimentador obtener una estimación más precisa de este efecto. Si σ2 es la varianza de una observación individual y hay n réplicas, la varianza de la media muestral es

σ2ỹ

= σ2/ n

1.3.2 Aleatorización.-

Esta es la piedra angular en la que se fundamenta el uso de los métodos estadísticos en el diseño experimental. Por aleatorización se entiende que tanto la asignación del material experimental como el orden en que se realizaran las corridas o ensayos individuales del experimento se determinan al azar. Uno de los requisitos de los métodos estadísticos es que las observaciones (o los errores) sean variables aleatorias con distribuciones independientes. La aleatorización hace por lo general que este supuesto sea válido. La aleatorización correcta del experimento ayuda también a sacar del promedio los efectos de factores extraños que pudieran estar presentes.

Page 7: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                5 

1.3.3 Formación de bloques o bloqueo.-

Es una técnica de diseño que se utiliza para mejorar la precisión de las comparaciones que se hacen entre los factores de interés. Muchas veces la formación de bloques se emplea para reducir o eliminar la variabilidad transmitida por factores perturbadores; es decir, aquellos factores que pueden influir en la respuesta experimental pero en los que no hay un interés específico.

Al bloquear se supone que el subconjunto de datos que se obtengan dentro de cada bloque, deben resultar más homogéneos que el conjunto total de datos.

1.4 Metodología para el diseño de experimentos.-

Lo principal que se debe tener en cuenta para aplicar el enfoque estadístico y análisis de un experimento es que todos los participantes tengan una idea exacta de lo que se va a estudiar, cuál será la colocación de los datos y cómo se van a analizar

  Un punto fundamental del diseño de experimentos es decidir que pruebas se van a correr en el proceso, y cuantas repeticiones de cada uno, de manera que se obtenga la máxima información al mínimo costo sobre lo que se estudia, a esto se le llama matriz de diseño o diseño. Esto se logra a través de una secuencia de etapas que se deben realizar para llegar hasta el objetivo planteado.

1.4.1 Planeación.-

1. Identificación y enunciación del problema. Algo común en la práctica es que no es sencillo darse cuenta cuando existe un problema y no solo es decir que parece un problema importante, eso se debe demostrar por medio de datos y a la vez ver cual es su impacto. Tampoco es fácil hacer una enunciación clara con la que todos estén de acuerdo.

Se debe observar cual es nuestra situación inicial que es de donde vamos a partir. Es fundamental tener conocimiento del proceso en donde tenemos nuestro problema y desarrollar todas las ideas acerca de los objetivos del experimento, por lo cual es importante solicitar aportaciones de las áreas involucradas: ingeniería, calidad, manufactura, mercadotecnia, administración, el cliente y los operadores (el que conoce a fondo el proceso y en la mayoría de los casos no es tomado en cuenta). Es bueno tener un enfoque de equipo para diseñar experimentos.

Es conveniente realizar algunas actividades para que sea mejor este paso:

• Hacer una lista de los problemas o las preguntas especificas que van a abordarse en el experimento.

• Una enunciación clara del problema, que contribuye a alcanzar una mejor compresión del fenómeno bajo estudio y la solución final del problema.

• Tener el objetivo global presente.

Page 8: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                6 

En esta etapa se puede dar cuenta de cuando un problema es extenso y no se podrá responder a las preguntas claves, por lo que se utiliza, en una estrategia más adecuada, una serie experimentos más pequeños.

2. Elección de los factores, los niveles y los rangos. Tenemos que utilizar toda la información disponible para la solución de nuestro problema.

Al considerar factores encontramos que algunos pueden influir en el desempeño de un proceso, a los cuales se les llama factores potenciales del diseño o factores perturbadores, que son los que el experimentador quiera hacer variar en el experimento. Se pueden encontrar gran cantidad de estos factores por lo que hacemos una clasificación de estos factores.

• Factores del diseño. Se seleccionan para estudiarlos en el experimento • Factores que se mantienen constantes. Pueden tener efecto sobre la respuesta,

pero para fines del experimento en curso no son de interés. Una vez seleccionados los factores, se eligen los rangos en los que se va a variar

estos factores, así como los niveles específicos con los que se realizaran las corridas. Hay que ver cómo se van a controlar los factores en los valores deseados y cómo van a medirse. Para esto es necesario tener un conocimiento del proceso, que suele ser una combinación de experiencia practica y conocimientos teóricos.

3. Selección de la variable de respuesta. Esta debe proporcionar información útil acerca del proceso ya que es el objetivo del experimento. En la mayoría de los casos, el promedio o la desviación estándar de la característica medida será la variable de respuesta. Pero puede haber más de una variable de respuesta. Se debe tener confianza en la eficiencia de los instrumentos de medición que pueden ser un factor importante. Si la eficiencia es inadecuada quizá sea necesaria las replicas adicionales, en lo que se puede medir varias veces y usar el promedio de las mediciones repetidas.

4. Elección del diseño experimental. Esto implica la consideración del tamaño de la muestra (repeticiones que se harán para cada tratamiento), la selección de un orden de corridas adecuado para los ensayos experimentales y la determinación de si entran o no la formación de bloques u otras restricciones sobre la aleatorización. Todo se hace tomando en cuenta el tiempo, costo y la precisión deseada.

En algunos casos se puede saber de antemano que algunos niveles de los factores producirán valores diferentes de la respuesta. En consecuencia, el interés se centra en identificar qué factores causan esta diferencia y en estimar la magnitud del cambio de la respuesta.

5. Planear y organizar el trabajo experimental. Aquí se organizan las personas que van a intervenir, la forma operativa en que se harán las cosas, etc.

 

Page 9: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                7 

6. Realización del experimento. Se sigue el plan antes hecho, y en caso de algún imprevisto que no se tenía contemplado se señala a la persona a la que se le reportara y se señala lo que se hará.

Cuando se lleva a cabo el experimento se tiene que monitorear el proceso para asegurarse de que todo este con lo planeado. Los errores en el procedimiento experimental pueden destruir la validez experimental.

Como sugerencia antes de realizar un experimento se pueden realizar corridas piloto. Con esto se nos proporcionara información de la consistencia del material experimental, una comprobación del sistema de medición, una idea aproximada del error experimental y la oportunidad de poner en práctica la técnica experimental global, a la vez de revisar las decisiones tomadas en los pasos 1 al 4.

1.4.2 Análisis.-

7. Análisis estadístico de los datos. Si el experimento se ha llevado a cabo de acuerdo con el diseño, los métodos estadísticos no deben ser complicados. Se debe determinar el análisis de varianza o la técnica estadística que mejor describa el comportamiento de los datos. Los métodos gráficos desempeñan un papel importante en el análisis e interpretación de datos.

Los métodos estadísticos no pueden demostrar que un factor posee efecto particular, pero si proporciona pautas generales en cuanto a la confiabilidad y la validez del resultado. Aplicados en forma correcta, los métodos estadísticos no permiten la demostración experimental de nada, pero si sirven para medir el error posible en una conclusión o asignar un nivel de confianza a un enunciado. Con estos métodos obtenemos la ventaja de agregar objetividad al proceso de toma de decisiones. Las conclusiones sólidas se logran con las técnicas estadísticas, una buena ingeniería o conocimiento del proceso y sentido común.

1.4.3 Interpretación.-

8. Interpretación. Se analiza a detalle el proceso del experimento, como el contraste de las conjeturas iniciales con el resultado final, observar nuevos aprendizajes que se lograron en el trayecto, verificar supuestos y elegir el tratamiento ganador.

1.4.4 Conclusiones finales.-

9. Conclusiones y recomendaciones. Se decide las medidas a implementar para generalizar el resultado final y tratar de mantenerlo, donde los métodos gráficos son de mucha ayuda. Otra cosa que se debe hacer es realizar corridas de seguimiento o pruebas de confirmación para dar validez a las conclusiones del experimento.

Page 10: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                8 

El experimentar es un proceso del aprendizaje, donde se formulan hipótesis de un sistema, se experimenta y tenemos nuevas hipótesis basadas en los resultados. Con esto llegamos a que la experimentación es iterativa.

En el tiempo que se va avanzando en un programa experimental, es común abandonar algunas variables de entrada e incorporar otras, se pueden modificar las regiones de exploración de algunos factores o incorporar nuevas variables de respuesta.

Una regla general para el diseño de experimentos es no invertirse más de 25% de los recursos disponibles en el primer experimento. Con lo que aseguramos que se contará con los recursos suficientes para realizar las corridas de confirmación y que se alcanzara el objetivo final del experimento.

1.5 Aplicaciones típicas del diseño de experimentos.-

Los métodos del diseño experimental se encuentran en un amplio número de aplicaciones de diversas disciplinas. Un aprendizaje viene después de una serie de actividades donde se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar datos del proceso y se usa esa información para nuevas conjeturas, lo que nos lleva a nuevos experimentos.

El diseño de experimentos es importante en ingeniería para la mejora del desempeño de un proceso de manufactura y tiene varias aplicaciones en el desarrollo de procesos nuevos. Las aplicaciones de las técnicas del diseño de experimentos en fases iniciales pueden redundar en:

• Mejoras en el rendimiento del proceso. • Variabilidad reducida y conformidad más cercana con los requerimientos

nominales o proyectados. • Reducción del tiempo de desarrollo. • Reducción de costos globales.

Hay un papel importante del diseño de experimentos en actividades del diseño

de ingeniería, para desarrollar productos nuevos y en el mejoramiento de productos existentes. Algunas aplicaciones del diseño experimental en el diseño de ingeniería se encuentran:

• La evaluación y comparación de configuraciones de diseños básicos. • La evaluación de materiales alternativos. • La selección de los parámetros del diseño para que el producto tenga un

buen funcionamiento en una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto.

• La determinación de los parámetros clave del diseño del producto que afectan el desempeño del mismo.

Page 11: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                9 

Con esto podemos lograr que la fabricación de los productos sea más sencilla, que tengan un desempeño y confiabilidad de campo mejorado, costos de producción más bajos y tiempos más cortos para el diseño y desarrollo del producto.

1.6 Casos.-

1.6.1 Caracterización de un proceso.-

En el proceso de fabricación de tarjetas de circuitos impresos se utiliza una maquina de soldadura líquida. La maquina limpia las tarjetas en un fundente, las somete a un proceso de precalentamiento y después las hace pasar por una onda de soldadura líquida mediante una transportadora. En este proceso de soldadura se hacen conexiones eléctricas y mecánicas de los componentes recubiertos de plomo en la tarjeta.

El proceso opera con un nivel de defectos de 1%. Es decir, cerca de 1% de las juntas de soldadura de una tarjeta son defectuosas y requieren corrección manual. Debido a que la tarjeta de circuitos impresos promedio contiene más de 2000 juntas de soldadura, este nivel de 1% es un número alto que requiere corrección. Al ingeniero le interesa un experimento diseñado para determinar los parámetros de la máquina que influyen en la ocurrencia de los defectos de soldadura y los ajustes que deberían hacerse en dichas variables para reducir los defectos de soldadura.

En la maquina de soldadura líquida hay diversas variables que pueden controlarse. Como:

• La temperatura de la soldadura.

• La temperatura del precalentamiento.

• La velocidad de la transportadora.

• El tipo de fundente.

• La gravedad especifica del fundente.

• La profundidad de la onda de soldadura.

• El ángulo de la transportadora.

Page 12: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                10 

Hay otros que no son sencillos manejar durante el proceso de fabricación como lo son:

• El espesor de la tarjeta de circuitos impresos.

• El tipo de componentes usados en la tarjeta.

• La disposición de los componentes en la tarjeta.

• El operador.

• La rapidez de producción.

Lo que interesa al ingeniero es caracterizar la maquina de soldadura liquida, lo que quiere decir que hay que determinar los factores que afectan la ocurrencia de defectos en las tarjetas de circuitos impresos. En este caso se puede diseñar un experimento que le permita estimar la magnitud y dirección de los efectos de los factores, es decir, cuánto cambia la variable de respuesta cuando se modifica cada factor, y si la modificación de los factores en conjunto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores. A este tipo de experimento se le conoce como experimento tamiz o de exploración exhaustiva.

La información obtenida se usará para identificar los factores críticos del proceso y determinar la dirección del ajuste de dichos factores a fin de conseguir una reducción adicional del número de defectos por unidad.

1.6.2 Optimización de un proceso.-

En el caso anterior se centraba más en determinar las variables del proceso que afectan la repuesta. En la optimización se determina la región de los factores importantes que conduzca a la mejor respuesta posible. Como ejemplo, si la respuesta es el rendimiento, se buscaría la región del rendimiento máximo, mientras que si la respuesta es la variabilidad de una dimensión crítica del producto, se buscaría una región de variabilidad mínima.

En la mejora del rendimiento de un proceso químico. Tenemos por los resultados de un experimento de caracterización que las dos variables más importantes del proceso que influyen en el rendimiento son la temperatura de operación y el tiempo de reacción. El proceso opera actualmente a 145 ºF y con 2.1 horas de tiempo de reacción, produciendo rendimiento de cerca de 80%. La figura 2 nos muestra la vista de la región tiempo- temperatura. Las líneas de rendimiento constante se unen para formar los contornos de respuesta, y se muestran las líneas de contorno para rendimiento de 60, 70, 80, 90 y 95 por ciento. Estos contornos son las proyecciones en la región tiempo-temperatura de las secciones transversales de la superficie del rendimiento

Page 13: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                11 

correspondiente a los rendimientos porcentuales arriba mencionados. A esta superficie se le llama superficie de respuesta. El personal no conoce la verdadera superficie de respuesta de la figura 2, por lo que se necesitaran métodos experimentales para optimizar el rendimiento con respecto al tiempo y la temperatura.

Para localizar el rendimiento óptimo, es necesario llevar a cabo un experimento en el que se hagan variar conjuntamente el tiempo y la temperatura, es decir, un experimento factorial. En la figura 2 se muestran los resultados de un experimento factorial inicial realizado con dos niveles tanto del tiempo como de la temperatura. Las respuestas que se observan en los cuatro vértices del cuadrado indican que para incrementar el rendimiento, los cambios deberían hacerse en la dirección general de la temperatura y la reducción del tiempo de reacción. Se realizarían algunas corridas adicionales en esta dirección, y esta experimentación adicional llevaría a la región del rendimiento máximo.

Una vez encontrada la región de rendimiento óptimo, el siguiente paso sería realizar un segundo experimento. El objetivo del segundo experimento es desarrollar un modelo empírico del proceso y obtener una estimación más precisa de las condiciones de operación óptimas para el tiempo y la temperatura. A este enfoque se le llama metodología de superficies de respuesta. El segundo diseño en la figura 2 es un diseño central compuesto, uno de los diseños más importantes que se usan en los estudios de optimización.

Page 14: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                12 

Figura 1. 2 Grafica de contorno del rendimiento como una función del tiempo de reacción y la temperatura de reacción, la cual ilustra la experimentación para

optimizar un proceso

1.6.3 Ilustración del diseño de un producto.-

Con frecuencia podemos observar que para el diseño de un producto se utilice un método de diseño de experimentos.

Un grupo de ingenieros está diseñando un gozne de la puerta de un automóvil. La característica de calidad del producto que les interesa es el esfuerzo del amortiguador, es decir, la capacidad de retención del tope que impide que la puerta se cierre cuando el vehículo se estaciona en una pendiente. El mecanismo amortiguador consta de un resorte, la cual produce el esfuerzo amortiguador. El equipo de ingenieros considera que el esfuerzo amortiguador es una función de los siguientes factores:

• La distancia que se desplaza el cilindro.

• La altura del resorte del pivote a la base.

• La distancia horizontal del pivote al resorte.

Page 15: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                13 

• La altura libre del resorte auxiliar.

• La altura libre del resorte principal.

Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar todos estos factores dentro de ciertos rangos. Identificados los niveles apropiados de estos factores, puede diseñarse un experimento que conste de varias combinaciones de los niveles de los factores, y el prototipo del gozne puede probarse con estas combinaciones. Obteniendo información respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y, mediante el análisis de esta información, podrá mejorarse el diseño del tope.

Page 16: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                14 

UNIDAD II Inferencia Estadística

 

 2.1 Introducción.-    El campo de la estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas. Cualquier persona tanto en su carrera profesional como en la vida cotidiana recibe información en forma de datos a través de periódicos, de la televisión y de otros medios. A menudo es necesario obtener alguna conclusión a partir de la información contenida en los datos de manera rutinaria, el conocimiento de la estadística tiene una importancia especial en estos campos. De manera específica, el conocimiento de la estadística puede constituirse en una herramienta poderosa para ayudar a los científicos e ingenieros a diseñar nuevos productos y sistemas, a perfeccionar los existentes y diseñar, desarrollar y mejorar los procesos de producción. Pero, ¿Cuáles son las aplicaciones de la estadística? A pesar de que manejamos la estadística desde hace ya algunos años y en muchas áreas de nuestras vidas, la mayoría de nosotros aún no logramos entender el poder de su aplicación. Por ejemplo si se desea estimar la edad promedio de los profesores de la UACJ, se toma una muestra de cinco profesores, seleccionados al azar de una lista de 100. Después de tomar las observaciones, el interés podría centrarse en cuestiones como: ¿La edad promedio de los profesores es menor que 37 años?, o ¿Cuánta confianza puede tenerse en que la edad promedio se encuentra en el intervalo que va de 30 a 45? Los métodos de la estadística inferencial se emplean para dar respuestas a estas preguntas. Y a otras del mismo tipo. El campo de la estadística inferencial se ha desarrollado principalmente desde comienzos del siglo pasado. La mayor parte del uso de moderno de la estadística, particularmente en la ciencia y en la ingeniería, se dirige mucho hacía la inferencia. Por ejemplo un ingeniero que diseña un nuevo circuito de computadora fabricará un prototipo y entonces querrá obtener conclusiones sobre la forma en que estos dispositivos funcionarán una vez que se produzcan a gran escala.

2.2 Conceptos básicos de estadística.-

Población.- Es una colección o totalidad de observaciones posibles que nos interesen, ya sea de individuos, especímenes, objetos o medidas, sobre los que se hace un estudio con el fin de acrecentar el conocimiento que se tiene sobre ellos, cabe mencionar que hay poblaciones finitas e infinitas.

Población finita.- Es aquella en la que se pueden medir todos los individuos para tener un conocimiento de exacto de sus características. Por ejemplo si en la escuela hay 600 estudiantes que clasificamos de acuerdo a su tipo sanguíneo, decimos que tenemos una población finita de tamaño 600. Los números en las cartas de una baraja, las alturas de los residentes de cierta ciudad y las longitudes de los peces en un lago en particular, son otros ejemplos.

Page 17: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                15 

Población infinita.- Es aquella en la que la población es grande y es imposible e incosteable medir todos los individuos. Casos como un experimento de lanzamiento de un dado, las observaciones que se obtienen de medir la presión atmosférica de cada día del pasado al futuro, o todas las mediciones de la profundidad de un lago desde cualquier posición posible, son ejemplos de poblaciones cuyo tamaño es infinito.

Es necesario mencionar que algunas poblaciones finitas son tan grandes que en teoría las suponemos infinitas. Esto es cierto si se considera la población de la duración de cierto tipo de batería de almacenamiento que se fabrica para su distribución masiva en todo el país.

Muestra representativa.- Es una parte o subconjunto de una población, seleccionada adecuadamente, que conserva los aspectos claves de la población. Las muestras son muy importantes cuando se tienen poblaciones infinitas o grandes como los materiales, productos terminados, partes, componentes o procesos en la industria, ya que en una producción masiva sería imposible o al menos impráctico medir cada pieza de cada material que llega o las propiedades de cada producto terminado.

La manera de tomar una muestra representativa es diseñar de manera adecuada un muestreo al azar. Una mala selección de la muestra puede llevar a inferencias erróneas con respecto a la población, es cuando decimos que el procedimiento esta sesgado, lo que quiere decir que la selección se realizó de cierta forma que favorece ciertos elementos en particular o ciertas características de la población que en la realidad no serían tan representativas. Para eliminar cualquier posibilidad de sesgo es necesario que todos los elementos de la población tengan las mismas oportunidades de ser incluidos en la muestra.

Parámetros.- Características o propiedades medibles que describen una población o conjunto de individuos o elementos. El valor de un parámetro es usualmente desconocido. Algunos ejemplos de parámetros son la media, la varianza o la proporción (en la industria, por ejemplo, un parámetro puede ser la proporción de productos defectuosos en una línea de producción).

Estimadores.- También se le llaman estadísticos, se podría decir que son formulas que extraen información de una muestra proveniente de una población y que además no dependen de un parámetro poblacional desconocido. En otras palabras el valor de un estadístico sólo depende de elementos seleccionados de la muestra, por lo que es lógico que el valor varíe de una muestra a otra.

Conocer la distribución de un estadístico nos permitirá hacer tanto estimaciones de parámetros como pruebas de validez de hipótesis o conjeturas que se tengan sobre una población, hay que mencionar que sería imposible que un estadístico funcione sin error y de un valor exacto del parámetro desconocido. Para cada parámetro existen varios estimadores y escoger uno de ellos es un problema para la mayoría de los estudiantes

Page 18: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                16 

pero los puntos a considerar para una buena elección son lo que en estadística llamamos insesgadez y eficiencia.

o Insesgadez.- Anteriormente se había mencionado lo que significa que un procedimiento estadístico este sesgado, de acuerdo a eso un estimador insesgado es aquel que no favorece ciertas características de la población que puedan hacer que cometamos errores al encontrar valores muy alejados de los que realmente tienen los parámetros poblacionales Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es un estimador insesgado de la misma.

o Eficiencia.- Diremos que un estimador es más eficiente o preciso que otro si la varianza del primero es menor que la del segundo.

En la siguiente figura por ejemplo se ilustran las distribuciones muestrales de tres diferentes estimadores Θ1, Θ2, y Θ3 todos para Θ. Es claro que sólo Θ1 y Θ2 son insesgados, pues sus distribuciones están centradas en Θ. El estimador Θ1 tiene una varianza menor Θ2 y por lo tanto es más eficiente. De aquí que nuestra elección de un estimador de Θ, entre los tres que se consideran, sería Θ1.

Figura 2.1 Distribuciones muestrales de diferentes estimadores de Θ.

Finalmente una representación de la relación entre población y muestra, parámetros y estadísticos.

Figura 2.2 Relación entre población y muestra, parámetros y estadísticos.

Page 19: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                17 

2.3 Pruebas de hipótesis.-

A menudo el problema al que se enfrenta el ingeniero no es tanto la estimación de un parámetro poblacional, sino más bien la formación de un procedimiento de decisión que se base en los datos con los que contamos y pueda producir una conclusión acerca de algún sistema que nos ayude a aceptar o rechazar una hipótesis de determinada situación.

Algunos ejemplos de hipótesis o conjeturas que nos importarían probar en la industria son:

a) Este proceso produce menos del 3% de artículos defectuosos. b) Hemos logrado mejorar nuestro proceso en 5% respecto al mes anterior. c) La edad de los operadores no influye en su rendimiento d) El contenido de los envases tiene mucha variabilidad. e) Éste es el defecto más común que se observa y debe a la causa x.

Muchas veces no se tienen elementos para probar las afirmaciones anteriores o mostrar datos adecuados que afirmen la conjetura, el diseño de experimentos es la técnica que no sólo permite probar sino también cuantificar los riesgos y el impacto que traería si cualquiera de las hipótesis fuera valida.

Para comenzar a adentrarnos en el tema podríamos comenzar por dar una definición de prueba de hipótesis.

o Prueba de hipótesis.- Es una regla o procedimiento para decidir si se rechaza una hipótesis a favor de una segunda, con base en la información que provee o podemos observar en una muestra aleatoria de datos de la población en estudio.

2.3.1 Hipótesis estadísticas: Conceptos generales.-

Una hipótesis estadística es una conjetura o afirmación sobre los valores de los parámetros de una población. Cabe mencionar que nunca se sabe con absoluta seguridad la falsedad o verdad de una hipótesis estadística a menos de que examinemos toda la población. Esto por supuesto, sería muy poco práctico e incluso costoso en la mayoría de las ocasiones. En su lugar tomamos una muestra aleatoria de la población de interés y utilizamos los datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hipótesis.

Algo que debe quedar muy claro es que al momento de diseñar un procedimiento de decisión o una prueba de hipótesis se debe hacer con la idea de la probabilidad de una conclusión errónea. Por ejemplo, si un investigador médico desea demostrar que beber café aumenta el riesgo de contraer cáncer, la hipótesis a probar debe ser “no hay aumento en el riesgo de contraer cáncer como producto de beber café”; de manera

Page 20: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                18 

similar para apoyar la afirmación de que un tipo de medidores es más preciso que otro, el ingeniero debe probar la hipótesis de que no hay diferencia en la precisión de los dos tipos de medidor.

Esto debe ser así por la siguiente explicación: suponga que un ingeniero establece que la fracción de productos defectuosos en cierto proceso es de 0.10, y al probar 100 artículos se encuentra que 12 están defectuosos. Con esto concluiríamos que no hay suficiente evidencia para rechazar la hipótesis de que p = 0.10, lo que nos conduciría a su aceptación. Sin embargo, con la observación anterior también se podrían aceptar más hipótesis como p = 0.12 o incluso p = 0.15. Como podemos ver la aceptación de una hipótesis simplemente nos indica que no hay suficiente seguridad para rechazarla, lo que no ayuda de mucho. En cambio el encontrar un argumento falso nos ayuda a llegar a una conclusión con más evidencia. En otros términos una aceptación podría ser igual a decir “Puede ser una hipótesis verdadera pero no estoy seguro de que sea la real” mientras que un rechazo sería igual a decir “estoy seguro de que esa hipótesis es falsa”. Ahora se ve con más claridad por que al intentar probar algo debemos buscar el rechazo de lo contrario, para poder estar mucho más seguros de nuestras pruebas.

Para concluir se puede decir que el objetivo de formular una prueba de hipótesis es determinar, con base en la información de una muestra de datos elegida al azar de la población en estudio, cuál de las dos hipótesis que se pueden formular en un procedimiento de este tipo es la que se aceptará como correcta.

2.3.2 Hipótesis nula y alternativa.-

En un procedimiento de prueba, se sigue la regla de suponer la existencia de dos tipos de hipótesis, una de ellas se defenderá como verdadera a menos de que exista suficiente evidencia en contra, y es precisamente la que deseamos probar teniendo en cuenta lo que se menciono en el subtema anterior. Ésta se denomina hipótesis nula denotándose como H0, generalmente se deriva del hecho de que se plantea como una igualdad.

La segunda hipótesis que se encontrará es la que se contrastará con la nula, será la contraparte llamada hipótesis alternativa denotándose como HA. La hipótesis alternativa permite la posibilidad de varios valores. De aquí si H0 es la hipótesis nula p = 0.5, la hipótesis alternativa HA sería una de las siguientes:

p < 0.5, p > 0.5, o p ≠ 0.5

Ejemplos:

(a) En una empresa que ensamblan televisores hay una línea de armado de uno de los componentes donde el tiempo estándar debe ser de 10 minutos en promedio. Debido a un cambio de proveedor de componentes, existe la sospecha de que lo anterior

Page 21: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                19 

ha influido negativamente en el tiempo de ensamblado, incrementándose el tiempo promedio de armado. En este caso la hipótesis nula, es la afirmación de que el tiempo promedio en el armado del componente es de 10 minutos y se escribe por H0: µ =10 min. y la hipótesis alternativa o contraria dice que el tiempo promedio es mayor a los 10 minutos puesto que si fuera menor el cambio no hubiera sido negativo, así que la hipótesis sería HA: µ >10 min.

(b) Una empresa que fabrica bolígrafos compra balincillos de acero de diámetro 2 milímetros para su fabricación y acepta una tolerancia en el diámetro de ± 0.5 mm. Para verificar que la empresa fabricadora de balines satisface los requerimientos del fabricante de bolígrafos se selecciona una muestra de 100 balincillos para contrastar la hipótesis nula y alternativa se plantearían como: H0: µ = 2mm y HA: µ ≠ 2mm (el signo ≠ se debe a que los balines no servirían para la fabricación de bolígrafos si el diámetro no fuera de 2mm).

2.3.3 Criterio de rechazo.-

Como ya habíamos visto una vez planteadas las hipótesis, se toma una muestra aleatoria de la población para después utilizar la información de ésta en un estadístico de prueba que es una función que además de depender de los datos de la muestra depende de H0, como lo son por ejemplo los estadísticos Z o T, como veremos más adelante. En el valor de este estadístico se basará nuestra decisión de aceptar o rechazar la hipótesis nula. Dependiendo de cada caso habrá una región de rechazo de H0 y una región de aceptación de H0. La primera se refiere a todo el conjunto de valores que puede tomar el estadístico de prueba para los que la hipótesis nula será rechazada. Mientras que la segunda describe todos aquellos valores que de manera contraria no conllevan a rechazar H0. El último número que observamos al pasar de la región de aceptación a la región crítica se llama valor crítico.

La hipótesis nula será entonces rechazada si y sólo si el valor observado o calculado del estadístico de prueba se ubica en la región de rechazo, región que a vez depende de si la H0 (hipótesis nula) es bilateral o unilateral. Se dice que es bilateral o una prueba de dos colas cuando la hipótesis alternativa (HA) se plantea con el signo ≠, y es unilateral o una prueba de una cola cuando en la alternativa se encuentran los signos “mayor que” (>) o “menor que” (<). Por lo tanto, en los ejemplos anteriores de los televisores y los bolígrafos, el primero se resolvería con una prueba unilateral al ser la siguiente la hipótesis alternativa HA: µ > 10 min., mientras que el segundo sería bilateral debido a la hipótesis HA: µ ≠ 2mm.

Como ya se sabe se utiliza la distribución normal para representar gráficamente una prueba de hipótesis y sabemos además que dicha gráfica tiene forma de campana. En la siguiente figura se ilustra la manera de representar la prueba realizada tanto para el ejemplo de los televisores como para el de los bolígrafos.

Page 22: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                20 

Figura 2.3 Hipótesis unilateral y bilateral, regiones de aceptación y rechazo.

Hay que mencionar que los números Zα y Zα/2 que separan la región de rechazo, se leen en la tabla de la distribución normal para el valor α deseado o indicado por el problema. La región de rechazo no es el área sombreada bajo las curvas sino más bien los valores en el eje X que estás en esa zona; el área sombreada corresponde a la probabilidad de la región de rechazo o el tamaño de α.

Los pasos para un procedimiento de prueba son realmente fáciles:

Se plantean las hipótesis según el caso. Gráficamente se sombrean las áreas de rechazo separadas de la región de aceptación

por los valores Zα y Zα/2 encontradas en la tabla de distribución normal. Se calcula el estadístico de prueba que se representará como Z0 sustituyendo en la

formula correspondiente los valores encontrados en la muestra. Finalmente si el estadístico cae dentro de la región de rechazo se rechazará H0

tomando la hipótesis alternativa (HA) como la verdadera; en caso de no rechazar H0 esta se aceptará como verdadera. En el ejemplo de los televisores esto equivaldría a que Z0 sea mayor que Zα. En el de los bolígrafos se rechaza H0 si Z0 < - Zα/2 o si Z0 > Zα/2.

2.3.4 Errores tipo I y tipo II en la prueba de hipótesis.-

Un procedimiento de decisión como el descrito anteriormente podría conducir a dos conclusiones erróneas. Dichas conclusiones reciben el nombre de error tipo I y error tipo II.

Para ilustrar y entender mejor estos dos conceptos, considere el siguiente ejemplo. Se sabe que cierto tipo de vacuna contra el catarro sólo es efectiva en 25% después de un periodo de dos años. Para determinar si una nueva vacuna y algo más cara es superior al proporcionar la protección contra el mismo virus durante un periodo más largo, suponga que se eligen 20 personas al azar y se vacunan. Si más de ocho de

Page 23: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                21 

los que reciben la nueva vacuna pasan el periodo de dos años sin contraer virus, la nueva vacuna se considerará superior a la que se usa en la actualidad.

La nueva vacuna puede no ser mejor que la que se usa actualmente, pero puede suceder que en este grupo escogido de forma aleatoria, más de ocho pasen el periodo de dos años sin contraer el virus. Cometeríamos un error al rechazar la hipótesis de que la nueva vacuna es igual a la que ya existe (H0) a favor de la hipótesis de que la nueva vacuna es superior (HA) cuando de hecho H0 es verdadera. Tal error se llama error tipo I.

En pocas palabras el error tipo I es aquel que ocurre cuando se rechaza la hipótesis nula cuando en realidad es verdadera. A la probabilidad de cometer un error tipo I, se le llama nivel de significancia, se denota con la letra griega α. La región de rechazo se determina de antemano con el tipo de hipótesis alternativa y el valor α del nivel de significancia, dado por el problema o decidido por el investigador desde un principio. Generalmente se utilizan los valores α = 0.05 o 0.01. Para darnos una idea de su uso; utilizar α = 0.05 significa que por cada 100 veces que se aplique el procedimiento de manera independiente y se rechace H0 se espera que en promedio 95 veces tal decisión sea correcta. Esa probabilidad del 95% viene de 1- α = p como α = 0.05, p = 1 – 0.05 = 0.95, o que es lo mismo 95%.

Si volvemos al ejemplo de las vacunas una segunda clase de error se puede cometer si ocho personas o menos del grupo pasan el periodo de dos años sin contraer el virus de forma exitosa y concluimos que la nueva vacuna no es mejor cuando realmente lo es. En este caso aceptaríamos H0 cuando es falsa. Éste se llama error tipo II y se denota por β, normalmente se recomienda que β tenga un valor del 0.10. A 1- β se le llama potencia de la prueba. Por lo general en las pruebas de hipótesis se especifica el valor de α y se diseña la prueba de tal forma que el valor β sea pequeño. Esto nos dice que el valor del error tipo I se puede controlar directamente, mientras que el error tipo II se controla indirectamente con el tamaño de la muestra; a más datos β será menor. En otras palabras cuando se tiene una muestra grande la potencia de la prueba es mayor, es decir se incrementa la posibilidad de rechazar H0 si ésta es falsa. Es necesario mencionar que controlar el valor de β puede parecer fácil sin embargo debido a que también el tamaño de la muestra adecuado se debe estimar el valor de β puede ser muy arbitrario.

El objetivo deseado por todo estadístico es tener una prueba potente. Sin embargo cuando el tamaño de la muestra se incrementa en exceso se llega a tener una potencia excesiva que podría resultar contraproducente amentando la probabilidad de un error tipo I.

En la práctica es mucho más delicado cometer un error tipo I que un error tipo II ya que en la mayoría de los casos el rechazo de una hipótesis nula tiene como consecuencia un cambio de algo que ya era convencional originando a veces costos que de ser un error, traerían pérdidas irreparables a la empresa. Por ejemplo, sería obviamente mucho mejor que el director del programa de prueba de las vacunas

Page 24: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                22 

cometiera un error tipo II, es decir, aceptar la hipótesis de que la actual y la nueva vacuna tienen la misma eficiencia cuando no es cierto; en vez de cometer el error tipo I de que la nueva vacuna es superior cuando no lo es, ya que de ser así se tomaría la decisión de gastar mucho más dinero en la nueva vacuna siendo que la actual, mucho más barata, evitaba contraer la enfermedad exactamente igual.

A continuación un resumen de las posibles situaciones que se pueden dar al probar una hipótesis estadística:

H0 es verdadera H0 es falsa Aceptar H0 Decisión correcta Error tipo II

Rechazar H0 Error tipo II Decisión correcta Tabla 2.1 Tipos de errores

2.4 Prueba con respecto a una sola media con varianza (σ2) conocida.-

Normalmente en el estudio de un proceso suelen interesarnos características como la media y la varianza (o desviación estándar), ya que éstas tienen que ver directamente con la posibilidad de que el producto cumpla con los requerimientos del proceso de producción. En particular al estudiar la media µ de un proceso, es de interés preguntarse si ésta es igual, mayor o menor a cierto valor µ0, donde µ0 representa la media que se obtiene de la muestra. Una pregunta así sólo se podría responder a menos de que se plantee una hipótesis estadística adecuada.

Estas pruebas se pueden llevar acabo suponiendo una varianza poblacional (σ2) conocida o desconocida, en seguida se explicarán ambas a pesar de que muy difícilmente nos encontraremos con el caso donde sea conocida la varianza poblacional.

Tabla 2.2 Pruebas de hipótesis para una media poblacional.

Page 25: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                23 

Caso (i)

Caso (ii)

Caso (iii)

Figura 2.4 Regiones de rechazo para cada caso.

Page 26: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                24 

En la tabla 2.2 podemos observar que para rechazar cualesquiera delas dos hipótesis basta con comparar |Z| con Zα, y de manera similar en el último caso sólo basta comparar a |Z| con Zα/2. Haciendo las comparaciones de esta manera se lograra hacer un procedimiento mucho más simple.

Ejemplo 1:

Un fabricante de sistemas de aspersión que se utilizan para protección contra incendios en edificios de oficinas afirma que el verdadero promedio de temperatura de activación del sistema es de 130º. Una muestra de n = 9 sistemas, cuando se prueba, produce un promedio muestral de temperatura de activación de 131.08ºF. Si la distribución de las temperaturas de activación es una variable X normal con desviación estándar de 1.5ºF, ¿Contradicen los datos la afirmación del fabricante al nivel de significancia α = 0.01?

Procedimiento de solución:

1. H0: µ= 130 2. HA: µ≠ 130 3. α = 0.01; como es una prueba bilateral se obtiene α/2 = 0.01/2 = 0.005 4. Se busca -Zα/2 y Zα/2 en la tabla de distribución normal es decir - Z0.005 = -2.58 y

Z0.005 = 2.58. 5. Región crítica o de rechazo: Z < - 2.58 y Z > 2.58. 6. Cálculo de Z: n= 9, x = 131.08, σ = 1.5, µ0 = 130. Z= x - µ0 = 130.08 - 130 = 2.16

σ/ √n 1.5/√9 7. Decisión: aceptar H0 ya que no cae en la región de rechazo. Por lo tanto lo que se

encontró no contradice la afirmación del fabricante.

Ejemplo 2:

Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9, ¿Esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.

Procedimiento de solución:

1. H0: µ= 70 años 2. HA: µ > 70 años 3. α = 0.05 4. Se busca Zα en la tabla de distribución normal es decir Z0.05 = 1.645. 5. Región crítica o de rechazo: Z > 1.645. 6. Cálculo de Z: n= 100, x = 71.8, σ = 8.9, µ0 = 70. Z= x - µ0 = 71.8 - 70 = 2.02

σ/ √n 8.9/√100 7. Decisión: rechazar H0 y concluir que la vida media hoy en día es mayor que 70

años.

Page 27: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                25 

En este y en cualquier ejemplo se puede obtener el valor de la probabilidad de obtener una Z= 2.02 y está dado por el área de la región sombreada como se muestra.

P = P (Z > 2.02) = 0.0217

Figura 2.5 Valor P para el ejemplo anterior

Para finalizar vale la pena decir que este método de prueba con varianza conocida también es aplicado mientras la muestra sea grande, es decir en aquellas donde n ≥ 30. Como se puede ver la técnica para efectuar una prueba de hipótesis es relativamente simple; únicamente se debe conocer el estadístico de prueba correspondiente, calcular el valor crítico Zα o Zα/2, compararlos y decidir rechazar o no rechazar la hipótesis nula. Sin embargo podemos cometer unos de los dos posibles errores al tomar cualquier decisión durante la prueba. 

 

2.5 Prueba con respecto a una sola media con varianza (σ2) desconocida.-

Tabla 2.3 Pruebas para µ con varianza poblacional desconocida.

Page 28: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                26 

Hacer una prueba con la varianza poblacional desconocida es prácticamente lo mismo que con varianza conocida, sólo hay que tener presentes algunas modificaciones:

Nuestro estadístico de prueba ahora es: T = x - µ0 donde S= desviación S / √n; de la muestra

Este estadístico maneja n – 1 grados de libertad y esto se representa con la letra v

Ejemplo 1:

Un comprador de baterías tipo “D” requiere que tengan una duración promedio de 22hrs. Un fabricante de dicho tipo de baterías afirma que su producto satisface la demanda requerida además de estar distribuido normalmente. El comprador toma una muestra aleatoria de 9 baterías y las usa en diversos artículos electrónicos teniendo una vida útil promedio de 20hrs. y una desviación estándar de 3. ¿Deberá el comprador confiar en la palabra del fabricante y adquirir sus baterías? Utilizar un nivel de significancia de α = 0.05.

Procedimiento de solución:

1. H0: µ= 22 2. HA: µ ≠ 22 3. α = 0.05 y v = n – 1= 9 – 1 =8 4. Se busca -Tα/2 y Tα/2 en la tabla de distribución t-student con v = 8 grados de

libertad es decir - T0.025 = - 2.306 y T0.025 = 2.306. 5. Región crítica o de rechazo: T < - 2.306 y T > 2.306. 6. Cálculo de T: n= 9, x = 20, S = 3, µ0 = 22. T= x - µ0 = 20 - 22 = -2.0

σ/ √n 3/√9 7. Decisión: no rechazar H0 ya que el valor del estadístico cae dentro de la región de

aceptación. Por lo tanto el comprador puede confiar en la palabra del fabricante.

El ejemplo anterior se puede representar gráficamente de la siguiente manera:

Figura 2.6 Regiones o intervalos de rechazo y de aceptación

Page 29: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                27 

Ejemplo 2:

Un fabricante de dulces compra costales de azúcar a un cierto ingenio. Según los vendedores, los costales tienen un peso medio de 50.1 kg. EL comprador sospecha que el peso medio es menor. ¿Será cierta su sospecha, al realizar una prueba con un nivel de significancia del 5% (α = 0.05), sobre una muestra de 15 bultos en la que se obtiene un valor x = 49.4 y S2 = 1.2?

Procedimiento de solución:

1. H0: µ= 50.1 2. HA: µ < 50.1 3. α = 0.05 y los grados de libertad serán v = n – 1= 15 – 1= 14 4. Como el signo de HA es < se busca -Tα con 14 grados de libertad en la tabla de

distribución t-student es decir -T0.05 = -1.761. 5. Región crítica o de rechazo: T < -1.761. 6. Cálculo de T: n= 15, x = 49.4, S = √1.2, µ0 = 50.1. Z= x - µ0 = 49.4 – 50.1 = -2.47

σ/ √n √1.2/√15 7. Decisión: rechazar H0 debido a que -2.47 < -1.761, con ello rechazamos también la

afirmación de que los bultos tienen un peso medio de 50.1.

La representación gráfica de la zona de rechazo sería:

Figura 2.7 Zona de rechazo para ejemplo de los costales.

Así como para las muestras ≥ 30 se puede usar el estadístico Z en las muestras menores que 30 el uso de la distribución t en distribuciones en forma de campana es bastante buena debido a que con otras distribuciones es muy difícil detectar desviaciones de una distribución normal.

2.6 Prueba para la varianza con una muestra.-

Las pruebas relacionadas con varianzas o desviaciones estándar poblacionales en realidad no son difíciles de motivar. Los ingenieros y los científicos constantemente se enfrentan a estudios en los que se les requiere demostrar que las mediciones involucradas con productos o procesos caen dentro de las especificaciones que fijan los consumidores. Las especificaciones a menudo se cumplen si la varianza del proceso es

Page 30: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                28 

suficientemente pequeña. Otra aplicación de este procedimiento es la experimentación comparativa como se verá más adelante.

Características del procedimiento:

Las hipótesis se plantean de la misma menara que cuando se hace para una prueba con respecto a la media. Siendo < > o = los signos que pueden ser utilizados para especificar la HA

El estadístico de prueba será X2 de la distribución de ji cuadrada Al igual que en la distribución t-student se utilizará el valor v = n – 1, como los

grados de libertad.

Ejemplo1:

Un fabricante de baterías para auto afirma que la duración de sus baterías se distribuye de forma aproximadamente normal con una desviación estándar igual a 0.9 años. Si una muestra aleatoria de 10 de tales baterías tiene una desviación estándar de 1.2 años ¿Considera que σ > 0.9 años? Utilice un nivel de significancia de 0.05.

Procedimiento de solución:

1. H0: σ2 = 0.81 2. HA: σ2 > 0.81 3. α = 0.05 y los grados de libertad serán v = n – 1= 10 – 1= 9 4. Se busca X2

α con 9 grados de libertad en la tabla de distribución ji cuadrada es decir X2

0.05 = 16.919. 5. Región crítica o de rechazo: X2 > 16.919. 6. Cálculo de X2: n= 10, S2= (1.2)2 = 1.44, σ0

2 = 0.81, X2= (n – 1) S2 = 9(1.44) = 16

σ02 0.81

7. Decisión: aceptar H0 ya que 16 no es mayor que 16.919, con ello rechazamos también la consideración de que σ > 0.9 años.

Figura 2.8 Región crítica para la hipótesis alternativa σ2 > 0.81 años

Page 31: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                29 

Nuestra decisión se baso en que el estadístico no cae dentro de la región de rechazo, en este caso unilateral como muestra la figura, puesto que dicha región se concentra en una cola de la distribución correspondiente.

2.7 Hipótesis para dos medias con distribución normal (Z).-

En la industria un problema muy común es la comparación de dos productos similares como baterías para automóviles, linternas, radios, celulares etc.; y cada uno de los fabricantes reclama que sus productos tienen una vida promedio µ de duración mayor o al menos igual que el de la competencia. Otro de los problemas frecuentes es el comparar la media de dos procesos o dos tratamientos; ésta es la situación cuando motivados por algún problema de calidad, se comparan dos máquinas o dos métodos de trabajo, por mencionar algunos casos de interés.

Para utilizar el siguiente procedimiento es necesario cumplir con las siguientes condiciones:

Las dos poblaciones en comparación deben de tener una distribución normal y sus varianzas σ2

1 y σ22 deben ser conocidas.

Las muestras x1,…….xm , y1,….yn extraídas de cada una de las poblaciones deben ser independientes.

Tabla 2.4 Pruebas para diferencias de media

Ejemplo 1:

Suponga que un comprador desea decidir cual de dos marcas de focos que cuestan lo mismo, dura más. Para ello selecciona al azar cien focos de cada una de las marcas y encuentra que la marca A tiene una media de muestra de 1180 horas y desviación estándar de 120hrs. Para la marca B encuentra que la vida media de las muestras es de 1160 hrs con una desviación estándar de 40hrs. ¿Qué decisión deberá tomar a un nivel del 95% de significancia? Suponga que se satisfacen las condiciones 1 y 2 antes mencionadas.

Page 32: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                30 

Procedimiento de solución:

1. H0: µ1 - µ2 = 0, probando que ambas marcas tengan el mismo promedio de vida. 2. HA: µ1 - µ2 ≠ 0 3. 1 - α = 0.95, α = 1 – 0.95 = 0.05 4. Se busca -Zα/2 y Zα/2 en la tabla de distribución normal es decir - Z0.025 = -1.96 y

Z0.025 = 1.96. 5. Región crítica o de rechazo: Z < - 1.96 y Z > 1.96. 6. Cálculo de Z: Sustituyendo los siguientes datos:

n x σ

Marca A 100 1180 120 Marca B 100 1160 40

Z = (X1 – X2) – ∆0 = (1180 – 1160) – 0 = 1.58 σ1

2 + σ22 14400 + 1600

√ n1 n2 √ 100 100 7. Decisión: no rechazar H0 ya que 1.58 no cae en la región de rechazo. Por lo tanto lo

que se encontró no contradice la afirmación de que ambas marcas de focos tienen la misma vida media.

Ejemplo 2:

Una empresa norteamericana que se dedica a fabricar ejes de motor para automóviles de 4 cilindros tiene dos plantas en México: una en Cd. Juárez y otra en Tijuana. El sindicato de la planta de Tijuana asegura que el salario promedio semanal de los técnicos de Cd. Juárez es mayor que el de ellos y solicitó a la empresa que se nivelen los salarios para que en Tijuana sus técnicos ganen en promedio lo mismo que los de Cd. Juárez.

La empresa solicitó al departamento de estadística que realizará un estudio para atender la petición sindical. Para ello se tomaron dos muestras al azar de empleados en cada planta para estimar los salarios promedios y compararlos, obteniendo los siguientes resultados (nivel de significancia = 0.05):

Planta n X σ Tijuana 40 1540 150

Cd. Juárez 50 1600 144

Procedimiento de solución:

1. H0: µ1 - µ2 = 0, probando que ambas plantas tengan el mismo salario promedio. 2. HA: µ1 - µ2 > 0 3. α = 0.05 4. Se busca Zα en la tabla de distribución normal es decir Z0.05 = 1.645. 5. Región crítica o de rechazo: Z > 1.645.

Page 33: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                31 

6. Cálculo de Z: Sustituyendo los datos correspondientes: Z = (X1 – X2) – ∆0 = (1540 – 1600) – 0 = - 1.92 σ1

2 + σ22 (150)2 + (144)2

√ n1 n2 √ 40 50 7. Decisión: no rechazar H0 ya que -1.92 no cae en la región de rechazo. Por lo tanto

se llega a la conclusión de que en las dos plantas se paga el mismo salario promedio por semana.

Para concluir este tema es necesario dejar claro que el procedimiento explicado anteriormente es usado cuando σ2

1 y σ22 son conocidas y además sólo cuando n1 y n2

sean lo suficientemente grandes es decir se tengan muestras ≥ 30.

2.8 Hipótesis para dos medias utilizando distribución T-student.-

Las situaciones que más prevalecen que implican pruebas sobre dos medias son las que tienen varianzas desconocidas. Hay dos casos importantes de mencionar en las que se puede utilizar la prueba T combinada:

Caso 1: Se da cuando el científico esta dispuesto a suponer que aunque no conozca su valor σ1 = σ2 es decir se plantean varianzas iguales y desconocidas.

Caso 2: Ocurre cuando el analista no es capaz de suponer que σ1 = σ2, teniendo por lo tanto varianzas diferentes (σ1 ≠ σ2) y desconocidas.

2.8.1 Caso 1: Pruebas para diferencias de medias con varianzas iguales y desconocidas.

En muchos estudios es razonable suponer que las varianzas desconocidas de los dos procesos a comparar son iguales, y un caso de éstos sería cuando en las cartas de control de rangos o histogramas que se hayan realizado en cada proceso se observa “más o menos” la misma dispersión de los puntos.

Tabla 2.5 Pruebas para diferencias de medias con σ1 = σ2 pero desconocidas

Page 34: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                32 

Ejemplo:

Se lleva a cabo un experimento para comprar el desgaste por abrasivo de dos diferentes materiales laminados. Se prueban 12 piezas del material 1 mediante la exposición de cada pieza a una máquina para medir el desgaste. Diez piezas del material 2 se prueban de manera similar. En cada caso, se mide la profundidad del desgaste. Las muestras arrojaron los siguientes datos:

Material N x S 1 12 85 4 2 10 81 5

¿Podemos concluir con un nivel de significancia del 0.05 que el desgaste abrasivo del material excede el del material 2 en más de dos unidades?

Procedimiento de solución:

1. H0: µ1 - µ2 = 2, el 2 se debe a que queremos probar si el desgaste es en más de 2 unidades en el material 1 que el del material 2.

2. HA: µ1 - µ2 > 2 3. α = 0.05, v = (n1 + n2) – 2 = (10 + 22) – 2 = 20 grados de libertad. 4. Se busca Tα con 20 grados de libertad en la tabla de distribución t- student es decir

T0.05 = 1.725. 5. Región crítica o de rechazo: T > 1.725. 6. Cálculo de t: Sustituyendo los datos correspondientes:

x1 = 85 s1 = 4 n1 = 12 x2 = 81 s2 = 5 n2 = 10

S2p = S1

2 (n1 - 1) + S22 (n2 - 1) = (11)(16) + (9)(25) = 4.478

√ n1 + n2 -2 √ 12 + 10 -2 t = (X1 – X2) – ∆0 = (85 – 81) – 2 = 1.04 Sp √1/n1 + 1/ n2 4.478 √(1/12) + (1/10)

7. Decisión: no rechazar H0 ya que 1.04 no cae en la región de rechazo. Por lo tanto se llega a la conclusión de que el desgaste del material 1 no excede por más de 2 unidades el desgaste del material 2.

El procedimiento de prueba anteriormente descrito para el primer caso es el más utilizado en la practica para probar la igualdad de dos medias incluso hay software, como Statgraphics, que usan este método por default.

Page 35: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                33 

2.8.2 Caso 2: Pruebas para diferencias de medias con varianzas diferentes y desconocidas.

En la práctica generalmente se desconocen las varianzas poblacionales y por ende si son distintas o iguales. El problema es que no hay datos históricos sobre los dos procesos que permitan suponer algo pertinente sobre las varianzas. Sin embargo existe un procedimiento con el cual podremos realizar la prueba sin problemas, siempre y cuando se cumplan dos condiciones:

Las muestras son totalmente independientes σ1 ≠ σ2 y desconocidas.

Tabla 2.6 Prueba para diferencia de medias con σ1 ≠ σ2 y desconocidas.

Ejemplo:

Un investigador de cierta universidad desea determinar si los estudiantes que ingresaron a un programa de ciencias el año de 1990 tienen el mismo coeficiente intelectual IQ que los que entraron diez años después en el año 2000.

Se seleccionan dos muestras aleatorias de cuatro estudiantes cada una correspondientes a cada uno de los años de interés de las bases de datos de la universidad y se encontraron los siguientes resultados de inteligencia:

IQ Estudiantes Año 1990: 110, 113, 116, 117 Año 2000: 110, 111, 112, 112     

Page 36: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                34 

Con un nivel de significancia del 0.05 ¿Podría el investigador concluir que los estudiantes del año 2000 tienen menos coeficiente intelectual de los de1990? De los datos se obtiene:

IQ Estudiantes n x S Año 1990 4 114.00 3.16 Año 2000 4 111.25 0.957

Procedimiento de solución:

1. H0: µ1 - µ2 = 0, 2. HA: µ1 - µ2 > 0 3. α = 0.05

4. v = (S12/n1 + S2

2/n2)2 = (3.162/4 + 0.9572/4)2 = 3.4547 ((S1

2/n1)2/n1 – 1) + ((S22/n2)2/n2 - 1) ((3.162/4)2)/3 + (0.9572/4)2)/3

Son 3.4547 grados de libertad al redondear hacia abajo tendremos: v = 3 5. Se busca Tα con 3 grados de libertad en la tabla de distribución t-student es decir

T0.05 = 2.353 6. Región crítica o de rechazo: T > 2.353. 7. Cálculo de t: Sustituyendo los datos correspondientes:

t = (X1 – X2) – ∆0 = (114 – 111.25) – 0 = 1.67 √S1

2/n1 + S22/ n2 √(3.162/4) + (0.9752/4)

8. Decisión: no rechazar H0 ya que 1.67 no cae en la región de rechazo. Con esto no rechazamos la afirmación de que el coeficiente intelectual de los estudiantes que ingresan al programa de ciencias es el mismo para los años de 1990 y 2000.

Un ejemplo en el que se podría aplicar el procedimiento de prueba anterior sería al comparar dos proveedores del mismo material ya que no hay suficientes razones para suponer de antemano que las varianzas de cada uno de ellos sean iguales o parecidas (estadísticamente). Cabe mencionar que este procedimiento trabaja bien aun en el caso de que las varianzas sean iguales así que resulta una prueba muy útil en la práctica.

Como se puede ver las pruebas con respecto a dos medias representan un conjunto de herramientas analíticas muy importantes para un ingeniero, y el procedimiento experimental resulta muy fácil ya que prácticamente implica una sencilla sustitución de datos en la formula adecuada.

Page 37: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                35 

2.9 Prueba para la igualdad de varianzas.-

Para evitar suponer de antemano que las varianzas son iguales o diferentes, se puede proceder a realizar una prueba de igualdad de varianzas antes de realizar la prueba de igualdad de medias. Las hipótesis planteadas en este procedimiento podrían ser las siguientes:

H0: σ12 = σ2

2 HA: σ1

2 < σ22, σ1

2 > σ22, o σ1

2 ≠ σ22

Para muestras aleatorias independientes de tamaño n1 y n2, el estadístico de prueba será: F = S1

2 S2

2 Donde S1

2 y S22 so las varianzas calculadas de las dos muestras. La prueba tiene

las siguientes características: La distribución a utilizar será la F Esta distribución exige un valor v1 y v2, que son los grados de libertad

para cada muestra. o v1 = n1 – 1 o v2 = n2 – 1

Las regiones criticas de tamaño α que corresponden a las alternativas unilaterales son: o σ1

2 < σ22 → F < f1-α(v1,v2)

o σ12 > σ2

2 → F > fα(v1,v2) Para la alternativa bilateral:

o σ12 ≠ σ2

2 → F < f1-α/2 (v1,v2) y F > fα/2 (v1,v2) Ejemplo: Al probar la diferencia en el desgaste abrasivo de los dos materiales del ejemplo para el tema 2.6.1, supusimos que las dos varianzas poblacionales desconocidas eran iguales. ¿Se justifica esta suposición? Utilice un nivel de significancia de 0.10. Procedimiento de solución:

1. H0: σ12 = σ2

2 2. HA: σ1

2 ≠ σ22

3. α = 0.10 y los grados de libertad serán: v1 = n1 – 1= 12 – 1= 11 v2 = n2 – 1= 10 – 1= 9

4. Se busca f 1-α/2(11,9) y fα/2(11,9) con v1 = 11 y v2 = 9 grados de libertad en la tabla de distribución F es decir f0.05(11,9) = 3.11 f0.95(11,9) = 0.34. esta última pudo haber sido calculada con 1/ f0.05(11,9) es decir 1/3.11 = 0.34

5. Región crítica o de rechazo: F < 0.34 y F > 3.11.

Cálculo de F: F = S12 = 16 = 0.64

S22 25

6. Decisión: aceptar H0 ya que 0.64 no entra en la región de rechazo. No hay suficientes evidencia de que las varianzas sean diferentes.

Page 38: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                36 

Figura 2.9 Región crítica para la alternativa σ1

2 ≠ σ22

Esta es una gran herramienta, ya que el valor de la varianza muestral es un

determinante del desempeño y capacidad de los procesos para cumplir con las especificaciones de calidad. A menor varianza, mejor calidad.

Page 39: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                37 

UNIDAD III Análisis de varianza (ANOVA)

3.1 Experimentos de un solo factor: procedimiento de prueba para la igualdad de medias poblacionales.

Análisis de varianza es una técnica estadística para realizar la prueba de hipótesis siguiente:

H0 : µ1 = µ2 =…= µk vs H1 : Al menos dos de las medias no son iguales

y se dice de un factor porque las medias a prueba se refieren a una sola característica o factor de cada una de las poblaciones, como por ejemplo:

Rendimiento en kilómetros por litro de gasolina para cinco marcas (poblaciones o tratamientos del factor) distintas.

Tiempo de duración en horas de varias marcas de focos de 100 watts. Tiempo en minutos para que surta efecto cierto tipo de anestesia administrada en

cuatro dosis distintas aplicadas a cuatro grupos de individuos. Duración en años para cinco marcas distintas de acumuladores para automóvil.

Las hipótesis anteriores se pueden escribir de forma equivalente como

H0 : τ1 = τ 2 =…= τ k H1 : τi ≠ 0 para algún i

donde τi es el efecto del tratamiento i sobre la variable de respuesta. Si se acepta H0 se confirma que los efectos sobre la respuesta de los k tratamientos son estadísticamente nulos (iguales a cero), y en caso de rechazar se estaría concluyendo que al menos un efecto es diferente de cero. La equivalencia de las dos hipótesis anteriores se puede ver fácilmente en la figura 3.1, que es una manera de representar el diseño completamente al azar. En la figura se ve que τi = µi - µ, es decir, el efecto del tratamiento i (τi) es la distancia entre la respuesta media del tratamiento, µi, y la respuesta media global, µ, y cuando un efecto es igual a cero, equivale a decir que la media del tratamiento correspondiente es igual a la media global. Para que todas las respuestas medias de tratamientos sean iguales a la respuesta media global µ representadas por la línea horizontal, se requiere que todos los

efectos τi sean iguales a cero.

Figura 3.1 Representación de los efectos de tratamientos completamente

al azar.

Page 40: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                38 

3.2 Diseño completamente aleatorizado, muestras iguales. Se seleccionan muestras aleatorias de tamaño n de cada una de las k poblaciones. Las k poblaciones diferentes se clasifican sobre la base de un solo criterio, como tratamientos o grupos diferentes. Tratamiento se usa para referirnos a las diversas clasificaciones, ya sea mezclas diferentes, análisis diferentes, fertilizadores diferentes o regiones del país diferente. Las k poblaciones son independientes y normalmente distribuidas con medias µ1, µ2,…, µk y varianza común σ2. Como se menciono en un principio debemos probar a hipótesis

H0 : µ1 = µ2 =…= µn vs H1 : Al menos dos de las medias no son iguales

Denotemos yij la j-ésima observación del i-ésimo tratamiento y los datos se acomodan como en la tabla 3.1. Yi es el total de todas las observaciones en la muestra i-ésimo tratamiento, ỹi es la media de todas las observaciones de la muestra del i-ésimo tratamiento. Cada observación se puede escribir en la forma

yij = µi + εij donde εij representa el error aleatorio.

Tratamiento: 1 2 … i … k y11 y21 ... yi1 … yk1 y12 y22 … yi2 … yk2 y1n y2n … yin … ykn Total Y1 Y2 … Yi … Yk Y Media ỹ1 ỹ2 … ỹi … ỹk ỹ

Tabla 3.1 k muestras aleatorias

Nuestra prueba se basará en una comparación de dos estimaciones independientes de la varianza poblacional común σ2. Estas estimaciones se obtendrán al dividir la variabilidad total de nuestros datos. Representados en la doble sumatoria

en dos componentes.

Page 41: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                39 

Identidad de suma de cuadrados

Es conveniente identificar los términos de la identidad de la suma de cuadrados mediante la siguiente notación:

La identidad de cuadrados la podemos representar de la siguiente manera

SST = SSA + SSE Si H0 es verdadera, una estimación de σ2, que se basa en k – 1 grados de libertad, la proporciona la siguiente expresión Cuadrado medio del tratamiento

Para un segundo e independiente estimador de σ2, que se basa en k(n – 1) grados de libertad, es la fórmula Cuadrado medio del error

Cuando H0 es verdadera, la razón f = s1

2 / s2 es un valor de la variable F que tiene una distribución F con k – 1 y k(n – 1) grados de libertad. Como s1

2 sobrestima σ2 cuando H0 es falsa, tenemos una prueba de una cola con la región crítica completamente en la cola derecha de la distribución.

Page 42: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                40 

La hipótesis nula H0 se rechaza en el nivel de significancía cuando

Otro enfoque, la aproximación del valor P, sugiere que la evidencia a favor o en contra de H0 es

Los cálculos para un problema de análisis de varianza lo podemos resumir en forma tabular como se ve en la tabla 3.2. Fuente de la variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

f calculada

Tratamientos SSA k – 1 s12= SSA

k - 1 s1

2 s2

Error SSE k(n – 1) s2 = SSE k(n – 1)

Total SST nk – 1

Tabla 3.2 Análisis de varianza para la clasificación unilateral Ejemplo Pruebe la hipótesis µ1 = µ2 =…= µ5 en el nivel de significancia de 0.05 para los datos que se muestran en la siguiente tabla sobre la absorción de la humedad por varios tipos de mezclas de cemento.

Mezcla: 1 2 3 4 5 551 595 639 417 563 457 580 615 449 631 450 508 511 517 522 731 583 573 438 613 499 633 648 415 656 632 517 677 555 679 Total 3320 3416 3663 2791 3664 16.854 Media 553.33 569.33 610.50 465.17 610.67 561.80

Solución

H0 : µ1 = µ2 =…= µ5 H1 : Al menos dos de las medias no son iguales

α = 0.05 Región critica: f > 2.76 con v1 = 4 y v2 = 25 grados de libertad.

Cálculos: SST = (551 – 561.8)2 + (457 – 561.8)2 + … + (679 – 561.8)2 = 209,377 , SSA = 6[(553.33 – 561.8)2 + (569.33 – 561.8)2 + … + (610.67 – 561.8)2] = 85,356 , SSE = 209,377 – 85,356 = 124,021.

Page 43: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                41 

Fuente de la variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

f calculada

Tratamientos 85356 4 21339 4.3014 Error 124021 25 4960.84 Total 209377 29 P = 0.0088

La decisión es rechazar H0 y concluir k las mezclas no tienen la misma absorción media. El valor P para f = 4.3014 es menor que 0.01. 3.3 Análisis de varianza para muestras diferentes. Durante el trabajo experimental con frecuencia se pierden algunas de las observaciones que se desean. Los animales e experimentación se mueren, el material experimental se puede dañar y los sujetos humanos pueden abandonar el estudio. El análisis anterior para tamaños iguales de muestras aún será válido al modificar ligeramente las fórmulas de tamaño n1, n2,…, nk, respectivamente. Suma de cuadrados; tamaños diferentes de muestras

Los grados de libertad se dividen como antes: N – 1 para SST, k – 1 para SSA, y N – 1 – (k – 1) = N – k para SSE. Ejemplo Parte de un estudio que se llevó a cabo en el Instituto Politécnico y Universidad Estatal de Virginia se diseño para medir los niveles de actividad de fosfatasa alcalina en suero (unidades en Bessey-Lowry) de niños con crisis convulsivas que reciben terapia contra convulsiones bajo el cuidado de un médico particular. Se encontraron 45 sujetos para el estudio y se clasificaron en cuatro grupos según el medicamento administrado:

G-1: Control (no reciben anticonvulsivos y no tienen historial de crisis . convulsivas)

G-2: Fonobartibal G-3: Carbamacepina G-4: Otros anticonvulsivos

Se determinó el nivel de actividad de la fosfatasa alcalina en suero a partir de

muestras sanguíneas obtenidas de cada sujeto y se registran en la tabla. Pruebe la hipótesis al nivel de significancia de 0.05 de que el nivel promedio de actividad de fosfatasa alcalina en suero es el mismo para los cuatro grupos.

Page 44: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                42 

G-1 G-2 G-3 G-4 49.20 97.50 97.07 62.10 110.60 44.54 105.00 73.40 94.95 57.10 45.80 58.05 68.50 142.50 117.60 95.84 86.60 91.85 53.00 77.71 30.10 58.35 106.60 175.00 150.00 36.50 72.80 0.57 79.50 82.90 82.30 116.70 0.79 29.50 111.50 87.85 45.15 0.77 78.40 105.00 70.35 0.81 127.50 95.22 77.40

Solución

H0 : µ1 = µ2 = µ5 = µ4 H1 : Al menos dos de las medias no son iguales

α = 0.05 Región crítica: f > 2.836

Cálculos: Y1 = 1460.25, Y2 = 440.36, Y3 = 842.45, Y4 = 707.41, y Y = 3450.47. Fuente de la variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

f calculada

Tratamientos 13939 3 4646 3.57 Error 53376 41 1302 Total 67315 44 P = 0.022 La decisión es rechazar H0 y concluir que los niveles promedio de actividad de fosfatasa alcalina en suero para los cuatro grupos no son los mismos. El valor P es 0.02

3.4 Análisis de varianza bilateral (dos factores).-

El método utilizado en el análisis de varianza de clasificación simple o experimentos de un factor puede generalizarse logrando un procedimiento para clasificación doble o experimentos de dos factores. Este experimento bilateral de ANOVA permite estudiar simultáneamente los efectos de dos fuentes de variación y se usa para dar solución a problemas como el siguiente:

Page 45: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                43 

Ejemplo de problemas a los que se daría solución:

Supóngase que un experimento agrícola consiste en examinar los rendimientos por acre de cuatro variedades diferentes de trigo, donde cada variedad se cultiva en cinco parcelas diferentes. Luego se necesita un total de (4)(5)= 20 parcelas. Es conveniente en tal caso combinar las parcelas en bloques, por ejemplo 4 parcelas en un bloque, con una variedad diferente de trigo cultivado en cada parcela dentro de un bloque. Necesitándose por lo tanto 5 bloques.

El problema anterior es un ejemplo que sólo puede ser resuelto con un experimento de dos factores debido a que existen dos clasificaciones o factores, puesto que pueden existir diferencias en el rendimiento por acre debido a:

• El tipo particular de trigo cultivado. • O el bloque particular utilizado (fertilidad del suelo etc.)

En este tipo de experimentos con frecuencia se suele referirse a las dos

clasificaciones o factores en un experimento como tratamientos y bloques, pero lógicamente podríamos simplemente referirnos a ellos como factor 1, factor 2, etc.

3.4.1 Notación para experimentos de dos factores.-

Suponiendo que tenemos a tratamientos y b bloques, se construye la siguiente tabla donde se supone que hay un valor experimental (por ejemplo rendimiento por acre) correspondiente a cada tratamiento y bloque.

Tabla 3.3 Notación para experimentos de dos factores.

Para el tratamiento j y el bloque k denotamos este valor por xjk. La media de los valores en la fila j se denota por xj donde j = 1,……,.a, mientras que la media de los valores en la columna k se denota por xk, donde k = 1,……b. La gran media o media total se denota por x. En símbolos:

                         b                                           a • xj = 1/b  ∑  xjk xk = 1/a ∑ xjk x = 1/ab ∑ xjk

k =1                             j = 1                                         j,k 

Page 46: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                44 

3.4.2 Variaciones para experimentos de dos factores.-

Tal como se hizo en los experimentos de un factor, podemos definir variaciones para experimentos de dos factores. Dichas variaciones se definirán y obtendrán como se indica en las siguientes formulas:

v = ∑ (xjk - x)2 o bien v = ve + vr + vc donde: j,k ve = Variación debida al error o al azar = ∑ (xjk - xj - xk + x)2 j,k a vr = Variación entre filas (tratamientos) = b ∑ ( xj - x)2 j,k b vc = Variación entre columnas (bloques) = a ∑ ( xk - x)2 j,k La variación debida al error o residual se conoce también como variación residual.

A continuación se darán unas formulas cortas utilizadas en computación, que resultan de mucha práctica para obtener las respectivas variaciones de una forma un poco más rápida.

v = ∑ xjk2 – т2

j,k ab

a vr = 1 ∑ т j

2 - т2 b j = 1 ab

b

vc = 1 ∑ т k2 - т2

a k = 1 ab

ve = v – vr – vc

Donde т j es el total de valores en la fila j, т k es el total de valores d la columna k y т es el total de todos los valores.

Al igual que en cualquier experimento visto anteriormente éste también requiere del planteamiento de ciertas hipótesis para su comprobación y posterior solución de nuestro problema, con la diferencia de que no tendremos sólo una hipótesis nula sino dos como las siguientes:

H0(1) : Todas las medias de tratamientos son iguales, es decir xj = 0 cuando

j = 1, 2……., a.

H0(2) : Todas las medias de bloques son iguales, es decir xk = 0 cuando k = 1,

2……., b.

Page 47: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                45 

Si H0(1) y H0

(2) son ciertas, entonces es necesario calcular los siguientes datos:

Ŝr2 = Vr , Ŝc

2 = Vc , Ŝ2 = V . a – 1 b – 1 ab – 1

Los datos anteriores serán utilizados para obtener el estadístico correspondiente para la prueba de cada hipótesis nula como lo indica el siguiente teorema:

Bajo la hipótesis H0(1) el estadístico Ŝr

2/Ŝc2 tiene la distribución F con

a – 1 y (a – 1)(b – 1) grados de libertad.

Bajo la hipótesis H0(1) el estadístico Ŝc

2/Ŝc2 tiene la distribución F con

b – 1 y (a – 1)(b – 1) grados de libertad.

Este teorema nos permite aceptar o rechazar H0(1) ó H0

(2) a niveles de significación especificadas. Por conveniencia, como en el caso de un sólo factor, una tabla de análisis de varianza puede construirse como se muestra en la siguiente tabla:

Variación Grados de libertad

Media de cuadrados F

Entre tratamientos, a -1 ŝ2

r = vr ŝ2r/ŝ2

e vr a -1 g.l. = a-1,(a-1)(b-1)

Entre bloques, b - 1 ŝ2c= vc ŝ2

c/ŝ2e

vc b - 1 g.l. = b-1,(a -1)(b-1) Residual o aleatorio (a-1)(b - 1) ŝ2

e = ve ve (a-1)(b-1)

Total ab -1 V

Tabla 3.4 Tabla de análisis de varianza para experimentos de dos factores.

Ejemplo:

La siguiente tabla muestra el rendimiento por acre de cuatro cosechas de plantas diferentes cultivadas en parcelas tratadas con tres tipos diferentes de fertilizantes. Utilizando el método largo, ensayar al nivel de significación de 0.05 si (a) hay diferencia significativa en rendimiento por acre debida a los fertilizantes, (b) hay una diferencia significativa en rendimiento por acre debido a las cosechas.

Page 48: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                46 

Cosecha I Cosecha II Cosecha III Cosecha IV

Fertilizante A 4.5 6.4 7.2 6.7

Fertilizante B 8.8 7.8 9.6 7.0

Fertilizante C 5.9 6.8 5.7 5.2

Procedimiento de solución:

1.-Calculamos los totales de fila y medias de fila, como también los totales de columna, las medias de columna, la gran media como se indica enseguida.

Cosecha I

Cosecha II

Cosecha III

Cosecha IV

Totales de fila

Media de fila

Fertilizante A

4.5 6.4 7.2 6.7 24.8 6.2

Fertilizante B

8.8 7.8 9.6 7.0 33.2 8.3

Fertilizante C

5.9 6.8 5.7 5.2 23.6 5.9

Totales de columna

19.2 21.0 22.5 18.9 Gran total = 81.6

Gran media = 6.8 

Medias de columna

6.4 7.0 7.5 6.3

2.-Calculamos variaciones con las formulas correspondientes: vr = Variación de medias de fila con respecto a la gran media (tratamientos). a = b ∑ ( xj - x)2 = 4[(6.2 – 6.8)2 + (8.3 – 6.8)2 + (5.9 – 6.8)2] = 13.68 j,k vc = Variación de medias de columna con respecto a la gran media (bloques) . b = a ∑ ( xk - x)2 = 3[(6.4 – 6.8)2 + (7.0 – 6.8)2 + (7.5 – 6.8)2 + (6.3 – 6.8)2] = 2.82 j,k v = Variación total = ∑ (xjk - x)2 = (4.5 – 6.8)2 + (6.4 – 6.8)2 + (7.2 – 6.8)2 + (6.7 – 6.8)2 + (8.8 – 6.8)2 + (7.8 – 6.8)2 + (9.6 – 6.8)2 + (7.0 – 6.8)2 + (5.9 – 6.8)2 + (6.8 – 6.8)2 + (5.7 – 6.8)2 + (5.2 – 6.8)2 = 23.08

Page 49: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                47 

ve = v - vr - vc = 23.08 – 13.68 – 2.82 = 6.58 

3.- Se crea la tabla de análisis de varianza: Variación Grados de libertad Media de cuadros F

vr = 13.68 2 ŝ2r = 13.68/2 = 6.84 F = ŝ2

r /ŝ2e = 6.24

gl: 2,6

vc = 2.82 3 ŝ2c = 2.82/3 = 0.94 F = ŝ2

c /ŝ2e = 0.86

gl: 2,6 ve = 6.58 6 ŝ2

e = 6.58/6 = 1.097 v = 23.08 11

  4.-Criterio de decisión: Buscan en tabla de distribución F al nivel de significación de 0.05 con 2,6 grados de libertad, F = 5.14. Entonces, ya que 6.24 (valor obtenido en tabla) > 5.14, podemos rechazar la hipótesis de que las medias de fila son iguales y concluir que al nivel 0.05 hay una diferencia significativa en el rendimiento debida a los fertilizantes.

Algo muy importante es que ya que el valor de F correspondiente a las diferencias en las medias de columnas es menor que 1 podemos concluir que no hay diferencia significativa en el rendimiento debido a las cosechas.

Enseguida se mostrará como utilizar el método rápido es decir las formulas cortas para obtener los resultados del problema anterior:

De la tabla:

∑ x2jk = (4.5)2 + (6.4)2 + ……+ (5.2)2 = 577.96

т = 24.8 + 33.2 + 23.6 = 81.6

∑ т j2 = (24.8)2 + (33.2)2 + (23.6)2 + = 2274.24

∑ т k2 = (19.2)2 + (21.0)2 + (22.5)2 + (18.9)2 = 1673.10

Entonces:

v = ∑ xjk2 – т2 = 577.96 - [(81.6)2/ (4)(3)] = 23.08

j,k ab

a vr = 1 ∑ т j

2 - т2 = ¼ (2274.24) – 554.88 = 13.68 b j = 1 ab b vc = 1 ∑ т k

2 - т2 = 1/3(1673.10) – 554.88 = 2.82 a k = 1 ab ve = v – vr – vc = 23.08 – 13.68 – 2.82 = 6.58

Page 50: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                48 

Si verifica son los mismos resultados obtenidos con las formulas largas. De aquí en adelante se continúa desde el paso 3 para llegar a la solución del problema. 3.4.3 Experimento de dos factores con repetición.-

En el tema anterior solamente existía un valor correspondiente a un tratamiento

dado y a un bloque dado. Se puede dar el caso en el que se tenga más información como por ejemplo dos o tres valores en vez de uno por tratamiento y bloque. Considerando los factores puede a veces obtenerse la solución a un problema así repitiendo el experimento anteriormente explicado por esto es que a este proceso se le conoce como repetición. En tal caso como ya dijimos habrá más de un valor correspondiente a un tratamiento dado y a un bloque dado. Supondremos que hay c valores para cada posición, pero debe tomarse en cuenta que se pueden hacer cambios apropiados para aquellos casos en los que los números de repeticiones no son todos iguales.

La notación usada en el método de repetición seguirá el mismo esquema que el del tema anterior habrá sólo unas pequeñas diferencias, una de ellas es que añadiremos un nuevo factor conocido como interacción fila-columna o tratamiento-bloque (a veces denominado interacciones).

Una segunda diferencia lo son las formulas aquí también obtendremos variaciones y estarán dadas según lo siguiente:

v = ∑ (xjkl - x)2 o bien v = ve + vr + vc + vi donde: j,k,l ve = Variación debida al error o al azar = ∑ (xjk - xjk)2 j,k,l a vr = Variación entre filas (tratamientos) = bc ∑ ( xj - x)2 j = 1 b vc = Variación entre columnas (bloques) = ac ∑ ( xk - x)2 k=1 vi = Variación debida a interacciones = c ∑ (xjk - xj - xk + x)2                                                                  j,k  

Utilizando el número apropiado de grados de libertad para cada fuente de variación, podemos establecer una tabla de análisis de varianza como la siguiente:

Page 51: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                49 

Variación Grados de libertad

Media de cuadrados F

Entre tratamientos, a -1 ŝ2

r = vr . ŝ2r/ŝ2

e vr a -1 g.l. = a-1, ab(c-1)

Entre bloques, b - 1 ŝ2c= vc . ŝ2

c/ŝ2e

vc b - 1 g.l. = b-1, ab(c-1) Inetracción, (a - 1)(b-1) ŝ2

i = vi . ŝ2i/ŝ2

e vi (a - 1)(b-1) g.l. = (a-1)(b-1), ab(c-1)

Residual o aleatorio, ab(c - 1) ŝ2

e = ve . ve ab(c - 1)

Total, abc -1 V

Tabla 3.5 Tabla de análisis de varianza para experimentos de dos factores con repetición.

Como se puede ver en la última columna de relaciones F en este experimento hay tres estadísticos por los tanto existen tres hipótesis nulas y son las siguientes:

H0(1) : Todas las medias de tratamiento (fila) son iguales, es decir xj = 0 cuando

j = 1, 2……., a.

H0(2) : Todas las medias de bloque (columna) son iguales, es decir xk = 0 cuando

k = 1, 2……., b.

H0(3) : No hay interacciones entre tratamientos y bloques esto es xkj = 0

Desde un punto de vista práctico debemos primero decidir si se puede rechazar o no H0

(3) a un nivel apropiado de significación utilizando la relación F de ŝi2 / ŝe

2. Dos casos posibles se presentan:

Caso I.- H0(3) no puede rechazarse. En este caso podemos concluir que las

interacciones no son muy grandes, luego de obtener un valor mayor que 1 en el estadístico de prueba ŝi

2 / ŝe2 o un valor menor al indicado por la tabla de

distribución F con los grados de libertad correspondientes. Luego podemos ensayar H0

(1) H0(2) utilizando sus respectivos estadísticos. 

Caso II.- H0(3) puede rechazarse. En este caso podemos concluir que las

interacciones son considerablemente grandes, luego de obtener un valor menor que 1 en el estadístico de prueba ŝi

2 / ŝe2 o un valor mayor al indicado por la

tabla de distribución F con los grados de libertad correspondientes. Luego podemos ensayar H0

(1) H0(2) utilizando sus respectivos estadísticos y el mismo

método de prueba para conocer la solución al problema. 

Page 52: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                50 

Al igual que en el tema anterior el proceso de solución no implica más que sustitución de formulas y comparación de estadísticos con valores de la tabla de distribución F. A continuación se resolverá un problema en el que se propondrá un procedimiento alterno en donde se podrá observar que es mucho más sencillo efectuar este experimento al totalizar primero los valores de repetición que corresponden a tratamientos (filas) y bloques (columnas) particulares. Esto generará una tabla con valores singulares que puede analizarse tal y como se hizo en el tema de análisis de dos factores sin repetición.

Ejemplo:

Un productor desea determinar la efectividad de cuatro tipos de maquina A, B, C, D en la producción de tornillos. Para llevarlo a cabo se obtiene el número de tornillos defectuosos producidos por cada máquina durante los días de una semana en cada uno de los dos turnos. Los resultados se indican en la siguiente tabla. Efectuar un análisis de varianza para ensayar al nivel de significación del 0.05 si hay (a) una diferencia en la máquinas, (b) una diferencia en los turnos.

Primer Turno Segundo Turno Lun Mar Mie Jue Vie Lun Mar Mie Jue Vie A 6 4 5 5 4 5 7 4 6 8 B 10 8 7 7 9 7 9 12 8 8 C 7 5 6 5 9 9 7 5 4 6 D 8 4 6 5 5 5 7 9 7 10

Procedimiento de solución:

1.- Organizar los datos en una tabla que nos permita ver más claros los dos factores máquina y turno. Nótese que para cada máquina se han indicado dos turnos:

Factor 1 Factor II REPETICIONES Máquina Turno Lun Mar Mie Jue Vie Totales

A 1 6 4 5 5 4 24 2 5 7 4 6 8 30

B 1 10 8 7 7 9 41 2 7 9 12 8 8 44

C 1 7 5 6 5 9 32 2 9 7 5 4 6 31

D 1 8 4 6 5 5 28 2 5 7 9 7 10 38

Totales 57 51 54 47 59 268

Page 53: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                51 

2.- Obtenemos variación total de repeticiones en donde tenemos un total de a(b) = (5)(8) = 40datos:

v = ∑ xjkl 2 - т2= 62 + 42 + 52 + …….+ 72 +102 – (268)2 = 1946 – 1795.6 = 150.4         j,k,l ab (5)(8)

3.- Para considerar los dos factores principales, máquina y turno, concentramos nuestra atención al total de los valores de repetición correspondientes a cada combinación de factores. Estos se ordenarán como muestra la tabla que como se puede ver ya es de dos factores con valores simples y no de repetición.

Primer turno

Segundo Turno Totales

A 24 30 54 B 41 44 85 C 32 31 63 D 28 38 66

Totales 125 143 268

4.- Obtenemos variaciones como sigue:

Primeramente la variación de la tabla anterior que llamaremos variación subtotal vs, que viene dada por:

vs = (24)2 + (41)2 + (32)2 + (28)2 + (30)2 + (44)2 + (31)2 + (38)2 - (268)2 = 65.6 5 5 5 5 5 5 5 5 40

Se puede observar que son tomados cada uno de los datos de la última tabla donde el último dato es el gran total, el 40 es por el número de repeticiones que ya se había mencionado anteriormente y el 5 representa el número de días.

La variación entre filas viene dada por: vr = (54)2 + (85)2 + (63)2 + (66)2 - (268)2 = 1846.6 – 1795.6 = 51.0 10 10 10 10 40 El 10 se debe a que por cada día tenemos dos datos el del primer turno y el del segundo turno. La variación entre columnas viene dada por: vc = (125)2 + (143)2 – (268)2 = 1803.7 – 1795.6 = 8.1 20 20 40

El 20 se refiere a que por cada maquina hay 5 días de prueba (5)(4) = 20. La variación debida a las interacciones se calculará como sigue: vi = vs - vr - vc = 65.6 – 51.0 – 8.1 = 6.5

  Finalmente la variación residual, que puede considerarse como la aleatoria o de error ve (si se cree que los diferentes días de la semana no producen diferencia importante) se da de la siguiente manera:

Page 54: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                52 

ve = v – (vr + vc + vi) = v - vs = 150.4 – 65.5 = 84.8

5.- Hacemos la tabla de análisis de varianza correspondiente:

Variación Grados de libertad

Media de cuadrados F

Filas (máquinas), 3 ŝ2r = 17 17/2.65 = 6.42

vr = 51.0 Columnas (turnos), 1 ŝ2

c = 8.1 8.1/2.65 = 3.06 vc = 8.1

Interacción 3 ŝ2

i = 2.167 2.167/2.65 =0.817 vi = 6.5

Subtotal 7 vs = 65.6

Aleatoria o residual 32 ŝ2

e = 2.65 ve = 84.8

Total, 39 v = 150.4

Grados de libertad correspondientes: Basándonos en la tabla anterior a la del análisis de varianza los grados de libertad se obtendrían como sigue:

Como en dicha tabla hay 4 filas la variación debida a las filas tendrá 4 – 1 = 3 grados de libertad.

Existen 2 columnas así que los grados de libertad de la variación de columnas estará dada por 2 – 1 = 1 grado de libertad.

Para la interacción hay 8 valores así que para vs habrá 8 – 1 grados de libertad. Los grados de libertad para vi = 7 – (3 +1) = 3 Ya que hay 40 valores en la tabla original el total de grados de libertad será 40 –

1 = 39.  Finalmente para la variación residual serán 39 – 7 = 32 grados de libertad. 

6.- Ahora analizamos y determinamos si hay alguna interacción significativa entre

los factores básicos (es decir filas columnas de la tabla). En la tabla de análisis de varianza vemos que para interacción hay F= 0.817, lo cual nos india que la interacción no es significativa, esto es, podemos rechazar la hipótesis H0

(3). Siguiendo las reglas al principio del tema explicadas vemos que F para las filas es 6.42. Puesto que F.95 = 2.90 para 3, 32 grados de libertad podemos rechazar la hipótesis H0

(1) de que las filas tienen medias iguales. Esto por conclusión es equivalente a decir que al nivel de 0.05 las máquinas no son igualmente efectivas es decir no rechazamos H0

(2).   Las técnicas de análisis de varianza discutidas anteriormente se emplean después de que han obtenido los resultados de un experimento. Sin embargo, puede ganar tata información como sea posible, los detalle de un experimento deben planearse cuidadosamente con anterioridad.

Page 55: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                53 

UNIDAD IV Diseño Factorial Completo

El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre

una o varias respuestas o características de calidad, es decir, lo que se busca es estudiar la relación entre factores y la respuesta, con la finalidad de conocer mejor como es esta relación y generar conocimientos que permita tomar acciones y decisiones que mejoren el desempeño del proceso. 4.1 Definición de experimento factorial.- Un diseño de experimentos factorial o arreglo factorial es el conjunto de puntos experimentales o tratamientos que pueden formarse considerando todas las posibles combinaciones de los niveles de los factores. Por ejemplo, con k = 2 factores, ambos con dos niveles de prueba, se forma el diseño factorial 2 X 2 = 22 que consiste en cuatro combinaciones o puntos experimentales. Considerando otra vez k = 2 factores, pero ahora uno con tres niveles y el otro con dos niveles, se puede construir 3 X 2 combinaciones que dan lugar al diseño factorial 3 X 2. Observe que en el nombre del diseño factorial va implícito el número de tratamientos que lo componen. Los factores pueden ser de dos tipos:

Cualitativos.- Maquinas, tipos de material, operador, la presencia o ausencia de una operación previa, etc.

Cuantitativos.- Temperatura, humedad, velocidad, presión, etc.

Para poder estudiar la manera que influye cada factor sobre la variable de respuesta, es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial completo se corren aleatoriamente en el proceso todas las posibles combinaciones que pueden formarse con los niveles seleccionados. Para obtener el numero de corridas experimentales se multiplica el numero de tratamientos por el numero de replicas, donde una replica se lleva a cabo cada vez que se repite el arreglo completo. 4.2 Ventajas de los Diseños Factoriales.-

1. Son diseños que se pueden aumentar para formar diseños compuestos en caso de que se requiera una exploración mas completa.

2. Se pueden correr fracciones de diseños factoriales, las cuales son de gran utilidad en las primeras etapas de una investigación que involucra muchos factores, cuando interesa descartar de manera económica los que no son importantes, antes de hacer un estudio más detallado con los factores que si son importantes.

Page 56: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                54 

3. Pueden utilizarse en combinación con diseños de bloques en situaciones en las que no puede correrse todo el diseño factorial completo bajo las mismas condiciones o circunstancias.

4. La interpretación y cálculo de los efectos en los experimentos factoriales se pueden hacer con aritmética elemental, en particular cuando cada factor se prueba en dos niveles.

El efecto de un factor se define como el cambio observado en la variable de respuesta debido a un cambio de nivel de tal factor. El efecto principal se define como el cambio en la media de la variable de respuesta producido por un cambio en el nivel de cada factor. Por ejemplo: Supongamos que se tienen dos factores A: Velocidad y B: Temperatura, cada uno con dos niveles (bajo y alto) denotado por A1= 80 Km. / h, A2= 120 Km. / h y B1= 20 ºC, B2: 33 ºC, respectivamente.

Temperatura B1: 20ºC B2: 33ºC Velocidad A1: 80 km/h 25 35

A2: 120 Km/h 35 42 Matemáticamente el efecto principal del factor A se obtiene como la diferencia entre la respuesta promedio observada cuando el factor estuvo en el primero y segundo nivel de ese factor, es decir:

Efecto A = A2B1 + A2B2 – A1B1 + A1B2 2 2 Velocidad = 35 + 42 – 25 + 35 = 8.5

2 2

Efecto B = A1B2 + A2B2 – A1B1 + A2B1 2 2 Temperatura = 35 + 42 – 25 +35 = 8.5

2 2

Esto quiere decir que si incrementamos el factor A del nivel 1 al 2, se produce un cambio en la respuesta promedio de 8.5 unidades. Si incrementáramos el efecto principal del factor B seria también de 8.5 unidades.

Por otra parte, se dice que dos factores interactúan entre si o que tienen un efecto

de interacción sobre la variable de respuesta, cuando el efecto de un factor depende del nivel en que se encuentra el otro.

Si existieran más niveles para cada factor, este procedimiento cambia. El efecto de A en el primer nivel de B es:

Page 57: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                55 

A = 35 – 25 = 10

El efecto de A en el segundo nivel de B es:

A = 42 – 35 = 7 Sin embargo en muchos casos puede encontrarse que la diferencia en la

respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores. Por ejemplo:

Factor B B1 B2 Factor A A1 25 35

A2 40 10

El efecto de A en el primer nivel de B es:

A = 40 – 25 = 15 El efecto de A en el segundo nivel de B es:

A = 10 – 35 = – 25 Si estos dos efectos de A en función del nivel de B fueran diferentes, entonces

eso seria evidencia de que la elección más conveniente del nivel de A depende del nivel de B, y viceversa. Esto seria evidencia de que los factores A y B interactúan entre si. En este caso puede suponerse que entre los factores A y B existe una iteración ya que el efecto de A depende del nivel elegido de B.

4.3 Representación del efecto de interacción.-

El efecto de interacción se puede graficar, poniendo en el eje vertical una escala

que represente la magnitud de la variable de respuesta, luego uno de los factores se representa con sus dos niveles en el eje horizontal y en dirección vertical de cada uno de estos niveles, se anota un punto que represente la respuesta promedio de cada nivel del otro factor. Finalmente cada punto del lado izquierdo se une con sus correspondientes puntos del lado derecho mediante una línea recta.

Resulta que cuando existe interacción entre las líneas obtenidas tienen una

pendiente muy diferente y si no hay interacción las líneas tienen pendientes muy similares, que son aproximadamente paralelas.

Page 58: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                56 

Estos datos pueden graficarse de la siguiente manera: Cuando la iteración es grande (un factor depende de otro), los “efectos

principales” no tienen sentido. Por ejemplo, de la tabla de la iteración:

Efecto de A = 40 + 10 – 25 + 35 = – 5 2 2

Efecto de B = 35 + 10 – 25 + 40 = – 10 2 2 Estos valores son muy pequeños, por lo cual se corre el riesgo de concluir que no existe un efecto debido al factor A. 4.4 Diseño factorial de dos factores.-

A este diseño factorial también se le conoce como diseño bifactorial y contiene todas las combinaciones de tratamiento ab. En general hay n repeticiones.

Para diseños factoriales de dos factores considere los factores A y B con a y b

(a, b ≥ 2) niveles de prueba, respectivamente. Con ellos se puede construir el diseño factorial a x b, que consiste en a x b tratamientos.

Los diseños factoriales que involucran menos de cuatro factores se corren replicados para poder tener la potencia necesaria en las pruebas estadísticas sobre los efectos de interés, de tal forma que si se hacen n replicas, el número total de corridas experimentales es n(a x b).

Con un diseño factorial se pueden estudiar los dos efectos individuales y el efecto de interacción de ambos factores. En términos estadísticos lo que se afirma es

A2B1  

A2B2  

Re 

t

50 

40 

30 

20 

10 

A2A1

A2B1 = 35 

A2B2 = 42 

A1B1 = 25 

A1B2 = 35 

Factor A 

Re 

t

50

40

30

20

10

A2 A1

A1B1  

A1B2  

Factor A 

Experimento sin iteración   Experimento con iteración  

Page 59: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                57 

que el comportamiento de la respuesta Y en el experimento con k replicas se podrá describir mediante el modelo de efectos. Modelo Estadístico;

Donde, µ = Es la media general. αi = Es el efecto debido al i-esimo nivel del factor A. β j= Es el efecto de j-esimo nivel del factor B. (αβ) ij = Es el efecto de interacción en la combinación ij . εijk; = Error aleatorio. Ejemplo:

Un ingeniero diseña una batería para un dispositivo el cual será sometido a diferentes temperaturas (15, 70 y 125ºF), el único parámetro de diseño que puede seleccionar es el material de la cubierta de la batería, sin embargo puede elaborar un diseño bifactorial que le permita poder variar la temperatura (tres niveles).

La siguiente tabla muestra la duración en horas de la batería:

Tipo de Material

Temperatura ºF 15 70 125

1 130 155 34 40 40 70 74 180 40 74 82 58

2 150 188 136 122 25 70 159 126 106 115 58 45

3 138 110 174 120 96 104 168 160 150 139 82 60

Un importante problema de ingeniería, es que un producto sea robusto, es decir que no se vea afectado por factores externos. El arreglo general de un diseño factorial de dos factores es el siguiente:

1 2 3 b 1 Y111,Y112...Y11n Y121,Y122...Y12n Y131,Y132...Y13n Y1b1,Y1b2...Y1bn 2 Y211,Y212...Y21n Y221,Y222...Y22n Y231,Y232...Y23n Y2b1,Y2b2...Y2bn ··· ··· ··· ··· ··· a Ya11,Ya12...Ya1n Ya21,Ya22...Ya2n Ya31,Ya32...Ya3n Yab1,Yab2...Yabn

Factor B

Factor A 

Page 60: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                58 

Donde Yijk es la observación:

i = factor A nivel i j = factor B nivel j k = número de combinaciones (3/3) (número de replica)

Así mismo el análisis de varianza para el modelo bifactorial es:

Las hipótesis a probar son:

Notación de puntos para representar sumas y medias: Y••• Es el total general de todas las observaciones. Yi•• Es total de las observaciones bajo el i-ésimo nivel del factor A. Yj•• Es el total de las observaciones bajo el j-ésimo nivel del factor B. Yij• Es el total de las observaciones bajo el ij-ésimo celda. Ỹi •• Es la media de las observaciones bajo el i-ésimo nivel del factor A (promedio del renglón). Ỹj •• Es la media de las observaciones bajo el j-ésimo nivel del factor B (promedio de la columna). Ỹij • Es la media de las observaciones bajo el ij-ésimo celda. Ỹ ••• Es la media global.

Fuente de la variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

Fo P-value

Efecto A SSA a – 1 MSA = SSA (a-1)

Fo = MSA MSE

P(F>FA0)

Efecto B SSB b – 1 MSB = SSB

(b – 1) Fo = MSB MSE

P(F>FB0)

Efecto AB SSAB (a -1)(b – 1) MSAB = SSAB (a-1)(b-1)

Fo = MSAB MSE

P(F>FAB0)

Error SSE ab(n – 1) MSE = SSE ab(n-1)

Total SST abn - 1

Igualdad de los efectos de

tratamiento de renglón. 

Igualdad de los efectos de

tratamiento de columna. 

Si los tratamientos de renglón y

columna interactúan.

H0 : µ1 = µ2 = µ3 = ... = µa = 0 

H1: al menos una µa ≠ 0 

H0 : µ1 = µ2 = µ3 = ... = µb = 0 

      H1 : al menos una µb ≠ 0 

H0 : µ1 = µ2 = µ3 = ... = µab= 0 

H1: al menos una µab ≠ 0 

Page 61: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                59 

Con esta notación la suma de los cuadrados totales es:

 1) SST = Σ Σ Σ Yijk2 ‐ _Y2..._ 

                abn 2)  SSA = Σ _Yi2_‐ _Y2..._ 

          bn       abn  

3) SSB = Σ _Yj2_‐ _Y2..._          an     abn 

4) SSAB = Σ Σ _Yij2_‐ _Y2..._                 n         abn  

5) SSE =SST ‐ SSA ‐ SSB ‐ SSAB     ó       SSE = SST ‐ SSsubtotales   

 

SST = SSA + SSB + SSAB + SSE 

SSAB =  SSsubtotales ‐ SSA ‐  SSB 

Page 62: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                60 

Solución del ejemplo de la batería: 1) SST = 478547 – _37992_ = 77,646.97 36

Σ Σ Σ Yijk2 =(1302 + 1552 + 742 + 1802 + 342 + 402 + 802 + 752 + ... + 602) =

478547

Y2... (Σ Σ Σ)2 = (130 + 155 + 74 + 180 + 34 + 40 + 80 + 75 + ... + 60) = (3799)2 2) SSA = Σ _Yi..2_= 9982 + 13002 + 15012 – 37992 = 10683.72 bn 12 36 3) SSB = 17382 + 12912 + 7702 – 37992 = 39118.72

12 36 4) SSAB= 59416.22 – 10683.72 – 39118.72 = 9613.78 SSsubtotales = (5392 + 2292 + 2302 + ... + 5832 + 3422) – 37992 = 59416.22

4 36 5) SSE =SST - SSsubtotales = 77646.97 – 59416.22 = 18230.75

Vaciando estos datos a la tabla de análisis de varianza en dos direcciones,

tenemos lo siguiente:

Fuente de la variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

Fo P-value

Tipo de material

SSA=10683.72 a – 1= 2 MSA = 5341.86

Fo = 7.91 P(F>FA0)

Temperatura SSB=39118.72 b – 1= 2 MSB = 19558.36

Fo = 28.97 P(F>FB0)

Iteración AB SSAB=9613.78 (a -1)(b – 1)=4 MSAB = 2403.44 Fo = 3.56 P(F>FAB0) Error SSE=18230.75 ab(n – 1)=27 MSE = 675.21 Total SST=77646.97 abn - 1=35

Page 63: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                61 

β = 95% F0.05,2,27 = 3.35 F0.05,4,27 = 2.73

� i. D

uración prom

edio 

175 

150 

125 

100 

50

75

25

15 70 125 

Temperatura

Page 64: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                62 

UNIDAD V Diseños factoriales fraccionados 2k-p

Son los diseños en los que se elige adecuadamente una parte o fracción de los tratamientos de un factorial completo, con la intención de poder estudiar el efecto de los factores utilizando menos corridas experimentales. La teoría de diseños factoriales fraccionados se basa en una jerarquización de los efectos: son más importantes los efectos principales, seguidos por las interacciones dobles, luego las triples, cuádruples, etc. En la tabla 5.1 se muestra el número de efectos de mayor interés para diseños factoriales 2k, y el primer diseño factorial completo que genera exceso de información es el 25. Con este diseño se estiman 31 efectos, donde 15 son importantes y los otros 16 se pueden ignorar. Con una fracción del diseño factorial completo 25(1/2 25 = 25-1) se pueden estimar los 15 efectos importantes, sacrificando la información de los 16 que no interesan. Así, con el diseño factorial fraccionado 25-1 se puede obtener la misma información que el diseño completo 25, pero con la mitad del costo experimental. En la tabla 5.1 se observa que para k<5 los efectos importantes superan a los que se pueden ignorar, y al fraccionarios se pierde información importante. Por lo tanto, si k≥5 los efectos ignorables supera a los importantes, por lo cual se pueden fraccionar sin perder mucha información. Mientras k es más grande, se permite un grado de fraccionamiento mayor.

Diseño 2k Total de efectos

Efectos no ignorables

Efectos ignorables

22 3 3 0 23 7 6 1 24 15 10 5 25 31 15 16 26 63 21 42 27 127 28 99

Tabla 5.1 Efectos en los factoriales 2k

5.1 Diseño factorial fraccionado 2k-1.- La notación 2k-1 significa una fracción ala mitad del diseño factorial completo 2k, k>2(½ 2k = 2k-1). 5.1.1 Diseño factorial fraccionado 23-1.- El diseño factorial completo 23 es el primero que se puede fraccionar. Si se quiere fraccionar a la mitad es necesario seleccionar cuatro entre los ocho tratamientos. Existen (8

4)= 70 posibles maneras de elegir una fracción a la mitad. Sólo existen dos elecciones adecuadas. Con el diseño 23 completo se pueden estimar siete efectos: A, B, C, AB, AC, BC y ABC. El efecto menos importante es la interacción triple ABC y es la más sacrificable

Page 65: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                63 

y perder menos información. Para generar la fracción se hace en base a signos de contraste ABC: los signos “+” del contraste ABC señalan a los tratamientos que conforman la llamada fracción principal, y los signos “-“señalan la fracción complementaria. Los dos diseños 23-1generados proporcionan la misma información de los efectos importantes. En la tabla 5.2 la fracción 1 es la principal generada por I = +ABC y la fracción 2 por I = -ABC. La letra I hace las veces de identidad o neutro multiplicativo. El efecto no estimable de ABC se llama generador de la fracción.

Fracción 1 (I = +ABC)

Fracción 2 (I = -ABC)

A B C A B C 1 -1 -1 a -1 -1 -1 (1) -1 1 -1 b 1 1 -1 ab -1 -1 1 c 1 -1 1 ac 1 1 1 abc -1 1 1 bc

Tabla 5.2 Dos posibles fraccionados 23-1

5.1.2 Representación geométrica del diseño 23-1 En la figura 5.1 se ve la representación de las dos fracciones del diseño 23.

Figura 5.1 Representación de los diseños factoriales fraccionales 23-1

Estructura de alias del diseño 23-1 con I=ABC consiste en escribir

explícitamente cuáles son los alias de cada efecto, y se deduce del generador de la fracción, considerando el signo utilizado. De la tabla 5.2, el contraste del efecto A ésta dado por

Contraste A = (a + abc – b – c)

Page 66: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                64 

Mientras que al multiplicar las columnas B x C

Contraste BC = (a + abc – b – c) Donde los dos son iguales, lo que significa que son alias y se esta estimando A + BC. Y en resumen, la estructura de alias es

A + BC B + AC C + AB

Estructura de alias del diseño 23-1 con I= -ABC esta dada por

A – BC B – AC C – AB

Combinando las estructuras alias de ambas fracciones se pueden separar los efectos alias; primero para separar los efectos principales las estructuras se suman y se divide entre dos, y segundo, para los efectos de interacción las estructuras se restan y se divide entre dos. Para el efecto A

Y la interacción doble BC se separa

5.2 El concepto de resolución.- Al correr el diseño factorial fraccionado se estiman las sumas (o restas) de efectos alias. Se elige siempre que sea posible diseños fraccionados en los cuales los efectos potencialmente importantes sean alias de efectos de antemano irrelevantes. Suponiendo que los efectos principales son más importantes que las de dos factores, y estas que la de tres, es conveniente usar diseños factoriales fraccionados de alta resolución. Definición de resolución.- un diseño factorial fraccionado es de resolución R si los efectos formados por la interacción de P factores no son alias de efectos de interacción que tengan menos R – P factores.

1. Diseños de resolución III. Los efectos principales no son alias entre ellos, pero existen efectos principales que son alias de alguna interacción doble.

2. Diseños de resolución IV. Los efectos principales no están alias entre ellos ni con las interacciones dobles, pero algunas interacciones dobles están alias con otra interacción doble.

3. Diseños de resolución V. Los efectos principales y las interacciones dobles

están alias con interacciones triples o de mayor orden, es decir, los efectos principales e interacciones dobles están limpiamente estimados.

Page 67: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                65 

En los diseños 2k-1 la resolución es igual al número de letras del generador, ya

que este es al mismo tiempo la relación definidora. Las fracciones 23-1, 24-1 y 25-1 tienen resolución III, IV y V respectivamente. 5.2.1 Construcción de fracciones 2k-1 Se puede construir de dos pasos con más alta resolución:

1. Se lista el diseño factorial completo para k – 1 factores, y se tienen las primeras k – 1 columnas de la fracción deseada.

2. La columna fáltate (la k-ésima) se construye multiplicando entre si las columnas previas. Si se quiere la fracción complementaria se cambian los signos de esta última.

Por ejemplo en la construcción del diseño 24-1 con resolución IV y generador I = -ABCD:

1. Se lista el diseño factorial completo 24-1=23

A B C D - - - + - - - + - + + - - - + + - + - + + + + +

2. La columna faltante se obtiene al multiplicar las columnas A, B y C de acuerdo al generador.

A B C D= -ABC - - - + + - - - - + - - + + - + - - + - + - + + - + + + + + + -

Page 68: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                66 

5.3 Diseños factoriales fraccionados 2k-2.-

En ocasiones es necesario correr una fracción más pequeña del diseño factorial completo 2k. El diseño 2k-2 representa la cuarta parte del factorial completo (¼ 2k = 2k-2) Para obtener este diseño se necesitan dos efectos generadores, de entre las interacciones del más alto orden, que deben ser elegidos de manera que su producto sea también una interacción del más alto orden. Estos diseños tendrán tres generadores: los primeros dos que se seleccionaron más su producto entre sí. El número de “palabras” de la relación definidora indica el número de alias que tendrá cada efecto y multiplicando un efecto dado por esta relación se determinan sus alias. La palabra con menos letras en la relación definidora indica la resolución de la fracción. 5.3.1 Construcción en dos pasos de diseño 2k-2.-

1. Se escribe el diseño 2k-2 como si fuera un factorial completo en k-2 factores, y de esta forma se tienen los niveles de los primeros k-2 factores

2. Los niveles que corresponden a los factores de las dos últimas columnas (factores k-1 y k) se obtienen multiplicando columnas previas de acuerdo a los generadores.

Ejemplo de fracción 25-2.

1. Se escribe el diseño completo 25 para A, B y C, dejando en blanco D y E.

2. Los niveles para los factores D y E se obtienen al seleccionar de manera adecuada generadores. En este caso I=ABD e I=ACE y el tercero es el producto BCDE. Al final con las relaciones definidoras obtenemos que AB y AC se generan los niveles del factor D y E.

A B C D E - - - + - - - + - + + - - - + + - + - + + + + +

Page 69: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                67 

La estructura de alias se obtiene al multiplicar cada efecto por la relación definidora dada por

I = ABD = ACE = BCDE

Los grupos de efectos alias tienen ahora cuatro elementos y no es posible

construir una fracción 25-2 con resolución mayor que III.

A + BD + CE + ABCDE B + AD +ABCE + CDE C + ABCD + AE + BDE D + AB + ACDE + BCE E + ABDE + AC + BCD BC + ACD + ABE + DE BE + ADE + ABC + CD

µ + ABD + ACE + BCDE Toda la información importante la contiene la estructura de alias reducida, que involucra sólo hasta las interacciones dobles.

A + BD + CE B + AD C + AE D + AB E + AC

BC + DE BE + CE

5.4 Diseño factorial fraccionado 2k-p.- Es una fracción 1/2p del diseño factorial completo 2k. Para construir un diseño 2k-p se eligen p generadores iníciales del más alto orden posibles, y sus productos también del más alto orden.

A B C D E - - - + + + - - - - - + - - + + + - + - - - + + - + - + - + - + + - - + + + + +

Page 70: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                68 

Con los p generadores el diseño se puede construir en dos pasos. 1) Se escribe el diseño 2k-p como si fuera diseño factorial completo para k-p factores. 2) Para los últimos p factores las columnas de signos se obtienen multiplicando las columnas que indican los generadores. La relación definidora tiene tantos términos como productos se puedan hacer con los p generadores. Cada efecto tiene (p

1)+ (p2)+ (p

3)+…+ (pp) alias. De aquí se obtiene la

estructura alias y la resolución de la fracción resultante. Lo más difícil es encontrar los mejores generadores de la fracción que se desea utilizar, y una alternativa es utilizar tablas donde se proporciona generadores adecuados para diferentes valores de k y p (tabla 5.3) Los efectos y las sumas de cuadrados en los diseños factoriales 2k-p se obtienen a partir de los contrastes. Se obtiene un contraste para cada grupo de efectos alias y se pondera por una constante apropiada `para estimar el efecto correspondiente como una diferencia de medias. El efecto de un grupo de efectos alias X se estima como

Y su correspondiente suma de cuadrados es

La cual tiene un grado de libertad.

Page 71: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                69 

Tabla 5.3 Factoriales fraccionados con resolución IV, con máximo 64 corridas

Page 72: Apuntes Doe

Diseño de Experimentos 

M.C. Roberto Romero López                                70 

Bibliografía

1. Montgomery, Douglas C, “Diseño y Análisis de Experimentos”, Editorial:

Grupo Editorial Iberoamérica

2. Gutierrez Humberto y De la Vara Román, “ Análisis y Diseño de

Experiementos

3. Hines, William W.; Montgomery Douglas C., “Probabilidad y Estadística para

Ingeniería y Administración”, Editorial: CECSA