Web

Post on 31-May-2015

2.951 views 1 download

Transcript of Web

EL MÉTODO ESTADÍSTICO PARA EL DISEÑO DE EXPERIMENTOS

Contenido

• El análisis de varianza.• Modelos clásicos de diseño experimental.• La homogeneidad estadística de las

comparaciones: diseños factoriales.• Diseños por bloques aleatorios.

El Análisis de Varianza

• Introducción:– Cuando definimos el diseño de experimentos,

diferenciamos dos aspectos:• La planeación del experimento.• El método estadístico.

El Análisis de Varianza

– El análisis de varianza fue creado por R.A. Fisher (1925).

– Consideraremos el problema de definir si las diferencias observadas entre más de dos medias de una muestra pueden atribuirse al azar.

La Metodología

1. Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas.

2. Formulación de las hipótesis.3. Comprobación de requisitos

1. Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas.

2. Formulación de las hipótesis.3. Comprobación de requisitos

Análisis de Varianza en un Solo Sentido• Ejemplo: Supóngase que se desea comparar la acción de

limpieza de tres detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador.

Registros de Blancura

Detergente A Detergente B Detergente C

77 72 76

81 58 85

71 74 82

76 66 80

80 70 77

Registro de blancura

Detergente: niveles del factor fijos! Se analizar

los existentes sin necesidad de tomar una

muestra.

Análisis de Varianza en un Solo Sentido

kj

ikijii

kj

kj

kj

yyyy

yyyy

yyyy

yyyy

kj

......

......

..................

......

......

......

......21

21

21

333231

222221

111211

Tratamientos

Medias

Suposiciones sobre las variables yij:

1)Son independientes.2)Tienen distribuciones

normales con las medias respectivas μi

3)Tienen varianza común σ2

Suposiciones sobre las variables yij:

1)Son independientes.2)Tienen distribuciones

normales con las medias respectivas μi

3)Tienen varianza común σ2

El modelo de las observaciones esta

dado por:

Yij = μ+τj+εij; donde:

μ es la media globalτj son los efectos del tratamiento (τj= μj-

μ)εij : variables

aleatorias independientes con con medias cero y

varianza común σ2. (εij : Yij – μj)

El modelo de las observaciones esta

dado por:

Yij = μ+τj+εij; donde:

μ es la media globalτj son los efectos del tratamiento (τj= μj-

μ)εij : variables

aleatorias independientes con con medias cero y

varianza común σ2. (εij : Yij – μj)

Análisis de Varianza en un Solo Sentido

kj

ikijii

kj

kj

kj

TTTT

yyyy

yyyy

yyyy

yyyy

kj

..........

......

..................

......

......

......

......21

21

21

333231

222221

111211

Tratamientos

Totales/columnaNúmeroMedias

n1 n2 … nj … nk NY.1 Y.2 … Y.j … Y.k Y..

Análisis de Varianza en un Solo Sentido

kjH

vs

H

j

k

,...2,1,0:

.

0...:

1

10

Si la hipótesis nula es verdadera, toda la variabilidad se debe al azar.

Ecuación Fundamental del Análisis de Varianza (Niveles del Factor Fijo)

k

j

n

i jij

k

j

n

i j

k

j

n

i ijjjj YYYYYY

1 1

2.1 1

2...1 1

2.. )()()(

Suma de cuadrados de las desviaciones de la gran media

Suma de cuadrados de las desviaciones de la gran media

Suma de cuadrados de las desviaciones entre los tratamientos

Suma de cuadrados de las desviaciones entre los tratamientos

Suma de cuadrados de las desviaciones dentro de tratamientos

Suma de cuadrados de las desviaciones dentro de tratamientos

Tabla ANOVA (Niveles del Factor Fijo)Fuente df SS MS F Valor p

Tratamiento k-1 SS tratamientos

SS tratamientos/(k-1)

P(F(ν1, ν2)≥f)

Error N-k SS error SS error/(N-k)

TOTAL N-1 SS total

error

ostratamient

MS

MSf

Análisis de Varianza en un Solo Sentido• Ejemplo: Supóngase que se desea comparar la acción de limpieza de tres

detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador.

Pruebe en el nivel de significancia 0.01 si las diferencias entre las medias son significativas.

Registros de Blancura

Detergente A Detergente B Detergente C

77 72 76

81 58 85

71 74 82

76 66 80

80 70 77

Análisis de Varianza en un Solo SentidoAnova: Single Factor

SUMMARYGroups Count Sum Average Variance

Detergente A 5 385 77 15,5Detergente B 5 340 68 40Detergente C 5 400 80 13,5

ANOVASource of Variation SS df MS F P-value F crit

Between Groups 390 2 195 8,48 0,01 6,93Within Groups 276 12 23

Total 666 14

Estadística DescriptivaEstadística Descriptiva

Debe rechazarse la hipótesis nula, concluimos que los tres detergentes no son igualmente efectivos

Después de ANOVA… qué?

• Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar.

• Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria.

• Métodos:– Student - Newman – Keuls (SNK)– Scheffé test

• Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar.

• Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria.

• Métodos:– Student - Newman – Keuls (SNK)– Scheffé test

Pasos para la prueba: Student - Newman – Keuls (SNK)

Pasos para la prueba: Student - Newman – Keuls (SNK)

1. Ordene las k medias muestrales de menor a mayor.2. Tome la media cuadrada del error y los grados de libertad del

error.3. Obtenga el error estándar de la media para cada tratamiento,

dicho valor será el denominador de la prueba F.

4. Tome los valores de la tabla: “Studentized Range”, con el valor de α deseado. Usando n2 como los grados de libertad del error y p = 2,3,..k.

5. Multiplique los rangos por el error estándar de la media para cada tratamiento, para encontrar los LSR (least significant ranges)

6. Analice los rangos entre las medias por pares comenzando con el valor mas alto y mas bajo.

j

errorY yennesobservaciodecantidad

MSS

j

.____.

Método de Scheffé• Usa el método de contrastes, sin embargo esos contrastes no

necesitan ser ortogonales.• Pasos:1. Establezca los contrastes de interés y calcule sus valores numéricos.2. Determine el valor de f para el que3. Calcule usando el valor de f del paso 2. 4. Calcule el error estándar de cada contraste. Para el contraste:

, el error estándar esta dado por:

5. Sea cm el valor que denote a Cm. Rechace la hipótesis de que el contraste de medias es cero si

fFP kNk ,1(fkA )1(

kkmmm TcTcC .1.1 ...

)...)(( 212

1 kmkmerrorm cncnMSSC

mm Ascc

Ejemplo

• La tabla adjunta muestra la vida de un tipo específico de bacteria (en minutos) expuesta a 4 temperaturas distintas.

• Encuentre la tabla ANOVA y defina si la temperatura tiene efecto en la vida de la bacteria.

• Establezca un contraste para comparar el promedio de vida de la bacteria entre la temperatura 1 y 2.

• Establezca un contraste para comparar la vida de la bacteria bajo la temperatura 1 y las tres restantes.

T1 T2 T3 T4

1,93 2,55 2,4 2,33

2,38 2,72 2,68 2,40

2,20 2,75 2,31 2,28

2,25 2,70 2,28 2,25

COMPONENTES DE VARIANZA

Componentes de la Varianza

Tabla ANOVA (Niveles del Factor Aleatorios)

Fuente df SS MS EMS (Valor esperado)

Tratamiento k-1 SS tratamientos SS tratamientos/(k-1)

Error N-k SS error SS error/(N-k)

TOTAL N-1 SS total

22 nerror

2error

Tabla ANOVA (Niveles del Factor Aleatorios)

• Ejemplo:Una empresa provee a un cliente con varios cientos de lotes de materia prima cada año. El cliente esta interesado en un mayor rendimiento del porcentaje de químico usable del producto.

Usualmente se toman tres muestras del rendimiento de cada lote para verificar la calidad de la materia prima. Ocurre variación dentro del lote, pero el cliente sospecha que existe variación significativa entre los lotes.

Para revisar esto, se han tomado cinco lotes aleatoriamente de varios lotes disponibles y tres rendimientos por lote. Los rendimientos se muestran en la tabla adjunta.

Cuánta varianza del experimento puede ser atribuida a las diferencias entre lotes?Cuánta varianza del experimento puede ser atribuida al error aleatorio?

Tabla ANOVA (Niveles del Factor Aleatorios)

1 2 3 4 5

74 68 75 72 79

76 71 77 74 81

75 72 77 73 79

Lotes

Rendimiento del químico por lotes

Tabla ANOVA (Niveles del Factor Aleatorios)

Factor Type Levels ValuesLote random 5 1. 2. 3. 4. 5

Analysis of Variance for Yield

Source DF SS MS F PLote 4 147,733 36,933 20,52 0,000Error 10 18,000 1,800Total 14 165,733

Expected Mean Square for Each Term (using Variance Error unrestricted Source component term model)1 Lote 11,711 2 (2) + 3 (1)2 Error 1,800 (2)

)(22otratamienterror MSEn

errorerror MSE2

Diferencia significativa

entre los lotes

Diferencia significativa

entre los lotes

511,138,1711,112222 SSStotaltotal

REVISIÓN DEL MODELO

Revisión del Modelo

• Las técnicas que se presentaron en este capítulo están basadas en:– Independencia– Muestras aleatorias– Distribuciones normales– Varianzas iguales

• En la práctica no se espera que las suposiciones del modelo sean satisfechas exactamente.

• Sin embargo, para que el procedimiento de resultados confiables las suposiciones deben ser satisfechas de forma razonable.

Revisión del Modelo

• Los residuos deben ser normales.– Los residuos de un experimento son los restos,

luego de que los efectos estimados en el modelo se han sustraído de los valores de la variable de respuesta.

– es el valor de que se predice utilizando el modelo.

ijijij YYE ˆ

ijY ijY

jijij YYE .

Revisión del Modelo

• Las varianzas deben ser homogéneas.– Analizar el rango de las observaciones en cada

tratamiento.– Utilizar criterio de control estadístico.

RD4

Revisión del Modelo

• Los errores deben ser independientes.– Los datos del experimento deben ser obtenidos de

una forma completamente aleatoria.– La falta de independencia afecta seriamente las

inferencias.– Se deben hacer esfuerzos para evitar errores

correlacionados.

Revisión del Modelo

• Procedimientos para revisar independencia:– Cálculo de auto-correlaciones.• La independencia de los errores se debe cuestionar si el

valor absoluto de la auto-correlación es mayor a:

– Durbin-Watson (DW)• Si el valores de DW mayores a 1.7 soportan la

suposición de independencia.

n96,1

n

i i

n

i ii

e

eeDW

1

22

21)(

Qué ocurre si el modelo no es adecuado?

• Qué ocurre si no se cumplen las suposiciones del modelo?– Considere un modelo distinto.– Transforme los datos a fin de lograr normalidad.

DISEÑO POR BLOQUES ALEATORIOS

Diseños por bloques aleatorios

• Son aquellos en los que se introduce una variable “bloque”.

• Se denomina variable bloque a aquella variable o factor que se introduce en el experimento para obtener comparaciones homogéneas. La variable bloque es un factor que:– Suponemos (a priori) que influye en la variable de

respuesta. – No tiene interacción con el resto de factores

incluidos en el experimento.

Diseños por bloques aleatorios

• El diseño aleatorizado por bloques permiten remover el efecto del bloque y concentrarse en los efectos de la variable de interés.– De ahí, que se reduce el estimado de la varianza del

error.• Ejemplos:– Probar el efecto de métodos de enseñanza en

diferentes estudiantes.– Probar el efecto de los de materiales en varias

máquinas.– Probar el efecto de los fertilizantes en distintos tipos

de suelos.• Bloques: estudiantes, máquinas y suelos

Diseño por Bloques Aleatorios

• El modelo:

• Donde representa el efecto del bloque.

ijjiijY

i

Tabla ANOVA (Diseño por bloques aleatorios)

Fuente df SS MS F

Entre los bloques

n-1 SS bloques SS bloques/(n-1) MS bloques/MS error

Entre los tratamientos

k-1 SS tratamientos

SS tratamientos/(k-1) MS tratamientos/MS error

Error (n-1)(k-1) SS error SS error/(n-1)(k-1)

TOTAL nk-1 SS total

Ejemplo• El jefe de transporte de una firma, desea determinar si

el desgaste de 4 marcas de llantas es el mismo luego de haber utilizado las mismas por 20,000 Km.

• Las marcas a considerar son A, B, C y D. El jefe de transporte desea probar el desempeño de las llantas en las condiciones actuales de las vías que utilizan los cuatro camiones de la empresa.

• La tabla adjunta muestra la pérdida del labrado de las llantas por vehículo y por tipo de llanta.– Se puede confirmar la variación entre los vehículos de la

flota?– El desgaste de las llantas es el mismo para todas las

marcas?

EjemploVehículo 1 Vehículo 2 Vehículo 3 Vehículo 4

Distribución de marcas y desgaste del labrado

B(14) D(11) A(13) C(9)

C(12) C(12) B(13) D(9)

A(17) B(14) D(11) B(8)

D(13) A(14) C(10) A(13)

Anova: Ejemplo de Desgaste de Neumáticos

Analysis of Variance for Desgaste

Source DF SS MS F PVehículo 3 38,688 12,896 10,04 0,003Marc 3 30,688 10,229 7,96 0,007Error 9 11,563 1,285Total 15 80,938

Se rechaza la hipótesis de igualdad entre las

medias de desgaste por vehículo y por marca.

Ejemplo• Se desea determinar la efectividad

de un fertilizante orgánico en suelos de cultivo de un producto a lo largo del año. En la tabla adjunta se registra la efectividad del fertilizante en las cuatro estaciones del año: invierno, verano, otoño y primavera.

• Formule un modelo para este diseño• Describa sus hipótesis.• Analice los datos utilizando un

modelo aleatorizado por bloques y describa sus conclusiones.

• Revise la validez del modelo.

resp fert estación4,0 1 14,8 1 25,0 1 34,6 1 44,8 2 15,0 2 25,2 2 34,6 2 44,0 3 14,8 3 25,6 3 35,0 3 4

Anexos

Sofía A. López MSc.

Cartas de Control para la Media y el Rango

Tabla 1. Factores para límites de control en gráficos de medias y rangos

Gráfico de medias

Gráfico de Rangos

Tamaño de muestra n

Factor A2 Factor D3

Factor D4

2 1.88 0 3.27

3 1.02 0 2.57

4 0.73 0 2.28

5 0.58 0 2.11

6 0.48 0 2.00

7 0.42 0.08 1.92

8 0.37 0.14 1.86

9 0.34 0.18 1.82

10 0.31 0.22 1.78