Bloques y Otros Vf

40
Bloques Aleatorios, Cuadrados Latinos y Diseños Relacionados

description

bloques diseño de experimentos

Transcript of Bloques y Otros Vf

Bloques Aleatorios, Cuadrados

Latinos y Diseños

Relacionados

Bloques

• Definición:

– Bloque: Un “grupo” de unidades experimentales que se sabe antes

del experimento a ser similares en alguna manera y se espera que

influya en la variable de respuesta.

• Bloques se escogen para:

– Maximizar variación bloque a bloque.

– Minimizar variación entre unidades experimentales dentro de cada

bloque.

• Objetivo:

– Separar la variabilidad de bloque a bloque del error experimental con

el fin de lograr una comparación mas sensitiva de los promedios de

los tratamientos.

2

El Principio de Bloques

• Bloquear es una técnica para tratar con factores perturbadores.

• Un factor perturbador es aquel que probablemente tenga algún efecto en la respuesta, pero no es de interés al experimentador. Sin embargo, la variabilidad que transmite a la respuesta necesita ser minimizada.

• Típicos factores perturbadores incluyen lotes (batches) de materia prima, operadores, partes de equipos de prueba, tiempo (turnos, días, etc.), unidades experimentales diferentes.

• Muchos experimentos industriales involucran bloques (o deberían).

• No bloquear es una falla común en diseñar un experimento

(¿consecuencias?).

3

El Principio de Bloques

• Si la variable perturbadora es conocida y controlable, usamos

bloques.

• Si el factor perturbador es conocido y no controlable, se puede

usar el análisis de covarianza para remover el efecto del factor

perturbador del análisis.

• Si el factor perturbador es desconocido y no controlable (se

desconoce esa variable), se espera que la aleatorización

balancee su impacto en todo el experimento.

• Algunas veces, varias fuentes de variabilidad son combinadas en

un bloque, de modo que el bloque llega a ser una variable

agregada.

4

Experimentos con Bloques Aleatorizados (cont)

• Diferencias en un experimento con bloques aleatorizados

– Unidades experimentales clasificadas en “bloques” .

– Para cada bloque, la variable de respuesta es recolectada para todos los

tratamientos.

– Métodos de análisis remueven efectos observados de bloques antes de

probar la igualdad de medias.

• Ejemplos de factores de bloques comunes:

– Personas, grupo socio-económico, grupo de edad, genero, región

geográfica.

– Cliente, producto, suplidor.

– Centro de distribución, bodega, numero de la semana.

5

• Bloquear es una técnica para hacer una comparación mas precisa en la

presencia de variabilidad.

• Ejemplos de bloques: Lotes de fabricas, lotes de ensambles, lotes de

material, equipos, operarios, días, etc.

Bloquear

– Unidades que pertenecen al

mismo bloque son mas

similares que las unidades de

bloques diferentes.

– Comparar tratamientos o

procesos dentro de cada

bloque.

Block 1 Block 2 Block 3

Process 2

Process 1

6

Procedimientos de Aleatorización

• Asigne aleatoriamente las unidades experimentales dentro

de un bloque a los k tratamientos.

• Dentro de cada bloque, aleatorice el orden en el cual los

tratamientos son administrados.

• Si es posible, aleatorice el orden en el cual los bloques son

corridos (no es esencial como la aleatorización dentro de

los bloques).

7

Ejemplo Motocicleta: Bloquear

• Diseño 3: Combinación de Factores

– Incluir múltiples conductores, motocicletas y rutas.

– Considerar cada viaje de motocicleta como un bloque.

– Aleatoriamente asignar una llanta de cada tipo a la llanta

delantera y trasera de cada motocicleta.

– Rotar las llantas en la mitad de cada viaje.

• ¿Cuál es el beneficio del diseño de bloques?

A

A

A

A

A

B

B

B

B

B

8

Ejemplo Motocicleta: Bloques

¿Puede usted detectar en este

grafico cual material es mejor?

Graficar los datos en una manera diferente.

¿Puede usted determinar cuál material es mejor ahora?

¿Qué hace mas fácil ver la diferencia?

9

Extensión del ANOVA a los Diseños de Bloques

Completamente Aleatorizados (DBCA)

• Suponga que hay a tratamientos (niveles de factor) y b

bloques.

• Un modelo estadístico (modelo de efectos) para el

DBCA es:

1,2,...,

1,2,...,ij i j ij

i ay

j b

10

Análisis de Experimentos con Bloques

Aleatorizados

• ANOVA de dos vías es usada para:

– Particionar al suma total de cuadrados en tres componentes :

SSTotal = SSTratamientos + SSBloques + SSError

– Probar H0 vs. H1 usando la prueba F

Error

ErrorError

Treatment

TreatmentTreatment

Error

Treatment

df

SSMS

df

SSMS

MS

MSF

;

;

11

SSTotalbk-1Total

MSE= SSE /(b-1)(k-1)SSE(b-1)(k-1)Error

p (>Fcalc)MSTrt /MSEMSTrt=SSTrt / k-1 SSTrt

k-1Treatments

MSBlk=SSBlk / b-1SSBlkb-1Blocks

P-valueF-stat

(Fcalc)

Mean SquareSum of SquaresdfSource

SSTotalbk-1Total

MSE= SSE /(b-1)(k-1)SSE(b-1)(k-1)Error

p (>Fcalc)MSTrt /MSEMSTrt=SSTrt / k-1 SSTrt

k-1Treatments

MSBlk=SSBlk / b-1SSBlkb-1Blocks

P-valueF-stat

(Fcalc)

Mean SquareSum of SquaresdfSource

Análisis de Experimentos con Bloques Aleatorizados(cont)

Tabla ANOVA Dos Vías

Source df Sum of

Squares

Mean Squares F-Stat

(Fcalc)

P-value

Treatments K - 1 SSBetween MSBetween = SSWithin / K - 1 MSBetween /

MSWithin

P (>FCalc)

Error nTotal - K SSWithin MSWithin = SSWithin / nTotal - 1

Total nTotal - 1 SSTotal SSTotal / nTotal - 1

Nueva fila correspondiente a la nueva variable

Tabla ANOVA Una Vía

12

Extensión del ANOVA a los DBCA

• Particionamiento de ANOVA de la variabilidad total:

2

.. . .. . ..

1 1 1 1

2

. . ..

2 2

. .. . ..

1 1

2

. . ..

1 1

( ) [( ) ( )

( )]

( ) ( )

( )

a b a b

ij i j

i j i j

ij i j

a b

i j

i j

a b

ij i j

i j

T Treatments Blocks E

y y y y y y

y y y y

b y y a y y

y y y y

SS SS SS SS

13

Extensión de ANOVA a los DBCA

• Los grados de libertad para las sumas de cuadrado en

son las siguientes:

• Por tanto, las razones de suma de cuadrados a sus grados de

libertad resulta en cuadrados medios y la razón del cuadrado

medio de tratamientos con el error medio cuadrado es un

estadístico F que puede ser usado para probar la hipótesis de

igualdad de medias de tratamientos.

T Treatments Blocks ESS SS SS SS

1 1 1 ( 1)( 1)ab a b a b

14

Otros aspectos del Diseño de Bloques

• El DBCA utiliza un modelo aditivo – no hay interacción entre tratamientos y bloques.

• Tratamientos y/o bloques como efectos aleatorios.

• Valores faltantes.

• ¿Cuáles son las consecuencias de no bloquear si no lo hiciéramos?

• Tamaño de muestra en DBCA. El procedimiento de la COpuede ser usado para determinar el número de bloques a correr.

15

16

Hipótesis Estadística

• Si queremos probar la hipótesis:

H0: 1 = 2 = = k

vs.

H1: no todas las k son iguales

Experimentos con Bloques Aleatorizados

Meta del Diseño

– Determinar si hay diferencias significativas entre las medias de los

k tratamientos .

– Misma meta como las pruebas de medias de k muestras

independientes.

– Específicamente, las hipótesis a probar:

Means Test

H0: 1 = 2 = = k

vs.

H1: no todas las k

son iguales

17

18

Análisis de Varianza (ANOVA)

ANOVA particiona la variabilidad total, o suma de cuadrados (SS), en fuentes diferentes

Variación debido a

Tratamientos SStrt

Variación debido a

muestreo aleatorio SSe

Variación Total SSTotal

= + ?+Variación debido

a Bloques SSblk

19

Tabla ANOVA de Dos Vías

20

Prueba F

• Test Estadístico

• Cuando H0 es verdadera, el estadístico F sigue una

distribución F con k-1 y (b-1)(k-1) grados de libertad

Si H0 es verdadera, entonces todas las

observaciones se comportan como una muestra

aleatoria de una sola población, de modo que el F

calculado debe estar cercano a 1.

Treatment

Error

MSF

MS

21

Criterio de Decisión F-test

Calcular Valor P

Rechazar Ho

Concluir no todas las i’s son

iguales

Se falla rechazar Ho

Concluir H0: 1=2=…=k

P-value > aP-value < a

Práctica

A continuación se muestra parte del ANOVA

para un diseño en bloques, que tiene tres

tratamientos y cinco bloques con una sola

repetición por tratamiento-bloque.

ESTUDIANTE
Nota adhesiva
2
ESTUDIANTE
Nota adhesiva
4
ESTUDIANTE
Nota adhesiva
8
ESTUDIANTE
Nota adhesiva
300
ESTUDIANTE
Nota adhesiva
212.5
ESTUDIANTE
Nota adhesiva
62.5
ESTUDIANTE
Nota adhesiva
4.8
ESTUDIANTE
Nota adhesiva
3.4

Ejemplo Desgaste de Llantas

23

Considere el problema de determinar si diferentes tipos de material

para hacer llantas presentan diferentes cantidades de pérdida de

espesor después de 32,000 km de manejo. Un gerente de una

compañía desea considerar cuatro diferentes materiales para hacer

llantas y tomar una decisión sobre cuál material podría mostrar la

cantidad mínima de desgaste después del periodo de manejo. Los

materiales a considerar son A, B, C, y D. Aunque las condiciones de

manejo podrían simularse en un laboratorio, él desea probar estos

cuatro materiales bajo condiciones actuales de manejo.

24

Ejemplo Desgaste de Llantas

• Un fabricante de llantas desea comparar los cuatro materiales

diferentes para hacer las llantas.

– Material A: Estándar

– Material B: Mas barato

– Material C: Competidor 1

– Material D: Competidor 2

• A ellos les gustaría cambiar al material B pero quieren estar seguros

que este material no es inferior al material estándar o al de los

competidores.

• La variable de respuesta es Yij es la diferencia en espesor en

milésimas (0.001 mm) y el único factor de interés es marca, o sea j

dónde j = 1, 2 , 3, 4

25

Ejemplo Desgaste de Llantas

• 4 carros representando diferentes marcas, modelos y

tamaños están disponibles.

• ¿Cómo se debe diseñar este experimento?

26

Diseño de Bloques Aleatorizados

• Incluir una llanta de cada uno de los 4 tipos de

materiales en cada carro.

• Aleatorice la asignación del tipo de material a la posición

de la llanta en cada carro.

• Maneje los carros por el numero especificado de km,

luego medir el desgaste en cada llanta.

• ¿Cuáles son los bloques?

La meta del diseño aleatorizado de bloques es separar la

variabilidad de bloque a bloque cuando se comparan

tratamientos al comparar tratamientos dentro de cada

bloque.

27

Ejemplo Desgaste de Llantas: Datos

¿Son las diferencias debido al tipo de

material o solo por variación aleatoria?

28

Lo que no se debe hacer

• ¿Se puede identificar cuales materiales son diferentes?

• ¿Qué es lo que hace difícil detectar cualquier diferencia, si existe?

DCBA

17

16

15

14

13

12

11

10

9

8

Tipo Material

De

sg

aste

29

Hipótesis Estadística

• Se quiere probar la hipótesis:

H0: 1 = 2 = = k

vs.

H1: no todas las i son iguales

La media verdadera de

desgaste es la misma para

los materiales A, B, C y D

No todos los materiales

tienen la misma media

verdadera de desgaste.

30

Lo que si se debe hacer

• ¿Se puede detectar ahora si los materiales son

consistentemente diferentes de cada uno?

• ¿Porqué las diferencias son mas fáciles de ver en este

grafico?

Graficar tratamientos dentro de cada bloque.

4,03,53,02,52,01,51,0

17

16

15

14

13

12

11

10

9

8

Carro

Y (

De

sga

ste

)

A

B

C

D

MARCA

Ejemplo Desgaste de Llantas

Two-way ANOVA: Y versus CARRO. MARCA

Source DF SS MS F P

CARRO 3 38,6875 12,8958 10,04 0,003

MARCA 3 30,6875 10,2292 7,96 0,007

Error 9 11,5625 1,2847

Total 15 80,9375

S = 1,133 R-Sq = 85,71% R-Sq(adj) = 76,19%

Rechazar Ho.

Existen diferencias significativas

entre tratamientos.

Al menos algún material es

diferente.

Se pueden realizar comparaciones

múltiples.

31

Ejemplo Desgaste de Llantas

• Método Tukey

DCBA

14,5

14,0

13,5

13,0

12,5

12,0

11,5

11,0

MARCA

De

sg

asteTukey Simultaneous Tests

Response Variable Y

All Pairwise Comparisons among Levels of

MARCA

MARCA = A subtracted from:

Difference SE of Adjusted

MARCA of Means Difference T-Value P-Value

B -2,000 0,8015 -2,495 0,1274

C -3,500 0,8015 -4,367 0,0080

D -3,250 0,8015 -4,055 0,0125

MARCA = B subtracted from:

Difference SE of Adjusted

MARCA of Means Difference T-Value P-Value

C -1,500 0,8015 -1,872 0,3041

D -1,250 0,8015 -1,560 0,4452

MARCA = C subtracted from:

Difference SE of Adjusted

MARCA of Means Difference T-Value P-Value

D 0,2500 0,8015 0,3119 0,9888

32

C D B A

Material A es significativamente

peor que el Material C y D.

Materiales C y D presentan los valores

menores de desgaste. Son equivalentes.

Adecuación del Modelo

210-1-2

99

90

50

10

1

Residual

Pe

rce

nt

N 16

AD 0,352

P-Value 0,423

161412108

1

0

-1

-2

Fitted Value

Re

sid

ua

l

1,00,50,0-0,5-1,0-1,5-2,0

4

3

2

1

0

Residual

Fre

qu

en

cy

16151413121110987654321

1

0

-1

-2

Observation Order

Re

sid

ua

l

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for Y

D

C

B

A

181614121086420

MA

RC

A

95% Bonferroni Confidence Intervals for StDevs

Test Statistic 1,45

P-Value 0,694

Test Statistic 0,16

P-Value 0,923

Bartlett's Test

Levene's Test

Prueba de Homogeneidad de Varianzas

Se cumplen las suposiciones del modelo.

33

Ejemplo Desgaste de Llantas

• Diseño de Cuadrados Latinos:

CARRO

Posición I II III IV

1 C (12) D (11) A (13) B (8)

2 B (14) C (12) D (11) A (13)

3 A (17) B (14) C (10) D (9)

4 D (13) A (14) B (13) C (9)

34

• Modelo Estadístico:

Yijk = + i + j + k + ijk

35

Resumen de Experimentos con Bloques Completamente

Aleatorizados

• Especificar las hipótesis experimentales y los riesgos del error:

H0 : 1 = 2 = … = k vs. H1: No todas las ’s son iguales.

• Determine el numero bloques para el numero de tratamientos y el

cambio a detectar.

• Conduzca el experimento.

• Grafique los datos, revise diferencias y valores atípicos.

• Si hay diferencias significativas entre las medias, utilice un

procedimiento de comparaciones múltiples para determinar cuales

medias son diferentes.

• Revise adecuación del modelo: normalidad de residuos,

independencia y homogeneidad de varianzas.

El Diseño de Cuadrados Latinos

• Estos diseños son usados para controlar simultáneamente (o eliminar) dos fuentes de variabilidad perturbadora.

• Una suposición significativa es que los tres factores (tratamientos, factores perturbadores) no interactúan.

• Si esta suposición es violada, los Cuadrados Latinos no

producirán resultados válidos

36

El problema de la carga propulsora – Un

diseño de Cuadrados Latinos

• Este es un diseño de cuadrados latinos de 5 x 5

37

Análisis Estadístico del Diseño de

Cuadrados Latinos

• El modelo estadístico (efectos) es:

• El análisis estadístico (ANOVA) es muy parecido al análisis para los DBCA.

1,2,...,

1,2,...,

1,2,...,

ijk i j k ijk

i p

y j p

k p

38

Otros Diseños Relacionados

Acid Concentration Batch 1 2 3 4 5

1 A=26 B=16 C=19 D=16 E=13 2 B=18 C=21 D=18 E=11 A=21 3 C=20 D=12 E=16 A=25 B=13 4 D=15 E=15 A=22 B=14 C=17 5 E=10 A=24 B=17 C=17 D=14

• Diseño Greco-Latino (4 Factores)

• Diseño Híper-Greco-Latino (5 Factores)

40