Anova

40
12 12-1 Panorama general 12-2 ANOVA de un factor 12-3 ANOVA de dos factores Análisis de varianza

Transcript of Anova

12

12-1 Panorama general

12-2 ANOVA de un factor

12-3 ANOVA de dos factores

Análisis de varianza

P R O B L E M A D E L C A P Í T U L O

¿Tratamientos diferentes afectan los pesos de álamos?El conjunto de datos 7 del apéndice B incluye los pesos(en kilogramos) de álamos que recibieron distintos tra-tamientos en terrenos diferentes. Sólo consideraremoslos pesos del año 1 en el terreno 1, el cual tiene un suelofértil y húmedo, y se localiza cerca de un arroyo. Lospesos que consideraremos se resumen en la tabla 12-1.

Con la intención de explorar los datos para investi-gar el centro, la variación, la distribución, los valoresextremos y los patrones de cambio a través del tiempo(CVDVT), comenzamos calculando los estadísticosmuestrales que aparecen en la parte inferior de la tabla12-1. Al examinar las medias muestrales, vemos queparecen variar mucho, desde 0.164 kg hasta 1.334 kg.Además, las desviaciones estándar de las muestras varíanconsiderablemente, desde 0.126 kg hasta 0.859 kg. Esdifícil analizar las distribuciones porque cada muestraconsiste únicamente en 5 valores, pero las gráficascuantilares normales sugieren que tres de las muestrasprovienen de poblaciones con distribuciones aproxi-madamente normales. Sin embargo, el análisis de lospesos de los álamos que recibieron tratamiento confertilizantes sugiere que el peso de 1.34 kg es un valor

extremo cuando se compara con los otros pesos de losárboles fertilizados. Con la presencia de un solo valorextremo, procederemos bajo el supuesto de que lasmuestras provienen de poblaciones con distribucionesaproximadamente normales. Podríamos realizar análisisadicionales posteriormente para determinar si el pesode 1.34 kg tiene un fuerte efecto en los resultados.(Véase el ejercicio 5 en la sección 12-2).

Parece que las diferencias entre las medias mues-trales indican que las muestras provienen de poblacio-nes con medias diferentes, pero en vez de considerarúnicamente las medias muestrales, también debemosconsiderar las cantidades de variación, los tamañosmuestrales y la naturaleza de la distribución de las me-dias muestrales. Una forma de tomar en cuenta todosestos factores importantes consiste en realizar una pruebaformal de hipótesis que los incluya de manera automá-tica. En el presente capítulo se estudiará una prueba deeste tipo, y la usaremos para determinar si existe evi-dencia suficiente para concluir que las medias no soniguales. Entonces sabremos si los distintos tratamientostienen algún efecto.

PR

OBLEMA

DE

L

C A PÍTUL

O12

Tabla 12-1 Pesos (en kg) de álamos

Tratamiento

Ninguno Fertilizante Riego Fertilizante y riego

0.15 1.34 0.23 2.030.02 0.14 0.04 0.270.16 0.02 0.34 0.920.37 0.08 0.16 1.070.22 0.08 0.05 2.38

n 5 5 5 50.184 0.332 0.164 1.334

s 0.127 0.565 0.126 0.859x

636 Capítulo 12 Análisis de varianza

12-1 Panorama generalEn la sección 12-2 explicamos un método importante para probar la igualdad detres o más medias poblacionales. En la sección 9-3 estudiamos procedimientos paraprobar la hipótesis de que dos medias poblacionales son iguales, pero los métodos deesa sección no pueden aplicarse cuando se incluyen tres o más medias. En vezde referirnos al objetivo principal de probar medias iguales, el término análisis devarianza se refiere al método que empleamos, el cual está basado en un análisisde varianzas muestrales.

¿Por qué no probar sencillamente dos muestras al mismo tiempo? ¿Por quénecesitamos un nuevo procedimiento, cuando podemos probar la igualdad de dosmedias utilizando los métodos presentados en el capítulo 9? Por ejemplo, si desea-mos utilizar los datos muestrales de la tabla 12-1 para probar la aseveración de quelas tres poblaciones tienen la misma media, ¿por qué no simplemente tomamos dosa la vez y probamos H0: m1 � m2, luego H0: m2 � m3, y así sucesivamente? Para losdatos de la tabla 12-1, el método de probar la igualdad de dos medias a la vez re-quiere de seis pruebas diferentes de hipótesis, de manera que el grado de confianzapodría ser tan bajo como 0.956 (o 0.735). En general, conforme incrementamos elnúmero de pruebas de significancia individuales, aumentamos el riesgo de obteneruna diferencia únicamente por el azar (en vez de una diferencia real en las medias).El riesgo de un error tipo I (encontrar una diferencia en uno de los pares cuando enrealidad no existe tal diferencia) es demasiado alto. El método del análisis de varian-za nos ayuda a evitar este problema en particular (rechazar una hipótesis nula verda-dera) utilizando una prueba de igualdad de varias medias.

Distribución FLos métodos del ANOVA de este capítulo requieren de la distribución F que sepresentó por primera vez en la sección 9-5, en la cual señalamos que la distribu-ción F tiene las siguientes propiedades importantes (véase la figura 12-1):

1. La distribución F no es simétrica; está sesgada hacia la derecha.

2. Los valores de F pueden ser 0 o positivos, pero no pueden ser negativos.

3. Existe una distribución F diferente para cada par de grados de libertad para elnumerador y el denominador.

Los valores críticos de F se localizan en la tabla A-5.El análisis de varianza (ANOVA) está basado en una comparación de dos esti-

mados diferentes de la varianza común de las distintas poblaciones. Estos estima-dos (la varianza entre muestras y la varianza dentro de las muestras) se describiránen la sección 12-2. El término un factor se utiliza porque los datos muestrales estánseparados en grupos según una característica o factor. En la sección 12-3 estudiare-mos el análisis de varianza de dos factores, el cual nos permite comparar poblacionesseparadas en categorías por medio de dos características (o factores). Por ejemplo,podríamos separar la estatura de las personas utilizando los siguientes dos factores:1. género (hombre o mujer) y 2. mano dominante derecha o izquierda.

DefiniciónEl análisis de varianza (ANOVA) es un método de prueba de igualdad de treso más medias poblacionales, por medio del análisis de las varianzas muestrales.

12-2 ANOVA de un factor 637

Estrategia de estudio sugerida: Puesto que los procedimientos empleadosen este capítulo requieren de cálculos complicados, enfatizaremos el uso y la in-terpretación de programas de cómputo, tales como STATDISK, Minitab y Excel, ode una calculadora TI-83>84 Plus. Sugerimos que inicie la sección 12-2 enfocán-dose en el siguiente concepto clave: estamos utilizando un procedimiento paraprobar la aseveración de que tres o más medias son iguales. A pesar de que losdetalles de los cálculos son complicados, nuestro procedimiento será fácil debidoa que está basado en un valor P. Si el valor P es pequeño, como 0.05 o menor, serechaza la igualdad de las medias. De otra manera no se rechaza la igualdad de lasmedias. Después de comprender este procedimiento básico y sencillo, proceda ala comprensión de los fundamentos subyacentes.

12-2 ANOVA de un factorConcepto clave En esta sección se presenta el método del análisis de varianzade un factor, que se utiliza para probar las hipótesis de que tres o más medias po-blacionales son iguales, como en H0: m1 � m2 � m3. Como los cálculos son muycomplicados, recomendamos interpretar los resultados obtenidos por medio de unprograma de cómputo o de una calculadora TI-83>84 Plus. Sugerimos la siguienteestrategia de estudio:

1. Comprenda que un valor P pequeño (como 0.05 o menos) conduce al rechazode la hipótesis nula de igualdad de medias. Con un valor P grande (como unomayor que 0.05), no rechace la hipótesis nula de igualdad de medias.

2. Trate de comprender el fundamento subyacente al estudiar los ejemplos de es-ta sección.

3. Familiarícese con la naturaleza de los valores de la SC (suma de cuadrados) y delos CM (cuadrados medios), así como con el papel que desempeñan en ladeterminación del estadístico de prueba F, pero utilice programas estadísticos decómputo o una calculadora para obtener esos valores.

El método que empleamos se denomina análisis de varianza de un factor (oanálisis de varianza de una entrada) porque empleamos una sola propiedad o ca-racterística para categorizar las poblaciones. En ocasiones a esta característica se lellama tratamiento o factor.

a

0 1.0

No simétrica (sesgada hacia la derecha)

F

Únicamente valores no negativos

Figura 12-1

Distribución F

Existe una distribución F distintapara cada par de grados de liber-tad diferente para el numerador y el denominador.

638 Capítulo 12 Análisis de varianza

DefiniciónUn tratamiento (o factor) es una propiedad o característica que nos permitedistinguir entre sí a las distintas poblaciones.

Por ejemplo, los pesos de los álamos en la tabla 12-1 se distinguen de acuerdo con eltratamiento (ninguno, fertilizante, riego, fertilizante y riego). Se utiliza el términotratamiento porque las primeras aplicaciones del análisis de varianza implicaronexperimentos de agricultura en los que distintas porciones de tierra se trataban condiferentes fertilizantes, tipos de semillas, insecticidas, etcétera. El siguiente recuadroincluye los requisitos y procedimientos que utilizaremos.

Requisitos

1. Las poblaciones tienen distribuciones que son aproximadamente normales. (Es-te requisito no es demasiado estricto, ya que el método funciona bien, a menosque la población tenga una distribución muy diferente de la normal. Si unapoblación tiene una distribución muy diferente a la normal, utilice la prueba deKruskal-Wallis, descrita en la sección 13-5).

2. Las poblaciones tienen la misma varianza s2 (o desviación estándar s). (Esterequisito no es demasiado estricto, ya que el método funciona bien a menos quelas varianzas poblacionales difieran en grandes cantidades. El especialista enestadística de la Universidad de Wisconsin, George E. P. Box demostró que,siempre y cuando los tamaños muestrales sean iguales (o casi iguales), lasvarianzas pueden diferir de tal forma que la más grande sea hasta nueve vecesel tamaño de la más pequeña, y los resultados del ANOVA continúan siendoesencialmente confiables).

3. Las muestras son aleatorias simples (es decir, muestras del mismo tamaño quetienen la misma probabilidad de ser elegidas).

4. Las muestras son independientes entre sí (es decir, no están aparejadas o asocia-das de ninguna forma).

5. Las diferentes muestras provienen de poblaciones que están categorizadas deuna sola forma. (Ésta es la base del nombre del método: análisis de varianzade un factor).

Procedimiento de prueba de H0: m1 � m2 � m3 � . . .

1. Utilice STATDISK, Minitab, Excel o una calculadora TI-83>>84 Plus paraobtener los resultados.

2. Identifique el valor P en los resultados.

3. Plantee una conclusión con base en estos criterios:

● ISi el valor P � A, rechace la hipótesis nula de medias iguales y concluyaque al menos una de las medias poblacionales es diferente de las otras.

● Si el valor P � A, no rechace la hipótesis nula de medias iguales.

Tenga cuidado al interpretar los resultados: Cuando concluimos que existe sufi-ciente evidencia para rechazar la aseveración de medias poblacionales iguales, nopodemos concluir a partir del ANOVA que cualquier media en particular es distintade las demás. (Existen otras pruebas que pueden utilizarse para identificar lasmedias específicas que son diferentes, las cuales se conocen como procedimientosde comparación múltiple y que estudiaremos más adelante en esta sección.

12-2 ANOVA de un factor 639

EJEMPLO Pesos de álamos Dados los pesos de álamos listadosen la tabla 12-1, y un nivel de significancia de a� 0.05, utilice STAT-DISK, Minitab, Excel o una calculadora TI-83>84 Plus para probar

la aseveración de que las cuatro muestras provienen de poblaciones con mediasdiferentes. Vea a las siguientes pantallas de resultados.

SOLUCIÓNREQUISITO Cuando se investiga el requisito de normalidad de las cuatropoblaciones diferentes, la única muestra cuestionable es la segunda del grupode tratamiento con fertilizante. Sólo para esa muestra, la gráfica cuantilar nor-mal y el histograma sugieren que tal vez no se trate de una distribución normal,y el problema es el valor de 1.34 kg, que al parecer es un valor extremo; por lotanto, debemos ser cuidadosos. Lo más adecuado sería realizar el análisis con ysin la inclusión de ese valor. Consulte el ejercicio 5, en donde vemos que en estecaso el valor extremo de 1.34 kg no tiene un efecto drástico en los resultados.

continúa

PROBLEMA

DE

L

C A PÍTUL

O12

640 Capítulo 12 Análisis de varianza

Las varianzas son muy diferentes, pero la más grande no es más de nueve vecesel tamaño de la más pequeña, de manera que se satisface el requisito de varian-zas iguales. Suponemos que tenemos muestras aleatorias simples. Sabemosque las muestras son independientes, y cada valor pertenece exactamente a ungrupo. Por lo tanto, los requisitos se satisfacen y podemos proceder con laprueba de hipótesis.

La hipótesis nula es H0: m1 � m2 � m3 y la hipótesis alternativa es laaseveración de que al menos una de las medias es diferente de las otras.

Paso 1: Utilice algún recurso tecnológico para obtener los resultados delANOVA, como alguno de los que se muestran en este ejemplo.

Paso 2: Todas las pantallas de resultados indican que el valor P es 0.007,redondeado.

Paso 3: Puesto que el valor P es menor que el nivel de significancia de a �0.05, rechazamos la hipótesis nula de igualdad de medias.

INTERPRETACIÓN Existe evidencia suficiente para sustentar la aseveraciónde que las cuatro medias poblacionales no son iguales. Con base en la muestra depesos de la tabla 12-1. Con base en la muestra de pesos de la tabla 12-1, conclui-mos que esos pesos provienen de poblaciones con medias diferentes. Con base enesta prueba de ANOVA, no podemos concluir que cualquier media en particularsea diferente de las demás.

FundamentosSuponiendo que las poblaciones tienen la misma varianza s2, el estadístico de pruebaF es la razón o el cociente de los siguientes dos estimados de s2: 1. la variación entremuestras (con base en la variación entre medias muestrales), y 2. variación dentrode muestras (con base en las varianzas muestrales). Un estadístico de prueba F signi-ficativamente grande (ubicado a la extrema derecha de la gráfica de distribución F)constituye evidencia en contra de medias poblacionales iguales, de manera quela prueba es de cola derecha. La figura 12-2 indica la relación entre el estadístico deprueba F y el valor P.

Estadístico de prueba del ANOVA de un factor

F 5varianza entre las muestras

varianza dentro de las muestras

El numerador del estadístico de prueba F mide la variación entre medias mues-trales. El estimado de la varianza en el denominador depende únicamente de lasvarianzas muestrales y no se ve afectado por las diferencias entre las mediasmuestrales. Como consecuencia, las medias muestrales que tienen valores cerca-nos dan como resultado un estadístico de prueba F pequeño y concluimos que noexisten diferencias significativas entre las medias muestrales. Pero si el valor de Fes excesivamente grande, entonces rechazamos la aseveración de igualdad demedias. (Los ambiguos términos “pequeño” y “excesivamente grande” se vuelvenobjetivos por medio del valor P correspondiente, el cual nos indica si el estadísticode prueba F está o no en la región crítica). Puesto que valores excesivamentegrandes de F reflejan medias desiguales, la prueba es de cola derecha.

12-2 ANOVA de un factor 641

Figura 12-2

Relación entre el estadístico de prueba F y el valor P

No rechace la igualdad

de medias poblacionales

F aquí

Estadístico de prueba F

grande, valor P pequeño

Estadístico de prueba F

pequeño, valor P grande

F aquí

Compare las

medias muestrales.

Al menos una

media muestral

es muy diferente.

Todas las medias

muestrales tienen

valores cercanos.

Rechace la igualdad

de medias poblacionales

Cálculos con tamaños muestrales n igualesPara comprender realmente los efectos del análisis de varianza de un factor, vea latabla 12-2. Compare el conjunto de datos A con el conjunto de datos B y observeque la única diferencia es que añadimos 10 a cada valor de la muestra 1 en el con-junto de datos A para obtener los valores de la muestra 1 en el conjunto de datos B.Si todos los conjuntos de datos tienen el mismo tamaño muestral (como en n � 4para la tabla 12-2), los cálculos requeridos no son demasiado difíciles. Primero,calcule la varianza entre muestras al evaluar ns , donde s es la varianza de lasmedias muestrales y n es el tamaño de cada una de las muestras. Es decir, considerelas medias muestrales como un conjunto ordinario de valores y calcule la varian-za. (Del teorema del límite central, sx– � s>��n se puede despejar s para obteners � ��n ? sx–, de manera que podemos estimar s2 con ns ). Por ejemplo, las me-dias muestrales del conjunto de datos A en la tabla 12-2 son 5.5, 6.0 y 6.0. Estostres valores tienen una varianza de s � 0.0833, de manera que la

varianza entre las muestras � ns � 4(0.0833) � 0.3332

A continuación, estime la varianza dentro de las muestras, calculando s2p, que

es la varianza agrupada que se obtiene al calcular la media de las varianzas mues-trales. Las varianzas muestrales en la tabla 12-2 son 3.0, 2.0 y 2.0, de forma que la

varianza dentro de muestras � s2p

Finalmente, evalúe el estadístico de prueba F de la siguiente manera:

F 5varianza entre muestras

varianza dentro de muestras5

ns2x#

s2p

50.3332

2.33335 0.1428

53.0 1 2.0 1 2.0

35 2.3333

2x#

2x#

2x#

2x#

2x#

642 Capítulo 12 Análisis de varianza

Grados de libertad:(k � número de muestras y n � tamaño muestral)

grados de libertad del numerador � k 2 1

grados de libertad del denominador 5 k (n 2 1)

El valor crítico de F se calcula suponiendo una prueba de cola derecha, ya quelos valores grandes de F corresponden a diferencias significativas entre medias.Con k muestras, cada una con n valores, el número de grados de libertad se obtie-ne como sigue.

añadir 10

Muestra 3 Muestra 2 Muestra 1 Muestra 3 Muestra 2 Muestra 1

F = = = 0.14280.33322.3333

F = = = 51.5721120.33322.3333

A B

n1 = 4x1 = 5.5s2

1 = 3.0

7366

6558

4767

17131616

6558

4767

n2 = 4x2 = 6.0s2

2 = 2.0

n3 = 4x3 = 6.0s2

3 = 2.0

n1 = 4x1 = 15.5s2

1 = 3.0

n2 = 4x2 = 6.0s2

2 = 2.0

n3 = 4x3 = 6.0s2

3 = 2.0

Varianza entre muestras

Varianza dentro de muestras

Estadístico de prueba F

ns2x = 4 (0.0833) = 0.3332

s2p = 3.0 + 2.0 + 2.0 = 2.3333

3

s2p

ns2x = 4 (30.0833) = 120.3332

s2p = 3.0 + 2.0 + 2.0 = 2.3333

3

ns 2x ns 2

x s2

p

Valor P = 0.8688 Valor P = 0.0000118Valor P (obtenido con Excel)

Para el conjunto de datos A de la tabla 12-2, k � 3 y n � 4, de manera que los gra-dos de libertad son 2 para el numerador y 3(4 � 1) � 9 para el denominador. Cona� 0.05, 2 grados de libertad para el numerador y 9 grados de libertad para el de-nominador, el valor crítico F de la tabla A-5 es 4.2565. Si utilizáramos el métodotradicional de prueba de hipótesis con el conjunto de datos A de la tabla 12-2, ve-ríamos que esta prueba de cola derecha tiene un estadístico de prueba F � 0.1428y un valor crítico de F � 4.2565, de manera que el estadístico de prueba no seencuentra en la región crítica y, por lo tanto, no rechazamos la hipótesis nula deigualdad de medias.

Resistencia a las encuestas

Las encuestas basadas en mues-

tras relativamente pequeñas

pueden ser bastante precisas,

siempre y cuando la muestra sea

aleatoria o representativa de la

población. Sin embargo, el incre-

mento en las tasas de rechazo a

las encuestas está haciendo que

sea más difícil obtener muestras

aleatorias. El Council of Ame-

rican Survey Research Organi-

zations reportó que, en un año

reciente, el 38% de los consumi-

dores se rehusaron a respon-

der encuestas. El director de

una compañía de investigación

de mercados dijo que “las per-

sonas tienen temor de ser se-

leccionadas y les preocupa que

las generalizaciones se reali-

cen con base únicamente en

aquellos que cooperan”. Los

resultados de la industria de in-

vestigación de mercados, mul-

timillonaria en dólares, afectan

los productos que compra-

mos, los programas de televi-

sión que vemos y muchas otras

facetas de nuestras vidas.

Tabla 12-2 Efecto de una media sobre el estadístico de prueba F

12-2 ANOVA de un factor 643

Para ver realmente cómo funciona el estadístico de prueba F, considere ambosconjuntos de datos muestrales en la tabla 12-2. Observe que las tres muestras de laparte A son idénticas a las tres muestras de la parte B, excepto que en la parte Bañadimos 10 a cada valor de la muestra 1 de la parte A. Las tres medias muestralesde la parte A son muy cercanas, pero existen diferencias sustanciales en la parte B.Las tres varianzas muestrales de la parte A son idénticas a las de la parte B.

La suma de 10 a cada dato de la primera muestra de la tabla 12-2 tiene un efectodrástico en el estadístico de prueba, ya que F cambia de 0.1428 a 51.5721. Lasuma de 10 a cada dato de la primera muestra también tiene un efecto drástico en elvalor P, el cual cambia de 0.8688 (no significativo) a 0.0000118 (significativo).Observe que la varianza entre muestras en la parte A es 0.3332, pero en la parte Bes 120.3332 (lo que indica que las medias muestrales en la parte B están más sepa-radas). Observe también que las varianzas dentro de las muestras son de 2.3333 enambas partes, ya que la varianza dentro de una muestra no se ve afectada cuandosumamos una constante a cada valor muestral. El cambio en el estadístico F y elvalor P es atribuible únicamente a los cambios en x–1. Esto ilustra que el estadísti-co de prueba F es muy sensible a las medias muestrales, aun cuando se obtiene através de dos estimados distintos de la varianza poblacional común.

He aquí el punto clave de la tabla 12-2: los conjuntos de datos A y B son idénti-cos, excepto que en el conjunto de datos B se añadió 10 a cada valor de la primeramuestra. La suma de 10 a cada valor de la primera muestra causa que las tres mediasmuestrales se aparten más, con el resultado de que el estadístico de prueba F se in-crementa y el valor P disminuye.

Cálculos con tamaños muestrales desigualesMientras que los cálculos requeridos para los casos con tamaños muestrales igualesson razonables, las cosas se complican bastante cuando los tamaños muestralesno son iguales. Se aplica el mismo razonamiento básico, porque calculamos un es-tadístico de prueba F que es el cociente de dos estimados diferentes de la varianzapoblacional común s2, pero esos estimados implican medidas ponderadas quetoman en cuenta los tamaños muestrales, tal como se indica a continuación.

donde 5 media de todos los valores muestrales combinadosk 5 número de medias poblacionales que se están comparando

ni 5 número de valores en la i-ésima muestrax–i � media de los valores en la i-ésima muestras2

i � varianza de los valores en la i-ésima muestra

El factor de ni está incluido de manera que las muestras más grandes llevan máspeso. El denominador del estadístico de prueba es sencillamente la media de lasvarianzas muestrales, pero se trata de una media ponderada cuyos pesos se basanen los tamaños muestrales.

Como el cálculo de este estadístico de prueba puede conducir a grandes erroresde redondeo, los diferentes programas estadísticos de cómputo suelen emplear unaexpresión distinta (pero equivalente) que implica la notación de la SC (suma de

x

F 5varianza entre muestras

varianza dentro de muestras5

cSnisxi 2 xd2

k 2 1d

cSsni 2 1ds2

i

Ssni 2 1d d

La ética en los repor-tes de encuestas

La American Association for

Public Opinion Research creó

un código de ética para aplicar-

se en los reportes de noticias

de resultados de encuesta. Este

código requiere que se incluya

lo siguiente: 1. identificación

del patrocinador, 2. fecha de la

realización de la encuesta, 3.tamaño de la muestra, 4. natu-

raleza de la población mues-

treada, 5. tipo de encuesta utili-

zada y 6. redacción exacta de

las preguntas de la encuesta. Las

encuestas financiadas por el

gobierno de Estados Unidos se

someten a una verificación que

evalúa el riesgo para los sujetos

encuestados, el mérito científi-

co de la encuesta y la garantía

del consentimiento de los suje-

tos para participar.

644 Capítulo 12 Análisis de varianza

cuadrados) y los CM (cuadrados medios). A pesar de que la siguiente notación ysus componentes son complicados y tediosos, la idea básica es la misma: el esta-dístico de prueba F es una razón con un numerador que refleja la variación entrelas medias de las muestras y un denominador que refleja la variación dentro de lasmuestras. Si las poblaciones tienen medias iguales, el cociente F tiende a serpequeño, pero si las medias poblacionales no son iguales, el cociente F tiende aser significativamente grande. A continuación se describen los componentes másimportantes del método ANOVA.

La SC(del tratamiento), también llamada SC(del factor), SC(entregrupos) o SC(entre muestras), es una medida de la variación entre lasmedias muestrales.

Fórmula 12-2

SC(del tratamiento) � n1( 1 2 )2 1 n2( 2 2 )2 1 . . . 1 nk( k 2 )2

5 Sni( i 2 )2xx

xxxxxx

La SC(del error), también conocida como SC(dentro de grupos) oSC(dentro de muestras), es una suma de cuadrados que representa lavariación que se supone común a todas las poblaciones consideradas.

Fórmula 12-3

SC(del error) � (n1 � 1)s21 � (n2 � 1)s2

2 � � � � � (nk � 1)s2k

� S(ni � 1)s2i

Si las medias poblacionales (m1, m2, . . . , mk) son iguales, entonces las mediasmuestrales x–1, x

–2, . . . , x

–k tenderán a acercarse entre sí y también a acercarse a .

El resultado será un valor de SC(del tratamiento) relativamente pequeño. Sin em-bargo, si las medias poblacionales no son todas iguales, entonces al menos una dex–1, x

–2, . . . , x

–k tenderá a estar lejos de las demás y también de . El resultado será

un valor relativamente grande de SC(del tratamiento).x

x

La SC (total) o suma total de cuadrados es una medida de la varia-ción total en todos los datos muestrales combinados.

Fórmula 12-1 SCstotald 5 Ssx 2 x d2

x

La SC(total) se puede separar en los componentes de la SC(del tratamiento) y laSC(del error), descritas como sigue.

Dadas las expresiones anteriores para SC(total), SC(del tratamiento) y SC(delerror), siempre deben mantenerse las siguientes relaciones.

Fórmula 12-4 SC(total) � SC(del tratamiento) � SC(del error)

12-2 ANOVA de un factor 645

SC(del tratamiento) y SC(del error) son ambas sumas de cuadrados, y si divi-dimos cada una de ellas entre su número correspondiente de grados de libertad,obtenemos los cuadrados medios. Algunas de las siguientes expresiones para loscuadrados medios incluyen la notación N:

N � número total de valores en todas las muestras combinadas

CM(del tratamiento) es un cuadrado medio de tratamiento, que se obtiene comosigue:

Fórmula 12-5

CM(del error) es un cuadrado medio del error, que se obtiene como sigue:

Fórmula 12-6

CM(total) es un cuadrado medio de la variación total, que se obtiene como sigue:

Fórmula 12-7

Estadístico de prueba para ANOVA con tamaños muestrales desigualesAl contrastar la hipótesis nula H0: m1 5 m2 5 . . . 5 mk con la hipótesis alternativade que no todas estas medias son iguales, el estadístico de prueba

Fórmula 12-8

tiene una distribución F (cuando la hipótesis nula H0 es verdadera) con gradosde libertad dados por

grados de libertad del numerador 5 k 2 1

grados de libertad del denominador 5 N 2 k

F 5CMsdel tratamientod

CMsdel errord

CMstotald 5SCstotald

N 2 1

CMsdel errord 5SCsdel errord

N 2 k

CMsdel tratamientod 5SCsdel tratamientod

k 2 1

Este estadístico de prueba es esencialmente el mismo que se utilizó antes, y suinterpretación también es igual a la descrita con anterioridad. El denominador de-pende únicamente de las varianzas muestrales que miden la variación dentro de lostratamientos y no se ve afectado por las diferencias entre las medias muestrales.En contraste, el numerador se ve afectado por las diferencias entre las mediasmuestrales. Si las diferencias entre las medias muestrales son extremas, causarán queel numerador sea excesivamente grande, por lo que F también será excesivamentegrande. Como consecuencia, los valores muy grandes de F sugieren medias desi-guales y, por lo tanto, la prueba ANOVA es de cola derecha.

Las tablas constituyen un formato adecuado para resumir los resultados másimportantes en los cálculos del ANOVA, y la tabla 12-3 tiene un formato que sueleutilizarse en el despliegue de resultados de las computadoras. (Véase las pantallasanteriores de STATDISK, Minitab y Excel). Las cifras de la tabla 12-3 resultan delos datos de la tabla 12-1.

Diseño del experimento En el análisis de varianza de un factor (o de una entra-da) utilizamos un factor como base para separar los datos en diferentes categorías.

646 Capítulo 12 Análisis de varianza

Si concluimos que las diferencias entre las medias son significativas, no podemosestar completamente seguros de que las diferencias se puedan explicar por el factorutilizado. Es posible que la variación de algún otro factor desconocido sea el respon-sable. Una forma de reducir el efecto de factores extraños es planear el experimentode manera que tenga un diseño completamente aleatorizado, en el que se da a cadaelemento la misma posibilidad de pertenecer a las diferentes categorías o tratamien-tos. Por ejemplo, usted podría asignar sujetos a dos diferentes grupos de tratamientoy a un grupo placebo por medio de un proceso de selección aleatoria equivalente asacar papeles de un tazón. Otra forma de reducir el efecto de factores extraños es eluso de un diseño rigurosamente controlado, en el cual los elementos se eligen cui-dadosamente de manera que el resto de los factores no tengan variabilidad. En gene-ral, los buenos resultados requieren que el experimento se diseñe y ejecute de formacuidadosa.

Identificación de medias diferentesDespués de hacer una prueba con el análisis de varianza, podemos concluir queexiste evidencia suficiente para rechazar una aseveración de igualdad de mediaspoblacionales, pero no podemos concluir a partir de un ANOVA que algunamedia en particular sea diferente de las demás. Existen varios procedimientosformales e informales para identificar las medias específicas que son diferentes.Un método informal consiste en usar la misma escala para construir gráficas decuadro con los conjuntos de datos, para ver si uno o más de ellos es muy dife-rente de los otros. Otro método consiste en construir estimados de intervalos deconfianza de las medias a partir de los conjuntos de datos, y luego compararesos intervalos de confianza para ver si uno o más de ellos no se traslapan conlos demás.

Anteriormente señalamos que no es adecuado aparear las muestras y realizarpruebas de hipótesis individuales con los procedimientos descritos en la sección9-3. Con cuatro poblaciones, este método (hacer dos a la vez) requiere de seispruebas de hipótesis diferentes, de manera que si cada prueba se realiza con unnivel de significancia de 0.05, el nivel general de confianza para las seis pruebassería demasiado bajo, como 0.956 (o 0.735), de manera que el nivel de significan-cia sería tan alto como 1 � 0.735 � 0.265. Este nivel de significancia indica queel riesgo de cometer un error tipo I (encontrar una diferencia en uno de los parescuando en realidad no existe tal diferencia), es demasiado alto.

Existen varios procedimientos para identificar cuáles medias difieren de lasdemás. Algunas de las pruebas, llamadas pruebas de rango, nos permiten localizarsubconjuntos de medias que no son significativamente diferentes de las demás.

Tabla 12-3 Tabla de ANOVA para los datos de la tabla 12-1

Suma de CuadradoFuente de cuadrados Grados de medio Estadístico devariación (SC) libertad (CM) prueba F Valor P

Tratamientos 4.6824 3 1.5608 5.7314 0.0073

Error 4.3572 16 0.2723

Total 9.0397 19

12-2 ANOVA de un factor 647

Otras pruebas, denominadas pruebas de comparación múltiple, utilizan pares demedias, pero hacen ajustes para superar el problema de tener un nivel de signifi-cancia que aumenta conforme se incrementa el número de pruebas individuales. Noexiste consenso sobre cuál es la mejor prueba, pero algunas de las más comunesson la prueba de Duncan, la prueba de Student-Newman-Keuls (o prueba SNK),la prueba de Tukey (o prueba de diferencia significativa honesta de Tukey), laprueba de Scheffé, la prueba de Dunnett, la prueba de la diferencia mínima sig-nificativa y la prueba de Bonferroni. Ahora aplicaremos esta última con el fin dever un ejemplo de uno de los métodos para identificar cuáles medias difieren de lasdemás. El procedimiento es el siguiente:

Prueba de comparación múltiple de Bonferroni

Paso 1. Realice una prueba t separada para cada par de muestras, pero haga losajustes que se describen en los siguientes pasos.

Paso 2. Para obtener un estimado de la varianza s2 que es común a todas laspoblaciones implicadas, utilice el valor del CM(del error), que utilizatodos los datos muestrales disponibles. El valor del CM(del error) ge-neralmente se obtiene al realizar la prueba del análisis de varianza. Uti-lice el valor del CM(del error) para calcular el valor del estadístico deprueba t, como se indica abajo. Este estadístico de prueba en particularse basa en la opción de la muestra 1 y la muestra 4; cambie los subíndi-ces y utilice otro par de muestras hasta haber probado todos los pares demuestras posibles.

Paso 3. Después de calcular el valor del estadístico de prueba t para un par específi-co de muestras, calcule el valor t crítico o el valor P, pero haga el siguienteajuste para que el nivel de significancia general no se salga de control.

Valor P: Utilice el estadístico de prueba t con gl � N � k, donde Nes el número total de valores muestrales y k es el número de muestras, ycalcule el valor P de la manera acostumbrada, pero ajústelo multiplicán-dolo por el número de pares de muestras diferentes posibles. (Por ejemplo,con cuatro muestras, existen seis pares posibles diferentes, de manera queel valor P se ajusta multiplicándolo por 6).

Valor crítico: Cuando calcule el valor crítico, ajuste el nivel designificancia a dividiéndolo entre el número de pares de muestras po-sibles. (Por ejemplo, con cuatro muestras, existen seis pares posiblesdiferentes, de manera que el nivel de significancia se ajusta dividién-dolo entre 6).

Observe que en el paso 3 del procedimiento de Bonferroni se realiza una prue-ba individual con un nivel de significancia mucho más bajo, o bien, el valor Paumenta de manera importante. Por ejemplo, si tenemos cuatro muestras, existenseis pares diferentes de muestras posibles. Si utilizamos un nivel de significanciade 0.05, cada una de las seis comparaciones apareadas utiliza un nivel de signi-ficancia de 0.05>6 � 0.00833. Por lo tanto, el rechazo de la igualdad de mediasrequiere de diferencias que estén muy separadas. El grado de confianza para las

t 5x1 2 x4

ÅCMserrord ? a

1

n11

1

n4b

648 Capítulo 12 Análisis de varianza

seis pruebas puede ser tan bajo como (1 � 0.00833)6 � 0.95, de manera que laposibilidad de cometer un error tipo I en una de las seis pruebas es de alrededorde 0.05. Este ajuste en el paso 3 compensa el hecho de que estamos realizandovarias pruebas en vez de una sola.

EJEMPLO Uso de la prueba de Bonferroni En un ejemplo previo deesta sección se utilizó el análisis de varianza con los datos muestrales de la ta-bla 12-1. Concluimos que existe evidencia suficiente para justificar el rechazode la aseveración de igualdad de medias. Utilice la prueba de Bonferroni, conun nivel de significancia de 0.05, para identificar cuál de las medias difiere delas demás.

SOLUCIÓN La prueba de Bonferroni requiere de una prueba t separada paracada diferente par de muestras posible. Las hipótesis nulas que deben probarseson las siguientes:

H0: m1 � m2 H0: m1 � m3 H0: m1 � m4

H0: m2 � m3 H0: m2 � m4 H0: m3 � m4

Comenzamos con H0: m1 � m4. En la tabla 12-1 observamos que x–1 � 0.184,n1 � 5, x–4 � 1.334 y n4 � 5. A partir de los resultados anteriores del análisis devarianza, también sabemos que para los datos de la tabla 12-3, CM(del error)� 0.2723275. Ahora podemos evaluar el estadístico de prueba:

El número de grados de libertad es gl � N � k � 20 � 4 � 16. Con unestadístico de prueba t � �3.484 y con gl � 16, el valor P de dos colas es0.003065, pero ajustamos este valor P al multiplicarlo por 6 (el número de dife-rentes pares de muestras posibles) para obtener un valor P final de 0.01839. Comoeste valor P es pequeño (menor que 0.05), rechazamos la hipótesis nula. Pareceque las muestras 1 y 4 tienen medias significativamente diferentes. [Si queremosobtener el valor crítico, usamos gl � 16 y un nivel de significancia ajustadode 0.05>6 � 0.00833. (Este nivel de significancia ajustado no se aleja mucho delárea de 0.01, que se incluye en la tabla A-3. Por lo tanto, los valores t críticospara la prueba de dos colas están cerca de �2.921 y 2.921). Los valores críti-cos reales son �3.008 y 3.008. El estadístico de prueba de �3.484 se encuentraen la región crítica, de manera que nuevamente rechazamos la hipótesis nulade que m1 � m4)].

En vez de continuar haciendo las pruebas de hipótesis separadas para loscinco pares restantes, observe la pantalla de SPSS, que incluye todos los resul-tados de la prueba de Bonferroni. (El tercer renglón de los resultados numéricoscorresponde a los resultados obtenidos aquí). La pantalla indica que la mediade la muestra 4 difiere significativamente de las otras tres medias muestrales.Con base en la prueba de Bonferroni, parece que los pesos de los álamos trata-dos con fertilizante y riego tienen una media diferente de las tres categorías detratamiento restantes.

t 5x1 2 x4

ÅCMsdel errord ? a

1

n11

1

n4b

50.184 2 1.334

Å0.2723275 ? a

1

51

1

5b

5 23.484

12-2 ANOVA de un factor 649

Uso de la tecnología

STATDISK Anote los datos en las co-lumnas de la ventana de datos. SeleccioneAnalysis de la barra del menú principal,

luego seleccione One-Way Analysis of Va-riance y proceda a elegir las columnas delos datos muestrales. Haga clic en Evaluateal finalizar.

MINITAB Primero ingrese los datosmuestrales en las columnas C1, C2, C3, . . .Después seleccione Stat, ANOVA, ONE-WAY(UNSTACKED) e introduzca C1 C2C3 . . . en el recuadro identificado como“Responses” (en columnas separadas).

EXCEL Primero anote los datos en lascolumnas A, B, C, . . . Después seleccioneTools de la barra del menú principal, luegoData Analysis, seguido por Anova: Single

Factor. En el cuadro de diálogo, introduzcael rango que contiene los datos muestrales.(Por ejemplo, ingrese A1:C12 si el primervalor está en el renglón 1 de la columna Ay el último dato está en el renglón 12 de lacolumna C).

TI-83>84 PLUS Primero registre losdatos como listas en L1, L2, L3, . . . , des-pués presione STAT, seleccione TESTS yelija la opción ANOVA. Ingrese los rótulosde las columnas. Por ejemplo, si los datosestán en las columnas L1, L2 y L3, ingreseesas columnas para obtener ANOVA (L1,L2, L3) y presione la tecla ENTER.

12-2 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. ANOVA. ¿Qué es el análisis de varianza de un factor y para qué se utiliza?

2. Tratamiento. En el contexto del análisis de varianza, ¿qué es un tratamiento? Eneste contexto, ¿la palabra “tratamiento” tiene el mismo significado que en el lenguajecotidiano?

SPSS Bonferroni Results

650 Capítulo 12 Análisis de varianza

3. Entre>>dentro. ¿Qué es la varianza entre muestras y qué es la varianza dentro demuestras?

4. Comparación de áreas de estudio. Un estudiante del College of Newport aplica unaprueba de razonamiento abstracto a estudiantes de inglés, matemáticas y ciencias desu universidad, elegidos al azar. Luego, utiliza el análisis de varianza con los datosmuestrales y concluye que no todas las medias son iguales. ¿El estudiante puede con-cluir que, en Estados Unidos, los estudiantes de inglés, matemáticas y ciencias tienenpuntuaciones medias de razonamiento abstracto que no son iguales? ¿Por qué?

Los ejercicios 5 y 6 se basan en el conjunto de datos 7 del apéndice B.

5. Pesos de álamos. En el problema del capítulo señalamos que el peso de 1.34 kg pareceser un valor extremo. Si eliminamos ese valor, los resultados de STATDISK son losque se presentan abajo.a. ¿Cuál es la hipótesis nula?b. ¿Cuál es la hipótesis alternativa?c. Identifique el valor del estadístico de prueba.d. Identifique el valor crítico para un nivel de significancia de 0.05.e. Identifique el valor P.f. Con base en los resultados anteriores, ¿qué concluye acerca de la igualdad de las

medias poblacionales?g. Compare estos resultados con los que se obtuvieron al incluir el peso de 1.34 kg.

¿El aparente valor extremo de 1.34 kg tiene un gran efecto en los resultados? ¿Al-tera la conclusión?

STATDISK

6. Pesos de álamos. El problema del capítulo utiliza los pesos de álamos para el año 1 y elterreno 1. (Véase el conjunto de datos 7 del apéndice B). Si utilizamos los pesos del año2 y del terreno 1 con la calculadora TI-83>84 Plus, obtenemos los resultados del análisisde varianza que se presentan al margen. Suponga que deseamos utilizar un nivel designificancia de 0.05 para probar la hipótesis nula de que los cuatro tratamientos dan porresultado pesos con la misma media poblacional.a. ¿Cuál es la hipótesis nula?b. ¿Cuál es la hipótesis alternativa?c. Identifique el valor del estadístico de prueba.d. Identifique el valor crítico para un nivel de significancia de 0.05.e. Identifique el valor P.f. Con base en los resultados anteriores, ¿qué concluye acerca de la igualdad de las

medias poblacionales?

7. Pérdida de peso con diferentes dietas. En una prueba de los programas Atkins, Zone,Weight Watchers y Ornish para perder peso, 160 sujetos siguieron los programas, de talmanera que cada dieta fue adoptada por 40 sujetos. Se pesó a los individuos un añodespués de seguir la dieta, y abajo se presentan los resultados del ANOVA, realizadocon Excel (según datos de “Comparison of the Atkins, Ornish, Weight Watchers andZone Diets for Weight Loss and Heart Disease Risk Reduction”, de Dansinger et al.,Journal of the American Medical Association, vol. 293, núm. 1). Utilice un nivel designificancia de 0.05 para probar la aseveración de que la pérdida media de peso esigual en todas las dietas. Dado que las cantidades medias de pérdida de peso despuésde un año son �2.1 lb, �3.2 lb, �3.0 lb y �3.3 lb para las cuatro dietas, ¿parece quelas dietas son efectivas?

12-2 ANOVA de un factor 651

8. Pruebas de inflamabilidad de tela en diferentes laboratorios. Se realizaron prue-bas de inflamabilidad en ropa infantil para dormir. Se utilizó la prueba Vertical Semi-restrained, en la que en se quemaron pedazos de tela en condiciones controladas. Unavez apagado el fuego, se midió y registró la longitud de la porción quemada. Las mis-mas muestras de tela se probaron en cinco laboratorios diferentes. A continuación sepresentan los resultados del análisis de varianza realizado con Minitab. Utilice un ni-vel de significancia de 0.05 para probar la aseveración de que los cinco laboratoriosproducen las mismas puntuaciones medias de prueba.

Minitab

9. Pesos medios de dulces M&M. El conjunto de datos 13 del apéndice B incluye lospesos (en gramos) de dulces M&M sencillos, clasificados de acuerdo con su color(rojo, anaranjado, amarillo, café, azul y verde). Se utilizó STATDISK para hacer unanálisis de varianza con esos datos; los resultados se presentan abajo. Utilice un nivelde significancia de 0.05 para probar la aseveración de que el peso medio de los dulcesM&M es igual en las seis poblaciones de diferente color. Si Mars Inc. tiene la intenciónde que las poblaciones de diferentes colores tengan el mismo peso medio, ¿estos resul-tados sugieren que la empresa tiene un problema que requiere una acción correctiva?

STATDISK

10. Energía solar en diferentes climas. Un alumno del autor vive en una casa que tiene unsistema eléctrico solar. A la misma hora, cada día, reunió las lecturas de voltaje deun medidor conectado al sistema y realizó un análisis de varianza con las lecturas obte-nidas en tres tipos de días diferentes: soleados, nublados y lluviosos. Los resultados de lacalculadora TI-83>84 Plus aparecen al margen. Utilice un nivel de significancia de 0.05para probar la aseveración de que la lectura media de voltaje es la misma en los tres ti-pos distintos de días. ¿Existe evidencia suficiente para sustentar una aseveración de me-dias poblacionales diferentes? Podríamos esperar que un sistema solar proporcione másenergía eléctrica los días soleados que los días nublados o lluviosos. ¿Podemos concluirque los días soleados dan como resultado mayores cantidades de energía eléctrica?

TI-83/84 Plus

Excel

652 Capítulo 12 Análisis de varianza

En los ejercicios 11 y 12, utilice los datos muestrales listados acerca de experimentos dechoques de automóviles realizados por la National Transportation Safety Administration.Se adquirieron autos nuevos y se hicieron chocar contra una barrera fija a 35 mi>h; lasmediciones se registraron con respecto al maniquí en el asiento del conductor. Los auto-móviles subcompactos son el Ford Escort, Honda Civic, Hyundai Accent, Nissan Sentra ySaturn SL4. Los automóviles compactos son Chevrolet Cavalier, Dodge Neon, Mazda 626DX, Pontiac Sunfire y Subaru Legacy. Los automóviles medianos son Chevrolet Camaro,Dodge Intrepid, Ford Mustang, Honda Accord y Volvo S70. Los automóviles grandes sonAudi A8, Cadillac Deville, Ford Crown Victoria, Oldsmobile Aurora y Pontiac Bonneville.

11. Traumatismo craneal en un choque de automóvil. A continuación se presentan losdatos de traumatismo craneal (de acuerdo con el Head Injury Criterion, HIC). Utiliceun nivel de significancia de 0.05 para probar la hipótesis nula de que las diferentes ca-tegorías de peso tienen la misma media. ¿Sugieren los datos que los automóvilesgrandes son más seguros?

Subcompacto: 681 428 917 898 420Compacto: 643 655 442 514 525Mediano: 469 727 525 454 259Grande: 384 656 602 687 360

12. Desaceleración del pecho en un choque de automóvil. A continuación se presentandatos de desaceleración del pecho (g). Utilice un nivel de significancia de 0.05 paraprobar la hipótesis nula de que las distintas categorías de peso tienen la misma media.¿Sugieren los datos que los automóviles más grandes son más seguros?

Subcompacto: 55 47 59 49 42Compacto: 57 57 46 54 51Mediano: 45 53 49 51 46Grande: 44 45 39 58 44

13. Ejercicio y estrés. Se realizó un estudio para investigar los efectos del ejercicio sobreel estrés. En la siguiente tabla se listan las lecturas de la presión sanguínea sistólica (enmmHg) de sujetos, antes de iniciar 25 minutos de ejercicio aeróbico en bicicleta y antesde generarles estrés por medio de una prueba de aritmética y otra de expresión verbal(según datos de “Sympathoadrenergic Mechanisms in Reduced Hemodynamic StressResponses after Exercise”, de Kim Brownley et al., Medicine and Science in Sportsand Exercise, vol. 35, núm. 6). Utilice un nivel de significancia de 0.05 para probarla aseveración de que los diferentes grupos de sujetos tienen la misma presión sanguí-nea media. Con base en los resultados, ¿se puede considerar que los grupos provienende la misma población?

Mujer>afroam. Hombre>afroam. Mujer>caucásica Hombre>caucásico

117.00 115.67 119.67 124.33130.67 120.67 106.00 111.00102.67 133.00 108.33 99.6793.67 120.33 107.33 128.3396.33 124.67 117.00 102.0092.00 118.33 113.33 127.33

14. Arqueología: Anchura de cráneos de distintas épocas. Se obtuvieron muestras deanchuras de cráneos de hombres egipcios de distintas épocas, y abajo se presentan lasmediciones (según datos de Ancient Races of the Thebaid, de Thomson y Randall-Maciver). Los cambios en la forma de la cabeza a lo largo del tiempo sugieren quehubo mestizaje con poblaciones inmigrantes. Utilice un nivel de significancia de 0.05para probar la aseveración de que las distintas épocas no tienen la misma media. ¿Quéconcluye?

12-2 ANOVA de un factor 653

4000 a. C. 1850 a. C. 150 d. C.

131 129 128138 134 138125 136 136129 137 139132 137 141135 129 142132 136 137134 138 145138 134 137

En los ejercicios 15 y 16, utilice el conjunto de datos del apéndice B.

15. Conjunto de datos del apéndice B: Pesos de monedas de un centavo. Remítaseal conjunto de datos 14 del apéndice B y utilice los pesos de los peniques o centavos“con cabeza de indio”, de los peniques “de trigo”, de los peniques anteriores a 1983y de los posteriores a 1983. Utilice un nivel de significancia de 0.05 para probar laaseveración de que el peso medio de los peniques es el mismo en las cuatro categoríasdiferentes. Con base en los resultados, ¿parecería que una máquina contadora demonedas puede manejar los pesos de los peniques de la misma forma?

16. Conjunto de datos del apéndice B: Distancias de home runs. Remítase al con-junto de datos 17 del apéndice B. Utilice un nivel de significancia de 0.05 para probarla aseveración de que los home runs anotados por Barry Bonds, Mark McGwire ySammy Sosa tienen distancias medias que no son iguales. ¿Explican las distanciasde los home runs el hecho de que hasta hoy, Barry Bonds tiene el mayor número dehome runs en una temporada, mientras que Mark McGwire posee el segundo númeromás grande de home runs? (En años recientes se ha afirmado que los jugadores debéisbol usaban esteroides para aumentar su fuerza, lo que los ayudó a batear laspelotas más lejos).

12-2 MÁS ALLÁ DE LO BÁSICO

17. Pruebas equivalentes. En este ejercicio usted comprobará que cuando tiene dos con-juntos de datos muestrales, la prueba t agrupada para muestras independientes y elmétodo ANOVA de esta sección son equivalentes. Remítase a los pesos de los álamosen la tabla 12-1, pero utilice únicamente los datos de los árboles que no recibierontratamiento y de los que sólo recibieron fertilizante.a. Utilice un nivel de significancia de 0.05 y el método de la sección 9-3 para probar

la aseveración de que las dos muestras provienen de poblaciones con la mismamedia. (Suponga que ambas poblaciones tienen la misma varianza).

b. Utilice un nivel de significancia de 0.05 y el método ANOVA de esta sección paraprobar la aseveración planteada en el inciso a).

c. Verifique que los cuadrados del estadístico de prueba t y el valor crítico del incisoa) son iguales al estadístico de prueba F y al valor crítico del inciso b).

18. Cálculo de componentes del ANOVA. El ejercicio 9 se basa en los pesos de los100 dulces M&M incluidos en el conjunto de datos 13 del apéndice B. Si se utilizanlos pesos de todos los dulces M&M de la bolsa llena, SC(del tratamiento) � 0.00644,gl(del tratamiento) � 5, SC(del error) � 1.47320 y gl(del error) � 459.a. ¿Cuántos dulces M&M hay en la bolsa llena?b. Calcule los valores del CM(del tratamiento) y del CM(del error).c. Calcule el valor del estadístico de prueba F y del valor P.d. Compare los resultados con los obtenidos en el ejercicio 9.

654 Capítulo 12 Análisis de varianza

19. Uso de la prueba de Tukey. En esta sección se incluyó una pantalla de resultados dela prueba de Bonferroni con los datos de la tabla 12-1. A continuación se muestran losresultados generados por SPSS de la prueba de Tukey. Compare los resultados de laprueba de Tukey con los de la prueba de Bonferroni.

SPSS

20. Uso de la prueba de Bonferroni. A continuación se presentan los resultados parcia-les de la prueba de Bonferroni con los datos muestrales utilizados en el ejercicio 14.Suponga que se utiliza un nivel de significancia de 0.05.a. ¿Qué nos indica la pantalla de resultados?b. Utilice el procedimiento de la prueba de Bonferroni para calcular el valor de signi-

ficancia para la prueba de una diferencia significativa entre la anchura media delos cráneos de 1850 a. C. y de 150 d. C. Identifique el estadístico de prueba y elvalor P o los valores críticos. ¿Qué indican los resultados?

12-3 ANOVA de dos factores 655

12-3 ANOVA de dos factoresConcepto clave El procedimiento de análisis de varianza que estudiamos en lasección 12-2 se conoce como análisis de varianza de un factor (o análisis de va-rianza de una entrada), porque los datos están categorizados en grupos de acuerdocon un solo factor (o tratamiento). En esta sección estudiaremos el método delanálisis de varianza de dos factores, que se utiliza con datos separados en catego-rías formadas de acuerdo con dos factores. El método de esta sección requiere queprimero hagamos una prueba de interacción entre los dos factores. Después, hace-mos una prueba para determinar si el factor de renglón tiene algún efecto, y tam-bién para determinar si el factor de columna tiene algún efecto.

La tabla 12-4 es un ejemplo de datos clasificados de acuerdo con dos factores.Un factor es la variable de renglón del terreno (terreno 1 y terreno 2), en tanto queel segundo factor es la variable de columna de tratamiento (ninguno, fertilizante,riego, fertilizante y riego). A las subcategorías de la tabla 12-4 se les conoce comoceldas, de manera que la tabla 12-4 tiene ocho celdas, con cinco valores cada una.

Cuando analizamos los datos muestrales de la tabla 12-4 estudiamos el análisisde varianza de un solo factor, por lo que parecería razonable hacer simplementeun ANOVA de una entrada para el factor del terreno y otro ANOVA de una entra-da para el factor de tratamiento. Por desgracia, si realizamos dos ANOVA de unfactor por separado, perdemos información e ignoramos totalmente una caracte-rística muy importante: el efecto de la interacción entre los dos factores.

Tabla 12-4 Pesos de álamos (en kg)

Sin Fertilizantetratamiento Fertilizante Riego y riego

Terreno 1 0.15 1.34 0.23 2.03(fértil, húmedo) 0.02 0.14 0.04 0.27

0.16 0.02 0.34 0.920.37 0.08 0.16 1.070.22 0.08 0.05 2.38

Terreno 2 0.60 1.16 0.65 0.22(arenoso, seco) 1.11 0.93 0.08 2.13

0.07 0.30 0.62 2.330.07 0.59 0.01 1.740.44 0.17 0.03 0.12

DefiniciónExiste una interacción entre dos factores si el efecto de uno de los factorescambia en las diferentes categorías del otro factor.

Como ejemplo de una interacción entre dos factores, considere el apareamientode alimentos. La crema de maní y la mermelada interactúan bien, pero la salsa detomate y el helado interactúan de tal forma que el resultado es un sabor desagrada-ble. Los médicos deben tener cuidado de evitar la prescripción de fármacos quetienen interacciones que producen efectos adversos. Se descubrió que el fármaco

656 Capítulo 12 Análisis de varianza

antimicótico Nizoral (ketoconazole) interactuaba con el fármaco antihistamínicoSeldane (terfenadine) de tal manera que el Seldane no se metabolizaba de maneraadecuada, provocando arritmias cardiacas en algunos pacientes. Posteriormente elSeldane fue retirado del mercado.

Exploración de los datos Exploremos los datos de la tabla 12-4 calculando lamedia de cada celda y construyendo una gráfica. En la tabla 12-5 se listan las mediasde las celdas individuales. Esas medias van de 0.164 kg hasta 1.334 kg, de maneraque parecen variar considerablemente. La figura 12-3 ilustra gráficas de esas mediase indica que las medias del terreno 2 son mayores que las medias del terreno 1 paratres de las cuatro categorías de tratamiento. Puesto que los segmentos lineales del te-rreno 2 parecen ser aproximadamente paralelos a los segmentos lineales correspon-dientes del terreno 1, aparentemente los pesos por terreno se comportan de la mismaforma para las distintas categorías del tratamiento, de manera que no hay un efecto deinteracción. En general, si una gráfica como la de la figura 12-3 da por resultado seg-mentos lineales que son aproximadamente paralelos, entonces tenemos evidencia deque no hay una interacción entre las variables de renglón y de columna. Si los seg-mentos lineales del terreno 2 no fueran paralelos a los segmentos lineales del terreno 1,tendríamos evidencia de una interacción entre el terreno y el tratamiento. Estas obser-vaciones basadas en la tabla 12-5 y en la figura 12-3 son muy subjetivas, por lo queprocederemos con el método más objetivo del análisis de varianza de dos factores.

Ninguno

Terreno 2

Terreno 1

Fertilizante Fertilizantey

riego

Riego

Pes

o (e

n kg

)

Tratamiento

1.5

1.0

0.5

0

Figura 12-3 Gráfica de interacción de medias (en kg) de las celdas de la tabla 12-4

Encuestas y psicólogos

Los resultados de las encuestas

se pueden ver muy afectados

por la redacción de las pregun-

tas. Las personas interpretan de

forma diferente una frase como

“durante los últimos años”.

Durante los últimos años (en

realidad desde 1980), los inves-

tigadores de encuestas y los

psicólogos han trabajado en

conjunto para mejorar las en-

cuestas disminuyendo el sesgo

e incrementando la exactitud.

En un caso, los psicólogos estu-

diaron el hallazgo de que del 10

al 15 por ciento de los encues-

tados afirmaron haber votado

en la última elección, cuando en

realidad no lo hicieron. Experi-

mentaron con teorías de proble-

mas de memoria, el deseo de

ser considerado responsable y

la tendencia que manifiestan

quienes generalmente votan de

decir que votaron en la elección

más reciente, aun cuando no lo

hayan hecho. Se encontró que

sólo esta última explicación

formaba parte del problema.

Tabla 12-5 Medias (en kg) de las celdas de la tabla 12-4

Tratamiento

FertilizanteNinguno Fertilizante Riego y riego

Terreno 1 0.184 0.332 0.164 1.334(fértil, húmedo)

Terreno 2 0.458 0.630 0.278 1.308(arenoso, seco)

12-3 ANOVA de dos factores 657

Cuando aplicamos el ANOVA de dos factores para los datos de la tabla 12-4,consideramos tres posibles efectos sobre el peso de los álamos: 1. los efectos deuna interacción entre el terreno y el tratamiento; 2. los efectos del terreno; 3. losefectos del tratamiento. Los cálculos son bastante complicados, de manera quesupondremos que se utilizó un programa de cómputo o una calculadora TI-83>84Plus. (Al final de esta sección se describen los procedimientos para el uso de he-rramientas tecnológicas). A continuación se presentan los resultados de Minitabpara los datos de la tabla 12-4.

Minitab

Ahora presentaremos los requisitos y el procedimiento básico para el análisisde varianza (ANOVA) de dos factores. El procedimiento también se resume en lafigura 12-3.

Requisitos

1. Para cada celda, los valores muestrales provienen de una población con unadistribución que es aproximadamente normal.

2. Las poblaciones tienen la misma varianza s2 (o desviación estándar s).3. Las muestras son aleatorias simples. (Es decir, las muestras del mismo tamaño

tienen la misma probabilidad de ser seleccionadas).4. Las muestras son independientes entre sí. (Las muestras no están apareadas o

asociadas de ninguna manera).5. Los valores muestrales se categorizan en dos factores. (Ésta es la base del

nombre del método: análisis de varianza de dos factores).6. Todas las celdas tienen el mismo número de valores muestrales. (Este diseño

se conoce como diseño balanceado).

Procedimiento del ANOVA de dos factores (véase la figura 12-4)

Paso 1: Efecto de interacción: En el análisis de varianza de dos factores, inicieprobando la hipótesis nula de que no existe interacción entre los dos fac-tores. Si utilizamos Minitab para los datos de la tabla 12-4, obtenemos elsiguiente estadístico de prueba:

Interpretación: El valor P correspondiente aparece en los resultados deMinitab como 0.915, por lo que no rechazamos la hipótesis nula de ningu-na interacción entre los dos factores. No parece que los pesos de los álamosestén afectados por una interacción entre el terreno y el tratamiento.

Paso 2: Efectos renglón>columna: Si rechazamos la hipótesis nula de ninguna in-teracción entre factores, entonces tenemos que detenernos aquí; no debe-mos proceder con las dos pruebas adicionales. (Si existe una interacción

F 5CMsde la interacciónd

CMsdel errord5

0.05721

0.335215 0.17

658 Capítulo 12 Análisis de varianza

entre los factores, no debemos considerar los efectos de alguno de losfactores sin considerar los del otro).

Si no rechazamos la hipótesis nula de ninguna interacción entre losfactores, entonces debemos proceder a probar las siguientes dos hipótesis:

H0: No existen efectos del factor de renglón (es decir, las mediasde renglón son iguales).

H0: No existen efectos del factor de columna (es decir, las mediasde columna son iguales).

En el paso 1 no rechazamos la hipótesis nula de ninguna interacción en-tre los factores, por lo que procedemos con las siguientes dos pruebas dehipótesis identificadas en el paso 2.

Para el factor de renglón del terreno obtenemos

F 5CMsdel terrenodCMsdel errord

50.27225

0.335215 0.81

Pruebe una interacción entre los dos factores. Utilice

F �CM(de la interacción)

CM(del error)

¿Existe un efecto debido

a la interacción entre los dos factores?

F �CM(del factor de renglón)

CM(del error)

Pruebe el efecto del factor de renglón utilizando

F �CM(del factor de columna)

CM(del error)

Pruebe el efecto del factor de columna utilizando

Deténgase. No considere los efectos de algún factor sin considerar los efectos del otro.

Inicio

No(No rechace H0 de ningún efecto de interacción)

(Rechace H0 de ningún efecto de interacción)

Figura 12-4

Procedimiento del ANOVA dedos factores

12-3 ANOVA de dos factores 659

Interpretación: Este valor no es significativo, ya que el valor P co-rrespondiente aparece en los resultados de Minitab como 0.374. Norechazamos la hipótesis nula de que no existen efectos por el terreno. Esdecir, el terreno no parece tener un efecto sobre el peso de los álamos.

Para el factor de columna del tratamiento obtenemos

Interpretación: Este valor es significativo, ya que el valor P correspondien-te se indica como 0.001. Por lo tanto, rechazamos la hipótesis nula de nin-gún efecto del tratamiento. Parece que el tratamiento tiene un efecto sobreel peso de los álamos. Con base en los datos muestrales de la tabla 12-4,concluimos que los diferentes tratamientos parecen tener pesos mediosdiferentes, aunque al parecer los pesos tienen medias iguales en ambos te-rrenos. (Vea la figura 12-3 y observe que los segmentos lineales cambiandrásticamente en las diferentes categorías de tratamiento, pero los segmen-tos lineales del terreno 1 y del terreno 2 no son muy diferentes entre sí).

Caso especial: Una observación por celda y ninguna interacción Latabla 12-4 contiene 5 observaciones por celda. Si nuestros datos muestrales con-sisten únicamente en una observación por celda, perdemos CM(de la interacción),SC(de la interacción) y gl(de la interacción), ya que estos valores están basados envarianzas muestrales calculadas para cada celda individual. Si existe sólo una ob-servación por celda, no hay variación dentro de las celdas individuales y esas va-rianzas muestrales no pueden ser calculadas. Cuando tenemos una observaciónpor celda procedemos de la siguiente manera: si parece razonable suponer (conbase en el conocimiento de las circunstancias) que no existe interacción entre losdos factores, haga dicha suposición y después proceda como antes a probar lassiguientes dos hipótesis por separado:

H0: No existen efectos del factor de renglón.

H0: No existen efectos del factor de columna.

Como ejemplo, suponga que tenemos únicamente el primer valor de cada celdade la tabla 12-4, lo que produce los datos de la tabla 12-6. En la tabla 12-6, las dosmedias por renglón son 0.9375 y 0.6575. ¿Es esta diferencia significativa, lo quesugiere que existe un efecto debido al terreno? En la tabla 12-6, las cuatro mediasde columna son 0.3750, 1.2500, 0.4400 y 1.1250. ¿Son significativas estas diferen-cias, lo que sugiere que existe un efecto debido al tratamiento? Suponiendo que lospesos no se ven afectados por alguna interacción entre el terreno y el tratamiento,

F 5CMsdel tratamientod

CMsdel errord5

2.51567

0.335215 7.50

Tabla 12-6 Pesos (en kg) de álamos en el año 1

Tratamiento

FertilizanteNinguno Fertilizante Riego y riego

Terreno 1 0.15 1.34 0.23 2.03(fértil, húmedo)

Terreno 2 0.60 1.16 0.65 0.22(arenoso, seco)

660 Capítulo 12 Análisis de varianza

a continuación se presentan los resultados de Minitab. (Si creemos que existe unainteracción, el método descrito aquí no se aplica).

Minitab

Factor de renglón: Primero empleamos los resultados de la pantalla de Minitabpara probar la hipótesis nula de ningún efecto del factor de renglón del terreno.

Este estadístico de prueba no es significativo, debido a que el valor P correspon-diente en la pantalla de Minitab es 0.634. No rechazamos la hipótesis nula; pareceque los pesos de los álamos no se ven afectados por el terreno.

Factor de columna: Ahora utilizamos la pantalla de Minitab para probar lahipótesis nula de ningún efecto del factor de columna de la categoría de tratamiento.El estadístico de prueba es

Este estadístico de prueba no es significativo, ya que el valor P correspondien-te en la pantalla de Minitab es 0.598. No rechazamos la hipótesis nula, de maneraque parece que el peso del álamo no se ve afectado por el tratamiento. Utilizandolos datos de la tabla 12-6, concluimos que los pesos de los álamos no parecen verseafectados por el terreno ni por el tratamiento, pero cuando utilizamos 5 valores encada celda (tabla 12-4), concluimos que los pesos parecen verse afectados por eltratamiento. Éste es el poder de las muestras grandes.

En esta sección explicamos brevemente una rama importante de la estadística.Pusimos énfasis en la interpretación de resultados de computadora y omitimos loscálculos y fórmulas manuales, que son bastante engorrosos.

12-3 DESTREZAS Y CONCEPTOS BÁSICOSConocimientos estadísticos y pensamiento crítico

1. ANOVA de dos factores. ¿Qué es el análisis de varianza de dos factores y para quése utiliza?

2. Interacción. ¿Qué es una interacción y qué papel desempeña en el análisis de varianzade dos factores?

3. Interacción. Cuando se realiza un análisis de varianza de dos factores, si hay unainteracción entre los dos factores, ¿por qué no debemos continuar con pruebas sepa-radas para los efectos de los factores de renglón y de columna?

F 5CMsde la edaddCMsdel errord

50.412217

0.5623005 0.73

F 5CMsdel terrenodCMsdel errord

50.156800

0.5623005 0.28

12-3 ANOVA de dos factores 661

4. Interacción. A continuación aparece una gráfica de interacción generada con Mini-tab, similar en naturaleza a la figura 12-3. [Como en la figura 12-3, esta gráfica de in-teracción se basa en pesos de árboles, y los factores son el terreno (terreno 1 y terreno2) y los tratamientos (ninguno, fertilizante, riego, fertilizante y riego)]. ¿Qué sugiereesta gráfica acerca de la interacción entre los dos factores?

Minitab

Uso de la tecnologíaSTATDISK Haga clic en Analysis y

seleccione Two-Way Analysis of Variance.Complete lo que se le pide en la ventana yluego haga clic en Continue. Proceda a in-gresar o copiar los datos en la columna “Va-lues” y luego haga clic en Evaluate.

MINITAB Primero ingrese todos losvalores muestrales en la columna C1. Regis-tre los números por renglón correspondien-tes en la columna C2. Ingrese los números decolumna correspondientes en la columna C3.Seleccione Stat de la barra del menú prin-cipal, después ANOVA y luego Two-Way.En el cuadro de diálogo ingrese C1 paraResponse, C2 para Row Factor y C3 Para Co-lumn Factor. Haga clic en OK. Sugeren-cia: Evite confusiones y ponga rótulos a lascolumnas C1, C2 y C3 con nombres quetengan algún significado.

EXCEL Para tablas de dos factores conmás de un dato por celda: los datos de lamisma celda deben listarse en una columna,no en un renglón. Ingrese los rótulos corres-pondientes al conjunto de datos en la columnaA y el renglón 1, como en este ejemplo, quecorresponde a la tabla 12-4:

A B C D E

1 Ninguno Fert Riego FertyRiego

2 Terreno 1 0.15 1.34 0.23 2.03

3 Terreno 1 0.02 0.14 0.04 0.27

A A A A A

Después de ingresar los datos muestrales ylos rótulos, seleccione Tools de la barra delmenú principal, luego Data Analysis y des-pués Anova: Two-Factor With Replication.En el cuadro de diálogo ingrese el rango deentrada. Para los datos de la tabla 12-4, ingre-se A1:E11. Para “rows per sample”, introduz-ca el número de valores en cada celda; ingrese5 para los datos de la tabla 12-4. Haga clicen OK.

Para tablas de dos factores con exactamenteun dato por celda, no se requieren los rótulos.Ingrese los datos muestrales como aparecenen la tabla. Seleccione Tools, luego DataAnalysis, después Anova: Two-Factor Wit-hout Replication. En el cuadro de diálogo,introduzca el rango de entrada únicamente delos valores muestrales; no incluya rótulos enel rango de entrada. Haga clic en OK.

TI-83>84 PLUS El programa A1A-NOVA de la calculadora TI-83>84 Plus puededescargarse del CD-ROM incluido con estelibro. Seleccione el archivo del software. Elprograma debe descargarse a la calculadora;luego, los datos muestrales deben ingresarsecomo una matriz D con tres columnas. Pre-sione 2nd y la tecla x�1. Muévase a la dere-cha hasta EDIT, muévase hacia abajo hasta[D], luego presione ENTER y proceda a in-gresar el número total de valores de datos,seguido por 3 (para las tres columnas). Laprimera columna de D lista todos los datosmuestrales, la segunda columna lista el nú-mero de renglón correspondiente y la terceracolumna lista el número de columna corres-pondiente. Después de ingresar todos los da-tos, los números de renglón y los números decolumna en la matriz D, presione PRGM, se-leccione A1ANOVA y presione ENTER dosveces; luego elija RAN BLOCK DESI (paradiseño de bloque aleatorio) y presione EN-TER dos veces. Seleccione CONTINUE ypresione ENTER. En un momento aparecenlos resultados. F(A) es el estadístico de prue-ba F para el factor de renglón, el cual seráseguido por el valor P correspondiente. F(B)es el estadístico de prueba F para el factor decolumna, el cual será seguido por el valor Pcorrespondiente. (Es necesario presionar EN-TER para poder ver el resto de los resulta-dos). F(AB) es el estadístico de prueba F parael efecto de interacción, y va seguido por elvalor P correspondiente.

662 Capítulo 12 Análisis de varianza

Interpretación de la pantalla de resultados de una computadora: pesos de álamos. Los ejer-cicios 5 a 7 requieren de la siguiente pantalla de Minitab, que resulta de los pesos de álamosdel segundo año que están listados en el conjunto de datos 7 del apéndice B. (La tabla 12-4de esta sección incluye los pesos del primer año, pero la siguiente pantalla de Minitab sebasa en los pesos del segundo año. El factor de renglón es el terreno (terreno 1 y terreno2) y el factor de columna es el tratamiento (ninguno, fertilizante, riego, fertilizante y riego).

Minitab

5. Efecto de interacción. Remítase a la pantalla de Minitab y ponga a prueba la hipótesisnula de que los pesos de los álamos no se ven afectados por una interacción entre elterreno y el tratamiento. ¿Qué concluye?

6. Efecto del terreno. Remítase a la pantalla de Minitab y suponga que los pesos de losálamos no se ven afectados por una interacción entre el terreno y el tratamiento.¿Existe evidencia suficiente para sustentar la aseveración de que el terreno tiene unefecto sobre el peso?

7. Efecto del tratamiento. Remítase a la pantalla de Minitab y suponga que los pesosde los álamos no se ven afectados por una interacción entre el terreno y el tratamiento.¿Existe evidencia suficiente para sustentar la aseveración de que el tratamiento tieneun efecto sobre el peso?

Interpretación de una pantalla de resultados de computadora. En los ejercicios 8 a 10, uti-lice los resultados de Minitab obtenidos a partir de las puntuaciones listadas en la siguientetabla. Los datos muestrales son calificaciones de la prueba SAT de las secciones verbal y dematemáticas (SAT-I) basadas en estadísticos reportados por el Consejo Universitario.

Verbal

Mujer 646 539 348 623 478 429 298 782 626 533Hombre 562 525 512 576 570 480 571 555 519 596

Matemáticas

Mujer 484 489 436 396 545 504 574 352 365 350Hombre 547 678 464 651 645 673 624 624 328 548

Minitab

8. Efecto de interacción. Pruebe la hipótesis nula de que las calificaciones de la pruebaSAT no se ven afectadas por una interacción entre el género y la prueba (verbal>dematemáticas). ¿Qué concluye?

12-3 ANOVA de dos factores 663

9. Efecto del género. Suponga que las calificaciones de la prueba SAT no se ven afec-tadas por una interacción entre el género y el tipo de prueba (verbal>de matemáticas).¿Existe suficiente evidencia para sustentar la aseveración de que el género tiene unefecto sobre las calificaciones de la prueba SAT?

10. Efecto del tipo de prueba del SAT. Suponga que las calificaciones de la prueba SATno se ven afectadas por una interacción entre el género y el tipo de prueba (verbal>dematemáticas). ¿Existe evidencia suficiente para sustentar la aseveración de que el tipode prueba (verbal>de matemáticas) tiene un efecto sobre las calificaciones del SAT?

Interpretación de una pantalla de resultados de computadora: una observación porcelda. En los ejercicios 11 y 12, remítase a la pantalla de resultados de Minitab. Estapantalla resulta de un estudio en el que se aplicó una prueba de audición a 24 sujetos,empleando cuatro listas diferentes de palabras. Los 24 sujetos tenían una audiciónnormal y las pruebas se llevaron a cabo sin sonido de fondo. El principal objetivo fuedeterminar si las cuatro listas eran igualmente difíciles de comprender. En la tablaoriginal de las puntuaciones de la prueba de audición, cada celda tiene un dato. Losdatos originales provienen del informe “A Study of the Interlist Equivalency of the CIDW-22 Word List Presented in Quiet and in Noise”, de Faith Loven, Universidad de Iowa.Los datos originales están disponibles en DASL (Data and Story Library) de Internet.

Edad

Menor de 20 20–40 Mayor de 40

Hombre 96 64 68 60 64 88 72 64 68 72 60 88Mujer 76 64 76 68 72 88 72 68 60 68 72 64

14. Tiempos de maratón. A continuación se presentan los tiempos (en segundos) de re-corrido de la maratón de Nueva York, para corredores elegidos al azar que completa-ron la prueba. ¿Los tiempos de recorrido se ven afectados por una interacción entre el

Minitab

11. Pruebas de audición: efecto de sujetos. Suponiendo que no existe un efecto sobrelas puntuaciones de las pruebas de audición como resultado de una interacción entre elsujeto y las listas, ¿existe evidencia suficiente para sustentar la aseveración de que laselección del sujeto tiene un efecto en la puntuación de las pruebas de audición? In-terprete el resultado explicando por qué tiene un sentido práctico.

12. Pruebas de audición: efecto de la lista de palabras. Suponiendo que no existeun efecto sobre las puntuaciones de las pruebas de audición como resultado de unainteracción entre el sujeto y las listas, ¿existe evidencia suficiente para sustentar laaseveración de que la selección de la lista de palabras tiene un efecto en la puntuaciónde las pruebas de audición?

En los ejercicios 13 y 14 utilice un programa de cómputo o una calculadora TI-83>84Plus para obtener los resultados del análisis de varianza de dos factores.

13. Pulsos. La siguiente tabla lista pulsos del conjunto de datos 1 del apéndice B. ¿Seven afectados los pulsos por una interacción entre el género y la edad? ¿Se ven afecta-dos los pulsos por el género? ¿Se ven afectados los pulsos por la edad?

664 Capítulo 12 Análisis de varianza

género y el grupo de edad? ¿Los tiempos de recorrido se ven afectados por el género?¿Los tiempos de recorrido se ven afectados por el grupo de edad?

Tiempos (en segundos) de corredores de la maratón de Nueva York

Edad

21–29 30–39 40 y mayores

Hombres 13,615 14,677 14,52818,784 16,090 17,03414,256 14,086 14,93510,905 16,461 14,99612,077 20,808 22,146

Mujeres 16,401 15,357 17,26014,216 16,771 25,39915,402 15,036 18,64715,326 16,297 15,07712,047 17,636 25,898

12-3 MÁS ALLÁ DE LO BÁSICO15. Transformaciones de datos. Suponga que se utiliza un ANOVA de dos factores para

analizar datos muestrales consistentes en más de un dato por celda. ¿De qué manerase ven afectados los resultados del ANOVA en cada uno de los siguientes casos?a. Se añade la misma constante a cada valor muestral.b. Cada valor muestral se multiplica por la misma constante distinta de cero.c. Se traspone el formato de la tabla, de manera que se intercambien los factores de

renglón y de columna.d. Se cambia el primer valor muestral de la primera celda, de manera que se convierte

en un valor extremo.

Repaso

En la sección 9-3 presentamos un procedimiento para probar la igualdad entre dos mediaspoblacionales, pero en la sección 12-2 utilizamos el análisis de varianza de un factor paraprobar la igualdad de tres o más medias poblacionales. Este método requiere: 1. poblacionesdistribuidas normalmente, 2. poblaciones con la misma desviación estándar (o varianza), y3. muestras aleatorias simples que sean independientes entre sí. Los métodos del análisis devarianza de un factor se utilizan cuando tenemos tres o más muestras obtenidas de poblacio-nes que están caracterizadas de acuerdo con un solo factor. Las siguientes son característicasclave del análisis de varianza de un factor:

● El estadístico de prueba F está basado en la razón de dos estimados diferentes de lavarianza poblacional común s2, como se indica a continuación:

● Los valores críticos de F se pueden encontrar en la tabla A-5, pero nos enfocamosen la interpretación de los valores P que están incluidos como parte de un resultadopor computadora.

En la sección 12-3 consideramos el análisis de varianza de dos factores, con los datoscategorizados de acuerdo con dos factores diferentes. Un factor se utiliza para ordenar losdatos muestrales en renglones diferentes, mientras que el otro factor se emplea para columnasdistintas. El procedimiento del análisis de varianza de dos factores está resumido la figura12-4 y requiere que primero probemos si existe una interacción entre los dos factores. Si no

F 5varianza entre muestras

varianza dentro de muestras5

CMsdel tratamientodCMsdel errord

Ejercicios de repaso 665

existe una interacción significativa, entonces procedemos a elaborar pruebas individualesde los efectos de cada uno de los dos factores. También consideramos el análisis de varian-za de dos factores para el caso especial en el que sólo existe una observación por celda.

Dada la naturaleza compleja de los cálculos requeridos a lo largo de este capítulo, en-fatizamos la interpretación de resultados por computadora.

Conocimientos estadísticos y pensamiento crítico

1. Análisis de varianza. ¿Por qué se le llama análisis de “varianza” al método empleadopara probar la igualdad de tres o más medias poblacionales, cuando las medias son losparámetros de interés?

2. ¿Cuál prueba? Un investigador médico realiza una prueba clínica de un fármacocreado para reducir el colesterol LDL. Se administraron 10 mg del fármaco a 50 suje-tos, a otros 50 sujetos se les administraron 20 mg y a otros 50 se les administró unplacebo. ¿Cuál método se debe utilizar para probar la igualdad de las tres cantidadesmedias de disminución del colesterol?

3. ¿Cuál prueba? Suponga que la prueba clínica del ejercicio 2 se modifica para ex-cluir el tratamiento con 20 mg del fármaco. ¿Qué método debe usarse para probar laigualdad de las cantidades medias de disminución del colesterol en el grupo placebo yen el grupo de tratamiento con 10 mg?

4. ANOVA de dos factores. Un genetista reúne datos que consisten en el color de ojos;los colores se categorizan de acuerdo con el género (hombre, mujer) y el grupo deedad (menor de 30, 30 y mayor). ¿Se pueden emplear los métodos de este capítulo paraprobar los efectos del género y del grupo de edad sobre el color de ojos? ¿Por qué?

Ejercicios de repaso

1. Interpretación de una pantalla de resultados de computadora: beber y conducir.El Associated Insurance Institute financia estudios sobre los efectos de la bebida alconducir. En uno de estos estudios, se seleccionaron al azar tres grupos de hombresadultos para un experimento que pretendía medir los niveles de alcohol en la sangre,después de haber consumido cinco bebidas. Los miembros del grupo A se probaron des-pués de una hora, los miembros del grupo B se probaron después de dos horas, y losmiembros del grupo C se probaron después de cuatro horas. Los resultados se presentanen la tabla adjunta; también se incluyen los resultados de Minitab para estos datos.Con un nivel de significancia de 0.05, pruebe la aseveración de que los tres grupostienen el mismo nivel medio.

A B C

0.11 0.08 0.040.10 0.09 0.040.09 0.07 0.050.09 0.07 0.050.10 0.06 0.06

0.040.05

Minitab

666 Capítulo 12 Análisis de varianza

2. Puntuaciones de facilidad de lectura. A continuación se muestran puntuaciones enla escala de Flesch sobre la facilidad de lectura de 12 páginas seleccionadas al azarde: El oso y el dragón, de Tom Clancy; Harry Potter y la piedra filosofal, de J. K.Rowling; y La guerra y la paz, de León Tolstoi. Utilice un nivel de significancia de0.05 para probar la aseveración de que los tres libros tienen la misma puntuación mediade facilidad de lectura de Flesch. Con base en los resultados, ¿parece que los tres librostienen el mismo nivel de lectura?

Clancy: 58.2 73.4 73.1 64.4 72.7 89.2 43.9 76.3 76.4 78.9 69.4 72.9

Rowling: 85.3 84.3 79.5 82.5 80.2 84.6 79.2 70.9 78.6 86.2 74.0 83.7

Tolstoi: 69.4 64.2 71.4 71.6 68.5 51.9 72.2 74.4 52.8 58.4 65.4 73.6

Interpretación de una pantalla de resultados de computadora. En los ejercicios 3 a 5,utilice la pantalla de resultados de Minitab que proviene de los valores listados en la tablaadjunta. Los datos muestrales son estimados de los estudiantes (en pies) de la longitud de su salón de clases. La longitud real del salón de clases es de 24 pies, 7.5 pulgadas.

Área de estudios

Matemáticas Negocios Artes liberales

Mujer 28 25 30 35 25 20 40 21 30Hombre 25 30 20 30 24 25 25 20 32

Minitab

3. Efecto de interacción. Pruebe la hipótesis nula de que las longitudes estimadas no seven afectadas por una interacción entre el género y el área de estudios.

4. Efecto del género. Suponga que las longitudes estimadas no se ven afectadas poruna interacción entre el género y el área de estudios. ¿Existe evidencia suficiente parasustentar la aseveración de que la longitud estimada se ve afectada por el género?

5. Efecto del área de estudios. Suponga que las longitudes estimadas no se ven afectadaspor una interacción entre el género y el área de estudios. ¿Existe evidencia suficientepara sustentar la aseveración de que la longitud estimada se ve afectada por el áreade estudios?

6. Tabaquismo, temperatura corporal y género. La tabla adjunta lista temperaturasobtenidas de sujetos elegidos al azar (según el conjunto de datos 2 del apéndice B).Las temperaturas están clasificadas de acuerdo con el género y el hábito del tabaquismo.Utilice un nivel de significancia de 0.05 para probar una interacción entre el género yel hábito del tabaquismo, para probar un efecto del género y para probar un efecto delhábito del tabaquismo. ¿Qué concluye?

Fuma No fuma

Hombre 98.4 98.4 99.4 98.6 98.0 98.0 98.8 97.0Mujer 98.8 98.0 98.7 98.4 97.7 98.0 98.2 99.1

7. Contaminación de automóviles. La tabla adjunta lista las cantidades de gases deinvernadero emitidos por diferentes automóviles en un año.

Ejercicios de repaso 667

a. Suponiendo que no existe un efecto de interacción, ¿existe evidencia suficiente parasustentar la aseveración de que las cantidades de gases de invernadero emitidas seven afectadas por el tipo de transmisión (automática>manual)?

b. Suponiendo que no existe un efecto de interacción, ¿existe evidencia suficiente parasustentar la aseveración de que las cantidades de gases de invernadero emitidas seven afectadas por el número de cilindros?

c. Con base en los resultados de los incisos a) y b), ¿podemos concluir que la emisiónde gases de invernadero no se ve afectada por el tipo de transmisión o el número decilindros? ¿Por qué?

Emisión de gases de invernadero (toneladas>>año)

4 cilindros 6 cilindros 8 cilindros

Automática 10 12 14Manual 10 12 12

8. Longevidad. Consulte la siguiente tabla que lista el número de años (desde 1690)que los presidentes estadounidenses, los papas y los monarcas británicos vivierondespués de que asumieron su respectivo cargo. Determine si los tiempos de supervi-vencia de los tres grupos difieren. (Tabla basada en datos de Computer-InteractiveData Analysis, de Lunn y McNeil, John Wiley & Sons).

Presidentes Papas Reyes y reinas

Washington 10 Alejandro VIII 2 Jaime II 17

J. Adams 29 Inocencio XII 9 María II 6

Jefferson 26 Clemente XI 21 Guillermo III 13

Madison 28 Inocencio XIII 3 Ana 12

Monroe 15 Benedicto XIII 6 Jorge I 13

J. Q. Adams 23 Clemente XII 10 Jorge II 33

Jackson 17 Benedicto XIV 18 Jorge III 59

Van Buren 25 Clemente XIII 11 Jorge IV 10

Harrison 0 Clemente XIV 6 Guillermo IV 7

Tyler 20 Pío VI 25 Victoria 63

Polk 4 Pío VII 23 Eduardo VII 9

Taylor 1 León XII 6 Jorge V 25

Fillmore 24 Pío VIII 2 Eduardo VIII 36

Pierce 16 Gregorio XVI 15 Jorge VI 15

Buchanan 12 Pío IX 32

Lincoln 4 León XIII 25

A. Johnson 10 Pío X 11

Grant 17 Benedicto XV 8

Hayes 16 Pío XI 17

Garfield 0 Pío XII 19

Arthur 7 Juan XXIII 5continúa

668 Capítulo 12 Análisis de varianza

Presidentes Papas Reyes y reinas

Cleveland 24 Paulo VI 15

Harrison 12 Juan Pablo I 0

McKinley 4 Juan Pablo II 26

T. Roosevelt 18

Taft 21

Wilson 11

Harding 2

Coolidge 9

Hoover 36

F. Roosevelt 12

Truman 28

Kennedy 3

Eisenhower 16

L. Johnson 9

Nixon 25

Reagan 23

Ejercicios de repaso acumulativo

1. Longevidad. Remítase al número de años que los presidentes estadounidenses, lospapas y los monarcas británicos vivieron después de asumir el cargo. Los datos sepresentan en la tabla del ejercicio de repaso 8.a. Calcule la media para cada uno de los tres grupos.b. Calcule la desviación estándar para cada uno de los tres grupos.c. Pruebe la aseveración de que existe una diferencia entre la media de los presidentes

y la media de los monarcas británicos.d. Considere la longevidad de los presidentes y determine si los datos parecen prove-

nir de una población con una distribución normal. Explique por qué la distribuciónparece o no ser normal.

e. Considere la longevidad de los presidentes y construya un estimado de un intervalode confianza del 95% para la media poblacional.

2. Tratamiento M&M. La tabla que se presenta a continuación incluye 60 califica-ciones del SAT, separadas en categorías de acuerdo con el color de los dulces M&Mutilizados como tratamiento. Las calificaciones del SAT están basadas en datos delConsejo Universitario, y el elemento del color de los dulces M&M está basado enun capricho del autor.a. Calcule la media de las 20 calificaciones del SAT en cada una de las tres categorías.

Al parecer, ¿las tres medias son aproximadamente iguales?b. Calcule la mediana de las 20 calificaciones del SAT en cada una de las tres categorías.

Al parecer, ¿las tres medianas son aproximadamente iguales?c. Calcule la desviación estándar de las 20 calificaciones del SAT en cada una de las

tres categorías. Al parecer, ¿las tres desviaciones estándar son aproximadamenteiguales?

d. Pruebe la hipótesis nula de que no existe una diferencia entre la calificación mediadel SAT de los sujetos tratados con dulces M&M rojos y la calificación media delSAT de sujetos tratados con dulces M&M verdes.

Actividades de cooperación en equipo 669

e. Construya un estimado del intervalo de confianza del 95% para la puntuaciónmedia del SAT de la población de sujetos que recibieron el tratamiento de dulcesM&M rojos.

f. Pruebe la hipótesis nula de que las tres poblaciones (tratamientos con dulcesM&M rojos, verdes y azules) tienen la misma calificación media en el SAT.

Rojo 1130 621 813 996 1030 1257 898 743 921 1179

1092 855 896 858 1095 1133 896 1190 908 699

Verde 996 630 583 828 1121 993 1025 907 1111 1147

780 916 793 1188 499 1180 1229 1450 1071 1153

Azul 706 1068 1013 892 1370 1590 939 1004 821 915

866 848 1408 793 1097 1244 996 1131 1039 1159

3. Genes azules. Algunas parejas tienen características genéticas que causan que unacuarta parte de sus descendientes tengan ojos azules. Se realiza un estudio con 100parejas que se cree tienen esas características, y los resultados revelan que 19 de sus100 descendientes tienen ojos azules. Suponiendo que una cuarta parte de todos losdescendientes tienen ojos azules, estime la probabilidad de que, de 100 descendientes,19 o menos tengan ojos azules. Con base en esa probabilidad, ¿parece que la proporciónde una cuarta parte es incorrecta? ¿Por qué?

4. Pesos de bebés: cálculo de probabilidades. En Estados Unidos los pesos de los reciénnacidos se distribuyen de manera normal, con una media de 7.54 lb y una desviaciónestándar de 1.09 lb (según datos de “Birth Weight and Prenatal Mortality”, de Wilcox,Skjaerven, Buekens y Kiely, Journal of the American Medical Association, vol. 273,núm. 9).a. Si se selecciona al azar a un bebé recién nacido, ¿cuál es la probabilidad de que

pese más de 8.0 lb?b. Si se seleccionan al azar 16 bebés recién nacidos, ¿cuál es la probabilidad de que

su peso medio sea mayor de 8.0 lb?c. ¿Cuál es la probabilidad de que cada uno de los siguientes tres bebés nazca con un

peso mayor de 7.54 lb?

Actividades de cooperación en equipo

1. Actividad fuera de clase El World Almanac and Bookof Facts incluye una sección llamada “Personalidadesnotables”, con apartados correspondientes a arquitectos,artistas, líderes de negocios, caricaturistas, científicossociales, líderes militares, filósofos, líderes políticos,científicos, escritores, compositores y animadores, entreotros. Diseñe y realice un estudio observacional queinicie con la selección de muestras de grupos selectos,seguida por una comparación de los tiempos de vidade personas de distintas categorías. ¿Algunos gruposen particular parecen tener tiempos de vida diferentes encomparación con los otros grupos? ¿Puede usted explicarestas diferencias?

2. Actividad en clase Comience pidiendo a cada estu-diante en la clase que estime la longitud del salón de

clases. Especifique que la longitud es la distancia entreel pizarrón y la pared opuesta. (Véase la sección deejercicios de repaso 3-5). En el mismo papel, cada estu-diante debe anotar también su género (hombre>mujer)y área de estudios. Después formen grupos de tres ocuatro miembros y utilicen los datos de toda la clasepara plantear estas preguntas:● ¿Existe una diferencia significativa entre el esti-

mado medio de los hombres y el estimado mediode las mujeres?

● ¿Existe evidencia suficiente para rechazar la igual-dad de los estimados medios en las diferentesáreas de estudio? Describa cómo se clasificaronlas áreas de estudio.

670 Capítulo 12 Análisis de varianza

● ¿La interacción entre el género y el área de estudiostiene algún efecto sobre la longitud estimada?

● ¿Parece que el género tiene un efecto sobre la longitudestimada?

● ¿Parece que el área de estudios tiene un efecto sobrela longitud estimada?

3. Actividad fuera de clase Formen grupos de tres o cuatroestudiantes. Cada grupo debe encuestar a otros estu-diantes de la misma universidad y pedirles que identifi-quen su área de estudios y género. También podría incluirotros factores, tales como el empleo (ninguno, de mediotiempo, de tiempo completo) y la edad (menos de 21,21-30, más de 30). Para cada sujeto encuestado, deter-mine la exactitud de la hora de su reloj de pulso. Primero

ponga su reloj a la hora correcta por medio de una fuenteexacta y confiable del tipo “Cuando escuche el tono, lahora es . . .”. Registre una hora positiva para los relojesque están adelantados. Registre una hora negativa paralos relojes que están atrasados. Utilice los datos mues-trales para plantear preguntas como éstas:● ¿Parece que el género tiene algún efecto sobre la

exactitud de los relojes de pulso?● ¿El área de estudios tiene algún efecto sobre la exac-

titud de los relojes de pulso?● ¿La interacción entre el género y el área de estudios

tiene algún efecto sobre la exactitud de los relojes depulso?

Proyecto tecnológico

Remítase a los datos muestrales de la tabla 12-4 (página655). Los resultados en la sección 12-3 mostraron que losdatos llevaron a la conclusión de que no hay interacciónentre el terreno y el tratamiento, que no hay un efecto delterreno, pero que sí existe un efecto del tratamiento. (Suge-rencia: Gráficas de interacción similares a las de la figura12-3 le serán útiles para lo siguiente).

a. Modifique los valores del terreno 1 y del cuarto tra-tamiento (fertilizante y riego), de manera que hayauna interacción entre el terreno y el tratamiento.

b. Modifique los valores del terreno 1 y del cuarto tra-tamiento (fertilizante y riego), de manera que no

haya una interacción entre el terreno y el tratamiento,que no haya un efecto del terreno y que no haya unefecto del tratamiento.

c. Trate de modificar los valores del terreno 1 y delcuarto tratamiento (fertilizante y riego), de maneraque no haya interacción, pero que sí haya un efectodel terreno y no haya un efecto del tratamiento. Sino se puede modificar esa celda para lograr los re-sultados deseados, modifique otras celdas según seanecesario.

De los datos a la decisión 671

De los datos a la decisión

Pensamiento crítico: ¿Debe ustedaprobar este fármaco?

Los fármacos deben ser sometidos a pruebasexhaustivas antes de ser aprobados para suuso general. Además de probar sus reaccio-nes adversas, también debe probarse su efi-cacia, y el análisis de este tipo de resultadosde pruebas suelen incluir métodos estadísti-cos. Considere la creación del Xynamine, unnuevo fármaco diseñado para disminuir lafrecuencia cardiaca. Para obtener resultadosmás consistentes, que no incluyan una varia-ble confusa del género, el fármaco se pruebaúnicamente en hombres. Abajo se incluyenlos pulsos de un grupo placebo, de un grupode hombres tratados con Xynamine en do-sis de 10 mg y de un grupo de hombres tra-tados con Xynamine en dosis de 20 mg. Eldirector del proyecto del fármaco realiza lainvestigación y encuentra que en hombresadultos el pulso se distribuye normalmente,con una media de alrededor de 70 latidospor minuto y una desviación estándar deaproximadamente 11 latidos por minuto. Elresumen de su informe afirma que el fármaco

es eficaz, con base en esta evidencia: el grupoplacebo tiene un pulso medio de 68.9, que seacerca al valor de 70 latidos por minuto delos hombres adultos en general, pero el gru-po tratado con dosis de 10 mg de Xynaminetiene una media más baja de 66.2, y el grupotratado con dosis de 20 mg de Xynamine tienela media más baja de 65.2.

Análisis de los resultadosAnalice los datos utilizando los métodosde este capítulo. Con base en los resultados,¿parece que existe evidencia suficiente parasustentar la aseveración de que el fármacoreduce la frecuencia cardiaca? ¿Existen al-gunos problemas graves en el diseño de esteexperimento? Dado que únicamente se in-cluyeron hombres en el experimento, ¿losresultados también son aplicables a las mu-jeres? El director del proyecto comparó lospulsos postratamiento con el pulso mediode hombres adultos. ¿Existe alguna formamejor de medir la eficacia del fármaco paradisminuir el pulso? ¿Cómo calificaría la va-lidez general del experimento? Con base enlos resultados disponibles, ¿debe aprobarseel fármaco? Escriba un breve reporte queresuma sus hallazgos.

Grupo de Grupo deGrupo tratamiento tratamiento

placebo con 10 mg con 20 mg

77 67 72

61 48 94

66 79 57

63 67 63

81 57 69

75 71 59

66 66 64

79 85 82

66 75 34

75 77 76

48 57 59

70 45 53

672 Capítulo 12 Análisis de varianza

Proyecto de Internet

Análisis de varianza

Visite el sitio de Internet de este libro en

http://www.pearsoneducacion.net/triola

Siga el vínculo del Proyecto de Internet de este

capítulo. El proyecto incluye antecedentes para

experimentos en áreas tan variadas como el de-

sempeño atlético, la etiquetación de productos

de consumo y la biología del cuerpo humano.

En cada caso, los datos asociados se podrán

agrupar de forma ideal para la aplicación de

las técnicas este capítulo. Usted Fórmulará las

hipótesis apropiadas, después realizará y resu-

mirá pruebas ANOVA.

La estadística en el trabajo 673

“Si no tuviera conocimientos

de estadística, no sería

capaz de comprender

plenamente los datos que

genera mi empresa . . .

ni de ayudar a proteger

a nuestros empleados

y clientes”.

Jeffrey Foy

Jeffrey Foy es toxicólogo y trabajapara la Cabot Corportion, unaempresa de productos químicos.

Jeffrey Foy también es responsa-

ble de evaluar los peligros de las

sustancias químicas que produce

la Cabot Corporation. Su trabajo

consiste en entender de qué ma-

nera los productos de la empresa

pueden afectar a los seres huma-

nos o al ambiente, y en tomar

decisiones sobre las mejores

formas de proteger ambos.

La estadística en el trabajo¿Qué hace usted en su trabajo?

Mis responsabilidades incluyen la orga-nización y evaluación de estudios toxico-lógicos, elaborar hojas de cálculo sobrela seguridad de los materiales y ayudara nuestros grupos de investigación y de-sarrollo a producir materiales que seanseguros tanto para las personas comopara el ambiente y a comprender quédaños potenciales pueden producir esosmateriales.

¿Qué conceptos de estadística utiliza?

El principal concepto que utilizo es laprueba de hipótesis (pruebas de proba-bilidad).

¿Cómo utiliza la estadística en eltrabajo?

Utilizo la estadística todos los días. Losmétodos estadísticos se han utilizado yse siguen utilizando de dos formas enmi trabajo. En primer lugar, la estadísti-ca se utiliza para determinar la formaen que diseño mis experimentos. En se-gundo lugar, la estadística se usa paradeterminar si los datos generados sonsignificativos o para saber si son lo sufi-cientemente buenos para utilizarlos.

Los estudios en que participo pue-den costar desde $1000 hasta $500,000o más, y si no determino de maneraapropiada la forma en que voy a evaluarlos datos, esto podría costar a la empresauna gran cantidad de tiempo y dinero.Si el experimento se realiza adecuada-mente, entonces procedemos a analizarlos datos. Los datos de los estudios querealizamos se utilizan para evaluar cual-

quier efecto potencial que muchos pro-ductos pueden tener en la salud denuestros empleados, clientes o en el am-biente. Los resultados se utilizan para de-terminar la manera en que se puedenvender o manejar los productos quími-cos. Cuando se realizan experimentosen un laboratorio de pruebas o en unacompañía farmacéutica, se busca deter-minar si los materiales tienen algún efec-to, ya sea deseable (como un fármacoque cura una enfermedad) o indeseable(por ejemplo, si un fármaco es tóxico).La estadística tiene un papel muy im-portante en nuestra evaluación de laimportancia de los efectos.

Por favor, describa un ejemplo específico que ilustre cómo el uso de la estadística tuvo éxito en mejorar un producto o servicio.

Hace poco tiempo realizamos un estu-dio toxicológico que costó alrededor de$300,000. Los datos del estudio se utili-zarían para determinar si cierto productoquímico causaba algún efecto en lossujetos estudiados. Después de que sellevó a cabo el estudio, se descubrieronfallas en los datos y en los estadísticosutilizados. Se requirieron dos años máspara revisar los datos adecuadamente yfinalizar la evaluación de salud. Si sehubieran elegido los métodos y los tér-minos apropiados, tal vez no se hubierarequerido de tiempo y dinero adiciona-les. La comprensión de los datos y laevaluación estadística correcta ayudó aprevenir un fracaso y una posible repeti-ción del estudio.