Comparación de dos Muestras - Statgraphics · STATGRAPHICS – Rev. 4/25/2007 © 2005 por...

22
STATGRAPHICS – Rev. 4/25/2007 © 2005 por StatPoint, Inc. Comparación de dos Muestras - 1 Comparación de dos Muestras Resumen El procedimiento de Comparación de dos Muestras está diseñado para comparar dos muestras independientes de datos de variables. Las pruebas son corridas para determinar si existe o no diferencia significativa entre medias, varianzas y/o medianas de las poblaciones de las cuales las muestras fueron tomadas. En adición, los datos pueden ser mostrados gráficamente de varias maneras, incluyendo un histograma dual, una gráfica de caja y bigotes dual y una gráfica de cuantiles. En este procedimiento se asume que no existe relación entre una observación seleccionada en una muestra y cualquier observación específica en otra muestra. En casos donde observaciones específicas en cada muestra corresponden a la misma unidad experimental, se usa el procedimiento Comparación de Muestras Aparedas. StatFolio de Muestra: two samples.sgp Datos de Ejemplo: El archivo bloodpressure.sf6 contiene datos que describen la presión arterial media de 27 pacientes hipertensos, n 1 = 15 de los cuales fueron tratados con un placebo y n 2 = 12 les fue suministrada una droga experimental. Los datos han sido introducidos en 2 columnas como se muestra abajo: Placebo (Placebo) Test Agent (Agente de Prueba) 113 112 116 106 147 100 114 100 111 100 132 96 125 97 109 98 107 104 114 93 116 96 98 98 123 126 123 Alternativamente todas las 27 lecturas de presión arterial podrían haber sido introducidas dentro de una sencilla columna de datos y se pudo haber creado una segunda columna para identificar a qué grupo pertenece cada paciente:

Transcript of Comparación de dos Muestras - Statgraphics · STATGRAPHICS – Rev. 4/25/2007 © 2005 por...

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 1

Comparación de dos Muestras Resumen El procedimiento de Comparación de dos Muestras está diseñado para comparar dos muestras independientes de datos de variables. Las pruebas son corridas para determinar si existe o no diferencia significativa entre medias, varianzas y/o medianas de las poblaciones de las cuales las muestras fueron tomadas. En adición, los datos pueden ser mostrados gráficamente de varias maneras, incluyendo un histograma dual, una gráfica de caja y bigotes dual y una gráfica de cuantiles. En este procedimiento se asume que no existe relación entre una observación seleccionada en una muestra y cualquier observación específica en otra muestra. En casos donde observaciones específicas en cada muestra corresponden a la misma unidad experimental, se usa el procedimiento Comparación de Muestras Aparedas. StatFolio de Muestra: two samples.sgp Datos de Ejemplo: El archivo bloodpressure.sf6 contiene datos que describen la presión arterial media de 27 pacientes hipertensos, n1 = 15 de los cuales fueron tratados con un placebo y n2 = 12 les fue suministrada una droga experimental. Los datos han sido introducidos en 2 columnas como se muestra abajo:

Placebo (Placebo)

Test Agent (Agente de Prueba)

113 112 116 106 147 100 114 100 111 100 132 96 125 97 109 98 107 104 114 93 116 96 98 98 123 126 123

Alternativamente todas las 27 lecturas de presión arterial podrían haber sido introducidas dentro de una sencilla columna de datos y se pudo haber creado una segunda columna para identificar a qué grupo pertenece cada paciente:

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 2

Patient (Paciente)

Pressure (Presión)

Group (Grupo)

1 113 Placebo 2 116 Placebo 3 147 Placebo 4 114 Placebo 5 111 Placebo 6 132 Placebo 7 125 Placebo 8 109 Placebo 9 107 Placebo 10 114 Placebo 11 116 Placebo 12 98 Placebo 13 123 Placebo 14 126 Placebo 15 123 Placebo 16 112 Agente de Prueba 17 106 Agente de Prueba 18 100 Agente de Prueba 19 100 Agente de Prueba 20 100 Agente de Prueba 21 96 Agente de Prueba 22 97 Agente de Prueba 23 98 Agente de Prueba 24 104 Agente de Prueba 25 93 Agente de Prueba 26 96 Agente de Prueba 27 98 Agente de Prueba 28 112 Agente de Prueba

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 3

Captura de Datos Los datos que se vana analizar se especifican en el cuadro de diálogo mostrado abajo. Para casos donde las dos muestras han sido colocadas en columnas separadas se especifican los nombres de las columnas.

• Muestra 1: columna numérica que contiene las observaciones de la primera muestra. • Muestra 2: columna numérica que contiene las observaciones de la segunda muestra. • Selección: selección del subconjunto. • Entrada: se fija en Dos Columnas de Datos para indicar que cada muestra han sido colocada

en una columna separada. Si los datos de ambas muestras han sido introducidos dentro de una simple columna, entonces introduzca el nombre de la columna que contiene los identificadores del grupo.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 4

• Datos: columna numérica que contiene las observaciones de ambas muestras. • Código de Muestra: columna numérica o no numérica que contiene un identificador para la

muestra correspondiente a cada observación. • Selección: selecciona el subconjunto. • Captura: se fija en Columnas de Códigos y Datos para indicar que los datos de ambas

muestras han sido colocados dentro de una sola columna.

Resumen del Análisis El Resumen del Análisis muestra el número de observaciones en cada muestra. Comparación de Dos Muestras - Placebo & Test Agent Muestra 1: Placebo Muestra 2: Test Agent Muestra 1: 15 valores en el rango de 98.0 a 147.0 Muestra 2: 12 valores en el rango de 93.0 a 112.0

También se muestran los valores más grandes y más pequeños.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 5

Estadísticos de Resumen El cuadro de Resumen de Estadísticos calcula un número de diferentes estadísticos que son comúnmente usados para resumir una muestra de los datos de variables: Resumen Estadístico Placebo Test Agent Recuento 15 12 Promedio 118.267 100.0 Mediana 116.0 99.0 Moda 100.0 Media Geométrica 117.745 99.8812 Media Recortada 5% 117.796 99.7222 Media Winsorizada 5% 118.267 100.0 Varianza 136.781 26.7273 Desviación Estándar 11.6953 5.16984 Coeficiente de Variación 9.88896% 5.16984% Error Estándar 3.01972 1.49241 Sigma Winsorizada 5% 11.6953 5.16984 DAM 7.0 2.5 Sbi 10.7038 4.52375 Mínimo 98.0 93.0 Máximo 147.0 112.0 Rango 49.0 19.0 Cuartil Inferior 111.0 96.5 Cuartil Superior 125.0 102.0 Rango Intercuartílico 14.0 5.5 1/6 sextil 109.0 96.0 5/6 sextil 126.0 105.0 Rango Intersextil 17.0 9.0 Sesgo 0.82607 1.17953 Sesgo Estandarizado 1.30613 1.6681 Curtosis 1.63626 1.55061 Curtosis Estandarizada 1.29358 1.09645 Suma 1774.0 1200.0 Suma de Cuadrados 211720. 120294. La mayoría de los estadísticos caen dentro de alguna de las tres categorías: A una distribución normal

1. medidas de tendencia central – estadísticos que caracterizan el “centro” de los datos. 2. medidas de dispersión – estadísticos que miden la variación de los datos. 3. medidas de forma – estadísticos que miden la forma de los datos en relación con una

distribución normal. Estos estadísticos incluidos en la tabla de manera automática son controlados por las especificaciones en el cuadro Stats del cuadro de diálogo Preferencias. Dentro del procedimiento la selección puede ser cambiada usando Opciones de Cuadro. Para una descripción detallada de cada estadístico, ver la documentación Análisis de Una Variable. Para los datos de presión arterial note que las siguientes medias muestrales y desviaciones estándar: Placebo: 3.1181 =x s1 = 11.70

Agente de Prueba: 0.1002 =x s2 = 5.17

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 6

Ambas la media y la desviación estándar parecen ser más grandes para la muestra donde el placebo fue suministrado. Note también que la estandarizada puntiagudez y la estandarizada curtosis para ambas muestras está dentro del intervalo –2 a +2, indicando que se podría asumir razonablemente que ambas muestras podrían provenir de distribuciones normales. Cuadro de Opciones

Seleccione los estadísticos deseados

Gráfica de Caja y Bigotes Este cuadro muestra una gráfica de Caja y Bigotes para cada muestra.

Gráfico Caja y Bigotes

93 103 113 123 133 143 153

Placebo

Test Agent

Las gráficas de Caja y Bigotes son construidas de la siguiente manera:

• Se dibuja una caja que se extiende desde el cuartil inferior de la muestra hasta el cuartil superior. Este es el intervalo cubierto por la mitad 50% de los valores de los datos cuando se ordenan del más pequeño al más grande.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 7

• Se dibuja una línea vertical en la mediana (el valor de en medio). • Si se requiere un signo de suma es colocado en la localización de la media muestral.

• Los bigotes son dibujados de los puntos extremos de la caja hasta los valores de datos

más grandes y más pequeños a menos que haya valores inusualmente más alejados de la caja (los cuales Tukey llama puntos extremos). Los puntos extremos, los cuales son puntos localizados más de 1.5 veces el rango intercuartílico arriba o debajo de la caja (la amplitud de la caja) se indican por símbolos de puntos. Cualquier punto más allá de 3 veces el rango intercuartílico arriba o debajo de la caja es conocido como punto extremo alejado y se indica como símbolo de punto con un signo de suma encima. Si los puntos extremos están presentes los bigotes se dibujan hasta los valores de los datos más grandes y más pequeños los cuales no son puntos extremos.

En los datos de la muestra, la caja para el grupo Placebo es cambiada a la derecha de la caja de la caja para el grupo Agente de Prueba. En resumen, la caja es más amplia lo que corresponde a la mayor variabilidad. Casa una de las gráficas también muestra un único punto extremo. Opciones de Cuadro

• Dirección: la orientación de la caja que corresponde a la dirección de los bigotes. • Muesca sobre la Mediana: Si es seleccionda un corte será añadido a la gráfica mostrando el

error de estimación asociado con cada mediana. La escala de los cortees se arregla de tal manera que si ellos nos enciman las dos medianas son significativamente diferentes al nivel de confianza predeterminado por el sistema (especificado en la tabulación General del cuadro de diálogo Preferencias en el menú Edición.

• Mostrar Aberrantes: si se selecciona indica la localización de los puntos extremos. • Mostrar Media: si se selecciona muestra la localización de la media muestral así como de la

mediana. Ejemplo – Caja con Muesca y Gráfica de Caja y Bigotes La siguiente gráfica añade muescas en las medianas en un intervalo de confianza de 95%.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 8

Gráfico Caja y Bigotes

93 103 113 123 133 143 153

Placebo

Test Agent

Cada corte cubre el intervalo

⎟⎠

⎞⎜⎝

⎛+±

211

35.1

)(25.12

~ 2/

j

jj n

IQRzx α (1)

donde jx~ es la mediana de la j-ésima muestra, IQRj es el rango intercuartílico de la muestra, nj es el tamaño de muetra, y zα/2 es el valor crítico superior (α/2)% de una distribución normal estándar. Dado que los cortees no se sobreponen, las medianas son significativamente diferentes en un nivel de confianza de 5%.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 9

Histograma de Frecuencias El cuadro de Histograma de Frecuencias muestra la muestra de datos usando un cuadro de barras dual:

Placebo

90 100 110 120 130 140 150Test Agent

8

4

0

4

8

frec

uenc

ia

La altura de cada barra en la gráfica de arriba representa el número de observaciones en los intervalos adyacentes, cada uno cubre 5 mm de presión. El histograma que se encuentra arriba de la línea es para el grupo al que se le suministró el placebo mientras que el histograma debajo de la línea representa el grupo Agente de Prueba.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 10

Opciones de Cuadro

• Número de clases: el número de intervalos dentro de los cuales los datos serán divididos.

Los intervalos son adyacentes entre sí e iguales en amplitud. • Límite Inferior: límite inferior del primer intervalo. • Límite Superior: límite superior del último intervalo. • Mantener: mantiene el número seleccionado de intervalos y límites incluso si la fuente de

datos cambia. De manera automática el número de clases y límites son estimados otra vez en cuanto los datos cambian. Esto es necesario para que todas las observaciones se muestren aún si algunos datos actualizados caen más allá de los límites originales.

• Frecuencias: Si es Relativa, la altura de las barras de las observaciones representa las

observaciones en un solo intervalo. Si es Acumulada la altura representa las observaciones en el intervalo indicado y todos los intervalos a su izquierda.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 11

Trazo de la Densidad El Trazo de Densidad provee una estimación no paramétrica de la función de densidad de probabilidad de las poblaciones de las cuales los datos fueron muestreados. Es creado al calcular el número de observaciones que caen dentro de una ventana de amplitud establecida que se mueven a través del rango de los datos.

VariablesPlaceboTest Agent

Densidades Suavizadas

93 103 113 123 133 143 1530

0.01

0.02

0.03

0.04

0.05

dens

idad

La función de densidad estimada está dada por:

∑=

⎟⎠⎞

⎜⎝⎛ −

=n

i

i

hxx

Whn

xf1

1)( (2)

donde h es la amplitud de la ventana en unidades de X y W(u) es la función de cargas determinada en la selección del cuadro de diálogo Cuadro de Opciones. Se encuentran disponibles dos formas de la función de cargas. Función Boxcar

⎩⎨⎧

=01

)(uW otherwise

uif 2/1≤ (3)

Función Coseno

⎩⎨⎧ +

=0

)2cos(1)(

uuW

π otherwise

uif 2/1< (4)

La última selección usualmente brinda un resultado suavizador con el valor deseable de h dependiendo del tamaño de los datos de la muestra.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 12

Para cada datos muestrales el trazo de la densidad se parece a las distribuciones normales. Cuadro de Opciones

• Método: la función de cargas deseada. La función encajonar evalúa todos los valores dentro

de la ventana por igual. La función coseno proporciona cargad decrecientes a las observaciones más allá del centro de la ventana. La selección automática está determinada por las especificaciones establecidas en la tabulación EDA del cuadro de diálogo Preferencias accesible desde el menú Edición.

• Ancho del Intervalo: la amplitud de la ventana h dentro de la cual las observaciones afectan

la densidad estimada como un porcentaje del rango cubierto por el eje x. h = 60% no es razonable para una muestra pequeña pero podría no proporcionar tanto detalle como un valor pequeño en muestras más grandes.

• Resolución del Eje X: el número de puntos en los cuales la densidad es estimada.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 13

Comparación de Desviaciones Estándar Las gráficas mostradas arriba sugieren que existen diferencias entre las dos muestras. Para determinar si las diferencias aparentes son estadísticamente significativas y no es sólo por los tamaños pequeño de las muestras se pueden realizar pruebas de hipótesis. La Comparación de las Desviaciones Estándar realiza una Prueba F para determinar si las desviaciones estándar son significativamente diferentes al considerar el radio de varianza definido por:

22

21

σσ

ϖ = (5)

El resultado se muestra abajo:

Comparación de Desviaciones Estándar Placebo Test Agent Desviación Estándar 11.6953 5.16984 Varianza 136.781 26.7273 Gl 14 11

Razón de Varianzas= 5.11765 Intervalos de confianza del 95.0% Desviación Estándar de Placebo: [8.56247, 18.4447] Desviación Estándar de Test Agent: [3.66229, 8.77776] Razones de Varianzas: [1.52365, 15.837] Prueba-F para comparar Desviaciones Estándar Hipótesis Nula: sigma1 = sigma2 Hipótesis Alt.: sigma1 <> sigma2 F = 5.11765 valor-P = 0.00988302 Se rechaza la hipótesis nula para alfa = 0.05.

La tabla muestra que:

1. Estadísticos Muestrales: las desviaciones estándar muestrales, varianzas y grados de libertad.

2. Radio de Varianzas: el radio de la varianza de la primera muestra entre el radio de la

varianza de la segunda muestra está dado:

22

21ˆ

ss

=ϖ (6)

Para los datos de la presión arterial, la varianza en la primera muestra está 5 veces arriba de la varianza en la segunda muestra.

3. Intervalos de Confianza: los intervalos se estiman para cada varianza muestral y para el

radio ω. Los intervalos para el radio indican que éste en realidad podría encontrarse en alguna parte aproximadamente entre 1.5 y 15.8, con un 95% de confianza. Note que los tamaños de muestra pequeños no proporcionan mucha precisión en las estimaciones de la varianza del radio.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 14

4. Prueba F: una prueba de hipótesis respecto al radio de la varianza. De manera automática, las hipótesis probadas son:

Hipótesis Nula: ω = 1 Hipótesis Alternativa: ω ≠ 1

Sin embargo, esto puede ser cambiado usando Opciones de Cuadro. Para probar la hipótesis se calcula el radio F:

0

22

21 /ϖ

ssF = (7)

Donde ω0 es el valor especificado por la hipótesis nula. Pequeños valores P-values (menos de 0.05 si operan en un 5% de nivel de significancia) conducen a rechazar la hipótesis nula. En el ejemplo actual, el pequeño P-Value indica que las muestras provienen de poblaciones con desviaciones estándar estadísticamente diferentes.

Opciones de Cuadro

• Hipótesis Nula: ω0, el valor del radio de la varianza especificado en la hipótesis nula.

• Hipótesis Alternativa: la hipótesis alternativa puede ser de dos colas (“No igual a”) o de una cola (tal como ω > 1 si “Mayor Que” es especificado).

• Alfa: el nivel de significancia de la prueba, usualmente se establece en 0.01, 0.05, o 0.10.

Esto es igual a la probabilidad de rechazar la hipótesis nula si es verdadera. No afecta el P-Value, solamente la conclusión establecida inmediatamente abajo del P-Value.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 15

Comparación de Medias La Comparación de Medias realiza una Prueba t para determinar si o no las medias de las dos muestras son significativamente diferentes al considerar la diferencia definida:

21 μμ −=Δ (8) El resultado se muestra abajo:

Comparación de Medias Intervalos de confianza del 95.0% para la media de Placebo: 118.267 +/- 6.47668 [111.79, 124.743] Intervalos de confianza del 95.0% para la media de Test Agent: 100.0 +/- 3.28477 [96.7152, 103.285] Intervalos de confianza del 95.0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: 18.2667 +/- 7.49787 [10.7688, 25.7645] Prueba t para comparar medias Hipótesis nula: media1 = media2 Hipótesis Alt.: media1 <> media2 suponiendo varianzas iguales: t = 5.01756 valor-P = 0.000035616 Se rechaza la hipótesis nula para alfa = 0.05.

La tabla muestra:

1. Intervalos de Confianza: estimaciones de intervalos para cada media muestral y para la diferencia entre medias Δ. El intervalo para la diferencia indica que la media de la presión arterial del grupo Placebo podría exceder la del grupo de Agente de Prueba por una diferencia aproximadamente entre 11.2 y 25.3 con 95% de confianza.

2. Prueba t: Una prueba de hipótesis respecto a la diferencia entre las medias.

Automáticamente la hipótesis que se prueba es:

Hipótesis Nula: Δ = 0 Hipótesis Alternativa: Δ ≠ 0

Sin embargo esto puede ser cambiado usando Opciones de Cuadro. Para probar la hipótesis se calcula un t estadístico. Dependiendo de la Opciones de Cuadro una prueba t puede ejecutarse asumiendo que las muestras provienen de poblaciones con varianzas iguales, o una prueba t aproximada puede ser ejecutada sin realizar tal supuesto. Asociados con cada t estadístico se encuentra un P-Value. Pequeños P-values (menores que 0.05 si se opera con un 5% de nivel de significancia) conducen a rechazar la hipótesis nula.

Desde que la prueba F describe primero si hubo una diferencia estadística entre las desviaciones estándar de las dos muestras, la prueba t fue realizada sin suponer varianzas iguales. P-values extremadamente pequeños indican que las muestras provienen de poblaciones con medias significativamente diferentes.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 16

Opciones de Cuadro

• Hipótesis Nula: Δ0, el valor de la diferencia entre las medias especificada por la hipótesis nula.

• Hipótesis Alternativa: la hipótesis alternativa puede ser de dos colas (“No Igual”) o de una cola (tal como Δ > 1 si “Mayor Que” es especificado).

• Alfa: el nivel de significancia de la prueba, usualmente establecido en 0.01, 0.05, o 0.10.

Esto es igual a la probabilidad de rechazar la hipótesis nula si es cierta. Esto no afecta el P-Value, solamente la conclusión declarada inmediatamente debajo del P-Value.

• Asumir Sigmas Iguales: si se asume o no que las dos muestras provienen de poblaciones

con varianzas iguales. La prueba t es exacta si se hace el supuesto y es aproximada si no se hace el supuesto.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 17

Comparación de Medianas STATGRAPHICS también provve una opción de tabulación que compara las medianans de dos poblacions usando la prueba Mann-Whitney (de Wilcoxon). Esta prueba es útil en casos sonde el supuesto de normalidad es cuestionable y no se encuentra una transformación adecuada y en casos donde una o más observaciones son sospechosas de ser valores atípicos. Para realizar la prueba las dos muestras se combinan y se les asigna un rango del valor más pequeño al más grande (del rango 1 al rango n1+n2). Si existen observaciones empatadas se asigna un rango promedio a las valores del grupo que se empata. El producto que aparece se muestra abajo:

Comparación de Medianas Mediana de muestra 1: 116.0 Mediana de muestra 2: 99.0 Prueba W de Mann-Whitney (Wilcoxon) para comparar medianas Hipótesis Nula: mediana1 = mediana2 Hipótesis Alt.: mediana1 <> mediana2 Rango Promedio de muestra 1: 19.3333 Rango Promedio de muestra 2: 7.33333 W = -80.0 valor-P = 0.000101812 Se rechaza la hipótesis nula para alpha = 0.05.

La tabla muestra:

1. Estadísticos Muestrales: las medianas de la s dos muestras. 2. Rango Promedio: el rango promedio de los datos en cada muestra cuando a ambas

muestras se les asigna un rango.

3. Pruebas de W: el estadístico de la prueba de Wilcoxon y su valor P-Value asociado. Pequeños P-Values (menores de 0.05 si se opera en un nivel de significancia de 5%) conducen a rechazar la hipótesis nula.

El pequeño P-Value en el ejemplo indica que las muestras provienen de poblaciones con medianas significativamente diferentes.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 18

Cuadro de Opciones

• Hipótesis Alternativa: las hipótesis alternativa puede ser de dos colas (“No Igual”) o de una

cola (tal como mediana1 > mediana2 si “Mayor Que” es especificado). • Alfa: el nivel de significancia de la prueba usualmente establecido en 0.01, 0.05, o 0.10. Esto

es igual a la probabilidad de rechazar la hipótesis nula si es cierta. Esto no afecta el P-Value, solamente afecta la conclusión declarada inmediatamente abajo del P-Value.

Gráfica de Cuantiles Este cuadro grafica los cuantiles (percentiles) de los datos en cada muestra.

VariablesPlaceboTest Agent

Gráfico Cuantil

93 103 113 123 133 143 1530

0.2

0.4

0.6

0.8

1

prop

orci

ón

En esta gráfica, los datos son ordenados del más pequeño al más grande y se grafican en las coordenadas

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛ −

ji n

ix 5.0, (9)

La compensación entre las dos líneas corresponde a las diferentes lugares de las dos distribuciones.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 19

Gráfica de Cuantiles- Cuantiles La gráfica de cuantiles-cuantiles (Q-Q) grafica los cuantiles de una muestra versus los cuantiles de la otra.

Gráfico Cuantil-Cuantil

93 103 113 123 133 143 153Placebo

93

103

113

123

133

143

153

Test

Age

nt

En la gráfica los puntos son dibujados para cada observación en la muestra más pequeña versus los percentiles interpolados para la muestra más grande. Si las dos muestras provienen de la misma población subyacente los puntos podrían yacer aproximadamente a lo largo de la línea diagonal. La compensación de los puntos a la derecha de la línea corresponde a la media más grande del grupo Placebo, mientras que el hecho de que la pendiente aparece ser menos que 1 es una muestra de que el grupo Placebo también tiene una desviación estándar más grande.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 20

Prueba de Kolmogorov-Smirnov La prueba de Kolmogorov-Smirnov Test realiza una prueba formal de la hipótesis nula que las dos muestras provienen de la misma población. Lo hace al calcular la máxima distancia entre las distribuciones empíricas

)()(max 21 xFxFDxn −= (10)

La cual equivale a la máxima distancia entre las dos curvas en la Gráfica de Cuantiles. El producto se muestra abajo:

Prueba de Kolmogorov-Smirnov Estadístico DN estimado = 0.85 Estadístico K-S bilateral para muestras grandes = 2.19469 Valor P aproximado = 0.000131017

En adición a Dn, la tabla también muestra el estadístico K-S definido como

nDnn

nnK21

21

+= (11)

Y un P-Value asociado. Pequeños P-values (menos que 0.05 si se opera en un nivel de significancia de 5% ) conducen a rechazar la hipótesis nula de que las dos muestras provienen de la misma población.

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 21

Cálculos Intervalo de Confianza para la Diferencia entre Medias Si se asume igualdad de varianzas:

( )21

2,2/2111

21 nnstxx pnn +±− −+α (12)

donde

( ) ( )

211

21

222

211

−+−+−

=nn

snsns p (13)

Si no sea sume igualdad de varianzas:

( )2

22

1

21

,2/21 ns

nstxx m +±− α (14)

donde

( )1

11

1

2

2

1

2

−−

+−

=n

cn

cm

(15)

y

2221

21

121

///

nsnsnsc

+= (16)

Intervalo de Confianza para el Radio de la Varianza

⎥⎥⎦

⎢⎢⎣

⎡−−

−−1,1,2/2

2

21

1,1,2/22

21

12

21

,1nn

nn

Fss

Fss

αα

(17)

Prueba t Si se asume igualdad de varianzas

( )

21

021

11nn

s

xxt

p +

Δ−−= (18)

STATGRAPHICS – Rev. 4/25/2007

© 2005 por StatPoint, Inc. Comparación de dos Muestras - 22

Es comparado con una distribución t con n1+n2-2 grados de libertad. Si no se asume igualdad de varianzas,

( )

2

22

1

21

021

ns

ns

xxt

+

Δ−−= (19)

Es comparado con una distribución t con m grados de libertad. Prueba de Mann-Whitney (Wilcoxon)

( )xT

nnnnW −

++=

2111

21 (20)

Donde Tx es la suma de los rangos para la muestra 1. Un estadístico de prueba normalizado es calculado de

)var(

5.02

21

W

nnWZ

−−= si W > 0.0 (21)

o

)var(

5.02

21

W

nnWZ

+−= si W ≤ 0.0 (22)

La varianza de W de arriba se calcula para las observaciones empatadas así:

⎥⎥⎥⎥

⎢⎢⎢⎢

−++

−−++=

∑=

)1)((

)1(1

12)var(

2121

1

2

2121

nnnn

ttnnnnW

g

jjj

(23)

donde g es el número de los grupos empatados y tj es el tamaño del grupo empatado j . Un P-value es calculado al comparar Z con la distribución normal estándar. P-Value Kolmogorov-Smirnov

1=P si K < 0.22 (24)

⎟⎟⎠

⎞⎜⎜⎝

⎛ −−= 2

2

8exp21

KKP ππ si 80.022.0 ≤< K (25)

222 18822 KKK eeeP −−− −+= si 15.380.0 ≤< K (26) 0=P si K > 3.15 (27)