MANUAL

30
Página 1 Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila Manual Minitab: Prueba de Hipótesis Ing. Tecnologías de la producción Estadística Aplicada a la Ingeniería Alumno Víctor Hugo Franco García 7° ``A´´ Profesor Lic. Gerardo Edgar Mata Ortiz A Martes 22 de Octubre de 2013

Transcript of MANUAL

Página 1

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Manual Minitab: Prueba de

Hipótesis

Ing. Tecnologías de la producción

Estadística Aplicada a la

Ingeniería

Alumno Víctor Hugo Franco García

7° ``A´´

Profesor

Lic. Gerardo Edgar Mata Ortiz

A Martes 22 de Octubre de 2013

Página 2

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Índice

Revisión general…………………………...3

Z de 1 muestra………………….................7

t de 1 muestra…………………………….11

t de 2 muestras……………………………14

t pareada………………………………….20

1 proporción………………………………24

2 proporciones……………………………27

Página 3

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Revisión general de estadísticas básicas

Utilice las capacidades de estadísticas básicas de Minitab para calcular estadísticas básicas y para realizar estimaciones simples y pruebas de hipótesis con una o dos muestras. Las

capacidades de estadísticas básicas incluyen procedimientos para:

Calcular o almacenar estadísticas descriptivas

Pruebas de hipótesis e intervalos de confianza de la media o la diferencia en las medias

Pruebas de hipótesis e intervalos de confianza para una proporción o la diferencia en

proporciones

Pruebas de hipótesis e intervalos de confianza de la tasa de ocurrencias, la media del

número de ocurrencias y las diferencias entre ellas para los procesos de Poisson.

Pruebas de hipótesis e intervalos de confianza para una varianza y para la diferencia entre dos varianzas

Medición de asociaciones

Pruebas de normalidad de una distribución

Pruebas para determinar si los datos siguen una distribución de Poisson

Cálculo y almacenamiento de estadísticas descriptivas

Mostrar estadísticas descriptivas genera estadísticas descriptivas para cada columna o

subconjunto dentro de una columna. Puede mostrar las estadísticas en la ventana Sesión y/o mostrarlas en una gráfica.

Almacenar estadísticas descriptivas almacena estadísticas descriptivas para cada

columna o subconjunto dentro de una columna.

Resumen gráfico genera cuatro gráficas y una tabla de salida en una ventana de

gráfica.

Para obtener una lista de las estadísticas descriptivas disponibles para mostrar o almacenar, véase Estadísticas descriptivas disponibles para mostrar o almacenar. Para calcular

estadísticas descriptivas de forma individual y almacenarlas como constantes, véase Estadísticas de columnas.

Intervalos de confianza y pruebas de hipótesis de medias

Página 4

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Los cuatro procedimientos de las pruebas de hipótesis e intervalos de confianza para las

medias de la población o la diferencia entre las medias se basan en que la distribución de la media de la muestra siga una distribución normal . De acuerdo con el Teorema del límite

central , la distribución normal se convierte en una aproximación cada vez mejor para la distribución de la media de la muestra extraída de cualquier distribución a medida que aumenta el tamaño de la muestra.

Z de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la

media cuando la desviación estándar de la población, , es conocida. Este procedimiento se

basa en una distribución normal, de manera que para las muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de una distribución normal o

una distribución cercana a normal. A partir del Teorema del límite central , usted puede utilizar este procedimiento si tiene una muestra grande, sustituyendo la desviación estándar

de la muestra por . Una regla de oro común consiste en considerar que las muestras con un

tamaño de 30 o más son muestras grandes. Muchos analistas eligen el procedimiento t y no

el procedimiento Z cuando es desconocida.

t de 1 muestra calcula un intervalo de confianza o realiza una prueba de hipótesis de la

media cuando es desconocida. Este procedimiento se basa en la distribución t, que se

deriva de una distribución normal con desconocida. Para el caso de muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de una distribución que es

normal o cercana a normal. Este procedimiento es más conservador que el procedimiento Z y siempre deberá tener preferencia sobre el procedimiento Z cuando se trata de muestras

pequeñas y es desconocida. Muchos analistas eligen el procedimiento t y no el

procedimiento Z cada vez que es desconocida. De acuerdo con el Teorema del límite

central , mientras mayor sea el tamaño de la muestra, usted podrá tener mayor confianza en los resultados de este procedimiento, porque la distribución de la media de la muestra se

comporta cada vez más como una distribución normal.

t de 2 muestras calcula un intervalo de confianza y realiza una prueba de hipótesis de la

diferencia entre las medias de dos poblaciones cuando las son desconocidas y las

muestras han sido extraídas independientemente. Este procedimiento se basa en la distribución t y, en el caso de muestras pequeñas, funciona mejor si sus datos se extraen de

distribuciones que son normales o cercanas a normales. A medida que el tamaño de la muestra aumenta, usted puede tener mayor confianza en los resultados.

t pareada calcula un intervalo de confianza y realiza una prueba de hipótesis de la

diferencia entre las medias de dos poblaciones cuando las observaciones son pareadas (coinciden). Cuando los datos son pareados, tal como ocurre en las mediciones "antes y

después", el procedimiento de t pareada produce una varianza menor y mayor potencia para detectar diferencias en comparación con el procedimiento de t de 2 muestras anterior, el cual presupone que las muestras fueron extraídas de manera independiente.

Página 5

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Intervalos de confianza y pruebas de hipótesis de

proporciones

1 Proporción calcula un intervalo de confianza y somete a una prueba de hipótesis una

proporción de la población.

2 proporciones calcula un intervalo de confianza y somete a una prueba de hipótesis la

diferencia entre 2 proporciones de la población.

Intervalos de confianza y pruebas de hipótesis de tasas de

Poisson

Tasa de Poisson de 1 muestra calcula un intervalo de confianza y somete a una prueba de hipótesis la tasa de ocurrencias y la media del número de ocurrencias en un proceso de

Poisson.

Tasa de Poisson de 2 muestras calcula un intervalo de confianza y somete a una prueba de hipótesis la diferencia en las tasas de ocurrencias y la diferencia en la media del número

de ocurrencias en dos procesos de Poisson.

Intervalos de confianza y pruebas de hipótesis de

varianza

1 varianza calcula un intervalo de confianza y somete a una prueba de hipótesis la varianza de una muestra.

2 varianzas calcula un intervalo de confianza y somete a una prueba de hipótesis la

calidad u homogeneidad de la varianza de dos muestras.

Medidas de asociación

Correlación calcula el coeficiente de correlación producto-momento de Pearson

(también denominado coeficiente de correlación o correlación) para pares de variables. El coeficiente de correlación es una de medida del grado de relación lineal entre dos variables.

Puede obtener un valor p para probar si hay suficiente evidencia de que el coeficiente de correlación no es cero.

Utilizando una combinación de comandos de Minitab, también puede calcular la correlación de Spearman y un coeficiente de correlación parcial. La correlación de

Spearman es simplemente la correlación calculada en las clasificaciones de las dos muestras. Un coeficiente de correlación parcial es el coeficiente de correlación entre dos

variables mientras se ajusta para los efectos de otras variables.

Página 6

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Covarianza calcula la covarianza para pares de variables. La covarianza es una medida

de la relación entre dos variables, pero no ha sido estandarizada, tal como se hace con el coeficiente de correlación, dividiendo entre la desviación estándar de ambas variables.

Prueba de distribución

La Prueba de normalidad genera una gráfica de probabilidad normal y realiza una prueba de hipótesis para examinar si las observaciones siguen o no una distribución normal . Algunos

procedimientos estadísticos, como una prueba t o Z, presuponen que las muestras provienen de una distribución normal. Utilice este procedimiento para poner a prueba el supuesto de normalidad.

Prueba de bondad de ajuste

Prueba de bondad de ajuste para Poisson evalúa si sus datos siguen una distribución de Poisson. Algunos procedimientos estadísticos, como la gráfica U, parten del supuesto de

que los datos siguen una distribución de Poisson. Utilice este procedimiento para poner a prueba este supuesto.

Página 7

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Z de una muestra

Utilice Z de 1 muestra para calcular un intervalo de confianza o realizar una prueba de

hipótesis de la media cuando no se conoce . Para una prueba Z de una muestra de dos

colas, las hipótesis son:

H0 : = 0 versus H1: ≠ 0

donde es la media de la población y 0 es la media de la población hipotética.

Elementos del cuadro de diálogo

Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas. Ingrese las columnas que contienen los datos de muestra.

Datos resumidos: Elija esta opción si tiene valores de resumen para el tamaño de la

muestra y la media.

Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra .

Media: Ingrese el valor para la media de la muestra.

Desviación estándar: Ingrese el valor de la desviación estándar de población.

Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis.

Media hipotética: Ingrese la media de la prueba 0.

Para calcular una prueba Z e intervalo de confianza de la media

1 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra.

2 En Muestras en columnas, ingrese las columnas que contienen las muestras.

3 En Desviación estándar, ingrese un valor para .

4 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.

Página 8

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Ejemplo de una prueba Z de 1 muestra e

intervalo de confianza Z

Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las

mediciones históricamente ha estado cerca de una distribución normal con = 0.2. Puesto

que usted conoce el valor de y desea probar si la media de población es 5 y obtener un intervalo de confianza de 90% para la media, usted utiliza el procedimiento Z.

1 Abra la hoja de trabajo EJA_ESTAD.MTW.

2 Elija Estadísticas > Estadísticas básicas > Z de 1 muestra.

3 En Muestras en columnas, ingrese Valores.

4 En Desviación estándar, ingrese 0.2.

5 Marque Realizar prueba de hipótesis. En Media hipotética, ingrese 5.

6 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar.

7 Haga clic en Gráficas. Marque Gráfica de valores individuales. Haga clic en Aceptar en cada cuadro de diálogo.

Salida de la ventana Sesión

Salida de la ventana Gráfica

Página 9

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Interpretación de los resultados

La estadística de prueba, Z, para probar si la media de población es igual a 5 es 3.17. El valor p , o la probabilidad de rechazar la hipótesis nula cuando es verdadera, es 0.002. Esto

se denomina un nivel de significancia obtenido, valor p o obtenido de la prueba. Debido a

que el valor p de 0.002 es más pequeño que los niveles comúnmente elegidos, existe

evidencia significativa de que no es igual a 5, de manera que usted puede rechazar H0 en

favor de que el valor de no es 5.

Una prueba de hipótesis en = 0.1 también puede realizarse al observar una gráfica de valores individuales. El valor hipotético se ubica fuera del intervalo de confianza de 90%

para la media de población (4.6792, 4.8985) y de este modo puede rechazar la hipótesis nula.

Ejemplos:

Página 10

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Página 11

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

t de 1 muestra

Realiza una prueba t de una muestra o intervalo de confianza t para la media.

Utilice t de 1 muestra para calcular un intervalo de confianza y realice una prueba de

hipótesis de la media cuando no se conoce la desviación estándar de la población , . Para una t de una muestra con dos colas,

H0: = 0 versus H1: ≠ 0

donde es la media de la población y 0 es la media de la población hipotética.

Elementos del cuadro de diálogo

Muestras en columnas: Elija esta opción si ha ingresado datos sin procesar en columnas.

Ingrese las columnas que contienen los datos de muestra.

Datos resumidos: Elija si tiene valores de resumen para el tamaño de la muestra, media y desviación estándar.

Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra .

Media: Ingrese el valor para la media de la muestra.

Desviación estándar: Ingrese el valor para la desviación estándar de la muestra.

Realizar prueba de hipótesis: Marque esta opción para realizar una prueba de hipótesis.

Media hipotética: Ingrese la media de la prueba 0.

Para calcular una prueba t y un intervalo de confianza de la media

1 Elija Estadísticas > Estadísticas básicas > t de 1 muestra.

2 En Muestras en columnas, ingrese las columnas que contienen las muestras.

3 Si lo desea, utilice cualquier opción del cuadro de diálogo y luego haga clic en Aceptar.

Página 12

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Ejemplo de una prueba t de 1 muestra y

un intervalo de confianza t

Las mediciones se tomaron en nueve artefactos. Usted sabe que la distribución de las mediciones de los artefactos históricamente ha estado cerca de una distribución normal,

pero supongamos que usted no conoce . Para probar si la media de población es 5 y para obtener un intervalo de confianza de 90% para la media, usted utiliza un procedimiento t.

1 Abra la hoja de trabajo EJA_ESTAD.MTW.

2 Elija Estadísticas > Estadísticas básicas > t de 1 muestra.

3 En Muestras en columnas, ingrese Valores.

4 Marque Realizar prueba de hipótesis. En Media hipotética, ingrese 5.

5 Haga clic en Opciones. En Nivel de confianza, ingrese 90. Haga clic en Aceptar en

cada cuadro de diálogo.

Salida de la ventana Sesión

Interpretación de los resultados

La estadística de prueba, T, para H0: = 5 se calcula como 2.56.

El valor p de esta prueba, o la probabilidad de obtener más valores extremos de la

estadística de prueba en virtud de las probabilidades si la hipótesis nula fuera verdadera, es de 0.034. Esto se denomina nivel de significancia obtenido o valor p. Por lo tanto, rechace

H0 si su nivel aceptable es mayor que el valor p o 0.034.

Un intervalo de confianza de 90% para la media de población, , es (4.6357,4.9421). Este intervalo es ligeramente más amplio que el intervalo Z correspondiente que se muestra en

Ejemplo de Z de 1 muestra.

Página 13

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Ejemplos:

Página 14

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

t de 2 muestras

Estadísticas > Estadísticas básicas > t de 2 muestras

Realiza una prueba t de 2 muestras independientes y genera un intervalo de confianza .

Cuando tenga muestras dependientes , utilice Estadísticas > Estadísticas básicas > t

pareada.

Utilice t de 2 muestras para realizar una prueba de hipótesis y calcular un intervalo de confianza o la diferencia entre dos medias de población cuando las desviaciones estándar

de las poblaciones, , sean desconocidas. Para una prueba t de 2 muestras con dos colas

H0: 1 2 = 0 versus H1: 1 2 ≠ 0

donde 1 y 2 son las medias de población y 0 es la diferencia hipotética entre las dos

medias de población.

Elementos del cuadro de diálogo

Muestras en una columna: Elija esta opción si los datos de la muestra se encuentran en

una columna individual, diferenciados por los valores de subíndice (códigos de grupo) en una segunda columna.

Muestras: Ingrese la columna que contiene los datos.

Subíndices: Ingrese la columna que contiene los subíndices de la muestra.

Muestras en diferentes columnas: Elija esta opción si los datos de las dos muestras están

en columnas separadas.

Primero: Ingrese la columna que contiene una muestra.

Segundo: Ingrese la columna que contiene la otra muestra.

Datos resumidos (diferencias): Elija esta opción si tiene valores de resumen para el tamaño de la muestra , media y desviación estándar para cada muestra.

Nombre

Tamaño de la muestra: Ingrese el valor para el tamaño de la muestra.

Media: Ingrese el valor de la media.

Página 15

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Desviación estándar: Ingrese el valor de la desviación estándar.

Segundo

Tamaño de la muestra: Ingrese el valor del tamaño de la muestra.

Media: Ingrese el valor de la media.

Desviación estándar: Ingrese el valor de la desviación estándar.

Asumir varianzas iguales: Marque esta opción para presuponer que las poblaciones tienen varianzas iguales. La opción predeterminada es presuponer varianzas desiguales. Véase

Varianzas iguales o desiguales.

Para calcular un intervalo de confianza t de dos muestras y una

prueba

1 Elija Estadísticas > Estadísticas básicas > t de 2 muestra.

2 Elija una de las siguientes opciones:

Si sus datos están apilados en una columna individual:

Elija Muestras en una columna.

En Muestras, ingrese la columna que contiene los datos numéricos.

En Subíndices, ingrese la columna que contiene los códigos de grupo o población.

Si sus datos no están apilados, es decir, cada muestra se encuentra en una columna separada:

Elija Muestras en diferentes columnas.

En Primera, ingrese la columna que contiene la primera muestra.

En Segunda, ingrese la columna que contiene la otra muestra.

3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en

Aceptar.

Página 16

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Ejemplo de una t de 2 muestras con las

Muestras en una columna

Se llevó a cabo un estudio para evaluar la efectividad de dos dispositivos para mejorar la eficiencia de sistemas de calefacción domésticos a gas. El consumo de energía en las

viviendas se midió después de la instalación de uno de los dos dispositivos. Los dos dispositivos eran: un regulador eléctrico (Regulador=1) y un regulador de activación térmica (Regulador=2). Los datos de consumo de energía (BTU.Con) se apilan en una

columna y una columna de agrupación (Regulador) contiene identificadores o subíndices para denotar la población. Supongamos que realizó una prueba de varianza y no encontró

evidencia de que las varianzas no sean iguales (véase Ejemplo de 2 varianzas). Ahora, usted desea comparar la efectividad de estos dos dispositivos al determinar si existe o no evidencia de que la diferencia entre los dispositivos es diferente de cero.

1 Abra la hoja de trabajo HORNO.MTW.

2 Elija Estadísticas > Estadísticas básicas > t de 2 muestras .

3 Elija Muestras en una columna.

4 En Muestras, ingrese 'BTU.Con'.

5 En Subíndices, ingrese Regulador.

6 Marque la opción Asumir varianzas iguales. Haga clic en Aceptar.

Salida de la ventana Sesión

Página 17

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Interpretación de los resultados

Minitab muestra una tabla de los tamaños de muestras, las medias de muestras, las desviaciones estándar y los errores estándar de las dos muestras.

Debido a que anteriormente no se encontró evidencia de que las varianzas sean desiguales,

decidimos utilizar la desviación estándar agrupada al elegir Asumir varianzas iguales. La desviación estándar agrupada, 2.8818, se utiliza para calcular la estadística de prueba y los intervalos de confianza .

Una segunda tabla ofrece un nivel de confianza para la diferencia en las medias de

poblaciones. Para este ejemplo, un intervalo de confianza de 95% es (1.450, 0.980), el cual incluye cero, lo que sugiere que no existe diferencia. El siguiente es el resultado de la

prueba de hipótesis . La estadística de prueba es 0.38, con un valor p de 0.701 y 88 grados de libertad .

Debido a que el valor p es mayor que los niveles normalmente elegidos, no existe evidencia de que haya diferencia en uso de energía cuando se utiliza un regulador eléctrico

versus un regulador de activación térmica.

Ejemplos:

Página 18

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Página 19

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Página 20

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

t pareada

Estadísticas > Estadísticas básicas > t pareada

Realiza una prueba t pareada. Este procedimiento es apropiado para poner a prueba la

diferencia media entre observaciones pareadas cuando las diferencias pareadas siguen una distribución normal.

Utilice el comando t pareada para calcular un intervalo de confianza y realizar una prueba

de hipótesis de la diferencia media entre las observaciones pareadas de la población. Una prueba t pareada crea correspondencia en pares de respuestas que son dependientes o están relacionadas. Esta correspondencia permite explicar la variabilidad entre los pares que por

lo general produce un término de error más pequeño y, de esta manera, se aumenta la sensibilidad de la prueba de hipótesis o intervalo de confianza.

Como ejemplos típicos de datos pareados figuran las mediciones hechas en gemelos o

mediciones del tipo "antes y después". Para una prueba t pareada:

H0: d = 0 versus H1: d ≠ 0

donde d es la media de la población de las diferencias y 0 es la media hipotética de las

diferencias.

Cuando las muestras se extraen de manera independiente de dos poblaciones, utilice Estadísticas > Estadísticas básicas > t de 2 muestras.

Elementos del cuadro de diálogo

Muestra en columnas: Elija esta opción si ha ingresado datos sin procesar en dos

columnas.

Primera muestra: Ingrese la columna que contiene la primera muestra

Segunda muestra: Ingrese la columna que contiene la segunda muestra

Datos resumidos (diferencias): Elija si tiene valores de resumen para el tamaño de la muestra , media y desviación estándar de la media.

Tamaño de muestra: Ingrese el valor del tamaño de la muestra.

Media: Ingrese el valor de la media.

Desviación estándar: Ingrese el valor de la desviación estándar.

Página 21

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Para calcular una prueba t pareada y un intervalo de confianza

1 Elija Estadísticas > Estadísticas básicas > t pareada.

2 En Primera muestra, ingrese la columna que contiene la primera muestra.

3 En Segunda muestra, ingrese la columna que contiene la segunda muestra.

4 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en

Aceptar.

Ejemplo de t pareada

Una empresa fabricante de zapatos desea comparar dos materiales, A y B, para utilizar en

las suelas de los zapatos para niños varones. En este ejemplo, cada uno de diez niños en un estudio usó un par especial de zapatos con la suela de un zapato hecha con el material A y

con la suela del otro zapato hecha con el material B. El tipo de suela fue asignado de forma aleatoria para explicar las diferencias sistemáticas en el desgaste entre el pie izquierdo y el derecho. Después de tres meses, los zapatos se miden para su uso.

Para estos datos, usted utilizaría un diseño pareado en vez de un diseño no pareado. Un

procedimiento t pareado probablemente tendría un término de error más pequeño que el que correspondería a un procedimiento no pareado porque éste elimina la variabilidad causada

por diferencias entre los pares. Por ejemplo, es posible que uno de los niños viva en la ciudad y camine sobre pavimento la mayor parte del día, mientras que otro niño pudiera vivir en el campo y pasar gran parte del día sobre superficies no pavimentadas.

1 Abra la hoja de trabajo EJA_ESTAD.MTW.

2 Elija Estadísticas > Estadísticas básicas > t pareada.

3 Elija Muestras en columnas.

4 En Primera muestra, ingrese Mat-A. En Segunda muestra, ingrese Mat-B. Haga clic en Aceptar.

Salida de la ventana Sesión

Página 22

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Interpretación de los resultados

El intervalo de confianza para la media de la diferencia entre los dos materiales no incluye

cero, lo cual sugiere una diferencia entre ellos. El valor p pequeño (p = 0.009) también

sugiere que los datos no concuerdan con H0: d = 0, es decir, los dos materiales no tienen el

mismo rendimiento. Específicamente, el Material B (media = 11.04) tuvo mejor rendimiento que el Material A (media = 10.63) en lo que respecta a desgaste a lo largo del

período de prueba de tres meses.

Compare los resultados del procedimiento pareado con los resultados del no pareado, prueba t de dos muestras (Estadísticas > Estadísticas básicas > t de 2 muestras). Los resultados del procedimiento pareado nos inducen a creer que los datos no concuerdan con

H0 (t = 3.35; p = 0.009). Sin embargo, los resultados del procedimiento no pareado (no se

muestran) son totalmente diferentes. Una prueba t no pareada produce un valor t de 0.37,

y un valor p de 0.72. Con base en estos resultados, no sería posible rechazar la hipótesis nula y podríamos concluir que no existe diferencia en el rendimiento de los dos materiales.

En el procedimiento no pareado, la gran cantidad de varianza en el desgaste de los zapatos entre los niños (el desgaste promedio para un niño fue de 6.50 y para otro de 14.25) oculta la diferencia, hasta cierto punto menos drástica, en el desgaste entre los zapatos izquierdo y

derecho (la diferencia más grande entre zapatos fue de 1.10). Esta es la razón por la cual un diseño experimental pareado y un análisis subsiguiente con una prueba t pareada, cuando

corresponda, es con frecuencia mucho más potente que un enfoque no pareado.

Página 23

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Ejemplos:

Página 24

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

1 Proporción

Estadísticas > Estadísticas básicas > 1 Proporción

Realiza una prueba de una proporción binomial.

Utilice 1 Proporción para calcular un intervalo de confianza y realizar una prueba de

hipótesis de la proporción . Por ejemplo, una fábrica de repuestos para vehículos afirma que menos del 2% de sus bujías son defectuosas. Usted podría tomar una muestra aleatoria de

las bujías y determinar si la proporción defectuosa real coincide o no con la afirmación. Para una prueba de dos colas de una proporción:

H0: p = p0 versus H1: p ≠ p0 donde p es la proporción de población y p0 es el valor hipotético.

Para comparar dos proporciones, utilice Estadísticas > Estadísticas básicas > 2 proporciones.

Elementos del cuadro de diálogo

Muestras en columnas: Elija esta opción si usted tiene datos en las columnas, luego,

ingrese las columnas que contienen los datos de muestra. Cada celda de estas columnas debe tener uno de dos valores posibles y corresponder a un elemento o sujeto. Los valores posibles en las columnas deben ser idénticos si usted ingresa columnas múltiples.

Datos resumidos: Elija esta opción si tiene valores de resumen para los números de ensayos y eventos.

Número de eventos: Ingrese el número de eventos observados. Si usted ingresa más de un valor; el valor entero que ingrese en Número de ensayos se aplicará a todos.

Número de ensayos: Ingrese un valor individual para el número de ensayos.

Realizar prueba de hipótesis: Marque esta opción para realizar la prueba de hipótesis de que la proporción de población es igual a un valor especificado.

Proporción hipotética: Ingrese el valor de la proporción para la hipótesis nula de la prueba.

Página 25

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Para calcular una prueba y un intervalo de confianza para una

proporción

1 Elija Estadísticas > Estadísticas básicas > 1 Proporción.

2 Realice uno de los siguientes procedimientos:

Si tiene datos sin procesar, elija Muestras en columnas, e ingrese las columnas que contienen los datos sin procesar.

Si tiene datos resumidos:

1 Elija Datos resumidos.

2 En Número de ensayos, ingrese un valor entero numérico simple para el número de ensayos. Con frecuencia, el número de ensayos será su tamaño de muestra..

3 En Número de eventos, ingrese uno o más valores enteros numéricos como el número observado de eventos.

3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar.

Ejemplo de 1 proporción

A una fiscal de condado le gustaría postularse para la fiscalía del estado. Ella decide que

renunciará a su cargo en la oficina del condado y postularse para la fiscalía del estado si más del 65% de los miembros de su partido la respaldan. Usted necesita probar H0: p = .65

versus H1: p > .65

Como su director de campaña, usted recopiló información de 950 miembros del partido seleccionados de manera aleatoria y observa que 560 miembros del partido apoyan a la

candidata. Una prueba de proporción se realizó para determinar si la proporción de los partidarios era o no mayor que la proporción requerida de 0.65. Además, se construyó un límite de confianza del 95% para determinar el límite inferior para la proporción de

partidarios.

1 Elija Estadísticas > Estadísticas básicas > 1 Proporción.

2 Elija Datos resumidos.

3 En Número de eventos, ingrese 560. En Número de ensayos, ingrese 950.

4 Marque Realizar prueba de hipótesis. En Proporción hipotética, ingrese 0.65.

Página 26

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

5 Haga clic en Opciones. En Hipótesis alterna, elija Mayor que. Haga clic en Aceptar

en cada cuadro de diálogo.

Salida de la ventana Sesión

Interpretación de los resultados

El valor p de 1.0 sugiere que los datos son consistentes con la hipótesis nula (H0: p = 0.65),

es decir, la proporción de los miembros del partido que apoyan a la candidata no es mayor que la proporción requerida de 0.65. Como su director de campaña, usted le aconsejaría no

postularse para la fiscalía del estado.

Página 27

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

2 proporciones Realiza una prueba de dos proporciones binomiales.

Utilice el comando 2 proporciones para calcular un intervalo de confianza y realizar una prueba de hipótesis de la diferencia entre dos proporciones. Minitab ofrece dos pruebas de hipótesis para la diferencia entre dos proporciones: La prueba exacta de Fisher y una prueba

basada en una aproximación normal. La prueba de aproximación normal puede ser inexacta para muestras en las cuales el número de eventos de cada muestra es menor que cinco o si la diferencia entre el número de ensayos y eventos de cada muestra es menor que cinco. La

prueba exacta de Fisher es exacta para todos los tamaños de muestra , pero sólo se puede calcular cuando la hipótesis nula establece que las proporciones de población son iguales.

En otras palabras, Minitab sólo realiza la prueba exacta de Fisher cuando usted especifica una diferencia de la prueba de cero en el cuadro de diálogo secundario Opciones.

Por ejemplo, supongamos que usted desea saber si la proporción de consumidores que responden a una encuesta pudiera incrementarse al ofrecer un incentivo tal como una

muestra del producto. Usted puede incluir la muestra del producto en la mitad de sus correos y determinar si obtiene más repuestas del grupo que recibió la muestra que del

grupo que no la recibió. Para una prueba de dos colas de dos proporciones:

H0: p1 - p2 = p0 versus H1: p1 - p2 ≠ p0

cuando p1 y p2 son las proporciones de eventos en las poblaciones 1 y 2, respectivamente, y p0 es la diferencia hipotética entre las dos proporciones.

Para probar una proporción utilice Estadísticas > Estadísticas básicas > 2 Proporciones.

Elementos del cuadro de diálogo

Muestras en una columna: Elija esta opción si ha ingresado datos sin procesar en una columna individual con una segunda columna de subíndices que identifican la muestra.

Muestras: Ingrese la columna que contiene los datos sin procesar.

Subíndices: Ingrese la columna que contiene los subíndices de la muestra.

Muestras en diferentes columnas: Elija esta opción si introdujo datos sin procesar en las

columnas individuales para cada muestra.

Primero: Ingrese la columna que contiene los datos sin procesar para la primera muestra.

Segundo: Ingrese la columna que contiene los datos sin procesar para la segunda muestra.

Página 28

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Datos resumidos: Elija esta opción si tiene valores de resumen para los números de

ensayos y eventos.

Nombre

Eventos: Ingrese el número de eventos en la primera muestra.

Ensayos: Ingrese el número de ensayos en la primera muestra.

Segundo

Eventos: Ingrese el número de eventos en la segunda muestra.

Ensayos: Ingrese el número de ensayos en la segunda muestra.

Para calcular un intervalo de confianza de prueba para la diferencia

en proporciones

1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones .

2 Realice uno de los siguientes procedimientos:

Si sus datos sin procesar están apilados en una columna individual:

1 Elija Muestras en una columna.

2 En Muestras, ingrese la columna que contenga los datos sin procesar.

3 En Subíndices, ingrese la columna que contiene los códigos de grupo o población.

Si sus datos sin procesar no están apilados, es decir, cada muestra se encuentra en una

columna separada:

1 Elija Muestras en diferentes columnas.

2 En Primera, ingrese la columna que contiene la primera muestra.

3 En Segunda, ingrese la columna que contiene la otra muestra.

Si tiene datos resumidos:

1 Elija Datos resumidos.

2 En Primera muestra, ingrese los valores numéricos en Ensayos y en Eventos.

Página 29

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

3 En Segunda muestra, ingrese los valores numéricos en Ensayos y en Eventos.

3 Si lo desea, utilice cualquiera de las opciones del cuadro de diálogo y haga clic en Aceptar.

Ejemplo de 2 proporciones

Como gerente de compras de su corporación, usted debe autorizar la adquisición de veinte

máquinas fotocopiadoras nuevas. Después de comparar numerosas marcas en términos de precio, calidad de la copia, garantía y funciones, usted ha reducido sus opciones a dos:

Marca X y Marca Y. Usted decide que el factor determinante será la confiabilidad de las marcas definida por la proporción de servicio requerido dentro de un año a partir de la compra.

Debido a que su corporación ya utiliza ambas marcas, usted pudo obtener información acerca del historial de servicio de 50 máquinas de cada marca seleccionadas aleatoriamente. Los registros indican que seis máquinas de la Marca X y ocho de la Marca Y requirieron

servicio. Utilice esta información para orientar su elección de la marca a comprar.

1 Elija Estadísticas > Estadísticas básicas > 2 Proporciones .

2 Elija Datos resumidos.

3 En Primera muestra, en Eventos, ingrese 44. En Ensayos, ingrese 50.

4 En Segunda muestra, en Eventos, ingrese 42. En Ensayos, ingrese 50. Haga clic en Aceptar.

Salida de la ventana Sesión

Página 30

Universidad Tecnológica de Torreón Organismo Público Descentralizado del Gobierno de Coahuila

Interpretación de los resultados

En este ejemplo, la prueba de aproximación normal es válida porque, para ambas muestras, el número de eventos es mayor que cuatro y la diferencia entre los números de ensayos y

eventos es mayor que cuatro. La prueba de aproximación normal indica un valor p de 0.564, y la prueba exacta de Fisher señala un valor p de 0.774. Ambos valores p son

mayores que los niveles comúnmente elegidos. Por lo tanto, los datos concuerdan con la

hipótesis nula de que las proporciones de población son iguales. En otras palabras, la proporción de máquinas fotocopiadoras que necesitaron servicio en el primer año no difiere

dependiendo de la marca. Como gerente de compras, usted debe hallar un criterio diferente para orientar su decisión sobre cuál marca comprar.

Debido a que la aproximación normal es válida, usted puede sacar la misma conclusión del

intervalo de confianza de 95%. Debido a que cero se ubica en el intervalo de confianza de

(0.0957903 a 0.175790) usted puede concluir que los datos coinciden con la hipótesis

nula. Si considera que el intervalo de confianza es demasiado amplio y no provee

información precisa con respecto al valor de p1 p2, es recomendable que recolecte más

datos con el fin de obtener un mejor estimado de la diferencia.

Víctor Hugo Franco García

https://www.facebook.com/victorhugo.francogarcia.7

[email protected]

http://www.slideshare.net/Hugo_Franco/newsfeed

hugofranco.bligoo.com.mx

victor-garcia.bligoo.com.mx