Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se...

39
Diseño de experimentos - prueba de hipótesis http://www.academia.utp.ac.pa/humberto-alvarez/diseno-de- experimentos-y-regresion

Transcript of Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se...

Page 1: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Diseño de experimentos -prueba de hipótesis

http://www.academia.utp.ac.pa/humberto-alvarez/diseno-de-experimentos-y-regresion

Page 2: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Inferencia estadística

◼ Conjunto de métodos y técnicas que permiten inducir,a partir de la información empírica proporcionada poruna muestra, cual es el comportamiento de unadeterminada población con un riesgo de errormedible en términos de probabilidad.

◼ Los métodos paramétricos de la inferencia estadísticase pueden dividir, básicamente, en dos: métodos deestimación de parámetros y métodos de contraste dehipótesis.

◼ Ambos métodos se basan en el conocimiento teóricode la distribución de probabilidad del estadísticomuestral que se utiliza como estimador de unparámetro.

Page 3: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Análisis estadísticos típicos

Page 4: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Prueba de hipótesis◼ Tienen como objetivo comprobar si determinado

supuesto referido a un parámetro poblacional, o aparámetros análogos de dos o más poblaciones, escompatible con la evidencia empírica contenida en lamuestra.

◼ Los supuestos que se establecen respecto a losparámetros se llaman hipótesis paramétricas.

◼ El contraste se basa en establecer un criterio de decisión.

◼ Depende de la naturaleza de la población, de ladistribución de probabilidad del estimador de dichoparámetro y del control que se desea fijar a priori sobrela probabilidad de rechazar la hipótesis contrastada en elcaso de ser ésta cierta.

Page 5: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Planteamiento de una hipótesis estadística

◼ En general siempre se definen dos tipos de hipótesis:

◼ Hipótesis nula H0,e Hipótesis alternativa H1.

◼ El nombre de hipótesis nula se deriva del hecho de seplantea como una igualdad, lo cual facilita el teneruna distribución de probabilidad de referenciaespecífica.

◼ En general, la estrategia a seguir para probar unahipótesis es suponer que la hipótesis nula esverdadera, y que en caso de ser rechazada por laevidencia que aportan los datos, se estará H1.

◼ La afirmación que se desea probar se aceptará comocierta, sólo en caso de rechazar la hipótesis nula.

Page 6: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

¿De dónde nace H0?

◼ Experiencia, pruebas pasadas o conocimiento delproceso. Interés: averiguar si ha cambiado el parámetro

◼ Alguna teoría o modelo sobre el funcionamiento delproceso. Interés: Verificar la validez de dicha teoría

◼ Especificaciones de diseño, obligaciones contractuales,normas a cumplir o solicitudes del cliente. Interés:probar el cumplimiento o incumplimiento de lasespecificaciones.

Page 7: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Hipótesis de contraste◼ Una hipótesis estadística es un proposición sobre los parámetros

de una población o sobre la distribución de probabilidad de unavariable aleatoria

◼ Una prueba de hipótesis es una herramienta de análisis dedatos que puede en general formar parte de un experimentocomparativo más completo.

◼ En todo contraste intervienen dos hipótesis:

◼ La hipótesis nula (H0) es aquella que recoge el supuesto de que elparámetro toma un valor determinado y es la que soporta la cargade la prueba.

◼ La proposición contraria a la hipótesis nula recibe el nombre dehipótesis alternativa (H1) y suele presentar un cierto grado deindefinición.

◼ Si la hipótesis alternativa se formula simplemente como 'lahipótesis nula no es cierta', el contraste es bilateral o a dos colas;

◼ Por el contrario cuando se indica el sentido de la diferencia, elcontraste es unilateral o a una sola cola.

Page 8: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Rechazar o no una hipótesis

◼ La decisión de rechazar la hipótesis nula, que enprincipio se considera cierta, está en función de quesea o no compatible con la evidencia empíricacontenida en la muestra.

◼ El contraste clásico permite controlar a priori laprobabilidad de cometer el error de rechazar lahipótesis nula siendo ésta cierta.

◼ Dicha probabilidad se llama nivel de significación delcontraste () y se acostumbra a fijarse en el 1%, 5%o 10%.

Page 9: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Rechazar o no una hipótesis

◼ Cuando se realiza un y no se fija el nivel designificación deseado, el programa calcula el valor-po significación asintótica.

◼ Esta es la probabilidad de que el estadístico deprueba tome un valor igual o superior al muestralbajo el supuesto de que la hipótesis nula es cierta.

◼ Por tanto, si el valor-p es menor o igual que el nivelde significación deseado se rechazará Ho.

◼ Un valor-p próximo a cero indica que se rechazará laHo para cualquier nivel de significación.

Page 10: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Ejemplo:◼ Se tiene interés en la rapidez de combustión de un agente propulsor

para los sistemas de salida de emergencia en aeronaves. (esta rapidezes una variable aleatoria con alguna distribución de probabilidad).

◼ Especialmente interesa la rapidez de combustión promedio (que es unparámetro () de dicha distribución). De manera más específica,interesa decidir si esta rapidez promedio es o no 50 cm/seg.

◼ El planteamiento formal de la situación se realiza en términos de unaHipótesis Nula (que es la proposición que se quiere poner a prueba) yuna Hipótesis Alternativa, la cual se aceptará si se rechaza la hipótesisnula:

◼ Hipótesis Nula: H0: = 50 cm/seg

◼ Hipótesis Alternativa: H1: 50 cm/seg

◼ En el ejemplo se tiene una Hipótesis Alternativa Bilateral, ya que se verifica para valores de a ambos lados de 50 cm/seg.

◼ ¿Cómo se puede convertir la hipótesis en unilateral?

Page 11: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

¿Se acepta o no H0?

Page 12: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

El valor de P◼ Las pruebas de hipótesis se denominan de significancia pues los valores de p

por sobre o debajo del límite se denominan como significativos, altamentesignificativos o no significativos.

◼ La p no es necesariamente efectiva como guía de la decisión científica, pues elvalor de p no tiene que ver con la magnitud de la diferencia que se estudia

◼ La p no es confiable porque depende absolutamente del tamaño de la muestray esto la hace especialmente peligrosa en trabajos epidemiológicos.

◼ Es necesario tener claro que se rechaza la hipótesis nula porque es pocoprobable que sea verdadera con los datos obtenidos.

◼ En ningún caso se está probando la hipótesis alternativa de que sí hay efecto.Sólo se dice que la probabilidad de que el efecto observado no existarealmente es tan baja que se acepta que lo más probable es queefectivamente exista.

◼ A la inversa, el rechazo de la hipótesis nula jamás implica la comprobación dela igualdad.

◼ La distinción podría parecer sutil semánticamente pero es muy importante enla interpretación de los resultados.

Page 13: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Proceso de contraste:

◼ Paso 1:

◼ Expresar el interrogante de la investigación como hipótesis estadística:

◼ H0: “no hay diferencia”

◼ H1: “Hay diferencia”

◼ Paso 2:

◼ Decidir sobre la prueba estadística adecuada según la población y el tipo de variable.

◼ Elegir la muestra

◼ Paso 3:

◼ Seleccionar el grado de significancia (probabilidad de rechazar H0 siendo esta correcta o error Tipo I).

◼ Paso 4:

◼ Realizar los cálculos y exponer conclusiones.

Page 14: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Criterios equivalente de rechazo o aceptación

◼ Existen tres criterios equivalentes para decidir cuándo rechazarla hipótesis nula y, en consecuencia, aceptar la hipótesisalternativa.

◼ Estadístico de prueba frente a valor crítico: rechazar H0 siel estadístico de prueba cae en la región de rechazo que estádelimitada por el valor crítico.

◼ Significancia observada frente a significancia predefinida: la significancia predefinida se denota por es el riesgo máximo que se está dispuesto a correr por rechazar H0

indebidamente (error tipo I). La significancia observada o calculada, también conocida como “valor-p”, es el área bajo la distribución de referencia más allá del valor del estadístico de prueba.

◼ Intervalo de confianza: se rechaza H0 si el valor del parámetro declarado en la hipótesis nula se encuentra fuera del

intervalo de confianza para el mismo parámetro.

Page 15: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

◼ Si p es menor que , rechazar H0 y aceptar la alternativa; en casocontrario, se acepta la hipótesis nula.

◼ El conjunto de valores que resultarían en el rechazo de H0 – calculadosconociendo la prueba usada, y el número de observaciones – seconoce con el nombre de región crítica.

◼ En otras palabras, se rechaza la H0 si el estadístico cae en la regióncrítica.

◼ Elegir la prueba estadística apropiada de acuerdo al diseñoexperimental, el tipo de datos y el número de grupos que se comparan.

◼ La cifra que resulta de usar la prueba en los datos recolectados seconoce como el estadístico del test en cuestión: z; estadístico t o deStudent, la r de Pearson, F del análisis de varianza, entre otros.

Tomado de Gutiérrez Pulido y De La Vara Salazar (2008)

Page 16: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan
Page 17: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Estimación de parámetros

◼ Consiste en asignar un valor concreto al parámetro oparámetros que caracterizan la distribución deprobabilidad de la población.

◼ Un error de estimación es la diferencia entre laestimación y el verdadero valor del parámetro.

◼ Para valorar el grado de precisión asociado con unaestimación puntual se parte de dicha estimación paraconstruir un intervalo de confianza.

◼ La amplitud de éste constituye una medida del grado deprecisión con el que se estima el parámetro.

Page 18: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Estimación puntual y por intervalo

Page 19: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

◼ Estimación por intervalo:

◼ Toma en cuenta la variación o error aleatorio.

◼ Se hace a través de un intervalo de confianza queindica el rango donde puede estar un parámetrodado.

◼ Un intervalo al (1-)% para un parámetrodesconocido , estará definido por dos estadísticosL y U de tal manera de que la probabilidad de que esté dentro del intervalo L – U está dada por:

P(L ≤ ≤ U) = 1 -

◼ La longitud del intervalo de confianza es unamedida de la precisión de la estimación, por loque se desea que este sea pequeño y con un altonivel de confianza.

Page 20: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Intervalo de confianza para una media:◼ Sea X1, X2, …, Xn una muestra aleatoria de tamaño n, de una

población normalmente distribuida con media y varianza 2, el intervalo de confianza con un nivel 1-, estará dado por:

ó

Donde t sigue una distribución T de Student, con n-1 grados de libertad, tal que:

El error estándar está dado por

Page 21: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Ejemplo:

◼ Se tiene un proceso donde el producto debe tener unespesor de 1.20mm con una tolerancia de ±0.1. Asíel producto deberá tener un rango de grosoraceptado de entre 1.10 y 1.30 mm.

◼ Para evaluar si se estaba dentro del rango de diseño,se hace un muestreo de 125 partes y se obtiene lainformación mostrada a continuación.

◼ Tamaño de la muestra n 125

◼ Media muestral 1.1773 mm

◼ Desviación estándar muestral 0.0244

Page 22: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Utilizando Infostat

Page 23: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan
Page 24: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Excel

Page 25: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Intervalo para la varianza

◼ Es posible definir intervalos de confianza parala varianza 2.

◼ La distribución de referencia es una ji-cuadrada (chi-cuadrada) con n – 1 grados delibertad o 2

/2, n-1, tal que:

Page 26: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Prueba t para la media◼ Cuando se estudia el comportamiento de un proceso o un

fenómeno suelen interesar su media y varianza (o desviaciónestándar).

◼ En particular, al estudiar la media , es de interés preguntarse siésta es igual, mayor o menor a cierto valor 0, donde 0 es unnúmero conocido.

◼ En general, para estos casos, tanto el valor de la media y elvalor de la desviación estándar son desconocidas.

◼ Sea X una variable aleatoria de media y desviación estándar ,ambas desconocidas, se quiere probar la hipótesis:

Page 27: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

◼ Para probar esta hipótesis se toma una muestra aleatoria de tamaño nde los posibles valores de la variable X y se calcula el estadístico deprueba:

donde S es la desviación estándar de la muestra y la media muestral.

◼ Bajo el supuesto de que H0 es verdadera, este estadístico se distribuye Tde Student con n – 1 grados de libertad.

◼ Se rechaza H0 si el valor absoluto del estadístico de prueba es mayorque el valor crítico de la distribución, es decir, se rechaza H0 si |t0 | >/2.

◼ Cuando ≤0 o ≥ , la hipótesis alternativa es unilateral y se rechazaráH0 cuando t0 ≤ –t, o cuando t0 ≥ t, respectivamente.

Page 28: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Ejemplo: peso de sacos de arroz:

◼ Una empresa que compra arroztiene la duda de que el peso de lossacos es el que realmente le estánvendiendo. De acuerdo con elmolino, los sacos tienen una mediade 50.1 kg, con una desviaciónestándar de 0.75 kg.

◼ A fin de comprobar esto, seleccionauna muestra de 19 sacos y lospesa, obteniendo la siguienteinformación que se muestra.

◼ Plantea las siguientes hipótesis acontrastar:

◼ H0: µ=50.1

◼ H1: µ<50.1

48.44

47.85

49.37

48.92

48.34

49.07

49.99

49.45

49.93

47.80

50.34

49.42

48.05

49.72

48.68

48.96

48.55

49.15

48.76

Page 29: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

No se acepta H0

Page 30: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Hipótesis para dos medias independientes: comparación para dos tratamientos.

◼ Se presenta al comparar la media de dos procesos o dos tratamientos independientes.

◼ Esta suposición se justifica por la manera en que se obtienen losdatos; es decir, a la muestra a la que se le aplica el tratamiento 1 esindependiente de la muestra para el tratamiento 2, y los datos seobtienen en orden completamente al azar.

◼ Suponga que interesa comparar dos tratamientos A y B, que realizan la misma acción. Para ello se obtendrá una muestra aleatoria de observaciones de cada Tratamiento.

◼ Suponga que los datos a observar en A son YAl, YA2, …, YAn y los datos de B son YBl, YB2, …,YBn.

Tratamientos

Prueba A B

1 Yal YBl

2 YA2 YB2

… … …

n YAn YBn

.

.

.

.

.

.

.

.

.

Page 31: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

◼ Sean dos tratamientos con medias y varianzas µx; 2x y µy;

2y,

respectivamente.

◼ Es posible plantear las siguientes hipótesis:

◼ Reescribiendo las mismas:

◼ Si cada proceso sigue una distribución normal y sonindependientes entre ellos, el estadístico de prueba adecuadopara probar la hipótesis de igualdad de medias está dado por,

◼ Se rechaza H0 si |t0| > t/2

Page 32: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Se tienen dos tratamientos y se quiere analizar si ambos son iguales en términos de peso, en mg, obtenido. Se tiene la siguiente información

X Y

4.71 4.31

5.14 4.74

4.61 4.27

3.96 3.75

4.69 4.33

4.02 3.81

4.89 4.53

4.56 4.41

4.91 4.62

4.63 4.34

4.87 4.78

4.92 4.71

4.99 4.75

¿Existen diferencias entre los tratamientos?

Page 33: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan
Page 34: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Comparando muestras pareadas◼ Orden completamente al azar es aquel en el que las

unidades se asignan de manera aleatoria a lostratamientos y las pruebas experimentales se hacenen orden aleatorio

◼ Muestras pareadas son aquellas en las que los datosde ambos tratamientos se obtienen por pares, demanera que éstos tienen algo en común y no sonindependientes.

◼ Ejemplos:◼ A los mismos pacientes se les aplican dos medicamentos (tratamientos)

para el dolor en distintas ocasiones; los tratamientos a comparar son losdos medicamentos.

◼ A las mismas piezas se les hace una prueba de dureza con distintosinstrumentos; aquí se quieren comparar los instrumentos.

Page 35: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

La hipótesis planteada◼ La comparación entre ambos tratamientos puede

hacerse bajo la siguiente hipótesis:

◼ H0: µ1=µ2

◼ H1: µ1≠µ2

◼ Debido a su dependencia es posible definir µD= µ1- µ2,y

◼ H0: µD = 0

◼ H1: µD≠ 0

◼ De esta manera, el problema de

◼ comparar las medias de dos poblaciones se convierteen el problema de comparar la media de una poblacióncon una constante cuando µ0=0.

Page 36: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Ejemplo:

◼ Se quieren probar dos básculas sobre la misma muestra para ver si los mismas son similares. Se tienen los siguientes datos:

Page 37: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan
Page 38: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Prueba de hipótesis para un parámetro

Tomado de Gutiérrez Pulido y De La Vara Salazar (2008)

Page 39: Diseño de experimentos - prueba de hipótesis · El valor de P Las pruebas de hipótesis se denominan de significancia pues los valores de p por sobre o debajo del límite se denominan

Prueba de hipótesis para dos parámetrosTomado de Gutiérrez Pulido y De La Vara Salazar (2008)