Trabajo de la unidad 3

10
Prueba de Hipótesis Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos. En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable. Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco pasos:

Transcript of Trabajo de la unidad 3

Page 1: Trabajo de la unidad 3

Prueba de Hipótesis

Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos.

En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.

Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco pasos:

Page 2: Trabajo de la unidad 3
Page 3: Trabajo de la unidad 3

Procedimiento sistemático para una

prueba de hipótesis de una muestraPaso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.

Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se

estudian.

La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de

muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis

nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho.

La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia

convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto

al valor especificado del parámetro.

La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si

los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la

hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con

respecto al valor especificado del parámetro.

Paso 2: Seleccionar el nivel de significancia.

Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra

griega α, también es denominada como nivel de riesgo, este termino es mas adecuado ya que se corre el riesgo de

rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que

realiza la prueba.

Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es

decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando

es verdadera en la población.

Page 4: Trabajo de la unidad 3
Page 6: Trabajo de la unidad 3

Las líneas verticales representan 50 construcciones diferentes de intervalos de

confianza para la estimación del valor μ.

En estadística, se llama intervalo de confianza a un par de números entre los

cuales se estima que estará cierto valor desconocido con una determinada

probabilidad de acierto. Formalmente, estos números determinan un intervalo,

que se calcula a partir de datos de una muestra, y el valor desconocido es

un parámetro poblacional. La probabilidad de éxito en la estimación se

representa con 1 - α y se denomina nivel de confianza. En estas

circunstancias, α es el llamado error aleatorio o nivel de significación, esto es,

Una medida de las posibilidades de fallar en la estimación mediante tal

intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma

que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel

de confianza), mientras que para un intervalo más pequeño, que ofrece una

estimación más precisa, aumentan sus posibilidades de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer

la distribución teórica que sigue el parámetro a estimar,θ. Es habitual que el parámetro

presente una distribución normal. También pueden construirse intervalos de confianza

con la desigualdad de Chebyshov.

En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un

parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una

expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de

distribuciónde probabilidad de θ.

Page 7: Trabajo de la unidad 3

Ejemplos

Intervalo de confianza para la media de una población.

De una población de media y desviación típica se pueden

tomar muestras de elementos. Cada una

de estas muestras tiene a su vez una media ( ). Se puede demostrar que la

media de todas las medias muestrales coincide con la media poblacional:

Pero además, si el tamaño de las muestras es lo suficientemente grande, la

distribución de medias muestrales es, prácticamente, una

distribución (o gaussiana) con media μ y una desviación típica dada por la

siguiente expresión:

Esto se representa como sigue:

Si estandarizamos, se sigue que

En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro

del cual caigan un determinado porcentaje de las observaciones, esto es, es

sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1

- α, donde (1 - α)·100 es el porcentaje deseado.

Page 8: Trabajo de la unidad 3

hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 –

α)·100 es el porcentaje deseado.

Se desea obtener una expresión tal que

En esta distribución normal de medias se puede calcular el

intervalo de confianza donde se encontrará la media

poblacional si sólo se conoce una media muestral ( ), con

una confianza determinada. Habitualmente se manejan

valores de confianza del 95 y del 99 por ciento. A este

valor se le llamará (debido a que es el error que se

cometerá, un término opuesto).

Para ello se necesita calcular el punto —o, mejor dicho,

su versión estandarizada o valor crítico— junto con su

"opuesto en la distribución" . Estos puntos delimitan la

probabilidad para el intervalo, como se muestra en la

siguiente imagen:

Page 10: Trabajo de la unidad 3

Dicho punto es el número tal que:

Y en la versión estandarizada se cumple que:

Así Haciendo operaciones es posible despejar para

obtener el intervalo:

De lo cual se obtendrá el intervalo de confianza:

Obsérvese que el intervalo de confianza viene dado por la

Media muestral el producto del valor crítico por

el error estándar.

Si no se conoce y n es grande (habitualmente se

toma n ≥ 30):

donde s es la desviación típica de una muestra.

Aproximaciones para el valor para los niveles de

confianza estándar son 1,96 para y 2,576 para

Intervalo de confianza para una proporción.

El intervalo de confianza para estimar una proporción p, conocida una proporción

muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es: