Trabajo de la unidad 3
-
Upload
alberto-de-avila -
Category
Documents
-
view
854 -
download
1
Transcript of Trabajo de la unidad 3
Prueba de Hipótesis
Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco pasos:
Procedimiento sistemático para una
prueba de hipótesis de una muestraPaso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.
Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se
estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de
muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis
nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia
convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto
al valor especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si
los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la
hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con
respecto al valor especificado del parámetro.
Paso 2: Seleccionar el nivel de significancia.
Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra
griega α, también es denominada como nivel de riesgo, este termino es mas adecuado ya que se corre el riesgo de
rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que
realiza la prueba.
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es
decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando
es verdadera en la población.
Intervalo de confianza
Las líneas verticales representan 50 construcciones diferentes de intervalos de
confianza para la estimación del valor μ.
En estadística, se llama intervalo de confianza a un par de números entre los
cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo,
que se calcula a partir de datos de una muestra, y el valor desconocido es
un parámetro poblacional. La probabilidad de éxito en la estimación se
representa con 1 - α y se denomina nivel de confianza. En estas
circunstancias, α es el llamado error aleatorio o nivel de significación, esto es,
Una medida de las posibilidades de fallar en la estimación mediante tal
intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma
que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel
de confianza), mientras que para un intervalo más pequeño, que ofrece una
estimación más precisa, aumentan sus posibilidades de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer
la distribución teórica que sigue el parámetro a estimar,θ. Es habitual que el parámetro
presente una distribución normal. También pueden construirse intervalos de confianza
con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un
parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una
expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de
distribuciónde probabilidad de θ.
Ejemplos
Intervalo de confianza para la media de una población.
De una población de media y desviación típica se pueden
tomar muestras de elementos. Cada una
de estas muestras tiene a su vez una media ( ). Se puede demostrar que la
media de todas las medias muestrales coincide con la media poblacional:
Pero además, si el tamaño de las muestras es lo suficientemente grande, la
distribución de medias muestrales es, prácticamente, una
distribución (o gaussiana) con media μ y una desviación típica dada por la
siguiente expresión:
Esto se representa como sigue:
Si estandarizamos, se sigue que
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro
del cual caigan un determinado porcentaje de las observaciones, esto es, es
sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1
- α, donde (1 - α)·100 es el porcentaje deseado.
hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 –
α)·100 es el porcentaje deseado.
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el
intervalo de confianza donde se encontrará la media
poblacional si sólo se conoce una media muestral ( ), con
una confianza determinada. Habitualmente se manejan
valores de confianza del 95 y del 99 por ciento. A este
valor se le llamará (debido a que es el error que se
cometerá, un término opuesto).
Para ello se necesita calcular el punto —o, mejor dicho,
su versión estandarizada o valor crítico— junto con su
"opuesto en la distribución" . Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la
siguiente imagen:
Dicho punto es el número tal que:
Y en la versión estandarizada se cumple que:
Así Haciendo operaciones es posible despejar para
obtener el intervalo:
De lo cual se obtendrá el intervalo de confianza:
Obsérvese que el intervalo de confianza viene dado por la
Media muestral el producto del valor crítico por
el error estándar.
Si no se conoce y n es grande (habitualmente se
toma n ≥ 30):
donde s es la desviación típica de una muestra.
Aproximaciones para el valor para los niveles de
confianza estándar son 1,96 para y 2,576 para
Intervalo de confianza para una proporción.
El intervalo de confianza para estimar una proporción p, conocida una proporción
muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es: