Intervalos de confianza
Click here to load reader
Transcript of Intervalos de confianza
Intervalos de confianza
Se llama intervalo de confianza a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza. Generalmente se construyen intervalos con confianza 1-=95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o sigma =1%.Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es normal y es conocido.
ESTIMACIÓN DE INTERVALO.-
Una estimación de Intervalo, describe un intervalo de valores dentro del cual es posible que este un parámetro de población.
Dentro de sus características encontramos: ¯ Dentro de las estimaciones de Intervalo, se maneja un
Concepto adicional, que implica la incertidumbre que acompañara dicha estimación. Una afirmación acerca del intervalo dentro del cual es probable que este la media de población desconocida. ¯ Para proporcionar dicha afirmación, se necesita encontrar el error estándar de la media. Para explicarlo mejor nos apoyaremos en el siguiente ejemplo:
Suponga que el director de investigaciones de mercado de una fábrica de refacciones automotrices necesita hacer una estimación de la vida promedio de las baterías para automóvil que su compañía produce. Se selecciona una muestra aleatoria de 200 baterías, se registro en nombre de los propietarios de los automóviles y su dirección, de la misma manera se entrevisto a estas personas con respecto a la duración de la batería de su automóvil. Después de realizar la aplicación de la formula de la media de la muestra, tenemos como resultado: 36 meses de vida promedio. Si se utiliza la estimación puntual de la media de la muestra como el mejor estimador de la media de la población µ se informaría que la vida media de las baterías de la empresa es de 36 meses. Pero supongamos que el director también conocer acerca de la incertidumbre que probablemente acompañara a la estimación, es decir una afirmación acerca del intervalo dentro de lo cual es posible que este la media de la población desconocida.
Eso se determina calculando el error estándar De la media. Para esto se utiliza la formula de cálculo de error estándar de la media: Supongamos que previamente se hizo el cálculo de la desviación estándar de las 200 baterías, y se ha determinado que es de 10 meses. Utilizando dicho dato y la formula que indicamos en el recuadro anterior. Resultaría así. Ahora se puede concluir que la estimación de la vida útil de un las baterías de la compañía es de 36 meses, y el error estándar que acompaña a dicha estimación es .707. En otras palabras, la vida útil real para todas las baterías puede estar en alguna parte de esta estimación de intervalo comprendida entre 35.293 y 36.707 meses.
NIVEL DE CONFIANZA.-
En la estadística la probabilidad que asociamos o relacionamos con una estimación de intervalo es conocida como Nivel de Confianza.
Que tanta confianza tenemos que la estimación que hicimos de un intervalo, incluya la mayor parte de la muestra, es decir los casos analizados.
LIMITES DE CONFIANZA.-
A menudo el intervalo de confianza se expresa en términos de errores estándar, más que con valores numéricos. De la siguiente forma.
x ± 1.64 σ x en la que: x + 1.64 σ x = limite superior del intervalo. x - 1.64 σ x = limite inferior del intervalo. A estos límites se les conoce como limites de Confianza del intervalo de Confianza.
Prueba de Hipótesis Una prueba de hipótesis consiste en contrastar dos hipótesis
estadísticas. Tal contraste involucra la toma de decisión
acerca de las hipótesis. La decisión consiste en rechazar o no
una hipótesis en favor de la otra. Una hipótesis estadística se
denota por “H” y son dos:
- Ho: hipótesis nula
- H1: hipótesis alternativa
La hipótesis nula “Ho”
Se refiere siempre a un valor especifico del parámetro de la
población, no a una estadística de muestra. La letra H
significa hipótesis y el subíndice cero no hay diferencia. Por lo
general hay un “no” en la hipótesis nula que indica que “no
hay cambio” Podemos rechazar o aceptar Ho.
Por lo tanto la hipótesis nula es una afirmación que no se
rechaza a menos que los datos muestrales proporcionen
evidencia convincente de que es falsa. El planteamiento de la
hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro.
- La hipótesis alternativa “H1”
Es cualquier hipótesis que difiera de la hipótesis nula. Es una
afirmación que se acepta si los datos muestrales
proporcionan evidencia suficiente de que la hipótesis nula es
falsa. Se le conoce también como la hipótesis de
investigación. El planteamiento de la hipótesis alternativa
nunca contiene un signo de igualdad con respecto al valor
especificado del parámetro.
Nivel de significancia
Probabilidad de rechazar la hipótesis nula cuando es
verdadera. Se le denota mediante la letra griega α, también
es denominada como nivel de riesgo, este término es mas
adecuado ya que se corre el riesgo de rechazar la hipótesis
nula, cuando en realidad es verdadera.
La distribución de muestreo de la estadística de prueba se
divide en dos regiones, una región de rechazo (conocida
como región crítica) y una región de no rechazo
(aceptación). Si la estadística de prueba cae dentro de la
región de aceptación, no se puede rechazar la hipótesis nula.
Estos valores no son tan improbables de presentarse si la
hipótesis nula es falsa. El valor crítico separa la región de no
rechazo de la de rechazo.
Errores tipo I y II
Error tipo l se presenta si la hipótesis nula Ho es rechazada
cuando es verdadera y debía ser aceptada. La probabilidad
de cometer un error tipo I se denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si
la hipótesis nula es aceptada cuando de hecho es falsa y
debía ser rechazada.
3. Estadístico de prueba
Valor determinado a partir de la información muestral, que se
utiliza para determinar si se rechaza la hipótesis nula., existen
muchos estadísticos de prueba para nuestro caso
utilizaremos los estadísticos z y t. La elección de uno de estos
depende de la cantidad de muestras que se toman, si las
muestras son iguales a 30 o mas se utiliza el estadístico z, en
caso contrario se utiliza el estadístico t.
Tipos de prueba
4. Formular la regla de decisión
Se establece las condiciones específicas en la que se
rechaza la hipótesis nula y las condiciones en que no se
rechaza la hipótesis nula. La región de rechazo define la
ubicación de todos los valores que son tan grandes o tan
pequeños, que la probabilidad de que se presenten bajo la
suposición de que la hipótesis nula es verdadera, es muy
remota
Distribución muestral del valor estadístico z, con prueba de
una cola a la derecha
Valor critico: Es el punto de división entre la región en la que
se rechaza la hipótesis nula y la región en la que no se
rechaza la hipótesis nula.
5. Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el
estadístico de prueba, se compara con el valor crítico y se
toma la decisión de rechazar o no la hipótesis nula. Tenga
presente que en una prueba de hipótesis solo se puede tomar
una de dos decisiones: aceptar o rechazar la hipótesis nula.
Debe subrayarse que siempre existe la posibilidad de
rechazar la hipótesis nula cuando no debería haberse
rechazado (error tipo I ). También existe la posibilidad de que
la hipótesis nula se acepte cuando debería haberse
rechazado