Intervalos de confianza

Intervalos de confianza

Se llama intervalo de confianza a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza. Generalmente se construyen intervalos con confianza 1-=95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o sigma =1%.Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1

http://es.wikipedia.org/wiki/Intervalo_(matem%C3%A1tica)

http://es.wikipedia.org/wiki/Muestra_aleatoria

http://es.wikipedia.org/wiki/Par%C3%A1metro_poblacional

http://es.wikipedia.org/wiki/Error_aleatorio



P(-1.96 < z < 1.96) = 0.95

(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).

Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:

Despejando en la ecuación se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es normal y es conocido.

ESTIMACIÓN DE INTERVALO.-

Una estimación de Intervalo, describe un intervalo de valores dentro del cual es posible que este un parámetro de población.

Dentro de sus características encontramos: ¯ Dentro de las estimaciones de Intervalo, se maneja un

Concepto adicional, que implica la incertidumbre que acompañara dicha estimación. Una afirmación acerca del intervalo dentro del cual es probable que este la media de población desconocida. ¯ Para proporcionar dicha afirmación, se necesita encontrar el error estándar de la media. Para explicarlo mejor nos apoyaremos en el siguiente ejemplo:

Suponga que el director de investigaciones de mercado de una fábrica de refacciones automotrices necesita hacer una estimación de la vida promedio de las baterías para automóvil que su compañía produce. Se selecciona una muestra aleatoria de 200 baterías, se registro en nombre de los propietarios de los automóviles y su dirección, de la misma manera se entrevisto a estas personas con respecto a la duración de la batería de su automóvil. Después de realizar la aplicación de la formula de la media de la muestra, tenemos como resultado: 36 meses de vida promedio. Si se utiliza la estimación puntual de la media de la muestra como el mejor estimador de la media de la población µ se informaría que la vida media de las baterías de la empresa es de 36 meses. Pero supongamos que el director también conocer acerca de la incertidumbre que probablemente acompañara a la estimación, es decir una afirmación acerca del intervalo dentro de lo cual es posible que este la media de la población desconocida.

Eso se determina calculando el error estándar De la media. Para esto se utiliza la formula de cálculo de error estándar de la media: Supongamos que previamente se hizo el cálculo de la desviación estándar de las 200 baterías, y se ha determinado que es de 10 meses. Utilizando dicho dato y la formula que indicamos en el recuadro anterior. Resultaría así. Ahora se puede concluir que la estimación de la vida útil de un las baterías de la compañía es de 36 meses, y el error estándar que acompaña a dicha estimación es .707. En otras palabras, la vida útil real para todas las baterías puede estar en alguna parte de esta estimación de intervalo comprendida entre 35.293 y 36.707 meses.

NIVEL DE CONFIANZA.-

En la estadística la probabilidad que asociamos o relacionamos con una estimación de intervalo es conocida como Nivel de Confianza.

Que tanta confianza tenemos que la estimación que hicimos de un intervalo, incluya la mayor parte de la muestra, es decir los casos analizados.

LIMITES DE CONFIANZA.-

A menudo el intervalo de confianza se expresa en términos de errores estándar, más que con valores numéricos. De la siguiente forma.

x ± 1.64 σ x en la que: x + 1.64 σ x = limite superior del intervalo. x - 1.64 σ x = limite inferior del intervalo. A estos límites se les conoce como limites de Confianza del intervalo de Confianza.

Prueba de Hipótesis Una prueba de hipótesis consiste en contrastar dos hipótesis

estadísticas. Tal contraste involucra la toma de decisión

acerca de las hipótesis. La decisión consiste en rechazar o no

una hipótesis en favor de la otra. Una hipótesis estadística se

denota por “H” y son dos:

- Ho: hipótesis nula

- H1: hipótesis alternativa

La hipótesis nula “Ho”

Se refiere siempre a un valor especifico del parámetro de la

población, no a una estadística de muestra. La letra H

significa hipótesis y el subíndice cero no hay diferencia. Por lo

general hay un “no” en la hipótesis nula que indica que “no

hay cambio” Podemos rechazar o aceptar Ho.

Por lo tanto la hipótesis nula es una afirmación que no se

rechaza a menos que los datos muestrales proporcionen

evidencia convincente de que es falsa. El planteamiento de la

hipótesis nula siempre contiene un signo de igualdad con

respecto al valor especificado del parámetro.

- La hipótesis alternativa “H1”

Es cualquier hipótesis que difiera de la hipótesis nula. Es una

afirmación que se acepta si los datos muestrales

proporcionan evidencia suficiente de que la hipótesis nula es

falsa. Se le conoce también como la hipótesis de

investigación. El planteamiento de la hipótesis alternativa

nunca contiene un signo de igualdad con respecto al valor

especificado del parámetro.

Nivel de significancia

Probabilidad de rechazar la hipótesis nula cuando es

verdadera. Se le denota mediante la letra griega α, también

es denominada como nivel de riesgo, este término es mas

adecuado ya que se corre el riesgo de rechazar la hipótesis

nula, cuando en realidad es verdadera.

La distribución de muestreo de la estadística de prueba se

divide en dos regiones, una región de rechazo (conocida

como región crítica) y una región de no rechazo

(aceptación). Si la estadística de prueba cae dentro de la

región de aceptación, no se puede rechazar la hipótesis nula.

Estos valores no son tan improbables de presentarse si la

hipótesis nula es falsa. El valor crítico separa la región de no

rechazo de la de rechazo.

Errores tipo I y II

Error tipo l se presenta si la hipótesis nula Ho es rechazada

cuando es verdadera y debía ser aceptada. La probabilidad

de cometer un error tipo I se denomina con la letra alfa α

Un error tipo II, se denota con la letra griega β se presenta si

la hipótesis nula es aceptada cuando de hecho es falsa y

debía ser rechazada.

3. Estadístico de prueba

Valor determinado a partir de la información muestral, que se

utiliza para determinar si se rechaza la hipótesis nula., existen

muchos estadísticos de prueba para nuestro caso

utilizaremos los estadísticos z y t. La elección de uno de estos

depende de la cantidad de muestras que se toman, si las

muestras son iguales a 30 o mas se utiliza el estadístico z, en

caso contrario se utiliza el estadístico t.

Tipos de prueba

4. Formular la regla de decisión

Se establece las condiciones específicas en la que se

rechaza la hipótesis nula y las condiciones en que no se

rechaza la hipótesis nula. La región de rechazo define la

ubicación de todos los valores que son tan grandes o tan

pequeños, que la probabilidad de que se presenten bajo la

suposición de que la hipótesis nula es verdadera, es muy

remota

Distribución muestral del valor estadístico z, con prueba de

una cola a la derecha

Valor critico: Es el punto de división entre la región en la que

se rechaza la hipótesis nula y la región en la que no se

rechaza la hipótesis nula.

5. Tomar una decisión.

En este último paso de la prueba de hipótesis, se calcula el

estadístico de prueba, se compara con el valor crítico y se

toma la decisión de rechazar o no la hipótesis nula. Tenga

presente que en una prueba de hipótesis solo se puede tomar

una de dos decisiones: aceptar o rechazar la hipótesis nula.

Debe subrayarse que siempre existe la posibilidad de

rechazar la hipótesis nula cuando no debería haberse

rechazado (error tipo I ). También existe la posibilidad de que

la hipótesis nula se acepte cuando debería haberse

rechazado

Intervalos de confianza

Documents

Transcript of Intervalos de confianza