ESTIMACION DE PARAMETROS PUNTUALES

25
ESTIMACION DE PARAMETROS, PUNTUALES, POR INTERVALOS O POR CONTRASTE DE HIPOTESIS La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos. Muestreo probabilístico Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de muestreo: Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemático Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra. Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4,

description

ESTADISTICA APLICADA

Transcript of ESTIMACION DE PARAMETROS PUNTUALES

ESTIMACION DE PARAMETROS, PUNTUALES, POR INTERVALOS O POR CONTRASTE DE HIPOTESISLa Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.Muestreo probabilsticoConsiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo:Muestreo aleatorio simplePara obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra.Muestreo aleatorio sistemticoSe elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra.Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes elementos de la muestra.2, 6, 10, 14,..., 98Muestreo aleatorio estratificadoSe divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato.En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin.Si consideremos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin, ...) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral.

Teorema central del lmiteSi una poblacin tiene media y desviacin tpica , y tomamos muestras de tamao n (n>30, cualquier tamao si la poblacin es "normal"), las medias de estas muestras siguen aproximadamente la distribucin:

Estimacin de parmetrosEs el procedimiento utilizado para conocer las caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra.Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de un parmetro de la poblacin; pero tambin necesitamos precisar un:Intervalo de confianzaSe llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico.Nivel de confianzaProbabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza.El nivel de confianza (p) se designa mediante 1 .Error de estimacin admisible Que estar relacionado con el radio del intervalo de confianza.

Estimacin de la media de una poblacinEl intervalo de confianza, para la media de una poblacin, con un nivel de confianza de 1 , siendo x la media de una muestra de tamao n y la desviacin tpica de la poblacin, es:

El error mximo de estimacin es:

Cuanto mayor sea el tamao de la muestra, n, menor es el error.Cuanto mayor sea el nivel de confianza, 1-, mayor es el error.Tamao de la muestra

Si aumentamos el nivel de confianza, aumenta el tamao de la muestra.Si disminuimos el error, tenemos que aumentar el tamao de la muestra.

EJEMPLO No 1El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviacin tpica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos.1. Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.

2. Indica el tamao muestral necesario para estimar dicho tiempo medio con un el error de 0,5 minutos y un nivel de confianza del 95%.

n 4

Estimacin de una proporcinSi en una poblacin, una determinada caracterstica se presenta en una proporcin p, la proporcin p' , de individuos con dicha caracterstica en las muestras de tamao n, se distribuirn segn:

Intervalo de confianza para una proporcin

El error mximo de estimacin es:

EJEMPLO No 2En una fbrica de componentes electrnicos, la proporcin de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analiz una muestra aleatoria de 500 componentes, encontrndose que 90 de ellos eran defectuosos. Qu nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido variaciones?p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18E = 0.2 - 0.18 = 0.02

P (1 - z/2 k

2. A partir de un nivel de confianza 1 o el de significacin . Determinar:El valor z/2 (bilaterales), o bien z (unilaterales)La zona de aceptacin del parmetro muestral (x o p').3. Calcular: x o p', a partir de la muestra.4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis con un nivel de significacin . Si no, se rechazaContraste bilateralSe presenta cuando la hiptesis nula es del tipo H0: = k (o bien H0: p = k) y la hiptesis alternativa, por tanto, es del tipo H1: k (o bien H1: p k).

El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media.La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad para x o p', es decir:

o bien:

EJEMPLO No 3Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%? 1. Enunciamos las hiptesis nula y alternativa:H0 : = 6 La nota media no ha variado.H1 : 6 La nota media ha variado.2. Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z/2 = 1.96.Determinamos el intervalo de confianza para la media:(6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78)3. Verificacin. Valor obtenido de la media de la muestra:5,6 .4. DecisinAceptamos la hiptesis nula H0, con un nivel de significacin del 5%.

Contraste unilateralCaso 1 La hiptesis nula es del tipo H0: k (o bien H0: p k). La hiptesis alternativa, por tanto, es del tipo H1: < k (o bien H1: p < k).Valores crticos1 z

0.900.101.28

0.950.051.645

0.990.012.33

El nivel de significacin se concentra en una parte o cola. La regin de aceptacin en este caso ser:

o bien:

EJEMPLO No 4Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar con un nivel de significacin del 1%, si se puede admitir el pronstico.1. Enunciamos las hiptesis nula y alternativa:H0 : 0.40 La abstencin ser como mnimo del 40%.H1 : < 0.40 La abstencin ser como mximo del 40%; 2.Zona de aceptacin Para = 0.01, le corresponde un valor crtico: z = 2.33.Determinamos el intervalo de confianza para la media:

3. Verificacin.

4. DecisinAceptamos la hiptesis nula H0. Podemos afirmar, con un nivel de significacin del 1%, que la abstencin ser como mnimo del 40%.

Caso 2La hiptesis nula es del tipo H0: k (o bien H0: p k). La hiptesis alternativa, por tanto, es del tipo H1: > k (o bien H1: p > k).

El nivel de significacin se concentra en la otra parte o cola. La regin de aceptacin en este caso ser:

o bien:

Un informe indica que el precio medio del billete de avin entre Canarias y Madrid es, como mximo, de 120 con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y se obtiene que la media de los precios de sus billetes es de 128 . Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin de partida? 1. Enunciamos las hiptesis nula y alternativa:H0 : 120 H1 : > 120 2.Zona de aceptacin Para = 0.1, le corresponde un valor crtico: z = 1.28 .Determinamos el intervalo de confianza:

3. Verificacin. Valor obtenido de la media de la muestra: 128 .4. DecisinNo aceptamos la hiptesis nula H0. Con un nivel de significacin del 10%. Errores de tipo I y tipo IIError de tipo I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se rechaza.Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste se acepta.

H0VerdaderaFalsa

AceptarDecisin correcta

Probabilidad = 1 Decisin incorrecta:

ERROR DE TIPO II

RechazarERROR DE TIPO I

Probabilidad = Decisin correcta

La probabilidad de cometer Error de tipo I es el nivel de significacin.La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace tanto menor cuanto mayor sea n.

EjerciciosEjercicio 1En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan ms a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. 1. Explicar qu procedimiento de seleccin sera ms adecuado utilizar: muestreo con o sin reposicin. Por qu? 2. Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500 nios, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Determinar el tamao muestral correspondiente a cada estrato.Ejercicio 2Sea la poblacin de elementos: {22,24, 26}.1. Escriba todas las muestras posibles de tamao dos, escogidas mediante muestreo aleatorio simple. 2. Calcule la varianza de la poblacin. 3. Calcule la varianza de las medias muestrales. Ejercicio 3La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

Ejercicio 4Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y media desconocida: 1. Cul es la distribucin de la media muestral?2. Determine el intervalo de confianza, al 95%, para la media poblacional. Ejercicio 5La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribucin normal con varianza 2 = 0,16 m2. 1. Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la poblacin. 2. Cul sera el mnimo tamao muestral necesario para que pueda decirse que la verdadera media de las estaturas est a menos de 2 cm de la media muestral, con un nivel de confianza del 90%? Ejercicio 6Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley normal, con desviacin tpica 900 . En un estudio estadstico de las ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 y 5 839 .1. Cul ha sido la media de las ventas en estos nueve meses? 2. Cul es el nivel de confianza para este intervalo? Ejercicio 7Se desea estimar la proporcin, p, de individuos daltnicos de una poblacin a travs del porcentaje observado en una muestra aleatoria de individuos, de tamao n.1. Si el porcentaje de individuos daltnicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimacin sea inferior al 3,1%. 2. Si el tamao de la muestra es de 64 individuos, y el porcentaje de individuos daltnicos en la muestra es del 35%, determina, usando un nivel de significacin del 1%, el correspondiente intervalo de confianza para la proporcin de daltnicos de la poblacin. Ejercicio 8En una poblacin una variable aleatoria sigue una ley normal de media desconocida y desviacin tpica 2.1. Observada una muestra de tamao 400, tomada al azar, se ha obtenido una media muestra al igual a 50. Calcule un intervalo, con el 97 % de confianza, para la media de la poblacin. 2. Con el mismo nivel de confianza, qu tamao mnimo debe tener la muestra para qu la amplitud del intervalo que se obtenga sea, como mximo, 1? Ejercicio 9Una marca de nueces afirma que, como mximo, el 6% de las nueces estn vacas. Se eligieron 300 nueces al azar y se detectaron 21 vacas.1. Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la marca? 2. Si se mantiene el porcentaje muestral de nueces que estn vacas y 1- = 0.95, qu tamao muestral se necesitara para estimar la proporcin de nueces con un error menor del 1% por ciento? Ejercicio 10La duracin de las bombillas de 100 W que fabrica una empresa sigue una distribucin normal con una desviacin tpica de 120 horas de duracin. Su vida media est garantizada durante un mnimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, despus de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significacin de 0,01, habra que rechazar el lote por no cumplir la garanta? Ejercicio 11En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en el departamento de atencin al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. 1. Qu tipo de muestreo deberamos utilizar para la seleccin de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados? 2. Qu nmero de trabajadores tendramos que seleccionar en cada departamento atendiendo a un criterio de proporcionalidad? Ejercicio 12La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de 2g/dl.Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media poblacional de hemoglobina en sangre est entre 13 y 15 g/dl. La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de 2g/dl.Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media poblacional de hemoglobina en sangre est entre 13 y 15 g/dl.

Ejercicio 13Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas por este mtodo y esta muestra tendr una duracin media de 2320 horas. Se puede aceptarr la hiptesis de validez del nuevo proceso de fabricacin con un riesgo igual o menor al 5%? Ejercicio 14La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de 2g/dl.Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media poblacional de hemoglobina en sangre est entre 13 y 15 g/dl.

3Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas por este mtodo y esta muestra tendr una duracin media de 2320 horas. Se puede aceptarr la hiptesis de validez del nuevo proceso de fabricacin con un riesgo igual o menor al 5%? 1 Enunciamos las hiptesis nula y alternativa: H0 : = 2400 H1 : 2400 2Zona de aceptacin = 0.05 z = 1.96. Determinamos el intervalo de confianza para la media:

3Verificacin. Valor obtenido de la media de la muestra: 2320 . 4Decisin Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin. Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media 300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviacin tpica: Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significacin del 1%? Ejercicio 15La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de 2g/dl.Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media poblacional de hemoglobina en sangre est entre 13 y 15 g/dl.

3Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas por este mtodo y esta muestra tendr una duracin media de 2320 horas. Se puede aceptarr la hiptesis de validez del nuevo proceso de fabricacin con un riesgo igual o menor al 5%? 1 Enunciamos las hiptesis nula y alternativa: H0 : = 2400 H1 : 2400 2Zona de aceptacin = 0.05 z = 1.96. Determinamos el intervalo de confianza para la media:

3Verificacin. Valor obtenido de la media de la muestra: 2320 . 4Decisin Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

4El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin. Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media 300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviacin tpica: Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significacin del 1%? 1 Enunciamos las hiptesis nula y alternativa: H0 : 300 H1 : < 300 2Zona de aceptacin = 0.01 z = 2.33. Determinamos el intervalo de confianza:

3Verificacin. = 2904Decisin Rechazamos la hiptesis nula H0. Con un nivel de significacin del 1%.

Se cree que el nivel medio de protombina en una poblacin normal es de 20 mg/100 ml de plasma con una desviacin tpica de 4 miligramos/100 ml. Para comprobarlo, se toma una muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la hiptesis, con un nivel de significacin del 5%?