39356922-Estadistica-inferencial
-
Upload
karla-trejo -
Category
Documents
-
view
217 -
download
0
Transcript of 39356922-Estadistica-inferencial
-
8/3/2019 39356922-Estadistica-inferencial
1/14
1
INTRODUCCIN.
El material sobre teora de la probabilidad constituye la base de la inferencia estadstica,
que tiene que ver con el uso de los conceptos de la probabilidad para tratar con la toma dedecisiones en condiciones de incertidumbre. La inferencia estadstica est basada en la
estimacin y en la prueba de hiptesis.
Matemticamente, podemos describir muestras y poblaciones al emplear mediciones como
la media, la mediana, la varianza y la desviacin estndar. Cuando estos trminos describenlas caractersticas de una poblacin, se llaman parmetros. Cuando describen las
caractersticas de la muestra, se llaman estadsticos. Una estadstica es una caracterstica deuna muestra y un parmetro es una caracterstica de la poblacin.
La teora de muestreo puede emplearse para obtener informacin acerca de muestras
obtenidas aleatoriamente de una poblacin conocida. Sin embargo, desde un punto de vistaprctico, suele ser ms importante y capaz de inferir informacin acerca de una poblacin a
partir de muestras de ellas.
Un problema importante de la inferencia estadstica es la estimacin de parmetros
poblacionales o simplemente parmetros a partir de los estadsticos mustralescorrespondientes o estadsticos, en este breve resumen trataremos de dar un panorama
general de lo que es una estimacin de parmetros abarcando desde conceptos hasta losprincipales modelos matemticos.
-
8/3/2019 39356922-Estadistica-inferencial
2/14
2
UNIDAD 3. ESTIMACIN DE PARMETROS.
1.- LOS DOS PROBLEMAS QUE ATIENDE LA ESTADSTICA INFERENCIAL
Los dos tipos de problemas que resuelven las tcnicas estadsticas son: estimacin y
contraste de hiptesis. En ambos casos se trata de generalizar la informacin obtenida enuna muestra a una poblacin. Estas tcnicas exigen que la muestra sea aleatoria. En laprctica rara vez se dispone de muestras aleatorias, por la tanto la situacin habitual es la
que se esquematiza en la figura
Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin diana, aparece
la denominada poblacin de muestreo: poblacin (la mayor parte de las veces no definidacon precisin) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la
generalizacin est amenazada por dos posibles tipos de errores: error aleatorio que es elque las tcnicas estadsticas permiten cuantificar y crticamente dependiente del tamao
muestral, pero tambin de la variabilidad de la variable a estudiar y el error sistemtico quetiene que ver con la diferencia entre la poblacin de muestreo y la poblacin diana y que
slo puede ser controlado por el diseo del estudio.
Para decidir el tamao muestral se consideran dos puntos:
En un problema de estimacin hay que tener una idea de la magnitud a estimar y del
error aceptable.En un contraste de hiptesis hay que saber el tamao del efecto que se quiere ver.
2. ESTIMACIN.
Un estimador es una estadstica de muestra utilizada para estimar un parmetro depoblacin. La media de la muestra puede ser un estimador de la media de la poblacin, y la
porcin de la muestra se puede utilizar como estimador de la porcin de la poblacin.Tambin podemos utilizar el alcance de la muestra como un estimador del alcance de la
poblacin.
-
8/3/2019 39356922-Estadistica-inferencial
3/14
3
Cuando hemos observado un valor numrico especfico de nuestro estimador, nos referimos
a ese valor como una estimacin. Una estimacin es un valor especfico observado de unaestadstica. Hacemos una estimacin si tomamos una muestra y calculamos el valor que
toma nuestro estimador en esa muestra.
En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar unvalor aproximado de un parmetro de una poblacin a partir de los datos proporcionados
por una muestra. Por ejemplo, una estimacin de la media de una determinada caractersticade una poblacin de tamao N podra ser la media de esa misma caracterstica para una
muestra de tamao n.
Conceptos.
Estimacin: valor especfico de un estimador, calculado en base a una muestradada.
Estimacin deintervalo: intervalo de valores utilizado para estimar un parmetrode poblacin desconocido.
Estimacin deparmetros: Aproximacin del valor de parmetros poblacionalesdesconocidos mediante el empleo de estadsticos muestrales.
Estimacinpuntual: un solo nmero que se utiliza para estimar un parmetro depoblacin desconocido.
Estimador: estadstica de muestra utilizada para estimar un parmetro depoblacin. Conceptualmente es una variable aleatoria.
Estimador coherente: estimador que produce valores que se acercan ms alparmetro de la poblacin conforme aumenta el tamao de la muestra.
Estimador eficiente: estimador con un menor error estndar que algn otroestimador del parmetro de la poblacin, esto es, cuanto ms pequeo sea el errorestndar de un estimador, ms eficiente ser ese estimador.
Estimador imparcial: estimador de un parmetro de poblacin que, en promedio,asume valores por encima del parmetro de la poblacin con la misma frecuencia, yal mismo grado, con que tiende a tomarlos por debajo del parmetro de la
poblacin.
Estimadorsuficiente: estimador que utiliza toda la informacin disponible en losdatos correspondientes a un parmetro.
Intervalo deconfianza: intervalo de valores que tiene designada una probabilidadde que incluya el valor real del parmetro de la poblacin.
Lmites deconfianza: lmites inferior y superior de un intervalo de confianza.
-
8/3/2019 39356922-Estadistica-inferencial
4/14
4
Nivel deconfianza: probabilidad que los estadsticos asocian con una estimacinde intervalo de un parmetro de poblacin, sta indica qu tan seguros estn de quela estimacin de intervalo incluir el parmetro de la poblacin. Probabilidad,
designada de antemano, de que un intervalo de confianza incluya al valor delparmetro desconocido.
Propiedades de un buen estimador: caractersticas deseables de un estimador,para lograr la mejor aproximacin posible de un parmetro poblacional.
3. TIPOS DE ESTIMADORES.
Podemos hacer dos tipos de estimaciones concernientes a una poblacin:
Unaestimacinpuntual, es slo u nmero que se utiliza para estimar un parmetrode poblacin desconocido. Una estimacin puntual a menudo resulta insuficiente,
debido a que slo tiene dos opciones: es correcta o est equivocada.
Es decir, consiste en un solo estadstico muestral que se usa para estimar el valor verdaderode un parmetro de una poblacin que es desconocido. Por ejemplo, la media muestral x es
un estimador puntual de la media poblacional y la proporcin muestral p es un estimadorpuntual de la verdadera proporcin poblacional p.
Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de
estimacin es prcticamente improbable que el valor de la estimacin coincida con elverdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin con
alguna medida que nos permitiera expresar la cercana del estimador al parmetro. Unasolucin a ello no los brindan los estimadores por Intervalos de Confianza.
Unaestimacin deintervalo, es un intervalo de valores que se utiliza para estimarun parmetro de poblacin.
Esta estimacin indica el error de dos maneras: por la extensin del intervalo y por laprobabilidad de obtener el verdadero parmetro de la poblacin que se encuentra dentro del
intervalo.
Es la estimacin de un parmetro de la poblacin dado por dos nmeros que forman unintervalo que contiene al parmetro con una cierta probabilidad.
4. CARACTERSTICAS DE UN BUEN ESTIMADOR.
Imparcialidad. Se refiere al hecho de que una media de muestra es un estimador nosesgado de una media de poblacin, porque la media de distribucin de muestreo de
las medias de muestras tomadas de la misma poblacin es igual a la media de lapoblacin misma. Podemos decir que una estadstica es un estimador imparcial (o
-
8/3/2019 39356922-Estadistica-inferencial
5/14
5
no sesgado) si, en promedio, tiende a tomar valores que estn por encima del
parmetro de la poblacin y la misma extensin con la que tiende a asumir valorespor debajo del parmetro de poblacin que se est estimando.
Eficiencia. Se refiere al tamao del error estndar de la estadstica. Si comparamos
dos estadsticas de una muestra del mismo tamao y tratamos de decidir cul deellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el menor
error estndar o la menor desviacin estndar de la distribucin de muestreo. Tienesentido pensar que un estimador con un error estndar menor (con menos
desviacin) tendr una mayor oportunidad de producir una estimacin ms cercanaal parmetro de poblacin que se est considerando.
Coherencia. Una estadstica es un estimador coherente de un parmetro depoblacin si al aumentar el tamao de la muestra, se tiene casi la certeza de que elvalor de la estadstica se aproxima bastante al valor del parmetro de la poblacin.
Si un estimador es coherente, se vuelve ms confiable si tenemos tamaos demuestras ms grandes.
Suficiencia. Un estimador es suficiente si utiliza una cantidad de la informacincontenida en la muestra que ningn otro estimador podra extraer informacinadicional de la muestra sobre el parmetro de la poblacin.
Una estadstica de muestra dada no siempre es el mejor estimador de su parmetro de
poblacin correspondiente. Considere una poblacin distribuida simtricamente, en la quelos valores de la mediana y de la media coinciden. En este caso, la media de la muestra
sera un estimador imparcial de la mediana de la poblacin debido a que asumira valoresque en promedio seran iguales a la mediana de la poblacin.
Tambin, la media de la muestra sera un estimador consistente de la mediana de la
poblacin, puesto que, conforme aumenta el tamao de la muestra, el valor de la media dela muestra tender a acercarse bastante a la mediana de la poblacin. Y la media de la
muestra sera un estimador ms eficiente de la mediana de la poblacin que la medianamisma, ya que en muestras grandes, la media de la muestra tiene una desviacin estndar
menor que la mediana de la muestra.
Al mismo tiempo, la mediana de la muestra de una distribucin distribuida simtricamentesera un estimador imparcial y consistente de la media de la poblacin, pero no el ms
eficiente estimador, porque en muestras grandes su error estndar es mayor que el de lamedia de la muestra.
5. ESTRUCTURA GENERAL DE UN INTERVALO DE CONFIANZA
Se llama intervalo de confianza en estadstica a un par de nmeros entre los cuales seestima que estar cierto valor desconocido con una determinada probabilidad de acierto.Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de
una muestra, y el valor desconocido es un parmetro poblacional.
-
8/3/2019 39356922-Estadistica-inferencial
6/14
6
La probabilidad de xito en la estimacin se representa por 1 - y se denomina nivel deconfianza. En estas circunstancias, es el llamado error aleatorio o nivel designificacin,esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo.
1
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un
intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza),mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumentan sus posibilidades de error.
Para la construccin de un determinado intervalo de confianza es necesario conocer la
distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro sedistribuya normalmente. Tambin pueden construirse intervalos de confianza con la
desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - % para la estimacin de un parmetropoblacional que sigue una determinada distribucin de probabilidad, es una expresin del
tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin deprobabilidad de .
6. INTERPRETACIN DE (1- )
El nivel deconfianza es la probabilidad a priori de que el intervalo de confianza a calcularcontenga al verdadero valor del parmetro. Se indica por 1- y habitualmente se da en
porcentaje 100 (1-)%. Hablamos de nivel de confianza y no de probabilidad ya que unavez extrada la muestra, el intervalo de confianza contendr al verdadero valor del
parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el 100 (1-)% de los intervalos as construidos contendra al
verdadero valor del parmetro.
Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9%, que
se corresponden con valores de 0,05 y 0,01 respectivamente.
Valor
Tambin llamado nivel designificacin. Es la probabilidad (en tanto por uno) de fallar ennuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-).
Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-95)/100 = 0,05
-
8/3/2019 39356922-Estadistica-inferencial
7/14
7
7. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN, W2CONOCIDA
Supongamos que disponemos de una poblacin en la que tenemos una v.a. con distribucin
con conocida (de estudios previos, por ejemplo). Obtenemos una muestra de tamao n y
deseamos estimar la media de la poblacin.El estimador puntual de la misma es la media muestral cuya distribucin muestral esconocida
La cantidad
Tendr distribucin normal estndar.
Sobre la distribucin N(0 , 1) podremos seleccionar dos puntos simtricos -z/2 y z/2 , talesque
Seleccin de los puntos crticos para el clculo del intervalo de confianza.
Sustituyendo Z por su valor en este caso particular
-
8/3/2019 39356922-Estadistica-inferencial
8/14
8
Despejando la media muestral y la varianza
Que verifica las condiciones de la definicin.
As, el intervalo de confianza para la media puede escribirse como
En la prctica, de todos los posibles valores de tenemos uno slo y por tanto un nico
intervalo de todos los posibles para distintas muestras
La importancia del intervalo de confianza para la estimacin est en el hecho de que el
intervalo contiene informacin sobre el estimador puntual (valor central del intervalo) ysobre el posible error en la estimacin a travs de la dispersin y de la distribucin muestral
del estimador. Obsrvese que el error en la estimacin est directamente relacionado con ladistribucin muestral del estimador y con la varianza poblacional, e inversamente
relacionado con el tamao muestral.
El grfico siguiente ilustra la interpretacin del nivel de confianza para el intervalo deconfianza para la media de una distribucin normal con varianza conocida. Para losdistintos posibles valores de la media, representados mediante su distribucin muestral,
obtenemos distintos intervalos de confianza. La mayor parte incluye al verdadero valor delparmetro, pero el resto no. Concretamente el 95% lo incluye y el 5% no, si el nivel de
confianza es del 95%.
En la prctica disponemos de una nica repeticin del experimento, y por tanto de un nicointervalo de confianza, el sealado en negro en el grfico, por ejemplo. Confiamos en que
nuestro intervalo sea de la mayora que con tiene al verdadero valor objetivo aunque notenemos la seguridad de que sea as, tenemos concretamente un riesgo del 5% de
equivocarnos.
-
8/3/2019 39356922-Estadistica-inferencial
9/14
9
Interpretacin del nivel de confianza en el intervalo para la media de una distribucin
normal.
8. ERROR DE ESTIMACIN.
Es una medida de su precisin que se corresponde con la amplitud del intervalo de
confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho
deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms
ocurrencias debern incluirse en la muestra estudiada. En caso de no incluir nuevas
observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele
llamar E, segn la frmula E = 2 - 1.
Tresfactores quelo determinan:
Cuando se mide una cantidad, ya sea directa o indirectamente, la medida que se obtiene no
es necesariamente el valor exacto de tal medida, ya que el resultado obtenido estar
afectado por errores debidos a la multiplicidad de factores. Algo en apariencia tan sencillo
como cronometrar el perodo de oscilacin de un pndulo simple, sufrir errores debidos a
la precisin del cronmetro, los reflejos del cronometrador, las corrientes de aire, el nmero
de medidas efectuadas ... errores que se propagarn a cualquier cantidad derivada de sta
que queramos determinar, como por ejemplo velocidad o aceleracin.
En estos casos es necesario estimar el error cometido al efectuar una medida o serie de
medidas. El conjunto de reglas matemticas dedicado a su estudio se conoce como teora de
errores, y resulta imprescindible en el anlisis de un conjunto de datos experimentales en
cuanto a la fiabilidad de estas mediciones.
-
8/3/2019 39356922-Estadistica-inferencial
10/14
10
9. DETERMINACIN DEL TAMAO DE LA MUESTRA PARA MEDIAS
Siempre que tomamos una muestra, perdemos algo de informacin til con respecto a la poblacin. El error de muestre se puede controlar si seleccionamos una muestra cuyo
tamao sea el adecuado. En general, cuanta ms precisin se quiera, ms grande ser el
tamao de la muestra necesaria.
Si no conocemos la desviacin estndar de la poblacin, podemos utilizar el alcance de la
poblacin para obtener una estimacin burda pero manejable de la desviacin estndar.Sabemos que ms menos tres desviaciones estndar incluyen 99,7% del rea total bajo la
curva normal, esto es, ms tres desviaciones estndar y menos tres desviaciones estndar dela media incluyen casi toda el rea de la distribucin.
Los datos que tenemos que incluir en la frmula para calcular el nmero de sujetosnecesarios en la muestra (N) son:
Z/2: valor de Z correspondiente al riesgo fijado. El riesgo fijado suele ser 0,05 yZ/2 de 1,96.s2: Varianza de la distribucin de la variable cuantitativa que se supone que existe
en la poblacin.i: Precisin con que se desea estimar el parmetro (2i es la amplitud del intervalo de
confianza).
Existen tres factores para determinar el tamao de la muestra.
El nivel de confianza deseado, expresado normalmente mediante Z
El mximo error permitido, E
La variacin de la poblacin expresada por S
Sufrmulaes: n = ( ZS / E ) 2
10. INTERVALO DE CONFIANZA PARA LA PROPORCIN T DE UNAPOBLACIN
Sea X una variable binomial de parmetros n y p (una variable binomial es el nmero dexitos en n ensayos; en cada ensayo la probabilidad de xito (p) es la misma, por ejemplo:nmero de diabticos en 2000 personas).
Si n es grande y p no est prximo a 0 1 (np 5) X es aproximadamente normal con
media np y varianza npq (siendo q = 1 - p) y se puede usar el estadstico (proporcin
-
8/3/2019 39356922-Estadistica-inferencial
11/14
11
muestral), que es tambin aproximadamente normal, con error tpico dado poren consecuencia, un IC para p al 100(1 - a)% ser
Es decir, la misma estructura que antes:
Obsrvese que para construirlo, se necesita conocer p!. Si n es grande (>30) se pueden
substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq 0,25 si sesubstituye pq por 0,25 se obtiene un intervalo ms conservador (ms grande).
Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80
curaciones. Calcular el intervalo de confianza al 95% de la eficacia del tratamiento.
Qu significa este intervalo? La verdadera proporcin de curaciones est comprendida
entre, aproximadamente, 72% y 88% con un 95% de probabilidad.
11. DETERMINACIN DEL TAMAO DE LA MUESTRA PARAPROPORCIONES
Para calcular el tamao de muestra para la estimacin de proporciones poblacionales hemos
de tener en cuenta los mismos factores que en el caso de la media. La frmula que nospermitir determinar el tamao muestral es la siguiente:
Donde
: z correspondiente al nivel de confianza elegido
-
8/3/2019 39356922-Estadistica-inferencial
12/14
12
P: proporcin de una categora de la variable
e: error mximo
N: tamao de la poblacin
12. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN, W2DESCONOCIDA
Si y s son la media y la desviacin estndar de una muestra aleatoria de una poblacinnormal con varianza 2, desconocida, un intervalo de confianza de
(1-) 100% para es:
Donde t/2 es el valor t con v = n - 1 grados de libertad, que deja un rea de /2 a la derecha.
Se hace una distincin entre los casos de conocida y desconocida al calcular lasestimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza
el teorema del lmite central, mientras que para desconocida se hace uso de la distribucinmuestral de la variable aleatoria t. Sin embargo, el uso de la distribucin t se basa en la
premisa de que el muestreo se realiza de una distribucin normal.
En tanto que la distribucin tenga forma aproximada de campana, los intervalos de
confianza se pueden calcular cuando la varianza se desconoce mediante el uso de ladistribucin t y se puede esperar buenos resultados.
Con mucha frecuencia los estadsticos recomiendan que aun cuando la normalidad no se
pueda suponer, con desconocida y n 30, s puede reemplazar a y se puede utilizar el
intervalo de confianza:
Por lo general ste se denomina como un intervalo de confianza de muestra grande. La
justificacin yace slo en la presuncin de que con una muestra grande como 30, s estarmuy cerca de la real y de esta manera el teorema del lmite central sigue valiendo. Sedebe hacer nfasis en que esto es solo una aproximacin y que la calidad de este enfoque
mejora a medida que el tamao de la muestra crece ms.
-
8/3/2019 39356922-Estadistica-inferencial
13/14
13
CONCLUSIN
La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga delestudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y
parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria deuna determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida de la
misma.
Los dos problemas fundamentales que estudia la inferencia estadstica son el
"Problema de la estimacin" y el "Problema del contraste de hiptesis"
Cuando se conoce la forma funcional de la funcin de distribucin que sigue la
variable aleatoria objeto de estudio y slo tenemos que estimar los parmetros que ladeterminan, estamos en un problema de inferencia estadstica paramtrica; por el contrario
cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoriaobjeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y queproporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un
estimador de la media poblacional, la proporcin observada en la muestra es un estimadorde la proporcin en la poblacin.
Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los
estimadores ms probables en este caso son los estadsticos obtenidos en la muestra, aunquees necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la
distribucin muestral indica la distribucin de los valores que tomar el estimador alseleccionar distintas muestras de la poblacin. Las dos medidas fundamentales de esta
distribucin son la media que indica el valor promedio del estimador y la desviacin tpica,tambin denominada error tpico de estimacin, que indica la desviacin promedio que
podemos esperar entre el estimador y el valor del parmetro.
Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que seencontrar el parmetro, con un nivel de confianza fijado de antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contieneal parmetro que se est estimando.
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero
valor del parmetro. Se indica por 1-a y habitualmente se da en porcentaje (1-a)100%.
Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra, elintervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos esque si repitisemos el proceso con muchas muestras podramos afirmar que el (1-a)% de los
intervalos as construidos contendra al verdadero valor del parmetro.
-
8/3/2019 39356922-Estadistica-inferencial
14/14
14
BIBLIOGRAFA
Douglas Montgomery & George Runger, Probabilidad y estadstica aplicadas a la
ingeniera,McGraw-Hill
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03.html
http://www.stadcenterecuador.com/contenidos/estadistica-
inferencial.html?q=contenidos%2Festadistica-inferencial.html&showall=1
http://es.wikipedia.org/wiki/Intervalo_de_confianza
http://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica
http://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM
http://www.hrc.es/bioest/esti_medias.html