39356922-Estadistica-inferencial

8/3/2019 39356922-Estadistica-inferencial

1/14

1

INTRODUCCIN.

El material sobre teora de la probabilidad constituye la base de la inferencia estadstica,

que tiene que ver con el uso de los conceptos de la probabilidad para tratar con la toma dedecisiones en condiciones de incertidumbre. La inferencia estadstica est basada en la

estimacin y en la prueba de hiptesis.

Matemticamente, podemos describir muestras y poblaciones al emplear mediciones como

la media, la mediana, la varianza y la desviacin estndar. Cuando estos trminos describenlas caractersticas de una poblacin, se llaman parmetros. Cuando describen las

caractersticas de la muestra, se llaman estadsticos. Una estadstica es una caracterstica deuna muestra y un parmetro es una caracterstica de la poblacin.

La teora de muestreo puede emplearse para obtener informacin acerca de muestras

obtenidas aleatoriamente de una poblacin conocida. Sin embargo, desde un punto de vistaprctico, suele ser ms importante y capaz de inferir informacin acerca de una poblacin a

partir de muestras de ellas.

Un problema importante de la inferencia estadstica es la estimacin de parmetros

poblacionales o simplemente parmetros a partir de los estadsticos mustralescorrespondientes o estadsticos, en este breve resumen trataremos de dar un panorama

general de lo que es una estimacin de parmetros abarcando desde conceptos hasta losprincipales modelos matemticos.


2/14

2

UNIDAD 3. ESTIMACIN DE PARMETROS.

1.- LOS DOS PROBLEMAS QUE ATIENDE LA ESTADSTICA INFERENCIAL

Los dos tipos de problemas que resuelven las tcnicas estadsticas son: estimacin y

contraste de hiptesis. En ambos casos se trata de generalizar la informacin obtenida enuna muestra a una poblacin. Estas tcnicas exigen que la muestra sea aleatoria. En laprctica rara vez se dispone de muestras aleatorias, por la tanto la situacin habitual es la

que se esquematiza en la figura

Entre la muestra con la que se trabaja y la poblacin de inters, o poblacin diana, aparece

la denominada poblacin de muestreo: poblacin (la mayor parte de las veces no definidacon precisin) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la

generalizacin est amenazada por dos posibles tipos de errores: error aleatorio que es elque las tcnicas estadsticas permiten cuantificar y crticamente dependiente del tamao

muestral, pero tambin de la variabilidad de la variable a estudiar y el error sistemtico quetiene que ver con la diferencia entre la poblacin de muestreo y la poblacin diana y que

slo puede ser controlado por el diseo del estudio.

Para decidir el tamao muestral se consideran dos puntos:

En un problema de estimacin hay que tener una idea de la magnitud a estimar y del

error aceptable.En un contraste de hiptesis hay que saber el tamao del efecto que se quiere ver.

2. ESTIMACIN.

Un estimador es una estadstica de muestra utilizada para estimar un parmetro depoblacin. La media de la muestra puede ser un estimador de la media de la poblacin, y la

porcin de la muestra se puede utilizar como estimador de la porcin de la poblacin.Tambin podemos utilizar el alcance de la muestra como un estimador del alcance de la

poblacin.


3/14

3

Cuando hemos observado un valor numrico especfico de nuestro estimador, nos referimos

a ese valor como una estimacin. Una estimacin es un valor especfico observado de unaestadstica. Hacemos una estimacin si tomamos una muestra y calculamos el valor que

toma nuestro estimador en esa muestra.

En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar unvalor aproximado de un parmetro de una poblacin a partir de los datos proporcionados

por una muestra. Por ejemplo, una estimacin de la media de una determinada caractersticade una poblacin de tamao N podra ser la media de esa misma caracterstica para una

muestra de tamao n.

Conceptos.

Estimacin: valor especfico de un estimador, calculado en base a una muestradada.

Estimacin deintervalo: intervalo de valores utilizado para estimar un parmetrode poblacin desconocido.

Estimacin deparmetros: Aproximacin del valor de parmetros poblacionalesdesconocidos mediante el empleo de estadsticos muestrales.

Estimacinpuntual: un solo nmero que se utiliza para estimar un parmetro depoblacin desconocido.

Estimador: estadstica de muestra utilizada para estimar un parmetro depoblacin. Conceptualmente es una variable aleatoria.

Estimador coherente: estimador que produce valores que se acercan ms alparmetro de la poblacin conforme aumenta el tamao de la muestra.

Estimador eficiente: estimador con un menor error estndar que algn otroestimador del parmetro de la poblacin, esto es, cuanto ms pequeo sea el errorestndar de un estimador, ms eficiente ser ese estimador.

Estimador imparcial: estimador de un parmetro de poblacin que, en promedio,asume valores por encima del parmetro de la poblacin con la misma frecuencia, yal mismo grado, con que tiende a tomarlos por debajo del parmetro de la

poblacin.

Estimadorsuficiente: estimador que utiliza toda la informacin disponible en losdatos correspondientes a un parmetro.

Intervalo deconfianza: intervalo de valores que tiene designada una probabilidadde que incluya el valor real del parmetro de la poblacin.

Lmites deconfianza: lmites inferior y superior de un intervalo de confianza.


4/14

4

Nivel deconfianza: probabilidad que los estadsticos asocian con una estimacinde intervalo de un parmetro de poblacin, sta indica qu tan seguros estn de quela estimacin de intervalo incluir el parmetro de la poblacin. Probabilidad,

designada de antemano, de que un intervalo de confianza incluya al valor delparmetro desconocido.

Propiedades de un buen estimador: caractersticas deseables de un estimador,para lograr la mejor aproximacin posible de un parmetro poblacional.

3. TIPOS DE ESTIMADORES.

Podemos hacer dos tipos de estimaciones concernientes a una poblacin:

Unaestimacinpuntual, es slo u nmero que se utiliza para estimar un parmetrode poblacin desconocido. Una estimacin puntual a menudo resulta insuficiente,

debido a que slo tiene dos opciones: es correcta o est equivocada.

Es decir, consiste en un solo estadstico muestral que se usa para estimar el valor verdaderode un parmetro de una poblacin que es desconocido. Por ejemplo, la media muestral x es

un estimador puntual de la media poblacional y la proporcin muestral p es un estimadorpuntual de la verdadera proporcin poblacional p.

Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de

estimacin es prcticamente improbable que el valor de la estimacin coincida con elverdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin con

alguna medida que nos permitiera expresar la cercana del estimador al parmetro. Unasolucin a ello no los brindan los estimadores por Intervalos de Confianza.

Unaestimacin deintervalo, es un intervalo de valores que se utiliza para estimarun parmetro de poblacin.

Esta estimacin indica el error de dos maneras: por la extensin del intervalo y por laprobabilidad de obtener el verdadero parmetro de la poblacin que se encuentra dentro del

intervalo.

Es la estimacin de un parmetro de la poblacin dado por dos nmeros que forman unintervalo que contiene al parmetro con una cierta probabilidad.

4. CARACTERSTICAS DE UN BUEN ESTIMADOR.

Imparcialidad. Se refiere al hecho de que una media de muestra es un estimador nosesgado de una media de poblacin, porque la media de distribucin de muestreo de

las medias de muestras tomadas de la misma poblacin es igual a la media de lapoblacin misma. Podemos decir que una estadstica es un estimador imparcial (o


5/14

5

no sesgado) si, en promedio, tiende a tomar valores que estn por encima del

parmetro de la poblacin y la misma extensin con la que tiende a asumir valorespor debajo del parmetro de poblacin que se est estimando.

Eficiencia. Se refiere al tamao del error estndar de la estadstica. Si comparamos

dos estadsticas de una muestra del mismo tamao y tratamos de decidir cul deellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el menor

error estndar o la menor desviacin estndar de la distribucin de muestreo. Tienesentido pensar que un estimador con un error estndar menor (con menos

desviacin) tendr una mayor oportunidad de producir una estimacin ms cercanaal parmetro de poblacin que se est considerando.

Coherencia. Una estadstica es un estimador coherente de un parmetro depoblacin si al aumentar el tamao de la muestra, se tiene casi la certeza de que elvalor de la estadstica se aproxima bastante al valor del parmetro de la poblacin.

Si un estimador es coherente, se vuelve ms confiable si tenemos tamaos demuestras ms grandes.

Suficiencia. Un estimador es suficiente si utiliza una cantidad de la informacincontenida en la muestra que ningn otro estimador podra extraer informacinadicional de la muestra sobre el parmetro de la poblacin.

Una estadstica de muestra dada no siempre es el mejor estimador de su parmetro de

poblacin correspondiente. Considere una poblacin distribuida simtricamente, en la quelos valores de la mediana y de la media coinciden. En este caso, la media de la muestra

sera un estimador imparcial de la mediana de la poblacin debido a que asumira valoresque en promedio seran iguales a la mediana de la poblacin.

Tambin, la media de la muestra sera un estimador consistente de la mediana de la

poblacin, puesto que, conforme aumenta el tamao de la muestra, el valor de la media dela muestra tender a acercarse bastante a la mediana de la poblacin. Y la media de la

muestra sera un estimador ms eficiente de la mediana de la poblacin que la medianamisma, ya que en muestras grandes, la media de la muestra tiene una desviacin estndar

menor que la mediana de la muestra.

Al mismo tiempo, la mediana de la muestra de una distribucin distribuida simtricamentesera un estimador imparcial y consistente de la media de la poblacin, pero no el ms

eficiente estimador, porque en muestras grandes su error estndar es mayor que el de lamedia de la muestra.

5. ESTRUCTURA GENERAL DE UN INTERVALO DE CONFIANZA

Se llama intervalo de confianza en estadstica a un par de nmeros entre los cuales seestima que estar cierto valor desconocido con una determinada probabilidad de acierto.Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de

una muestra, y el valor desconocido es un parmetro poblacional.


6/14

6

La probabilidad de xito en la estimacin se representa por 1 - y se denomina nivel deconfianza. En estas circunstancias, es el llamado error aleatorio o nivel designificacin,esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo.

1

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un

intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza),mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,

aumentan sus posibilidades de error.

Para la construccin de un determinado intervalo de confianza es necesario conocer la

distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro sedistribuya normalmente. Tambin pueden construirse intervalos de confianza con la

desigualdad de Chebyshov.

En definitiva, un intervalo de confianza al 1 - % para la estimacin de un parmetropoblacional que sigue una determinada distribucin de probabilidad, es una expresin del

tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin deprobabilidad de .

6. INTERPRETACIN DE (1- )

El nivel deconfianza es la probabilidad a priori de que el intervalo de confianza a calcularcontenga al verdadero valor del parmetro. Se indica por 1- y habitualmente se da en

porcentaje 100 (1-)%. Hablamos de nivel de confianza y no de probabilidad ya que unavez extrada la muestra, el intervalo de confianza contendr al verdadero valor del

parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el 100 (1-)% de los intervalos as construidos contendra al

verdadero valor del parmetro.

Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9%, que

se corresponden con valores de 0,05 y 0,01 respectivamente.

Valor

Tambin llamado nivel designificacin. Es la probabilidad (en tanto por uno) de fallar ennuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-).

Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-95)/100 = 0,05


7/14

7

7. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN, W2CONOCIDA

Supongamos que disponemos de una poblacin en la que tenemos una v.a. con distribucin

con conocida (de estudios previos, por ejemplo). Obtenemos una muestra de tamao n y

deseamos estimar la media de la poblacin.El estimador puntual de la misma es la media muestral cuya distribucin muestral esconocida

La cantidad

Tendr distribucin normal estndar.

Sobre la distribucin N(0 , 1) podremos seleccionar dos puntos simtricos -z/2 y z/2 , talesque

Seleccin de los puntos crticos para el clculo del intervalo de confianza.

Sustituyendo Z por su valor en este caso particular


8/14

8

Despejando la media muestral y la varianza

Que verifica las condiciones de la definicin.

As, el intervalo de confianza para la media puede escribirse como

En la prctica, de todos los posibles valores de tenemos uno slo y por tanto un nico

intervalo de todos los posibles para distintas muestras

La importancia del intervalo de confianza para la estimacin est en el hecho de que el

intervalo contiene informacin sobre el estimador puntual (valor central del intervalo) ysobre el posible error en la estimacin a travs de la dispersin y de la distribucin muestral

del estimador. Obsrvese que el error en la estimacin est directamente relacionado con ladistribucin muestral del estimador y con la varianza poblacional, e inversamente

relacionado con el tamao muestral.

El grfico siguiente ilustra la interpretacin del nivel de confianza para el intervalo deconfianza para la media de una distribucin normal con varianza conocida. Para losdistintos posibles valores de la media, representados mediante su distribucin muestral,

obtenemos distintos intervalos de confianza. La mayor parte incluye al verdadero valor delparmetro, pero el resto no. Concretamente el 95% lo incluye y el 5% no, si el nivel de

confianza es del 95%.

En la prctica disponemos de una nica repeticin del experimento, y por tanto de un nicointervalo de confianza, el sealado en negro en el grfico, por ejemplo. Confiamos en que

nuestro intervalo sea de la mayora que con tiene al verdadero valor objetivo aunque notenemos la seguridad de que sea as, tenemos concretamente un riesgo del 5% de

equivocarnos.


9/14

9

Interpretacin del nivel de confianza en el intervalo para la media de una distribucin

normal.

8. ERROR DE ESTIMACIN.

Es una medida de su precisin que se corresponde con la amplitud del intervalo de

confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho

deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms

ocurrencias debern incluirse en la muestra estudiada. En caso de no incluir nuevas

observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele

llamar E, segn la frmula E = 2 - 1.

Tresfactores quelo determinan:

Cuando se mide una cantidad, ya sea directa o indirectamente, la medida que se obtiene no

es necesariamente el valor exacto de tal medida, ya que el resultado obtenido estar

afectado por errores debidos a la multiplicidad de factores. Algo en apariencia tan sencillo

como cronometrar el perodo de oscilacin de un pndulo simple, sufrir errores debidos a

la precisin del cronmetro, los reflejos del cronometrador, las corrientes de aire, el nmero

de medidas efectuadas ... errores que se propagarn a cualquier cantidad derivada de sta

que queramos determinar, como por ejemplo velocidad o aceleracin.

En estos casos es necesario estimar el error cometido al efectuar una medida o serie de

medidas. El conjunto de reglas matemticas dedicado a su estudio se conoce como teora de

errores, y resulta imprescindible en el anlisis de un conjunto de datos experimentales en

cuanto a la fiabilidad de estas mediciones.


10/14

10

9. DETERMINACIN DEL TAMAO DE LA MUESTRA PARA MEDIAS

Siempre que tomamos una muestra, perdemos algo de informacin til con respecto a la poblacin. El error de muestre se puede controlar si seleccionamos una muestra cuyo

tamao sea el adecuado. En general, cuanta ms precisin se quiera, ms grande ser el

tamao de la muestra necesaria.

Si no conocemos la desviacin estndar de la poblacin, podemos utilizar el alcance de la

poblacin para obtener una estimacin burda pero manejable de la desviacin estndar.Sabemos que ms menos tres desviaciones estndar incluyen 99,7% del rea total bajo la

curva normal, esto es, ms tres desviaciones estndar y menos tres desviaciones estndar dela media incluyen casi toda el rea de la distribucin.

Los datos que tenemos que incluir en la frmula para calcular el nmero de sujetosnecesarios en la muestra (N) son:

Z/2: valor de Z correspondiente al riesgo fijado. El riesgo fijado suele ser 0,05 yZ/2 de 1,96.s2: Varianza de la distribucin de la variable cuantitativa que se supone que existe

en la poblacin.i: Precisin con que se desea estimar el parmetro (2i es la amplitud del intervalo de

confianza).

Existen tres factores para determinar el tamao de la muestra.

El nivel de confianza deseado, expresado normalmente mediante Z

El mximo error permitido, E

La variacin de la poblacin expresada por S

Sufrmulaes: n = ( ZS / E ) 2

10. INTERVALO DE CONFIANZA PARA LA PROPORCIN T DE UNAPOBLACIN

Sea X una variable binomial de parmetros n y p (una variable binomial es el nmero dexitos en n ensayos; en cada ensayo la probabilidad de xito (p) es la misma, por ejemplo:nmero de diabticos en 2000 personas).

Si n es grande y p no est prximo a 0 1 (np 5) X es aproximadamente normal con

media np y varianza npq (siendo q = 1 - p) y se puede usar el estadstico (proporcin


11/14

11

muestral), que es tambin aproximadamente normal, con error tpico dado poren consecuencia, un IC para p al 100(1 - a)% ser

Es decir, la misma estructura que antes:

Obsrvese que para construirlo, se necesita conocer p!. Si n es grande (>30) se pueden

substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq 0,25 si sesubstituye pq por 0,25 se obtiene un intervalo ms conservador (ms grande).

Ejemplo: En una muestra de 100 pacientes sometidos a un cierto tratamiento se obtienen 80

curaciones. Calcular el intervalo de confianza al 95% de la eficacia del tratamiento.

Qu significa este intervalo? La verdadera proporcin de curaciones est comprendida

entre, aproximadamente, 72% y 88% con un 95% de probabilidad.

11. DETERMINACIN DEL TAMAO DE LA MUESTRA PARAPROPORCIONES

Para calcular el tamao de muestra para la estimacin de proporciones poblacionales hemos

de tener en cuenta los mismos factores que en el caso de la media. La frmula que nospermitir determinar el tamao muestral es la siguiente:

Donde

: z correspondiente al nivel de confianza elegido


12/14

12

P: proporcin de una categora de la variable

e: error mximo

N: tamao de la poblacin

12. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN, W2DESCONOCIDA

Si y s son la media y la desviacin estndar de una muestra aleatoria de una poblacinnormal con varianza 2, desconocida, un intervalo de confianza de

(1-) 100% para es:

Donde t/2 es el valor t con v = n - 1 grados de libertad, que deja un rea de /2 a la derecha.

Se hace una distincin entre los casos de conocida y desconocida al calcular lasestimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza

el teorema del lmite central, mientras que para desconocida se hace uso de la distribucinmuestral de la variable aleatoria t. Sin embargo, el uso de la distribucin t se basa en la

premisa de que el muestreo se realiza de una distribucin normal.

En tanto que la distribucin tenga forma aproximada de campana, los intervalos de

confianza se pueden calcular cuando la varianza se desconoce mediante el uso de ladistribucin t y se puede esperar buenos resultados.

Con mucha frecuencia los estadsticos recomiendan que aun cuando la normalidad no se

pueda suponer, con desconocida y n 30, s puede reemplazar a y se puede utilizar el

intervalo de confianza:

Por lo general ste se denomina como un intervalo de confianza de muestra grande. La

justificacin yace slo en la presuncin de que con una muestra grande como 30, s estarmuy cerca de la real y de esta manera el teorema del lmite central sigue valiendo. Sedebe hacer nfasis en que esto es solo una aproximacin y que la calidad de este enfoque

mejora a medida que el tamao de la muestra crece ms.


13/14

13

CONCLUSIN

La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga delestudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y

parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria deuna determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida de la

misma.

Los dos problemas fundamentales que estudia la inferencia estadstica son el

"Problema de la estimacin" y el "Problema del contraste de hiptesis"

Cuando se conoce la forma funcional de la funcin de distribucin que sigue la

variable aleatoria objeto de estudio y slo tenemos que estimar los parmetros que ladeterminan, estamos en un problema de inferencia estadstica paramtrica; por el contrario

cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoriaobjeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica.

Un estimador es un valor que puede calcularse a partir de los datos muestrales y queproporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un

estimador de la media poblacional, la proporcin observada en la muestra es un estimadorde la proporcin en la poblacin.

Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los

estimadores ms probables en este caso son los estadsticos obtenidos en la muestra, aunquees necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la

distribucin muestral indica la distribucin de los valores que tomar el estimador alseleccionar distintas muestras de la poblacin. Las dos medidas fundamentales de esta

distribucin son la media que indica el valor promedio del estimador y la desviacin tpica,tambin denominada error tpico de estimacin, que indica la desviacin promedio que

podemos esperar entre el estimador y el valor del parmetro.

Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que seencontrar el parmetro, con un nivel de confianza fijado de antemano.

Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contieneal parmetro que se est estimando.

Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero

valor del parmetro. Se indica por 1-a y habitualmente se da en porcentaje (1-a)100%.

Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra, elintervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos esque si repitisemos el proceso con muchas muestras podramos afirmar que el (1-a)% de los

intervalos as construidos contendra al verdadero valor del parmetro.


14/14

14

BIBLIOGRAFA

Douglas Montgomery & George Runger, Probabilidad y estadstica aplicadas a la

ingeniera,McGraw-Hill

http://www.itch.edu.mx/academic/industrial/estadistica1/cap03.html

http://www.stadcenterecuador.com/contenidos/estadistica-

inferencial.html?q=contenidos%2Festadistica-inferencial.html&showall=1

http://es.wikipedia.org/wiki/Intervalo_de_confianza

http://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica

http://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM

http://www.hrc.es/bioest/esti_medias.html

39356922-Estadistica-inferencial

Documents

Transcript of 39356922-Estadistica-inferencial