Estimacion de Parametros

60
Distribuciones gaussianas con igual media pero varianza diferente.

description

Estimacion de parametros Probabilidady Estadistica

Transcript of Estimacion de Parametros

Page 1: Estimacion de Parametros

Distribuciones gaussianas con igual media pero varianza

diferente.

Page 2: Estimacion de Parametros

Distribuciones gaussianas con diferentes medias e igual

dispersión.

Page 3: Estimacion de Parametros

DISTRIBUCIONES EN EL

MUESTREO

Page 4: Estimacion de Parametros

Si un estadístico puede ser calculado para cada una de las muestras de tamaño n obtenidas de una población , la distribución del estadístico obtenido de de cada una las muestras se denomina distribución en el muestreo.

Sx,

Page 5: Estimacion de Parametros

LA DISTRIBUCION DE LOS PROMEDIOS MUESTRALES SE DENOMINA

DISTRIBUCION EN EL MUESTREO DE LA MEDIA

Page 6: Estimacion de Parametros

PROPIEDADES DE LA MEDIA – Insesgada: El valor medio que se obtiene de todos

los promedios muestrales debe ser el valor del parámetro.

– Consistente: Cuando el tamaño de la muestra crece, el valor del estadístico se aproxima al valor del parámetro desconocido.

– Eficiente: Al estadístico no puede exigírsele que, para una muestra cualquiera se obtenga el valor exacto del parámetro. Sin embargo podemos pedirle que su dispersión (varianza) sea tan pequeña como sea posible. La media muestral es más estable de una muestra a otra que el modo y la mediana, su dispersión con respecto al valor central es menor que la de los otros dos.

)(

Page 7: Estimacion de Parametros

• ERROR ESTÁNDAR DE LA MEDIA

nx

Page 8: Estimacion de Parametros

Teorema del límite central:

Cuando el tamaño de las muestras se vuelve suficientemente grande, la

distribución en el muestreo del promedio se puede aproximar a una distribución normal. Esto es válido cualquiera sea la distribución de los valores individuales de la población.

Page 9: Estimacion de Parametros

• ERROR ESTÁNDAR DE LA MEDIA (ó desvío estándar de las medias muestrales)

nx

Page 10: Estimacion de Parametros

Consecuencias del Teorema

• Cualquiera sea la distribución de la población, cuando n >= 30 , la distribución de los promedios muestrales será aproximadamente normal.

• Si la distribución de la población tiene una simetría razonable, la distribución en el muestreo de la media, para n por lo menos de 15, también tiene distribución normal.

• Si la distribución de la población es normal, la distribución en el muestreo de la media, para cualquier tamaño de muestra, también tiene distribución normal

Page 11: Estimacion de Parametros

De acuerdo al TEOREMA DEL LÍMITE CENTRAL: podremos

entonces considerar a la distribución de las medias

muestrales

),(n

Nx

Page 12: Estimacion de Parametros

ESTIMACIONES DE PARAMETROS

• Estimación puntual: Usa un solo valor de la muestra para estimar el

parámetro de la población

22

S

x

Page 13: Estimacion de Parametros

Estimación Busco una relación en la que intervengan el

parámetro desconocido junto con su estimador y de modo que estos se distribuyan según una ley de probabilidad que es bien conocida y de ser posible tabulada.

Tomamos un intervalo que contenga una masa de probabilidad determinada que llamamos 1-

Este intervalo lo tomamos simétrico con respecto a la media, allí es donde se acumula más masa (para que sea lo más pequeño posible)

Page 14: Estimacion de Parametros

ESTIMACIONES DE PARAMETROS

• Estimación por intervalos: En lugar de tener una estimación basada

en un solo valor, se toma un intervalo, que tiene una confianza específica, o probabilidad de estimar en forma correcta el valor real del parámetro de la población.

Page 15: Estimacion de Parametros

ESTIMACIONES DE PARAMETROS

• Estimación puntual: Usa un solo valor de la muestra para estimar el

parámetro de la población

22

S

x

Page 16: Estimacion de Parametros

La distribución y el intervalo más pequeño posible

Page 17: Estimacion de Parametros

INTERVALO PARA LA MEDIA SI SE CONOCE LA VARIANZA DE

LA POBLACIONcon un nivel de confianza de 1

1..

nzx

nzxp

nzx

Page 18: Estimacion de Parametros

INTERVALO PARA LA MEDIA SI NO SE CONOCE LA VARIANZA

DE LA POBLACIONcon un nivel de confianza 1

1..

11

nStx

nStxp nn

nStx

Page 19: Estimacion de Parametros

La distribución de Student

Page 20: Estimacion de Parametros

Función de densidad de una de distribución t de Student

Page 21: Estimacion de Parametros

Comparación entre las funciones t (para n=1) y Normal N(0,1)

Page 22: Estimacion de Parametros

Cuando aumentan los g. de libertad, la distribución t se

aproxima a la distribución normal estándar.

Page 23: Estimacion de Parametros

Características de la distribución t de Student

  

• Al igual que la distribución Z, es una distribución continua• La distribución t tiene una media de cero, es simétrica

respecto de la media y se extiende de - á + • Tiene forma acampanada • No hay una distribución t, sino una "familia" de distribuciones

t, todas con la misma media cero, pero con su respectiva desviación estándar diferente de acuerdo con el tamaño (n) de la muestra.

• La distribución t es más ancha y más plana en el centro que la distribución normal estándar como resultado de ello se tiene una mayor variabilidad en las medias de muestra calculadas a partir de muestras más pequeñas, pero a medida que aumenta el tamaño de la muestra, la distribución t se aproxima a la distribución normal estándar

.

Page 24: Estimacion de Parametros
Page 25: Estimacion de Parametros

Cálculo de t

nSxt

n

1

Page 26: Estimacion de Parametros

Determinación del tamaño de la muestra para la media

2

22.

.

ezn

ezn

despejandon

ze

ex

Page 27: Estimacion de Parametros

Siendo• e = error muestral, es la diferencia entre

el promedio de la muestra y el promedio de la población (error muestral permitido)

• Z = que depende del nivel de confianza• = varianza de la población

2

Page 28: Estimacion de Parametros

Planteo un problema para estimar la proporción de una población

Una empresa recibe una partida de tubos de ensayo más económicos que lo habitual.El propietario de la empresa desea estimar la proporción de tubos defectuosos. Para esto se toma una muestra de 200 tubos y en ella se encuentran 20 defectuosos. Establecer una estimación por intervalo, con 90% de confianza, de la proporción de tubos defectuosos recibidos. Si la partida se puede devolver en caso de más del 5% de defectuosos, entonces en base a los resultados obtenidos con la muestra, ¿está en condiciones el propietario de la empresa de solicitar le cambien la partida?

Page 29: Estimacion de Parametros

Distribución en el muestreo de la proporción

Primero, hay que recordar: • la distribución Binomial se puede aproximar a

la distribución Normal cuando

• Para la distribución binomial el

• La desviación estándar

5. pn

pn.

qpn ..

Page 30: Estimacion de Parametros

Si en lugar de considerar el número de éxitos, consideramos la proporción de éxitos en los n ensayos que determinan el experimento

p= x/nla media para la proporción de éxitos

el error estándar de la proporción de éxitos Recordando por el Teorema del Límite Central ahora

pp

nqp

p.

x

xZ

nqpppZ´´.

´

Page 31: Estimacion de Parametros

• Siendo:• p´= x/n donde x es el número de éxitos de

una muestra • q´= 1-p´• n = tamaño de la muestra

• En se usan los valores de la muestra ya que los de la población son justamente los que se deben estimar

nqp

Page 32: Estimacion de Parametros

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA POBLACIÓNcon un nivel de confianza de 1

nqpzpp

.

1´´..´´´..´

nqpzpp

nqpzpP

Page 33: Estimacion de Parametros

Resolución del problema planteado de proporción

:%90%)48,13%5,6(%90)1348,0065,0(

%90)0348,010,00348,010,0(

%90200

90,0.10,0.64,110,0200

90,0.10,0.64,110,0

ConclusiónpPpP

pP

pP

Page 34: Estimacion de Parametros

Determinación del tamaño de la muestra para la proporción

2

2 ´´..

´´..

''..

´

eqpzn

eqpzn

despejandonqpze

epp

Page 35: Estimacion de Parametros

Distribución Ji ó Chi cuadrado:Si de una población normal se obtienen muestras de tamaño n, la distribución en el muestreo de:

Los coeficientes son positivos y la curva no es simétrica , pero para

2

22 .1

Sn

Nn 2

2

Page 36: Estimacion de Parametros

Distribución Ji ó Chi cuadradaSi de una población normal se obtienen todas

las muestras de tamaño n, la distribución en el muestreo de

Tiene una distribución de probabilidad con asimetría positiva, los coeficientes son positivos, la curva no es simétrica , pero para:

2

22 1

Sn

Nn 2

2

Page 37: Estimacion de Parametros

DISTRIBUCION JI ó CHI CUADRADO para distintos tamaños de muestra

Page 38: Estimacion de Parametros

INTERVALO DE CONFIANZA PARA LA VARIANCIA DE UNA POBLACIÓNcon un nivel de confianza de:

1).1().1(2

22

2

2 SnSnp

Despejo

De

1

2

22 .1

Sn

2

22 1

Sn

Page 39: Estimacion de Parametros

PRUEBAS DE HIPOTESISUna hipótesis estadística es una proposición o

supuesto respecto a un parámetro de una ó más poblaciones.

Las hipótesis son proposiciones sobre los parámetros de la población, no de las muestras.

El procedimiento que conduce a una decisión sobre la hipótesis planteada recibe el nombre de prueba de hipótesis.

Este procedimiento depende del empleo de la información contenida en una muestra de la población.

Page 40: Estimacion de Parametros

Procedimiento general para la prueba de hipótesis

• Establecer la hipótesis nula H0

• Establecer la hipótesis alternativa H1• Establecer un estadístico de prueba apropiado (Z , t, ji

cuadrado, F)• Establecer la región de rechazo y la región de no rechazo ó

aceptación.Con el fin de tomar una decisión respecto de la hipótesis nula, debemos determinar el valor critico del estadístico de prueba.

• Sustituir en la ecuación del estadístico de prueba las cantidades determinadas por la muestra.

• Determinar si la prueba ha caído en la región de rechazo o en la de no rechazo, o sea verificar si se debe ó no rechazar la hipótesis nula.

• Expresar la decisión estadística en términos del problema.

Page 41: Estimacion de Parametros

Tipos de Pruebas de Hipótesis• Una prueba con hipótesis planteada de la

siguiente manera:

Se denomina prueba bilateral.

01

00

HH

Page 42: Estimacion de Parametros

En una prueba bilateral, la región de rechazo se separa en dos partes con la misma

probabilidad en cada cola de la distribución del estadístico de prueba.

Page 43: Estimacion de Parametros

Tipos de Pruebas de Hipótesis

• Una prueba con hipótesis planteada de la siguiente manera:

ó

Se denomina prueba unilateral.

01

00

HH

01

00

HH

Page 44: Estimacion de Parametros

En una prueba unilateral:Para el primer caso: La región de rechazo es

una sola, y se encuentra en la cola superior de la distribución del estadístico de prueba.

01

00

HH

Page 45: Estimacion de Parametros

Para el segundo caso: La región de rechazo es una sola, y se encuentra en la cola inferior de la distribución del estadístico de prueba.

01

00

HH

Page 46: Estimacion de Parametros

Grados de libertadPara el cálculo de un estadístico, es necesario emplear tanto observaciones de muestra como propiedades de ciertos parámetros de la población. Si estos parámetros son desconocidos, hay que estimarlos a partir de la muestra; el número de grados de libertad de un estadístico, se define como el número “n" de observaciones independientes en la muestra (o sea, el tamaño de la muestra) menos el número K de parámetros de la población, que debe ser estimado a partir de observaciones muéstrales.En símbolos, g.l. = n – k.

Page 47: Estimacion de Parametros

Prueba de hipótesis bilateral para la varianza

Page 48: Estimacion de Parametros

Prueba de hipótesis unilateral para la varianza

Page 49: Estimacion de Parametros

Prueba de hipótesis unilateral para la varianza

   

Page 50: Estimacion de Parametros

El problema de rechazar o aceptar una hipótesis puede plantearse como un problema de decisión, en el que evidentemente existe la posibilidad de fracasar o acertar en la elección o decisión a la hora de concluir que la hipótesis, bien nula o bien alternativa, son rechazables o no.

Page 51: Estimacion de Parametros

Relación entre los errores

En realidad no hay una elección que minimice a β y α simultáneamente, pues, como se observa, su comportamiento es inverso

Page 52: Estimacion de Parametros

Cuando se realiza una prueba de hipótesis pueden suceder las

siguientes situaciones:

No rechazar Ho Rechazar Ho

Ho es cierta Correcto Error tipo I

Probabilidad: 1-α

Probabilidad: α

Ho es falsa Error Tipo II Correcto

Probabilidad: β

Probabilidad: 1-β

Page 53: Estimacion de Parametros

Prueba de hipótesis para dos poblaciones

PARA LA DIFERENCIA DE MEDIAS DE POBLACIONES CON DISTRIBUCIÓN NORMAL (Con muestras independientes)

Planteadas así ó

211

210

::

HH

0:0:

211

210

HH

Page 54: Estimacion de Parametros

SE CONOCEN LAS VARIANZAS POBLACIONALES ( y )

Antes z se calculaba:

Ahora:

21 2

2

2

22

1

21

21

nn

xxzcalc

n

xZ

Page 55: Estimacion de Parametros

NO SE CONOCEN LAS VARIANZAS POBLACIONALES ( y )Si se considera que:

Se estima una varianza conjunta

22

21

21 2

2

Ahora

21

21

11nn

s

xxt

p

calc

2

11

21

222

2112

nn

snsns p

nSxt

Antes

Page 56: Estimacion de Parametros

Si se considera que: 22

21

NO SE CONOCEN LAS VARIANZAS POBLACIONALES ( Y )2

1 22

Ahora

2

22

1

21

21

ns

ns

xxtcalc

Page 57: Estimacion de Parametros

OBSERVACIONES PAREADASCuando los datos se obtienen antes y después de

realizar un determinado proceso.Ahora:

Es el promedio de las diferencias de las muestras

Es el desvío estándar de las diferencias de las muestras

nSdtd

calc

d

dS

Page 58: Estimacion de Parametros

PRUEBAS DE HIPÓTESIS PARA COMPARAR LAS DESVIACIONES

ESTÁNDAR DE DOS POBLACIONES

Las hipótesis se plantean de la siguiente manera:

211

210

::

HH

0:0:

211

210

HH

Page 59: Estimacion de Parametros

Se usa el estadístico F, que considera el cociente de las varianzas de las dos muestras:

La distribución F ó de Snedecor está tabulada, no es simétrica (tiene asimetría positiva), sólo toma valores positivos, y siempre se debe colocar en el numerador el S mayor.

Determino valores críticos.

2

2

2

1

SSF

Page 60: Estimacion de Parametros

La tabla contiene los valores teóricos de F

correspondientes a la cola superior de la curva , como la curva no es simétrica, para calcular el valor de F de la cola inferior:

a= grados de libertad de la muestra 1b= grados de libertad de la muestra 2

),sup(1),inf(abF

baF