Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]
-
Upload
adonai-sala -
Category
Documents
-
view
218 -
download
1
description
Transcript of Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]
BIOESTADÍSTICA
Universidad Nacional del ComahueFacultad de Ciencias del Ambiente y la Salud
1er cuatrimestre 2016
CONTENIDOS
UNIDAD 4: Estimación de parámetros. Teorema central del
límite. Estadísticos. Distribuciones muestrales. Estimación de
parámetros. Condiciones de un buen estimador. Métodos de
máxima verosimilitud y de mínimos cuadrados. Intervalos de
confianza para la Media y la Variancia de una población Normal, y
para la proporción. Intervalos de confianza para la diferencia de
Medias y el cociente de Variancias de poblaciones Normales
independientes, y para la diferencia de proporciones.
DESCRIPTIVA INFERENCIAL
Auxilio de la Teoría de Probabilidades
ESTADÍSTICA
X1
X2...
Xi...XN
Muestra
Población
X1...Xn
El campo de la inferencia estadística esta formado por los métodosutilizados para tomar decisiones u obtener conclusiones sobre unapoblación utilizando la información contenida en una muestra
“se puede pensar en la inferencia estadística como una colección demétodos para aprender de la experiencia” C. Batanero
Población: es la totalidad de los elementos, o las
observaciones realizadas sobre ellos, que son objeto de
discusión y acerca de los cuales se desea información
Muestra: es un subconjunto de una población
Muestra Experimento Aleatorio
Debe poderse definir con absoluta precisión
Debería ser representativa de la población, una buena muestra
)()(...)(.)(),......,(1
2121
n
iinn XfXfXfXfXXXg
Sea f(x) la función de densidad de una variable aleatoria X, correspondiente a cierta población:
Muestra aleatoria: las variables aleatorias (X1 , X2 , X3 , … , Xn)
constituyen una muestra aleatoria de tamaño n si:
(i) las Xi son variables aleatorias independientes, y
(ii) todas las Xi tienen la misma distribución de probabilidad
por lo tanto su distribución conjunta será:
La comprensión del concepto de muestra aleatoria implica el equilibrioadecuado entre dos ideas aparentemente antagónicas: la representatividadmuestral y la variabilidad muestral. La primera de estas ideas nos sugiereque la muestra tendrá a menudo características similares a las de lapoblación, si ha sido elegida con las precauciones adecuadas. La segunda, elhecho de que no todas las muestras son iguales entre si.
Ejemplo:
3
5
7
3
3
3
5
3
7
5
3
5
5
5
7
7
3
7
5
7
7
TEORÍA DEL MUESTREO
COMO CUANTO
Muestreo simple al azar
Muestreo estratificado al azar
Variabilidad de los datos
Error admisible
Confianza
Estimación de Parámetros Pruebas de Hipótesis
I N F E R E N C I A
Ejemplo de estimación de parámetros:
¿ que proporción de esas 400.000 manzanas están dañadas ?
podemos partir unas pocas manzanas y basándonos en ese resultado, hacer una afirmación sobre el nro de fruta
‘bichada’ que hay en el cuadro ?
NO en forma exacta pero SI en términos probabilísticos
Ejemplo de prueba de hipótesis:
¿ las peras son más suceptibles al daño por carpocapsa que las manzanas ?
Inferencia Inductiva
base de las ciencias empíricas y del progreso científico
Inductiva:
Inferencia
- Premisa mayor
- Premisa menor
- Conclusión
- Hipótesis
- Observación experimental sobreunos pocos frutos de cada cuadro
- Conclusión sobre que pasa en ambos cuadros
Deductiva:
Sujeta a incertidumbre
- María es mayor de 18 años
Concluyente
- Todos los estudiantes del curso de estadística son mayores de 18 años
- María es estudiante del curso de estadística
Imaginemos una bodega que tiene huevos frescos. Por ej. supongamos quecontiene 5000 huevos.
¿qué proporción de estos 5000 huevos sondefectuosos?
Otro ejemplo de estimación de parámetros:
Podemos seleccionar aleatoriamente unos pocos huevos y basándonos en eseresultado, hacer una afirmación sobre el número de huevos defectuosos que hayen la bodega.
Otro ejemplo de prueba de hipótesis:
¿ los huevos del fabricante ‘A’ son ´mejores´ que los producidos por ‘B’ ?
Productor ‘ A’ Productor ‘ B’
Estadístico: es cualquier función de las variables
aleatorias que se observaron en la muestra y que no
contiene cantidades desconocidas
Parámetro: es una caracterización numérica de la
distribución de probabilidad de una población, de manera
que la describe en forma parcial o completa
Sea la muestra M(m): x1 , x2 , x3 , …. , xn
T1(M): (x1 + x2 + x3 +….+ xn) / n
T2(M): (log x1 + log x2 + log x3 +….+ log xn) / n
T3(M): x1 + x2Son Variables Aleatorias
!!!!
Si T se emplea para predecir el valor de un parámetro desconocido recibe el nombre de estimador
Es decir, un estimador, es un estadístico o función obtenido de los datos deuna muestra y que pretendemos que represente lo más fielmente posible a unparámetro poblacional desconocido, que es el objeto de nuestro estudio.
Muestra
Población
Estimación de Parámetros
Para que estos estimadores hagan ‘buenas’ estimaciones deben satisfacer ciertas propiedades:
ser insesgados
ser consistentes
de mínima variancia
Por otro lado hay distintas formas o métodos para realizar una estimación:
Estimación por mínimos cuadrados
Máxima verosimilitud
Método de los momentos
Propiedades de un buen estimador:
• Ser INSESGADO: )ˆE(
h
)E(x
n2
i2 i 1
x
(x x)S
n 1
con
)E(s
ˆE( )
sesgo
• Ser de MINIMA VARIANCIA (eficiente):
si y son 2 estimadores insesgados de se dice que es
mejor que si <
1θ 2θ
1ˆV(θ ) 2
ˆV(θ )
1θ
2θ
• Ser CONSISTENTE:
sea mejor a medida que aumenta el tamaño de muestra, esto es a
medida que n aumenta la distribución de se concentra más alrededor
de
nlim
Plim
n
θ
θ
Cuando se propone algún estimador se debe estudiar
su distribución para ver como se comporta
θ
Error Cuadrático Medio (ECM)
A veces no hay alternativa y es necesario utilizar estimadores sesgados
( ), en tales casos, es importante el ECM de ese estimador que se
define como:
2 2 2ˆ ˆ ˆ ˆ ˆECM(θ) = E E E( ) E( )
ˆE(θ)
2ˆV( ) sesgo
exactitudprecisión
Grado de cercanía que tienen las mediciones con respecto al valor objetivo
Grado de dispersión presente
en los datos
Eficiencia relativa
1
2
ˆECM(θ )ECM( )
Exacto Preciso Exacto y Preciso
Distribuciones de muestreo
3
5
7
3
3
3
5
3
7
5
3
5
5
5
7
7
3
7
5
7
7
5X
66,22
X
543 321 xxx
654 654 xxx
765 987 xxx
9
1 ixXPComo
XE(X) 5
2XV(X) 1,33
xXXE )(
nXV X
X
22)(
XXDE (X)
n
Error estándar de la media
Si X1 , X2 , X3 , …. , Xn es un muestra aleatoria que consiste en n v.a.
independientes normalmente distribuidas con E(Xi) = y V(Xi) = 2.
Entonces la distribución de la media muestral es normal con media
y variancia 2/nX
X N ( ; 2/n)
Sean X1 , X2 , X3 , …. , Xn n variables aleatorias IID con una distribución de
probabilidad no especificada y que tienen una media y una variancia 2
finita. El promedio muestral tiene una distribución con media y variancia
2/n que tiende hacia una normal conforme n tiende a infinito.
En otras palabras, la variable aleatoria Z tiene como límite una distribución
normal estándar.
X
1,0N
n
XZ n
Teorema Central del Límite
En situaciones en que se conoce 2
Tamaño de muestra
Pruebas de hipótesis acerca del valor de Intervalos de
confianza para
1
2 3
4 5
6
5,3X
9167,22 X
Ejemplo:
Muestreo n = 2 :
1 2 3 4 5 6
X
0%
5%
10%
15%
20%
Pro
b
2,78%
5,56%
8,33%
11,11%
13,89%
16,67%
13,89%
11,11%
8,33%
5,56%
2,78%
1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
Media Muestral
Pro
b
Gamma
Uniforme
Población n=2 n=5
Población n=2 n=5
Conociendo establecer x1 y x2 tal que:x
P(x1< x <x2) = 1-
Operando:
nzxi
)/()(
Tamaño de muestra óptimo:
EA
.zn
1a. Intervalo de confianza para con 2 conocida
Yo se que: 95,096,196,1P z
96,196,1P
n
x
nx
n
96,196,1P
x
nx
n
96,196,1P
95,096,196,1P
nx
nx
Por TCL:
Operando:
Si una población normal tiene media = 20 y varianza 2 = 16
a) Cómo se distribuye una media muestral basada en 25 datos extraídos de esa población?
b) Haga un esquema de ambas distribuciones.
Y si no conocemos 2 ??????
Distribución t-Student:
t(n -1)
-5 -4 -3 -2 -1 0 1 2 3 4 50,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
ns
tx ni );/()(
1b. Intervalo de confianza para con 2 desconocida
ns
x
x
x William Sealey Gosset (Student)1876-1937
2. Intervalo de confianza para 2
Empírica: 2(n -1)
sn )(
f
2(n-3) (n-1)
E(2) = n - 1 Mo (2) = n - 3 V(2) = 2 (n -1)
Distribución Chi-cuadrado
Teórica: suma del cuadrado de n-1 variables independiente con distribuciónN(0,1)
z12 + z1
2 + z12 + ... + zn-1
2 2(n -1)
);()(
)(
nii
sn con i = (1-/2) y (/2)
3. Intervalo de confianza para una proporción
Npoblación la en éxitos de Nro
P nmuestra la en éxitos de Nro
p
V.A.
nx
p con x Bi(n ;P) entonces yP)pE( n
P)-P.(1)pV(
por lo tanto:
nP)-P.(1
P-p
N(0;1)
nzi
P)-P.(1.p)P( i(P)
ˆ ˆp.(1-p)p z.
n
Factor de corrección por población finita:
Si la población de donde se extrae la muestra es finita y su tamaño N no es lolo suficientemente grande respecto al tamaño de la muestra n como paragarantizar de que se trate de una muestra aleatoria (datos independientes), lavarianza del estimador debe ser corregido por el siguiente factor:
P.(1 -P) N-nV(p) .
n N-1ˆ
N - nfcpf
N -1
μ1 ?
X1μ2 ?
X2
n1 n2
x x
4. Intervalo de confianza para diferencia de medias
2
22
1
21
2121 ;N ~nn
XX
1 2 1 20 2 2
1 2
1 2
(X X ) ( )Z
n n
Con Z0 ~ N(0;1)
4a. Con varianzas poblacionales conocidas
(iguales o distintas)
Si y nx = ny22
yx
y
y
x
xi nn
zyxyx
)/()( )(
nzyx
yxi
)/()( )(
Si las varianzas poblacionales no son distintas, ambas variancias muestralesestiman la variancia común 2, entonces podemos combinarlas para produciruna sola estimación, digamos:
nnsnsn
s p)()(
Situación 1:
4b. Con varianzas poblacionales desconocidas
y
p
x
pnni n
sns
tyxyxyx
);/()( )(
yxpnn nn
styxyx
);/()(
Situación 2:
Si la homocedasticidad no es sustentable la distribución no esexactamente t con nx+ny-2 grados de libertad pero igualmente funcionacomo una muy buena aproximación:
y
y
x
xnni n
sns
tyxyxyx
22
)2;2/1()( )(
2
1)/(
1)/(
2
22
22
1
21
21
2
2
21
1
21
nns
nns
ns
ns
Nota: los grados de libertad (gl) se deberían calcular como unaponderación de las variancias y se los denomina grados de libertadefectivos ().
5. Intervalo de confianza para diferencia de proporciones
2
22
1
11)2/1(21)(
)ˆ1(ˆ)ˆ1(ˆ)ˆˆ(
21 npp
npp
zppPPi
NOTA: hay casos en que ambas proporciones muestrales son extraídas de una única muestra, en ese caso existe un solo n (n1=n2=n).
nnxx
p
21)2/1(21)(
11)ˆ1.(ˆ)ˆˆ(
21 nnppzppPPi