7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
1/19
BIOESTADSTICA
Universidad Nacional del Comahue
Facultad de Ciencias del Ambiente y la Salud
1er cuatrimestre 2016
CONTENIDOS
UNIDAD 5: Pruebas de Hiptesis. Teora general de las
pruebas de hiptesis. Tipos de errores. Dcimas relativas a la
media, a la variancia y a una proporcin. Comparacin de dos
medias, dos varianzas y dos proporciones, en muestras
independientes. Comparacin de medias en muestras apareadas.
Pruebas de hiptesis no-paramtricas. Comparacin de una series
de frecuencias empricas con una serie terica. Estadstico de
Pearson. Requerimientos de aplicacin del estadstico. Pruebas deindependencia de variables y de bondad de ajustes de modelos de
probabilidad.
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
2/19
Pruebas de Hiptesis
Estimacin de Parmetros Pruebas de Hiptesis
INFERENCIA ESTADSTICA
Qu es una hiptesis estadstica ?
Es una proposicin o afirmacin sobre la distribucin deprobabilidad de una variable aleatoria.
Parmetros de la distribucin
Asociadas a una o ms poblaciones
Forma de la distribucin
Ejemplos:
La edad media de los alumnos del curso es de 22 aos.
Con la aplicacin de un determinado nutriente se obtendrn rendimientos
medios superiores a 2.000 kg/ha, que es la produccin usual de la zona.
El peso promedio al nacimiento de ovejas hembras es menor al de los
machos
La altura de almos sigue una distribucin normal
El nmero de semillas germinadas por placa responde a una distribucin
binomial
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
3/19
Hiptesis acerca de los parmetros de una poblacin:
Caso 1
H0: = 1
H1: =2
Caso 3
H0: = 0
H1: 0
Hiptesis nula
Hiptesis alternativa
Hiptesis
puntualeso simples
Caso 2
H0: = 0
H1: 0 Hiptesis compuestas
Consideraciones importantes:
Las hiptesis son siempre afirmaciones relativas a la poblacin odistribucin bajo estudio, no en torno a la muestra
La hiptesis nula siempre contiene a la hiptesis =0
Hay una estrecha relacin entre la prueba de hiptesis en tornoa un parmetroy el intervalo de confianza de
Puedan combinarse otros casos de Hiptesis nulas e Hiptesis alternativas
Caso 5
H0: 0
H1: 0
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
4/19
Estadstico de prueba y Regla de Decisin
Ho: = 15
H1: 15X1
X2...
Xi...
XN
Poblacin
Muestra
X1...
Xn
Prueba de hiptesis:
Es un procedimiento (o experiencia) que conduce a una toma dedecisin en cuanto a optar por una u otra hiptesis, a la luz de lainformacin proporcionada por una muestra aleatoria extrada
de la poblacin bajo estudio
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Variable
10 11 12 13 14 15 16 17 18 19 20
x
NO RECHAZORECHAZO RECHAZO
obsx obsxobsx
Conclusin sujeta a error
Pruebas
Bilaterales
Unilaterales
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
5/19
Ho es Verdadera Ho es Falsa
Error Decisin correcta
Tipos de error:
DECISIN Rechazo H0
No Rechazo H0 Decisin correcta Error
Error de Tipo I
Error de Tipo II
P(Error Tipo I) = P(Rechazar H0 | H0 es Verdadera) =
P(Error Tipo II) = P(No Rechazar H0 | H0 es Falsa) =
Potencia = 1 - = P(Rechazar H0 | H0 es Falsa)
1
2critx
Zona de rechazo de H0Zona de no rechazo de H0
Representacin esquemtica de tipos de errores
Ho: = 1
H1: = 2
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
6/19
= VEREDICTO =
PRESUNCION
JUICIO
DECISION 2 DECISION 1
H0 H1
Procedimieno general para una prueba de hiptesis:
Del contexto del problema identificar el parmetro de inters
Plantear H0y H1
Planificar una experiencia para la extraccin de la muestra
Establecer el nivel de significacin de la prueba
Seleccionar un estadstico de prueba e identificar su distribucinbajo H0
Establecer regiones de rechazo y no rechazo para el estadsticode prueba
Calcular de la muestra el valor del estadstico
Decidir si debe o no rechazarse H0 e interpretar esto en elcontexto del problema
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
7/19
A. Pruebas sobre una sola muestra
A1. Pruebas de hiptesis acerca de la media de unadistribucin normal con variancia conocida
Problema: A un productor se le ofrece un nutriente con el que obtendrrendimientos medios superiores a 2.000 kg/ha, que es la produccin usual de la
zona. Se sabe que en esa poblacin los rendimientos tienen un desvo estndar
de 210 kg/ha. El productor decide realizar una prueba sobre 9 parcelas, en las
que pretende observar los rendimientos, promediarlos y de acuerdo al resultado
optar o no por el nuevo producto.
DATOS: 2150 1950 2170 1860 2050 2120 1920 1850 2230
a. El parmetro de inters es, redimiento promedio con aplicacin denutriente.
b. Informacin: 2, VA distribucin normal, redimiento promedio sinaplicacin de nutriente,n=9.
c. Planteo H0y H1
H0: 2.000
H1: 2.000
H0: 2.000
H1: 2.000
d. Se acuerda correr un riesgo de rechazar el nutriente cuando enrealidad ste cumple con las especificaciones promocionales, fijandopara ello una probabilidad de error de 5% ( = 0,05)
e. Dado que se conoce 2, el estadstico de prueba es:
Con Z0 ~ N(0;1)
n
xZ
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
8/19
1800 1850 1900 1950 2000 2050 2100 2150 2200 -3 -2 -1 0 1 2 3
f. Regiones de rechazo:
Rechazo H0 si > 2.115,15 kgs/haobsx
Rechazo H0 si zobs > 1,645
g. Clculo del estadstico observado:
2.033,33obsx Zobs = 0,476
h. Conclusin:
No se rechaza H0, es decir, no existe suficiente evidencia como para decir
que efectivamente el nutriente aumenta los rendimientos.
Comentarios:
* P-value de un estadstico de prueba observado es la probabilidad de que
la VA estadstico de prueba tome un valor al menos tan extremo como el
observado dado que la hiptesis nula es verdadera.
En nuestro ejemplo: P-value = P(Z> zobs/ H0 es Verdadera)
* Si la VA bajo estudio no se distribuye normalmente debernconsiderarse las condiciones para la aplicacin del Teorema Central del
Lmite
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
9/19
A2. Pruebas de hiptesis acerca de la media de una distribucinnormal con variancia desconocida
A3. Pruebas de hiptesis sobre la variancia de una distribucinnormal
H0: 2 = 02
H1: 2 02H0: 2 = 02
H1: 2 >02H0: 2 = 02
H1: 2
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
10/19
B. Pruebas sobre dos muestras
B1. Pruebas de hiptesis para la igualdad de dos variancias
Esta prueba es un paso intermedio necesario en las pruebas decomparaciones de medias cuando se desconocen las varianzas poblacionales
:H0
:H0
s
s0F
:H1
Con F0 ~ F(n1-1;n2-1)
Las pruebas unilaterales son muy usadas y constituyen la base de las pruebas
asociadas a la tcnica ANOVA
:H1
Algunas caractersticas
de Distribucin F-Snedecor:
Emprica: F(n1-1;n2-1)
Terica: si Uy V son dos variables aleatorias independientes con
distribucin chi-cuadrado conn1-1 yn2-1 grados de libertad, entonces:
F(n1-1;n2-1)
s
s
F(5,5)
F(12,12)
F(50,50)0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
n
V
n
W
Mo (F) = (n2-1)(n1-3) / (n1-1)(n2-3)
V(F) = 2(n2 -1)2(n1+n2)/(n1-1)(n2-3)2(n2-5)
E(F) = (n2 1)/ (n2 3)
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
11/19
B2. Pruebas de hiptesis sobre las medias de dosdistribuciones normales con variancias conocidas (muestrasindependientes)
Ho: 1 = 2
H1: 1
2
Ho: 1 -2 = 0
H1: 1
-2
0
1 ?
X12 ?
X2
n1 n2
x x
B2. Pruebas de hiptesis sobre las medias de dosdistribuciones normales con variancias conocidas (muestrasindependientes)
Ho: 1 = 2
H1: 1 2
Ho: 1 -2 = 0
H1: 1 -2 0
1 2 1 2
12
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
12/19
Estadstico de prueba se basa en la distribucin de una diferencia de medias:
Bajo H0:
nnXX ;N~
nn
XXZ Con Z0 ~ N(0;1)
Se rechazar H0
si:
Z0 > Z/2 o Z0 < -Z/2
B3. Pruebas de hiptesis sobre las medias de dosdistribuciones normales con variancias desconocidas
Situacin 1:
Dado que las varianzas se estiman de las muestras, antes de calcular el
estadstico de prueba para las medias, debemos verificar mediante una
Prueba F la igualdad de las varianzas poblacionales
Si la conclusin es que las varianzas no son distintas, ambas variancias
muestrales estiman la variancia comn 2, entonces podemos combinarlas
para producir una sola estimacin, digamos:
Este caso, al igual que el visto sobre hiptesis para una media con
varianza desconocida, es el que usualmente debemos resolver.
nn
snsnsp
)()(
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
13/19
El estadstico de prueba ser:
Con t0 ~ t(n1+n2-2)
nns
xxt
p
Se rechazar H0si:
t0 > t
/2 ; n1+n2-2 o t0 < - t
/2 ; n1+n2-2
Ho: 1 = 2
H1: 1 2
Si las hiptesis son de la forma:
Tambin pueden plantearse pruebas unilaterales y todas las combinaciones entre H0y
H1vistas anteriormente:Ho: 1 = 2
H1: 1
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
14/19
B4. Pruebas de hiptesis para muestras apareadas
Se dicen muestras apareadas cuando las obervaciones en las dospoblaciones de inters se recaban de a pares, con la premisa que cada parse toma en condiciones homogeneas, aunque estas condiciones pueden
cambiar de un par a otro.
Ejemplo: considere que estamos interesados en comparar dos tipos de alimentospara cerdos (A y B). Para ello se planea una experiencia donde se suministrar
cada alimento a 10 cerdos para luego comparar el peso ganado al cabo de cierto
tiempo. Pero no contamos con un lote homogeneo de 20 cerdos en cuanto a su
tamao y pensamos que el peso inicial de los animales es un factor que podra
incidir en los aumentos de peso. Para evitar que este efecto peso inicial se pueda
confundir con el efecto alimento se seleccionan parejas de cerdos de igual peso,
y en cada una de ellas se asignan ambos alimentos al azar. Se han obtenido 20
observaciones pero estas estnapareadas.
H0: d = 0
H1: d 0
Para que la hiptesis contemple el efecto de apareo, se calcula una nuevavariabledque consiste en las diferencias observadas en cada par. La hiptesis
nula a probar es que la media de las diferencias es cero
El estadstico asociado a la prueba es:
n
s
dt
d
Con t0 ~ t(n-1)
La comparacin de medias dependientes surge de un muestreo que se realiz
con restricciones en la aleatorizacin, esto constituye el paso elemental en undiseo experimental en el que las unidades experimentales no son homogneas
(DBCA)
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
15/19
B5. Pruebas de hiptesis sobre dos proporciones
H0: P1 = P2
H1: P1 P2
H0: P1 - P2 = 0
H1: P1 - P2 0
nnpp
Z
)..(
p-p 21
nn
xxp
Las pruebas conocidas como chi-cuadrado utilizan el estadstico que dise Karl Pearson
en 1899. Es un ndice que mide la desviacin de las frecuencias observadas en una
muestra respecto a las esperadas bajo una hiptesis.
Frmula de clculo
i fobservado fesperado
1
2
3
.
.
.
.k
f1
f2
f3
.
.
.
.fk
f
1
f
2
f
3
.
.
.
.f
k
k
ii
ii
f
ff
k
i i
ii
e
eo
ne
ok
i i
i
C. Pruebas basadas en el estadstico de Pearson
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
16/19
Pearson estudi la distribucin terica bajo Ho verdadera. Algunas caractersticas son:
1. Tiene distribucin Chi-cuadrado con k-1 grados de libertad
2. Si el valor del estadstico=0 significa que no hay diferencias entre las frecuencias
observadas y esperadas. Cuanto ms se aleja de 0 mayor la discrepancia entre lasfrecuencias
3. Si las frecuencias esperadas < 5 el estadstico se aleja de la distribucin Chi-
Cuadrado por lo que se debe reagrupar intervalos o aumentar el numero de
individuos estudiados.
4. Si la frecuencia total es muy pequea (sobre todo para el caso de 1 grado de
libertad) es aconsejable introducir el factor de correccin de Yates al calcular el
estadstico.
k
i i
ii
e
eo ,
C1. Pruebas de ajuste de modelo:
Modelo gentico (distribucin de proporciones):
Ho: la segregacin de cierto poroto responde a la teora de Mendel 9:3:3:1
(Lisos Amarillos Rugosos Amarilos Lisos Verdes Rugosos Verdes)
Ho: la relacin de moscas ojos blancos respecto a moscas ojos rojos es 1 a 3
Distribucin de probabilidad:
Ho: la variable X sigue una distribucin Poisson con parmetro
Ho: la variable X sigue una distribucin Poisson
Ho: la variable X sigue una distribucin Normal
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
17/19
X fob pesp fesp
x1
x2x3
.
.
.
.
xk
f1
f2f3
.
.
.
.
fk
p1
p2p3
.
.
.
.
pk
f
1
f
2f
3
.
.
.
.
f
k
Ho: X Possion
pi= P(X=xi/X Possion)
= pi. N
2Pearson
2(k-1-p)
if
En general se prueba slo forma y para verificar valor de los parmetros se
dejan las pruebas vistas anteriormente
C2. Pruebas de independencia de dos factores:
Determina si dos factores que clasifican a una poblacin o muestra son
estadsticamente independientes. Es decir, los niveles de un determinado factor no
afectan a los niveles del otro factor. Es la Hiptesis general de una tabla de
contingencia y el principio de anlisis de datos categorizados.
1. Ho:los factores A y B son independientes
2. Proponer un Nivel de significacin
3. Regla de Decisin: Hoes rechazada si y solo si, el valor chi-cuadrado es mayor que elvalor crtico para el nivel de significacin.
4. Clculo del estadstico de Pearson
5. Decisin
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
18/19
Factor A
Factor B
Frecuencias observadasen cada celda porcombinacin de dosniveles de factores
Total General
Total columna
Total fila
Marginales fila
Marginales columna
A1 A2 ... Aa
B1 f11 f12 ... f1a f1.
B2 f21 f22 ... f2a f2.
... ... ... fij ... ...
Bb fb1 fb1 ... fba fb.
f.1 f.2 ... f.a f..
A1 A2 ... Aa
B1 f11 f12 ... f1a f1.
B2 f21 f22 ... f2a f2.
... ... ... ... ... ...
Bb fb1 fb1 ... fba fb.
f.1 f.2 ... f.a f..
Bajo la hiptesis nula, las frecuencias esperadas en una tabla de contingencia se puedenobtener como producto de las frecuencias marginales observadas.
Es decir que bajo independencia de factores se cumple que:
f11 f12 f1a f1.
f.1 f.2 f.a f..= = ==
11f
..
1..111
f
fff
2Pearson 2[(a-1).(b-1)]
7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]
19/19
C3. Pruebas de homogeneidad de muestras
Equivalente a las anteriores slo que aqu se determina si k muestras son
homogeneas en cuanto a una caracterstica que tiene dos alternativas. La nica
diferencia radica en la obtencin de la informacin (muestreo).
A1 A2
Muestra 1 f11 f12 f1.
Muestra 2 f21 f22 f2.
... ... ... ...
Muestra i fi1 fi2 fi.
... ... ... ...
Muestra k fk1 fk1 fk.
f.1 f.2 f..
Top Related