Conceptos estadistica Unidad IV
Transcript of Conceptos estadistica Unidad IV
-
7/24/2019 Conceptos estadistica Unidad IV
1/17
ContenidoUnidad IV: pruebas de bondad de ajustes y pruebas no paramtricas............................3
4.1.- Bondad de ajuste............................................................................................ 3
4.1.1.- Anlisis ji- cuadrada................................................................................3
4.1.2.- rueba de independencia........................................................................4
4.1.!.- rueba de la bondad de ajuste................................................................5
4.1.4.-"ablas de contin#encia............................................................................5
4.2.- ruebas no paramtricas..............................................................................7
4.2.1.- $scala de medici%n................................................................................8
4.2.2.- rueba de ran#os con si#no de &ilco'on para la mediana...........................9
4.2.!.- rueba de ran#os con si#no de &ilco'on para la di(erencia entre 2 medianas)2 poblciones independientes*.........................................................................10
4.2.4.- rubas de ran#os con si#nos de &ilco'on para la di(erencia de 2 medianas )2poblaciones dependientes+ datos pareados*......................................................11
4.2.,.- rueba de las corridas.......................................................................... 12
4.!.- todos estadsticos contra no paramtricos.................................................12
4.4.- ruebas para /eri(icar la normalidad en un #rupo de datos..............................13
4.4.1.- rueba de 0olmo#oro/ mirno/..........................................................14
4.4.2.- rueba Anderson 3arlin#....................................................................15
4.4.!.- rueba de yan 5oiner.......................................................................16
4.4.4.- rueba de 6appiro &il7....................................................................17
BIB8I9A;IA....................................................................................................19
2
-
7/24/2019 Conceptos estadistica Unidad IV
2/17
Unidad IV: pruebas de bondad de ajustes y pruebas no
paramtricas
-
7/24/2019 Conceptos estadistica Unidad IV
3/17
4.1.2.- rueba de independencia
$l objeti/o es /eri(icar si e'iste una dependencia entre las /ariables cualitati/as=ue de(inen (ilas y columnas+ es decir+ si para todo i 1+ ...+ k y j 1+ ..+ mse/eri(ica =ue la probabilidad del resultado correspondiente a la
combinaci%nAiG Bj es el productode las probabilidades mar#inalescorrespondientes. P)Ai* es la probabilidad del resultado i para la /ariable (ilay P)Bj* la del resultadojpara la /ariable columna.P)AiG Bj* P)Ai* H P)Bj*UtiliCaremos #eneralmente la notaci%n ms simpli(icada:P)AiG Bj* pijP)Ai* piP)Bj* pj8os /alores depiH ypHjse estimarn+ a partir de los /alores obser/ados en la tablade contin#encia+ por niN y nHjN respecti/amente.Hiptesis nula de independencia: para toda combinaci%n de resultados de las
/ariables (ila y columna )i+j*.@?:pijpiHpHj para todo i 1+ ...+ k j 1+ ..+ m8a 6ip%tesis alternati/a+ =ue implica dependencia+ se puede (ormular diciendo =ueal#una de las i#ualdades de la 6ip%tesis nula es (alsa.8os /alores obser/ados son nij. 8os /alores esperados bajo la 6ip%tesis nula deindependencia se calculan de la manera si#uiente:eij NHpij NHpiHHpHj NH )niHN* H )nHjN* )niH nHj*N$l estadstico de contraste se calcula de la manera 6abitual:
8a distribuci%n asint%tica bajo la 6ip%tesis nula es una F2con )kJ 1* H )mJ 1*#rados de libertad. 8os #rados de libertad pueden entenderse+ de manera intuiti/a+entendiendo =ue el nDmero de parmetros =ue se estiman son )kJ 1* y )mJ 1*+ya =ue =ueda (ijada la probabilidad de la Dltima clase de cada caracterstica una/eC estimadas las restantes. or tanto+ aplicando la (%rmula para los #rados delibertad se obtiene:#rados de libertad nDmero de clases J nDmero de parmetros estimados J 1#rados de libertad kH mJ )kJ 1* J )mJ 1* J 1 )kJ 1* H )mJ 1*$l criterio de decisi%n es el mismo =ue en el caso #eneral:ec6aCamos la 6ip%tesis nula si
donde el Dltimo trmino es el /alor crtico asociado con una distribuci%n F2+con )kJ 1* H )mJ 1* #rados de libertad+ tal =ue deja a su derec6a una probabilidadi#ual a E.8a condici%n de /alideC es =ue las (recuencias esperadas eijsean mayores =ue ,.
4
-
7/24/2019 Conceptos estadistica Unidad IV
4/17
4.1.!.- rueba de la bondad de ajuste
Una e'tensi%n de la prueba sobre la proporci%n binomial ocurre cuando unarealiCaci%n puede clasi(icarse en kposibles cate#oras en /eC de dos )'ito y(racaso*. $sto puede ocurrir en la elecci%n de un indi/iduo de un partido poltico
)tricolor+ amarillo+ aCul+ otro*+ en el tipo de delito por el cual un indi/iduo es recluido)un delito de /iolencia+ un delito de cuello blanco+ otro*+ por mencionar al#unosejemplos.
up%n#ase =ue en una muestra en particular se obser/a =ue ocurre un conjuntode e/entos posibles $1+ $2+ $!+ K+ $7)/ase la tabla*+ con (recuencias o1+ o2+ o!+ K+o7+ denominadas frecuencias observadas+ y =ue de acuerdo con las re#las deprobabilidad+ se espera =ue ocurran con (recuencias e 1+ e2+ e!+ K+ e7+ llamdasfrecuencias esperadas. $n un escenario como el descrito arriba se desea saber silas (recuencias obser/adas di(ieren si#ni(icati/amente de las (recuenciasesperadas.
$/ento $1 $2 $! K $7
;recuencia obser/ada o1 o2 o! K o7
;recuencias esperadas e1 e2 e! K e7
$l estadstico
2
proporciona una medida de la discrepancia e'istente entre la
(recuencia obser/ada y la (recuencia esperada+ =ue est dada por
222 22 1 1 2 2
11 2
( )( )( ) ( )...
kj jk k
jk j
o eo eo e o e
e e e e
=
= + + + =
)1*
3onde+ se la (recuencia total es n+
j jo e n= =
. )2*
8a 6ip%tesis nula =ue se desea probar es
@?: p1p1?+Kp7 p7?
5
-
7/24/2019 Conceptos estadistica Unidad IV
5/17
-
7/24/2019 Conceptos estadistica Unidad IV
6/17
e representan estos /alores en una tabla de doble entrada+ llamada tabla decontingencia:
-
7/24/2019 Conceptos estadistica Unidad IV
7/17
mas bien en una escala ordinal tal =ue es bastante natural asi#nar ran#os a losdatos.
Un ejemplo donde se aplica una prueba no paramtrica es el si#uiente+ dos juecesdeben clasi(icar cinco marcas de cer/eCa de muc6a demanda mediante la
asi#naci%n de un #rado de 1 a la marca =ue se considera =ue tiene la mejorcalidad #lobal+ un #rado 2 a la se#unda mejor+ etctera. e puede utiliCar entoncesuna prueba no paramtrica para determinar donde e'iste al#Dn acuerdo entre losdos jueces.
e debe sealar =ue 6ay /arias des/entajas asociadas con las pruebas noparamtricas. $n primer lu#ar+ no utiliCan la in(ormaci%n =ue proporciona lamuestra+ y por ello una prueba no paramtrica ser menos e(iciente =ue elprocedimiento paramtrico correspondiente+ cuando se pueden aplicar ambosmtodos. $n consecuencia+ para lo#rar la misma potencia+ una prueba noparamtrica re=uerir la correspondiente prueba no paramtrica.
-
7/24/2019 Conceptos estadistica Unidad IV
8/17
8a escala de inter"alo+ adems de todas las propiedades de la escala ordinal+6ace =ue ten#a sentido calcular di(erencias entre las mediciones.
;inalmente+ la escala de ra#npermite+ adems de lo de las otras escalas+
comparar mediciones mediante un cociente.
4.2.2.- rueba de ran#os con si#no de &ilco'on para la mediana
3ebido =ue se supone =ue la distribuci%n subyacente es simtrica as =ue
se e'presa la 6ip%tesis de inters en trminos de en /eC de N.
uposici%n: >1+ >2+K >n es una muestra aleatoria de una distribuci%n deprobabilidad continua y simtrica con media y mediana )*
1?|K|>nn|
se deben clasi(icar de menor a mayor
@ip%tesis nula: @?: OO?
Valor del estadstico de prueba
P las suma de los ran#os relacionados con )' i- O?* positi/as.
Hiptesis alternati"a $e%in de rec&a#o para la prueba de ni"el
@a: Q ? P R
-
7/24/2019 Conceptos estadistica Unidad IV
9/17
4.2.!.- rueba de ran#os con si#no de &ilco'on para la di(erenciaentre 2 medianas )2 poblciones independientes*
8a prueba de los ran#os con si#no de &ilco'on es una pruebanoparamtricapara comparar la medianade dos muestras relacionadas y determinar
si e'isten di(erencias entre ellas. e utiliCa como alternati/a a laprueba t detudentcuando no se puede suponer la normalidad de dic6as muestras. 3ebe sunombre a;ran7 &ilco'on+ =ue la public% en 1W4,.1$s una prueba no paramtricade comparaci%n de dos muestras relacionadas+ debe cumplir las si#uientescaractersticas:
X $s libre de cur/a+ no necesita una distribuci%n espec(ica X Mi/el ordinal de la/ariable dependiente X e utiliCa para comparar dos mediciones de ran#os)medianas* y determinar =ue la di(erencia no se deba al aCar )=ue la di(erenciasea estadsticamente si#ni(icati/a*.
e utiliCa cuando la /ariable subyacente es continua pero no se presupone nin#Dntipo de distribuci%nparticular.
upon#a =ue se dispone de npares de obser/aciones+ denominadas . $l
objeti/o del test es comprobar si puede dictaminarse =ue los /alores e son o
no i#uales.
8a 6ip%tesis nulaes : . etrotrayendo dic6a 6ip%tesis a los /alores
ori#inales+ sta /endra a decir =ue son en cierto sentido del mismo tamao.
ara /eri(icar la 6ip%tesis+ en primer lu#ar+ se ordenan los /alores
absolutos y se les asi#na suran#o . $ntonces+ el estadstico de
la prueba de los si#nos de &ilco'on+ + es
es decir+ la suma de los ran#os correspondientes a los /alores
positi/os de .
8a distribuci%n del estadstico puede consultarse en tablas para determinar sise acepta o no la 6ip%tesis nula.
$n ocasiones+ esta prueba se usa para comparar las di(erencias entre dos
muestras de datos tomados antes y despus del tratamiento+ cuyo /alor central se
espera =ue sea cero. 8as di(erencias i#uales a cero son eliminadas y el /alor
absoluto de las des/iaciones con respecto al /alor central son ordenadas de
10
http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesishttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Medianahttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Frank_Wilcoxonhttp://es.wikipedia.org/wiki/Frank_Wilcoxonhttp://es.wikipedia.org/wiki/Prueba_de_los_rangos_con_signo_de_Wilcoxon#cite_note-1http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Hip%C3%B3tesis_nulahttp://es.wikipedia.org/wiki/Rango_(estad%C3%ADstica)http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesishttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Medianahttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Frank_Wilcoxonhttp://es.wikipedia.org/wiki/Prueba_de_los_rangos_con_signo_de_Wilcoxon#cite_note-1http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Hip%C3%B3tesis_nulahttp://es.wikipedia.org/wiki/Rango_(estad%C3%ADstica) -
7/24/2019 Conceptos estadistica Unidad IV
10/17
menor a mayor. A los datos idnticos se les asi#na el lu#ar medio en la serie. 8a
suma de los ran#os se 6ace por separado para los si#nos positi/os y los
ne#ati/os. Srepresenta la menor de esas dos sumas.
-
7/24/2019 Conceptos estadistica Unidad IV
11/17
4.2.,.- rueba de las corridas
8as pruebas de las corridas+ =ue se basan en el orden en el =ue se obtienen lasobser/aciones muestrales+ es una tcnica Dtil para probar la 6ip%tesis nula @ ?de=ue las obser/aciones en realidad se e'traen al aCar.
ara ilustrar las pruebas de corridas. upon#amos =ue se encuestan 12 personas
para saber si utiliCan cierto producto. e cuestionara seriamente la supuesta
aleatoriabilidad de la muestra si las 12 personas (ueran del mismo se'o.
3esi#naremos un 6ombre y una mujer con los smbolos y ;+ respecti/amente+ y
re#istraremos los resultados de acuerdo con su se'o en el orden en =ue ocurren.
ubsecuencia tpica para el e'perimento podra ser
; ; ; ; ; 3onde a#rupamos las subsecuencias de smbolos similares. "ales a#rupamientos
se llaman corridas.
3e(inici%n: una corrida es una subsecuencia de uno o ms smbolos idnticos =ue
representan una propiedad comDn de los datos.
4.(.- )todos estad*sticos contra no paramtricos
$8
-
7/24/2019 Conceptos estadistica Unidad IV
12/17
Una (orma de eliminar esta di(icultad+ es usar U$"A $8A
-
7/24/2019 Conceptos estadistica Unidad IV
13/17
prueba se basa en la comparaci%n entre la (unci%n distribuci%n acumulada de unadistribuci%n te%rica con la (unci%n distribuci%n acumulada de la muestra.i las (unciones de distribuci%n acumulada te%rica y muestral no sonsi#ni(icati/amente di(erentes+ entonces decimos =ue la muestra pro/iene de la
distribuci%n cuya (unci%n distribuci%n acumulada es ; t)'*. in embar#o+ si lasdi(erencias entre las (unciones distribuci%n acumuladas son muy #randes comopara =ue no sean debidas solamente al aCar+ rec6aCamos @o
8os pasos a se#uir en la prueba de bondad de ajuste de 0olmo#oro/-mirno/ sonlos si#uientes:
lantear la 6ip%tesis: @o: ;m)>*;t)>* para todo > $ ] @a: ;m)>*;t)>*+por lo menos para un >.
* de la muestra >1+>2+K.+>n.
3eterminar la des/iaci%n m'ima+ =ue est dada por el supremo de los
/alores absolutos de las di(erencias entre los /alores dela (unci%n acumulada te%rica y de la muestra.
$sco#er un ni/el de si#ni(icaci%n
3e acuerdo al resultado se toma la decisi%n
8as suposiciones en la prueba de bondad de ajuste de 0olmo#oro/-mirno/ son:1. uestras Aleatorias
2. 8a poblaci%n deber ser continua en la /ariable obser/ada
!. 8a prueba no es /alidad si se tiene =ue estimar uno o ms parmetrosusando los datos de la muestra.
"AB8A 3$ 098999V-IM9V
14
-
7/24/2019 Conceptos estadistica Unidad IV
14/17
4.4.2.- rueba Anderson 3arlin#
8a prueba de Anderson-3arlin# es usada para probar si una muestra /iene de unadistribuci%n especi(ica. $sta prueba es una modi(icaci%n de la prueba de
0olmo#oro/- mirno/ donde se le da ms peso a las colas de la distribuci%n =uela prueba de 0olmo#oro/-mirno/.
$n estadstica+ la prueba de Anderson-3arlin# es una prueba no paramtrica sobresi los datos de una muestra pro/ienen de una distribuci%n espec(ica. 8a (%rmulapara el estadstico determina si los datos )obser/ar =ue los datos se debenordenar* /ienen de una distribuci%n con (unci%n acumulati/a ;.
3onde:
n es el nDmero de datos
()'*: es la (unci%n de distribuci%n de probabilidad te%rica
;)>*: es la (unci%n de distribuci%n emprica.
ara de(inir la re#la de rec6aCo para esta prueba es necesario+ tambin+ obtener elestadstico ajustado para lue#o compararlo con los /alores crticos de la tabla de
Anderson- 3arlin#
15
-
7/24/2019 Conceptos estadistica Unidad IV
15/17
Una /eC obtenido el estadstico ajustado+ la re#la de rec6aCo se realiCaanlo#amente a la utiliCada en la prueba de 0-.
$l estadstico de la prueba se puede entonces comparar contra lasdistribuciones del estadstico de prueba )dependiendo =ue ; se utiliCa* para
determinar el - /alor.
4.4.!.- rueba de yan 5oiner
8a prueba de ryan joiner es usada para probar si una muestra /iene de muestraespeci(ica. $sta prueba es una modi(icaci%n de la prueba de 0olmo#orc7 mirno/ donde se da ms paso a las colas de la distribuci%n =ue la prueba de0olmo#orc7 mirno/.
$s una prueba no paramtrica donde sobre si los datos de una muestra pro/ienede una distribuci%n especi(ica la (%rmula para el estadstico determina si los datos
)obser/ar =ue los datos se deben ordenar* /ienen de una distribuci%n conacumulati/a ;.
;ormulas:
A2=NS
3onde el estadstico de prueba para la prueba de Anderson 3arlin#:
4.4.4.- rueba de 6appiro &il7
ide el ajuste de la muestra a una recta+ al dibujarla en papel probabilsticonormal. $ste tipo de representaci%n tambin lo proporcionan al#unos pro#ramasde estadstica+ de tal manera =ue nos permite adems apreciar el ajuste o
desajuste de (orma /isual:
16
-
7/24/2019 Conceptos estadistica Unidad IV
16/17
$n escala probabilstica normal se representa en el eje 6oriContal+ para cada /alorobser/ado en nuestros datos+ la (unci%n de distribuci%n o probabilidad acumuladaobser/ada+ y en el eje /ertical la pre/ista por el modelo de distribuci%n normal. iel ajuste es bueno+ los puntos se deben distribuir apro'imadamente se#Dn unarecta a 4,^. $n la ima#en /emos =ue en este ejemplo e'iste cierta discrepancia.
$n cual=uier caso siempre es adecuado e(ectuar una representaci%n #r(ica detipo 6isto#rama de los datos+ y comparar el /alor de la media y la mediana+ ascomo e/aluar el coe(iciente de asimetra y apuntamiento+ adems de lle/ar a cabouna representaci%n en escala probabilstica de la distribuci%n de probabilidadesperada /ersus obser/ada+ como la de la (i#ura.
-
7/24/2019 Conceptos estadistica Unidad IV
17/17
donde 3 es la suma de las di(erencias corre#idas.
e rec6aCar la 6ip%tesis nula de normalidad si el estadstico & es menor =ue el/alor crtico proporcionado por la tabla elaborada por los autores para el tamaomuestral y el ni/el de si#ni(icaci%n dado.
BIB,I$/0I/
ar=us dos antos+ ara 5os] $stadstica Bsica: un en(o=ue no paramtrico+Uni/ersidad Macional Aut%noma de 'ico+ ;acultad de $studios uperiores_ara#oCa
8lins olano+ @umberto] $stadstica in(erencial+ $diciones Uninorte+ 2??Y$st. Bsica p Adm%n. - Berenson+ 8e/ine
robabilidad y $stadstica Aplicadas a la In#eniera )ont#omery - un#er* - 2^$dici%n S