Conceptos estadistica Unidad IV

download Conceptos estadistica Unidad IV

of 17

Transcript of Conceptos estadistica Unidad IV

  • 7/24/2019 Conceptos estadistica Unidad IV

    1/17

    ContenidoUnidad IV: pruebas de bondad de ajustes y pruebas no paramtricas............................3

    4.1.- Bondad de ajuste............................................................................................ 3

    4.1.1.- Anlisis ji- cuadrada................................................................................3

    4.1.2.- rueba de independencia........................................................................4

    4.1.!.- rueba de la bondad de ajuste................................................................5

    4.1.4.-"ablas de contin#encia............................................................................5

    4.2.- ruebas no paramtricas..............................................................................7

    4.2.1.- $scala de medici%n................................................................................8

    4.2.2.- rueba de ran#os con si#no de &ilco'on para la mediana...........................9

    4.2.!.- rueba de ran#os con si#no de &ilco'on para la di(erencia entre 2 medianas)2 poblciones independientes*.........................................................................10

    4.2.4.- rubas de ran#os con si#nos de &ilco'on para la di(erencia de 2 medianas )2poblaciones dependientes+ datos pareados*......................................................11

    4.2.,.- rueba de las corridas.......................................................................... 12

    4.!.- todos estadsticos contra no paramtricos.................................................12

    4.4.- ruebas para /eri(icar la normalidad en un #rupo de datos..............................13

    4.4.1.- rueba de 0olmo#oro/ mirno/..........................................................14

    4.4.2.- rueba Anderson 3arlin#....................................................................15

    4.4.!.- rueba de yan 5oiner.......................................................................16

    4.4.4.- rueba de 6appiro &il7....................................................................17

    BIB8I9A;IA....................................................................................................19

    2

  • 7/24/2019 Conceptos estadistica Unidad IV

    2/17

    Unidad IV: pruebas de bondad de ajustes y pruebas no

    paramtricas

  • 7/24/2019 Conceptos estadistica Unidad IV

    3/17

    4.1.2.- rueba de independencia

    $l objeti/o es /eri(icar si e'iste una dependencia entre las /ariables cualitati/as=ue de(inen (ilas y columnas+ es decir+ si para todo i 1+ ...+ k y j 1+ ..+ mse/eri(ica =ue la probabilidad del resultado correspondiente a la

    combinaci%nAiG Bj es el productode las probabilidades mar#inalescorrespondientes. P)Ai* es la probabilidad del resultado i para la /ariable (ilay P)Bj* la del resultadojpara la /ariable columna.P)AiG Bj* P)Ai* H P)Bj*UtiliCaremos #eneralmente la notaci%n ms simpli(icada:P)AiG Bj* pijP)Ai* piP)Bj* pj8os /alores depiH ypHjse estimarn+ a partir de los /alores obser/ados en la tablade contin#encia+ por niN y nHjN respecti/amente.Hiptesis nula de independencia: para toda combinaci%n de resultados de las

    /ariables (ila y columna )i+j*.@?:pijpiHpHj para todo i 1+ ...+ k j 1+ ..+ m8a 6ip%tesis alternati/a+ =ue implica dependencia+ se puede (ormular diciendo =ueal#una de las i#ualdades de la 6ip%tesis nula es (alsa.8os /alores obser/ados son nij. 8os /alores esperados bajo la 6ip%tesis nula deindependencia se calculan de la manera si#uiente:eij NHpij NHpiHHpHj NH )niHN* H )nHjN* )niH nHj*N$l estadstico de contraste se calcula de la manera 6abitual:

    8a distribuci%n asint%tica bajo la 6ip%tesis nula es una F2con )kJ 1* H )mJ 1*#rados de libertad. 8os #rados de libertad pueden entenderse+ de manera intuiti/a+entendiendo =ue el nDmero de parmetros =ue se estiman son )kJ 1* y )mJ 1*+ya =ue =ueda (ijada la probabilidad de la Dltima clase de cada caracterstica una/eC estimadas las restantes. or tanto+ aplicando la (%rmula para los #rados delibertad se obtiene:#rados de libertad nDmero de clases J nDmero de parmetros estimados J 1#rados de libertad kH mJ )kJ 1* J )mJ 1* J 1 )kJ 1* H )mJ 1*$l criterio de decisi%n es el mismo =ue en el caso #eneral:ec6aCamos la 6ip%tesis nula si

    donde el Dltimo trmino es el /alor crtico asociado con una distribuci%n F2+con )kJ 1* H )mJ 1* #rados de libertad+ tal =ue deja a su derec6a una probabilidadi#ual a E.8a condici%n de /alideC es =ue las (recuencias esperadas eijsean mayores =ue ,.

    4

  • 7/24/2019 Conceptos estadistica Unidad IV

    4/17

    4.1.!.- rueba de la bondad de ajuste

    Una e'tensi%n de la prueba sobre la proporci%n binomial ocurre cuando unarealiCaci%n puede clasi(icarse en kposibles cate#oras en /eC de dos )'ito y(racaso*. $sto puede ocurrir en la elecci%n de un indi/iduo de un partido poltico

    )tricolor+ amarillo+ aCul+ otro*+ en el tipo de delito por el cual un indi/iduo es recluido)un delito de /iolencia+ un delito de cuello blanco+ otro*+ por mencionar al#unosejemplos.

    up%n#ase =ue en una muestra en particular se obser/a =ue ocurre un conjuntode e/entos posibles $1+ $2+ $!+ K+ $7)/ase la tabla*+ con (recuencias o1+ o2+ o!+ K+o7+ denominadas frecuencias observadas+ y =ue de acuerdo con las re#las deprobabilidad+ se espera =ue ocurran con (recuencias e 1+ e2+ e!+ K+ e7+ llamdasfrecuencias esperadas. $n un escenario como el descrito arriba se desea saber silas (recuencias obser/adas di(ieren si#ni(icati/amente de las (recuenciasesperadas.

    $/ento $1 $2 $! K $7

    ;recuencia obser/ada o1 o2 o! K o7

    ;recuencias esperadas e1 e2 e! K e7

    $l estadstico

    2

    proporciona una medida de la discrepancia e'istente entre la

    (recuencia obser/ada y la (recuencia esperada+ =ue est dada por

    222 22 1 1 2 2

    11 2

    ( )( )( ) ( )...

    kj jk k

    jk j

    o eo eo e o e

    e e e e

    =

    = + + + =

    )1*

    3onde+ se la (recuencia total es n+

    j jo e n= =

    . )2*

    8a 6ip%tesis nula =ue se desea probar es

    @?: p1p1?+Kp7 p7?

    5

  • 7/24/2019 Conceptos estadistica Unidad IV

    5/17

  • 7/24/2019 Conceptos estadistica Unidad IV

    6/17

    e representan estos /alores en una tabla de doble entrada+ llamada tabla decontingencia:

  • 7/24/2019 Conceptos estadistica Unidad IV

    7/17

    mas bien en una escala ordinal tal =ue es bastante natural asi#nar ran#os a losdatos.

    Un ejemplo donde se aplica una prueba no paramtrica es el si#uiente+ dos juecesdeben clasi(icar cinco marcas de cer/eCa de muc6a demanda mediante la

    asi#naci%n de un #rado de 1 a la marca =ue se considera =ue tiene la mejorcalidad #lobal+ un #rado 2 a la se#unda mejor+ etctera. e puede utiliCar entoncesuna prueba no paramtrica para determinar donde e'iste al#Dn acuerdo entre losdos jueces.

    e debe sealar =ue 6ay /arias des/entajas asociadas con las pruebas noparamtricas. $n primer lu#ar+ no utiliCan la in(ormaci%n =ue proporciona lamuestra+ y por ello una prueba no paramtrica ser menos e(iciente =ue elprocedimiento paramtrico correspondiente+ cuando se pueden aplicar ambosmtodos. $n consecuencia+ para lo#rar la misma potencia+ una prueba noparamtrica re=uerir la correspondiente prueba no paramtrica.

  • 7/24/2019 Conceptos estadistica Unidad IV

    8/17

    8a escala de inter"alo+ adems de todas las propiedades de la escala ordinal+6ace =ue ten#a sentido calcular di(erencias entre las mediciones.

    ;inalmente+ la escala de ra#npermite+ adems de lo de las otras escalas+

    comparar mediciones mediante un cociente.

    4.2.2.- rueba de ran#os con si#no de &ilco'on para la mediana

    3ebido =ue se supone =ue la distribuci%n subyacente es simtrica as =ue

    se e'presa la 6ip%tesis de inters en trminos de en /eC de N.

    uposici%n: >1+ >2+K >n es una muestra aleatoria de una distribuci%n deprobabilidad continua y simtrica con media y mediana )*

    1?|K|>nn|

    se deben clasi(icar de menor a mayor

    @ip%tesis nula: @?: OO?

    Valor del estadstico de prueba

    P las suma de los ran#os relacionados con )' i- O?* positi/as.

    Hiptesis alternati"a $e%in de rec&a#o para la prueba de ni"el

    @a: Q ? P R

  • 7/24/2019 Conceptos estadistica Unidad IV

    9/17

    4.2.!.- rueba de ran#os con si#no de &ilco'on para la di(erenciaentre 2 medianas )2 poblciones independientes*

    8a prueba de los ran#os con si#no de &ilco'on es una pruebanoparamtricapara comparar la medianade dos muestras relacionadas y determinar

    si e'isten di(erencias entre ellas. e utiliCa como alternati/a a laprueba t detudentcuando no se puede suponer la normalidad de dic6as muestras. 3ebe sunombre a;ran7 &ilco'on+ =ue la public% en 1W4,.1$s una prueba no paramtricade comparaci%n de dos muestras relacionadas+ debe cumplir las si#uientescaractersticas:

    X $s libre de cur/a+ no necesita una distribuci%n espec(ica X Mi/el ordinal de la/ariable dependiente X e utiliCa para comparar dos mediciones de ran#os)medianas* y determinar =ue la di(erencia no se deba al aCar )=ue la di(erenciasea estadsticamente si#ni(icati/a*.

    e utiliCa cuando la /ariable subyacente es continua pero no se presupone nin#Dntipo de distribuci%nparticular.

    upon#a =ue se dispone de npares de obser/aciones+ denominadas . $l

    objeti/o del test es comprobar si puede dictaminarse =ue los /alores e son o

    no i#uales.

    8a 6ip%tesis nulaes : . etrotrayendo dic6a 6ip%tesis a los /alores

    ori#inales+ sta /endra a decir =ue son en cierto sentido del mismo tamao.

    ara /eri(icar la 6ip%tesis+ en primer lu#ar+ se ordenan los /alores

    absolutos y se les asi#na suran#o . $ntonces+ el estadstico de

    la prueba de los si#nos de &ilco'on+ + es

    es decir+ la suma de los ran#os correspondientes a los /alores

    positi/os de .

    8a distribuci%n del estadstico puede consultarse en tablas para determinar sise acepta o no la 6ip%tesis nula.

    $n ocasiones+ esta prueba se usa para comparar las di(erencias entre dos

    muestras de datos tomados antes y despus del tratamiento+ cuyo /alor central se

    espera =ue sea cero. 8as di(erencias i#uales a cero son eliminadas y el /alor

    absoluto de las des/iaciones con respecto al /alor central son ordenadas de

    10

    http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesishttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Medianahttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Frank_Wilcoxonhttp://es.wikipedia.org/wiki/Frank_Wilcoxonhttp://es.wikipedia.org/wiki/Prueba_de_los_rangos_con_signo_de_Wilcoxon#cite_note-1http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Hip%C3%B3tesis_nulahttp://es.wikipedia.org/wiki/Rango_(estad%C3%ADstica)http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesishttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Estad%C3%ADstica_no_param%C3%A9tricahttp://es.wikipedia.org/wiki/Medianahttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Prueba_t_de_Studenthttp://es.wikipedia.org/wiki/Frank_Wilcoxonhttp://es.wikipedia.org/wiki/Prueba_de_los_rangos_con_signo_de_Wilcoxon#cite_note-1http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidadhttp://es.wikipedia.org/wiki/Hip%C3%B3tesis_nulahttp://es.wikipedia.org/wiki/Rango_(estad%C3%ADstica)
  • 7/24/2019 Conceptos estadistica Unidad IV

    10/17

    menor a mayor. A los datos idnticos se les asi#na el lu#ar medio en la serie. 8a

    suma de los ran#os se 6ace por separado para los si#nos positi/os y los

    ne#ati/os. Srepresenta la menor de esas dos sumas.

  • 7/24/2019 Conceptos estadistica Unidad IV

    11/17

    4.2.,.- rueba de las corridas

    8as pruebas de las corridas+ =ue se basan en el orden en el =ue se obtienen lasobser/aciones muestrales+ es una tcnica Dtil para probar la 6ip%tesis nula @ ?de=ue las obser/aciones en realidad se e'traen al aCar.

    ara ilustrar las pruebas de corridas. upon#amos =ue se encuestan 12 personas

    para saber si utiliCan cierto producto. e cuestionara seriamente la supuesta

    aleatoriabilidad de la muestra si las 12 personas (ueran del mismo se'o.

    3esi#naremos un 6ombre y una mujer con los smbolos y ;+ respecti/amente+ y

    re#istraremos los resultados de acuerdo con su se'o en el orden en =ue ocurren.

    ubsecuencia tpica para el e'perimento podra ser

    ; ; ; ; ; 3onde a#rupamos las subsecuencias de smbolos similares. "ales a#rupamientos

    se llaman corridas.

    3e(inici%n: una corrida es una subsecuencia de uno o ms smbolos idnticos =ue

    representan una propiedad comDn de los datos.

    4.(.- )todos estad*sticos contra no paramtricos

    $8

  • 7/24/2019 Conceptos estadistica Unidad IV

    12/17

    Una (orma de eliminar esta di(icultad+ es usar U$"A $8A

  • 7/24/2019 Conceptos estadistica Unidad IV

    13/17

    prueba se basa en la comparaci%n entre la (unci%n distribuci%n acumulada de unadistribuci%n te%rica con la (unci%n distribuci%n acumulada de la muestra.i las (unciones de distribuci%n acumulada te%rica y muestral no sonsi#ni(icati/amente di(erentes+ entonces decimos =ue la muestra pro/iene de la

    distribuci%n cuya (unci%n distribuci%n acumulada es ; t)'*. in embar#o+ si lasdi(erencias entre las (unciones distribuci%n acumuladas son muy #randes comopara =ue no sean debidas solamente al aCar+ rec6aCamos @o

    8os pasos a se#uir en la prueba de bondad de ajuste de 0olmo#oro/-mirno/ sonlos si#uientes:

    lantear la 6ip%tesis: @o: ;m)>*;t)>* para todo > $ ] @a: ;m)>*;t)>*+por lo menos para un >.

    * de la muestra >1+>2+K.+>n.

    3eterminar la des/iaci%n m'ima+ =ue est dada por el supremo de los

    /alores absolutos de las di(erencias entre los /alores dela (unci%n acumulada te%rica y de la muestra.

    $sco#er un ni/el de si#ni(icaci%n

    3e acuerdo al resultado se toma la decisi%n

    8as suposiciones en la prueba de bondad de ajuste de 0olmo#oro/-mirno/ son:1. uestras Aleatorias

    2. 8a poblaci%n deber ser continua en la /ariable obser/ada

    !. 8a prueba no es /alidad si se tiene =ue estimar uno o ms parmetrosusando los datos de la muestra.

    "AB8A 3$ 098999V-IM9V

    14

  • 7/24/2019 Conceptos estadistica Unidad IV

    14/17

    4.4.2.- rueba Anderson 3arlin#

    8a prueba de Anderson-3arlin# es usada para probar si una muestra /iene de unadistribuci%n especi(ica. $sta prueba es una modi(icaci%n de la prueba de

    0olmo#oro/- mirno/ donde se le da ms peso a las colas de la distribuci%n =uela prueba de 0olmo#oro/-mirno/.

    $n estadstica+ la prueba de Anderson-3arlin# es una prueba no paramtrica sobresi los datos de una muestra pro/ienen de una distribuci%n espec(ica. 8a (%rmulapara el estadstico determina si los datos )obser/ar =ue los datos se debenordenar* /ienen de una distribuci%n con (unci%n acumulati/a ;.

    3onde:

    n es el nDmero de datos

    ()'*: es la (unci%n de distribuci%n de probabilidad te%rica

    ;)>*: es la (unci%n de distribuci%n emprica.

    ara de(inir la re#la de rec6aCo para esta prueba es necesario+ tambin+ obtener elestadstico ajustado para lue#o compararlo con los /alores crticos de la tabla de

    Anderson- 3arlin#

    15

  • 7/24/2019 Conceptos estadistica Unidad IV

    15/17

    Una /eC obtenido el estadstico ajustado+ la re#la de rec6aCo se realiCaanlo#amente a la utiliCada en la prueba de 0-.

    $l estadstico de la prueba se puede entonces comparar contra lasdistribuciones del estadstico de prueba )dependiendo =ue ; se utiliCa* para

    determinar el - /alor.

    4.4.!.- rueba de yan 5oiner

    8a prueba de ryan joiner es usada para probar si una muestra /iene de muestraespeci(ica. $sta prueba es una modi(icaci%n de la prueba de 0olmo#orc7 mirno/ donde se da ms paso a las colas de la distribuci%n =ue la prueba de0olmo#orc7 mirno/.

    $s una prueba no paramtrica donde sobre si los datos de una muestra pro/ienede una distribuci%n especi(ica la (%rmula para el estadstico determina si los datos

    )obser/ar =ue los datos se deben ordenar* /ienen de una distribuci%n conacumulati/a ;.

    ;ormulas:

    A2=NS

    3onde el estadstico de prueba para la prueba de Anderson 3arlin#:

    4.4.4.- rueba de 6appiro &il7

    ide el ajuste de la muestra a una recta+ al dibujarla en papel probabilsticonormal. $ste tipo de representaci%n tambin lo proporcionan al#unos pro#ramasde estadstica+ de tal manera =ue nos permite adems apreciar el ajuste o

    desajuste de (orma /isual:

    16

  • 7/24/2019 Conceptos estadistica Unidad IV

    16/17

    $n escala probabilstica normal se representa en el eje 6oriContal+ para cada /alorobser/ado en nuestros datos+ la (unci%n de distribuci%n o probabilidad acumuladaobser/ada+ y en el eje /ertical la pre/ista por el modelo de distribuci%n normal. iel ajuste es bueno+ los puntos se deben distribuir apro'imadamente se#Dn unarecta a 4,^. $n la ima#en /emos =ue en este ejemplo e'iste cierta discrepancia.

    $n cual=uier caso siempre es adecuado e(ectuar una representaci%n #r(ica detipo 6isto#rama de los datos+ y comparar el /alor de la media y la mediana+ ascomo e/aluar el coe(iciente de asimetra y apuntamiento+ adems de lle/ar a cabouna representaci%n en escala probabilstica de la distribuci%n de probabilidadesperada /ersus obser/ada+ como la de la (i#ura.

  • 7/24/2019 Conceptos estadistica Unidad IV

    17/17

    donde 3 es la suma de las di(erencias corre#idas.

    e rec6aCar la 6ip%tesis nula de normalidad si el estadstico & es menor =ue el/alor crtico proporcionado por la tabla elaborada por los autores para el tamaomuestral y el ni/el de si#ni(icaci%n dado.

    BIB,I$/0I/

    ar=us dos antos+ ara 5os] $stadstica Bsica: un en(o=ue no paramtrico+Uni/ersidad Macional Aut%noma de 'ico+ ;acultad de $studios uperiores_ara#oCa

    8lins olano+ @umberto] $stadstica in(erencial+ $diciones Uninorte+ 2??Y$st. Bsica p Adm%n. - Berenson+ 8e/ine

    robabilidad y $stadstica Aplicadas a la In#eniera )ont#omery - un#er* - 2^$dici%n S