Curso de Estadística Inferencial Aplicado a La Educación

74
Curso de estadística inferencial aplicada al análisis de la educación superior LUZ KARINE ARDILA VARGAS 2015 1

description

Curso estadístico

Transcript of Curso de Estadística Inferencial Aplicado a La Educación

Curso de estadstca nferenca apcada a anss de a educacn superorLUZ KARINE ARDILA VARGAS201511. Contendo1. Introduccn a a estadstca2. Anss Unvarado . Dstrbucones dscretas y contnuas. Dstrbucn norma y e teorema de mte centra. Pruebas de hptessv. Anss de varanzas: ANOVA3. Anss Mutvarado.Coecente de correacn de Pearson. Estudo de as pruebas no paramtrcas de correacn y anss de tabas cruzadas21. Contendo. Anss Factorav. Construccn de Indcadores Snttcosv. Anss mutvarado4. Anss de bases de datosde as pruebas SABERPRO de ICFES, y de Observatoro Labora OLE de Mnstero de Educacn31. Introduccn a a estadstcaDenconesPobacn: Con|unto de undades que comparten aguna caracterstca. E|empos: Los estudantes, os profesores, os graduados, etc.Muestra:Recoeccndeundadesquerepresentanapropadamenteaa muestra. E|empos: La muestra de estudantes cacuada para e Estudo de Satsfaccn de Estudantes. 4:muestra auxar:Pobacn: PesoVaranza=0,52: Margen de error:1,96SatsfaccnServcos acadmcosServcos admnstratvosInfraestructuraApoyosServcos estudantes1. Introduccn a a estadstca5DenconesTposdemedcones:Datosnomnaes,datosordnaes,datosen ntervaos, y datos en tasas. Losdatosprovenendeaundaddeanssqueconsttuyea muestra,puedenservarabescuatatvasocategrcaso cuanttatvas. Ademsasvarabescuanttatvaspuedensercontnuaso dscretas.1. Introduccn a a estadstca61. Introduccn a a estadstcaUna vez se dentc a pobacn, y se recoectaron os datos. Esguentepropstoesdescrbrdeformaapropadaascaracterstcasesencaesdea muestra. Estafaseseeconocecomoaconstruccndeasestadstcasdescrptvastaquesepueda reaconarunprocesogeneradordedatos,esdecr,queosdatossguenunafuncnde dstrbucn probabstca. o La probabdad de espaco muestra es 1, y est acotada entre 0 y 1. oSobrequmedcn esnuestroproceso generadordedatosen asencuestasa estudantes?71. Introduccn a a estadstcaLas dstrbucones tenen formas o caracterstcas sobre e proceso generador de datos. Dos de eos son muy conocdos: a meda y a varanza. 0 1 2 3 4 5 6-10.020.030.040.050.060.070.080.0 - 3.4 0.50.8 12.3 54.2 28.9Hstograma de frecuencas reatvasSatsfaccn con e programa (%) Investgacn (%)Cafetera (%)Satsfaccn%81. Introduccn a a estadstcaLas dstrbucones tenen formas o caracterstcas sobre e proceso generador de datos. Dos de eos son muy conocdos: a meda y a varanza. 9Adems de as anterores meddas. Es muy mportante conocer otros momentos de as dstrbucones:Asmetra Curtoss1. Introduccn a a estadstca10Funcones de dstrbucn DscretasBernouxto No xto00.10.20.30.40.50.60.70.80.290.71Dstrbucn Bernou (6 en a satsfaccn con e programa)1. Introduccn a a estadstca11Bnoma(Geomtrca, Bnoma negatva) 0 1 2 3 4 5 6 7 8 9 10Dstrbucn bnoma (6 en a satsfaccn con e programa, N=10)1. Introduccn a a estadstca12Posson 1 2 3 4 5 6 7 8 9 10 1100.050.10.150.20.25Dstrbucn Posson (Tasa =2,89)1. Introduccn a a estadstca130 1 2 3 4 5 6010 1 2 3 4 5 601 1. Introduccn a a estadstca14Tcncas unvaradas15Dstrbucones de muestrasContnuasNormaT -studentCh cuadrado16Dstrbucn normaSu mportanca:Es una dstrbucn t porque se aproxma aa dstrbucn bnomay esto va a ser muy mportante en as prueba de hptess. Es a pedra anguar de a nferenca estadstca porque as dstrbucones de muchas estadstcas muestraes tenden a esta dstrbucn a medda que crece e tamao de a muestra. 17Dstrbucn normaS os eventos tenen una dstrbucn norma con meda (a) y varanza , entonces:18Dstrbucn norma estndar19Teorema de os grandes nmerosCadasucesndeeventosoreazaconessonndependentese dntcamentedstrbudas,cadaunadeeasconamsmameday varanza. Cuando N es muy muy grande se cumpe que 20Teorema de mte centraCadasucesndeeventosoreazaconessonndependentese dntcamentedstrbudas,cadaunadeeasconamsmameday varanza. Cuando N es muy muy grande se cumpe que 21TeoremaSea X una varabe aeatora bnoma con meda np y varanza np(1-p). Se cumpe que Y tene una dstrbucn norma22Pruebas de hptessLasfunconesdeprobabdadnospermtansaberconqueocurrenca podra ocurrr un evento. De ea sabemos cmo est denda, por ende su medaysuvaranza.Sn embargo, ena readado quevemos eso contraro,vemossonasreazaconesydebemosesestmarsu dstrbucn para hacer agn tpo de nferenca. Cuandoasummosqueasreazaconesquevemossguenaguna dstrbucndebemosestmarsusparmetros.Aestemtodonos refermos como estmacn paramtrca. 23Estmacn puntaHay dos tpos de estmacn paramtrca: Puntua: Mtodo de momentos y de Mxma verosmtud-V24Estmacn puntaAgunosestmadorescomnmenteusadosson,sXsedstrbuyenorma:Dosdeos momentosmuestraesmscomnmenteusadosparacaracterzasunproceso generador de datos: S no se conoce a medaS no se conoce a varanzaS X se dstrbuye bnoma )25Estmacn por ntervaoLo ms mportante de a estmacn por ntervao es a sguente condcn Para souconar este hecho debemos saber sobre qu ntervao es certa a anteror armacn. Para eo necestamos saber como se dstrbuye . Pero antes necestamos denr dos conceptos: Error tpo 1 y e error tpo 2. =0,9999999999999926Estmacn por ntervaoE ntervao de conanza de a estadstca serA contnuacn agunos estmadores y su dstrbucn:Cuando a varanza es conocdaEn readad a varanza no es conocda27Estmacn por ntervaoLa varanzaComo en readad no conocemos a varanza, y en su ugar a estmamos28Estmacn por ntervaoOtros estmadores tes para comparar momentos muestraes son as dferencas de medas y a comparacn de varanzas. La comparacn de varanzas ser29Estmacn por ntervaoAhora s os ntervaos de conanza de cada estmador menconado anterormente:30Estmacn por ntervao 31Estmacn por ntervao32Pruebas de hptessAgunos conceptos bscos de as pruebas de hptess: Hptess nua (): Es a hptess que se consdera como verdad hasta que se demuestre o contraro. Hptess aternatva (: Es a hptess contrara a a nua que a rechaza. Segn os dos tpos de errores (I y II)RechazarNo rechazar En muchas ocasones se consdera ms grave cometer e error I a error II. 33Pruebas de hptessS e nve de conanza es a probabdad de cometer e error tpo IEn e caso ms genera: Por e|empo: e promedo se dstrbuye norma, s se conoce a varanza; sno, se dstrbuye t student. En consecuenca, os estadstcos de prueba respectvamente son: y/oVsVs34Pruebas de hptessEn este caso se conoce a varanza. S no fuese as, sera a dstrbucn t.35Pruebas de hptessVsVsEquvaenteVsVsPor e|empo:36Anss de varanza (Anova)Es comnmente utzado en:Anss de os datos de una varabeAnss de un estudo observaconaSe usa para comparar as propedades muestraes de con|untos de datos de expermentosTambn se usa en anss en as regresones mutvaradasIntutvamente se trata de anazar y expotar a variabilidad37Anss de varanza (ANOVA)Por smpcdad dremos que buscamos expcar a varabe (Punta|e de a prueba saber pro). Adems, se consdera que a fuente de varacn dees a varabe categrca (Programa acadmco). Cada una de as categoras es ndependente. 38Anss de varanza (ANOVA)Supuestos:En a pobacn, a varabe dependente tene dstrbucn norma.La varanza de a varabe dependente es a msma en cada categora. Las observacones son ndependentes. Dferencas de as medas39Anss de varanza (ANOVA)De os 3 grupos tenemos que a desvacn de a meda respecto a a pobacona es(|=1,2,3):Por otro ado, tenemos que hay un trmno de error entre a medcn y a meda pobaconaEntonces:Partconamos a varacn+()+(-) ()+(-) Grupo Error40Anss de varanza (ANOVA)En trmnos conocdos:E anss de a varacn ser por cuenta de una funcn de a desvacn ()+(-) + Suma de cuadrados Totaes (SCT)Suma de cuadrados Tratados(SCTR)Suma de cuadrados de os errores41Anss de varanza (ANOVA)En trmnos conocdos:E anss de a varacn ser por cuenta de una funcn de a desvacn ()+(-) + Suma de cuadrados Totaes (SCT)Suma de cuadrados Tratados(SCTR)Suma de cuadrados de os erroresN-1 |-1 N-|Grados de bertad42Anss de varanza (ANOVA)Nuestro propsto ser dentcar s a varacn corresponde a grupo o no, es decr, a hptess nua a probar es s . S o es, a mayor fuente de expcacn ser motvado por a suma de os errores. En ese caso construmos un estadstco para a comparacn de as varanzas, que dar ugar a a taba Anova. 43Anss de varanza (ANOVA)44Tcncas mutvaradas45Correacn de PearsonE estadstco de Pearson es una medda comn para estabecer a reacn entre varas varabes contnuas. Es dendo como:46E estadstco muestra qu tanta reacn exste entre as dos varabes: Su rango est entre -1 y 1. Reveando s exste una reacn postva o negatva entre as varabes. Usuamente s a correacn estmada es superor a 50% se supone que hay una correacn fuerte.Correacn de Pearson47Mtodos no paramtrcos de correacnMTODO KOLMOGOROV - SMIRNOVEs una tcnca usada para contrastar as dstrbucones de dos varabes, sn asumr nnguna dstrbucn. Por e|empo es t para contrastar a dstrbucn de os punta|es de ICFES segn Insttucones de Educacn Superor. En este caso (de a pares):Se basa en a comparacn de a dstrbucn acumuada de ambas dstrbucones.48Mtodos no paramtrcos de correacnKOLMOGOROV - SMIRNOVEs una tcnca usada para contrastar dstrbucones. Tambn es t para contrastar a dstrbucn de os punta|es de ICFES segn Insttucones de Educacn Superor. En este caso (de a pares):Se basa en a comparacn de a dstrbucn acumuada de ambas dstrbucones.49Frecuenca reatva Frecuenca acumuada DstancaCategoras F(1) F(2) F(1) F(2) F(1) F(2) F(1) - F(2)Muy nsatsfecho 20 4 0,1613 0,0323 0,1613 0,0323 0,1290Insatsfecho 30 27 0,2419 0,2177 0,4032 0,2500 0,1532N satfecho o nsatsfecho13 28 0,1048 0,2258 0,5081 0,4758 0,0323Satsfecho 20 18 0,1613 0,1452 0,6694 0,6210 0,0484Muy satsfecho 41 47 0,3306 0,3790 1,0000 1,0000 0,0000Tota 124 124 1,0000 1,0000D 0,1532(1,36/Raz(N))Vaor Cr0,12213161Mtodos no paramtrcos de correacn50TABLA DE CONTINGENCIASe empea usuamente sobre varabes categrcas. Su ob|etvo es probar s as dos caracterstcas son ndependentes. Mtodos no paramtrcos de correacn51Como no contamos con a probabdad pobacona de cada categora, aestmamoscomoaproporcndeobservaconesquecumpenas condcones sobre a caracterstca A, y a B. Intutvamentequeremosprobarandependenca,entoncesnuestro estadstco nos debe decr s:Mtodos no paramtrcos de correacn52E estadstco de prueba ser:Mtodos no paramtrcos de correacn53Indcadores snttcosEs una medda anatca muy utzada en as cencas socaes y tes en as tomas de decsones. Segn a OECD es a combnacn de os ndcadores que representan dstntos componentes de concepto que se pretende evauar a partr de un contexto mutdmensona. Impca un mtodo de agregacn.Usuamente usa de ponderacones. Las crtcas ms grandes es sobre a decsn de as ponderacones. 54Los eementos mportantes de os ndcadores son:E rangoLa normazacnLa transformacn para hacer de un ndcador mutdmensonaE|empo: Indcador compuesto de efcienciaIndcadores snttcosDesercn consta de 3 ndcadores% de estudantes en os 3 prmeros deces de a prueba SaberPro Indcador de ecenca de programas acadmcos55Anss factoraCon|unto de mtodos Anaza a reacn entre "factores" o componentes. No exge a condcn dependenca ondependenca. Como supuestos: La parsmona y a nterpretabdad. E anss puede ser exporatoro o conrmatoro. 56Pasos57Pasos58E anss factoraTodo comenza con a sguente representacn para a expcacn de dos varabes.Fsonosfactorescomunesqueenvestgadorconsderaqueestn reaconadosconasvarabesaexpcar.Loscoecentesson conocdoscomocargasfactoraes.Ucorrespondeaosfactores ncos.Pueden ncurse ms varabes a expcar. Ese nmero debe ser menor a os factores. 59Anss factoraSupuestos:Las varabes deben estar estandarzadas ta que:E trmno u debe ser ndependente a os factores, e ndependente entre s. E anss de componentes pincipa!es es e msusadoenune|erccoprctcoy exporatoro.Sobretodoporecarcterdeos supuestos.60E anss factoraLa representacn:Entonces:Pueden ncurse ms varabes a expcar. Ese nmero debe ser menor a os factores. 61Pasos62E anss factoraLa matrz de correacn de os factores permtr determnar s hay aguna reacn db o redundante entre os factores. E test de Barett prueba s a matrz de varanza de os datos (R) es a dentdad. E estadstco de prueba se dstrbuye ch cuadrado congrados de bertad63Pasos64Anss factoraUn mtodo comn para saber s e Anss factora es ndcado es medante a anss de as covaranzas de os factores. Una de sus meddas es e anss de adecuacn muestra. En a prctca hay que tener cudado con a emnacn de varabes por medo de este mtodo. La varabe con e menor ndce es a canddata a ser emnada. Medda de adecuacn muestrapara cada 65Recordemos que, en a prctca. La matrz de varanza y covaranza pobacona es: Anss factoraOb|etvoAdetermnarepesodeosfactoressobreaexpcacnde asvarabes.Podremossaberquefactorestenenunpeso nuo en e modeo. 66Pasos67Se pueden utzar varas estrategas para determnar os factores a utzar:1. La experenca. 2. La matrz de varanza y covaranza. 3. E ccuo de os vaores propos de a matrz de varanza y covaranza pobacona, y emnar aqueas varabes con un vaor p superor a 0,7. 4. Fracconar a muestra y evdencar s os factores son guamente mportantes es ambas. Anss factora68Pasos69La rotacn (transformacin) emna ambgedades de as concusones en as etapas prevas.De esa forma con a rotacn agunos pesos (a) sern mayores o nuos en as varabes. Identcando a reacn entre as varabes no ncudas y as ncudas. Es decr, encontrar un mtodo ms smpe. No se perden as propedades matemtcas de a matrz. Anss factora70Pasos71Regresn neaEsunmtodoampamenteusadoparadentcarvarabes determnantesenaexpcacndeatrayectoradeunavarabe dependente. Asume una estructura nea por dencn.Asume que a varabe dependente (y) es expcada por un con|unto de varabes(x),yuntrmnodeerror(sedstrbuyenorma).En consecuenca, se asume aguna causadad. 72Los supuestos en a versn "dea"La normadad de trmno de errorLa varanza de error es constante, y a meda es cero. No hay una reacn muy fuerte entre os regresores. No se estn omtendo varabes reevantes.E error es ndependente a os regresores. No hay endogendad. Regresn nea73Regresn nea74