Material de Apoyo curso 7 Matemática

download Material de Apoyo curso 7 Matemática

of 100

Transcript of Material de Apoyo curso 7 Matemática

PROGRAMA DIGNIFICACIN DEL MAGISTERIO Y DESARROLLO PROFESIONALDE DIRECTIVOS Y DOCENTES PROYECTO PROGRAMA DE ESPECIALIZACIN DOCENTE PARA LA ENSEANZA DE LENGUAJE Y LITERATURA, ESTUDIOS SOCIALES, MATEMTICA, BIOLOGA, QUMICA Y FSICA PARA DOCENTES DE EDUCACIN MEDIA Y TERCER CICLO DE EDUCACIN BSICA. (POSTGRADO PARA DOCENTES DE EDUCACIN MEDIA) Matemtica MATERIAL DE APOYO - CURSO 7 ESTADSTICA San Salvador, Septiembre-Noviembre 2011 Ministerio de Educacin Direccin Nacional de Educacin Gerencia de Gestin Pedaggica Escuela Superior de Maestros REPBLICA DE EL SALVADOR MINISTERIO DE EDUCACIN DIRECCIN NACIONAL DE EDUCACIN Mauricio Funes Presidente de la Repblica de El Salvador Salvador Snchez Cern Vicepresidente de la Repblica de El Salvador yMinistro de Educacin Ad-honoren Eduardo Bada Serra Viceministro de Educacin Erlinda Handal Viceministra deCiencia y Tecnologa Sandra Alas Guidos Directora Nacional de Gestin Departamental Lorena Duque de Rodrguez Directora Nacional de Educacin Lorena Janet Serrano de Lpez Gerencia de Gestin Pedaggica Luis Armando Gonzlez GonzlezDirector General de Escuela Superior de Maestros ESMA Rolando Lemus Gmez Coordinador de Matemtica REPBLICA DE EL SALVADOR MINISTERIO DE EDUCACIN DIRECCIN NACIONAL DE EDUCACIN INTRODUCCIN. ElMinisteriodeEducacin,conscientedelanecesidaddefortalecerlascompetenciasdelosdocentesal nivelde Educacin Media y Tercer Ciclo, ofrece el programa de Formacin Docente en las asignaturas de: Lenguaje y Literatura, Estudios Sociales, Matemtica,Biologa, Qumica y Fsica. ElprogramadeFormacinDocenterespondeanecesidadesdeactualizacinyespecializacin docente y en coherencia con elPlan Social Educativo 2009-2014,a la lnea estratgica Dignificacin del Magisterio y Desarrollo Profesional. Esteprogramatienecomopropsitocontribuiralacualificacindeldesarrolloprofesionaly desempeo docente, por consiguiente al mejoramiento de los aprendizajesde los educandos.

OBJETIVO GENERAL. Contribuir al desarrollo profesional docente del profesorado del pas, en el manejo de contenidos y herramientas pedaggicas necesarias para mejorar su desempeo en el aula.Garantizareldesarrollodeaprendizajessignificativosenloseducandosatravsdeprcticas docentes exitosas. Cualificarlaoferta formativade losdocentesen servicio delMinisteriodeEducacinatravsde cursos especializados que garanticenlas buenas prcticas pedaggicas. OBJETIVOS ESPECFICOS. Mejorar enel cortoy mediano plazo losconocimientos y el uso de herramientas pedaggicas de los maestros y maestras del sector pblico, en las asignaturas bsicas del currculo. Fortalecereldesarrollodeconocimientosespecializadosenlasdiferentesreas,quepermitanal docente una eficienteaplicacin de los programas de cada asignatura. Desarrollarcursos que permitan la especializacin docente en las asignaturas bsicas de acuerdo en nivel que ejerce el docente. Facilitarelaccesoafuentesactualizadasdelconocimientoparaintroduciralasinstituciones educativas en los cambios generados por el avance de la ciencia y la tecnologa. FORMACIN DOCENTEMATEMTICA - Curso 7 1 (Para impresin sta pgina debe quedar en blanco) Ministerio de EducacinDireccin Nacional de EducacinGerencia de Gestin PedaggicaEscuela Superior de MaestrosMDULO ESTADSTICAEquipo de diseo:Rolando Lemus Gmez (Coordinador)Francisco Asdrubal Hernndez RamrezCamilo Salvador Ernesto Zamora CastroJose Ren Palacios BarreraPedro Armando Ramos AlbertoRicardo Salvador Ros MrquezWalter Otoniel Campos GranadosIngrid Carolina Martnez BarahonaJos Nerys Funes TorresOscar Hernn Lemus GmezArmando Figueroa MoralesOscar de Jess Aguila ChvezCarlos Ernesto Gmez RodrguezMarcelino Meja GonzlezJos Henry Garca FloresJorge Alberto Martnez GutirrezSan Salvador, Septiembre-Noviembre 2011ResumenLa estadstica es una de las herramientas ms ampliamente utilizadas en la investigacin cientca.Su aplicacin en instituciones gubernamentales y educativas, en los negocios y en la industria, en labanca y en otros quehaceres diarios hacen de la estadstica una herramienta indispensable.Sin embargo el trmino Estadstica tiene varios signicados para diferentes personas; para la gentecomn y corriente la estadstica solamente signica nmeros. En el periodo de la maana se pueden encontrarla estadstica ms reciente sobre los delitos en el pas; de asesinatos, de robos de automviles; de asaltos ydems delitos que hayan sido denunciados en determinado periodo de tiempo; de la situacin econmica sobrela canasta bsica, el empleo, el precio de la gasolina; sobre la actuacin del gabinete del actual gobierno; o enrelacin con el deporte, el nmero de partidos ganados y perdidos por equipos de la liga mayor de futbol.Paraotraspersonasesunmtodoparaobtener, presentar yescribir grandescantidadesdedatos, yparaotras es un mtodo para tomar decisiones en situaciones bajo incertidumbre.El objetivobsicodeestematerial deapoyoparael MdulodeEstadsticaes aclarar los signicadosde Estadstica, denir sus conceptos bsicos utilizados con frecuencia, estudiar el proceso de anlisis estads-tico en la investigacin educativa con ayuda del computador, y evidenciar los usos y abusos de los mtodosestadsticos.Aunquelossignicadosseandiferentes, todosellosformanpartedel conceptototal deEstadstica. Lapalabratienesusentidomsamplioparaaquellaspersonascuyotrabajorequiereunconocimientodelosaspectos ms tcnicos de la estadstica. Para estas personas, la palabra tiene relacin con aquellos mtodosytcnicas queseutilizanenlaformulacindel problemaainvestigar, larecopilacindelos datos, suorganizacin y presentacin, su resumen a travs de medidas, su anlisis, interpretacin y comunicacin dela informacin o modelo para obtener conclusiones que enriquezcan nuestro conocimiento de la realidad ynuestra capacidad para transformarla.Lacomputadoray, estosmtodosytcnicasjueganunpapel importanteenlasactividadesquerealizanlos profesionales de todas las ciencias, y en especial los docentes de educacin media, del sistema de educacinnacional, yaquelaEstadsticacontribuyeal conocimientodelascondicionessiolgicas, psicolgicasysociales de los alumnos y de los docentes. Al perfeccionamiento de los mtodos de enseanza y de evaluacin.NDICE 1ndice1. Introduccin a la estadstica. 61.1. Resea histrica de la estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2. Importancia de la estadstica y denicin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.1. Qu es investigar en educacin? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.2.2. Particularidades de la investigacin educativa. . . . . . . . . . . . . . . . . . . . . . . 101.3. La investigacin educativa y su relacin con la estadstica. . . . . . . . . . . . . . . . . . . . 102. Conceptos bsicos 132.1. Aleatoriedad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.2. Poblacin, muestra, parmetro y estadstico. . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.3. Variables y tipos de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.4. Medicin de variables y escalas de medicin. . . . . . . . . . . . . . . . . . . . . . . . . . . 172.5. Tipos de escalas de medicin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173. Fuentes y recoleccin de datos. 193.1. Fuentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203.2. Tcnicas e instrumentos de recoleccin de datos. . . . . . . . . . . . . . . . . . . . . . . . . 204. Organizacin y presentacin de los datos. 224.1. Presentacin de datos en tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.2. Distribuciones de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.3. Presentacin de datos en grcos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234.4. Representacin Grca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.5. Representaciones para variables cualitativas o Categricas . . . . . . . . . . . . . . . . . . . 254.6. Representaciones para variables cuantitativas sin agrupamiento. . . . . . . . . . . . . . . . . 274.7. Representaciones para variables cuantitativas agrupadas . . . . . . . . . . . . . . . . . . . . . 285. Resumen de datos 325.1. Medidas de Centralizacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335.1.1. Moda , Mo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335.1.2. Mediana , Md . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345.1.3. Media ,X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355.2. Medidas de Posicin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365.2.1. Cuartiles, Qi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365.2.2. Deciles, Di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375.2.3. Centiles, Ci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375.3. Medidas de Dispersin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375.3.1. Rango o Recorrido, R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375.3.2. Desviacin Media, DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385.3.3. Varianza, S2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385.3.4. Coeciente de variacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395.3.5. Estadsticos de Asimetra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405.3.6. Estadstico de apuntamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415.4. Diagrama de caja. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425.5. Otros resmenes estadsticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 435.6. Nmeros ndices: cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 455.7. Algunos ndices demogrcos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45NDICE 25.7.1. Nacimientos brutos e ndice de mortalidad . . . . . . . . . . . . . . . . . . . . . . . . 465.8. Estandarizacin de indicadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465.8.1. ndice de mortalidad estandarizado . . . . . . . . . . . . . . . . . . . . . . . . . . . 486. Probabilidades 496.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496.2. Resea Histrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506.3. Conceptos Bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506.4. Algebra de sucesos de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 516.5. Denicin de Probabilidad. Probabilidad de un evento . . . . . . . . . . . . . . . . . . . . . 546.6. Nociones Bsicas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556.7. Teoremas de espacios probabilsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556.8. Probabilidades Condicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566.9. Leyes de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 566.10. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567. Distribuciones de probabilidad 577.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577.2. Conceptos Bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577.3. Distribuciones de Probabilidad. Distribucin de Bernoulli. . . . . . . . . . . . . . . . . . . . 607.4. Distribucin de probabilidad Binomial, Valor Esperado y Varianza . . . . . . . . . . . . . . . 617.5. Distribucin Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627.6. Distribucin Normal Estndar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648. Muestreo 658.1. Algunas tcnicas probabilsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668.2. Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668.3. Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678.4. Muestreo estraticado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 688.4.1. Muestreo Estraticado sin reposicin: Estimadores y errores . . . . . . . . . . . . . . 708.4.2. Muestreo Estraticado con reposicin: Estimadores y errores . . . . . . . . . . . . . . 708.4.3. Ajacin de la muestra: Tipos de ajacin y errores de los estimadores para muestreocon reposicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708.5. Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 738.6. Muestreo sistemtico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 758.7. Nmeros Aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 768.7.1. Aleatorizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 769. Inferencia estadstica 779.1. Estimacin puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779.1.1. Propiedades deseables de los estimadores puntuales . . . . . . . . . . . . . . . . . . . 779.2. Estimacin por intervalo de conanza de medias y proporciones . . . . . . . . . . . . . . . . 779.2.1. Intervalo de conanza para la media poblacional, conocida (n 30) . . . . . . . . . 789.2.2. Intervalo de conanza para la media poblacional, es desconocida (n 30) . . . . . 799.2.3. Intervalo de conanza para estimar la diferencia de medias poblacionales (xy) . 799.2.4. Estimacin por intervalo para proporciones . . . . . . . . . . . . . . . . . . . . . . . 809.2.5. Estimacin por intervalo para diferencias de proporciones . . . . . . . . . . . . . . . 809.2.6. Estimacin de para muestas pequeas (n < 30) . . . . . . . . . . . . . . . . . . . . 809.2.7. Intervalos de conanza para diferencia de medias poblacionales (n < 30) . . . . . . . 81NDICE 39.2.8. Intervalos de conanza para una proporcin poblacional P (n < 30) . . . . . . . . . . 819.3. Prueba de hiptesis estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 829.3.1. Denicin de pruebas de hiptesis y tipo de error . . . . . . . . . . . . . . . . . . . . 829.3.2. Procedimiento para probar hiptesis estadsticas . . . . . . . . . . . . . . . . . . . . 829.3.3. Prueba de hiptesis para muestras grandes . . . . . . . . . . . . . . . . . . . . . . . . 839.3.4. Prueba de hiptesis para muestras pequeas y distribucin t de Student . . . . . . . . 8510. Distribuciones bidimensionales 8610.1. Tablas de contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8710.1.1. Contraste de independencia de caracteres. . . . . . . . . . . . . . . . . . . . . . . . . 8710.1.2. Distribuciones marginales y condicionales. . . . . . . . . . . . . . . . . . . . . . . . 8910.2. Correlacin y prediccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9010.3. Modelos de regresin lineal: Lnea de tendencia. . . . . . . . . . . . . . . . . . . . . . . . . 9110.4. Estimacin de los parmetros por mnimos cuadrados . . . . . . . . . . . . . . . . . . . . . . 9210.4.1. Ejemplos. Regresin lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94LISTA DE TABLAS 4Lista de tablas1. Diferentes formas de medir la presencia del hbito tabquico. . . . . . . . . . . . . . . . . . . . . . 192. Distribucin de frecuencias simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233. Distribucin de frecuencia agrupada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234. Resumen de las decisiones que el investigador puede tomar en la prueba de hiptesis . . . . . 825. Prueba de hiptesis para . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 836. Prueba de hiptesis para P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 847. Prueba de hiptesis para en muestras pequeas . . . . . . . . . . . . . . . . . . . . . . . . 858. Prueba de hiptesis para Pen muestras pequeas . . . . . . . . . . . . . . . . . . . . . . . . 86LISTA DE FIGURAS 5Lista de guras1. Etapas que comprende la investigacin educativa . . . . . . . . . . . . . . . . . . . . . . . . . . . 112. La estadstica en la investigacin educativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133. Relacin poblacin, muestra, parmetro y estadstico . . . . . . . . . . . . . . . . . . . . . . . . . 154. Clasicacin de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165. Clasicacin segn el nmero de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176. Diagrama de tcnicas e instrumentos para la recoleccin de datos. . . . . . . . . . . . . . . . . . . 207. Grco de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268. Grco de pastel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279. Pictograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2710. Grco de barras para las notas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2811. Polgono de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2912. Gasto en lea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3013. Ayuda en remesas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3014. Poligono de frecuencias acumuladas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3115. Serie temporal para el ujo de remesas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3216. Medidas representativas de un conjunto de datos estadsticos . . . . . . . . . . . . . . . . . . 3317. La mediana es el punto de corte de la ojiva creciente con la decreciente . . . . . . . . . . . . . 3418. Posibles ubicaciones de las medidas de centralizacin en un conjunto de datos. . . . . . . . . 3619. Distribuciones de frecuencias simtricas y asimtricas . . . . . . . . . . . . . . . . . . . . . . 4020. Uso de los cuartiles para medir la asimetra. . . . . . . . . . . . . . . . . . . . . . . . . . . . 4121. Apuntamiento de distribuciones de frecuencia. . . . . . . . . . . . . . . . . . . . . . . . . . . 4222. Intervalo de conanza para con conocido . . . . . . . . . . . . . . . . . . . . . . . . . . 7823. Interpretacin del nivel de conanza en un intervalo para la media de una distribucin normal . 7924. Diagrama de dispersin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 911 INTRODUCCIN A LA ESTADSTICA. 61. Introduccin a la estadstica.Como dijera Huntsberger: La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apiladosen grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones,ingresos, deudas, crditos y as sucesivamente. Huntsberger tiene razn pues al instante de escuchar esta pal-abra estas son las imgenes que llegan a nuestra cabeza.La Estadstica es mucho ms que slo nmeros apilados y grcas bonitas. Es una ciencia con tanta antigedadcomo la escritura, y es por s misma auxiliar de todas las dems ciencias.La ausencia de sta conllevara a un caos generalizado, dejando a los investigadores, administradores y ejecu-tivos sin informacin vital a la hora de tomar decisiones en tiempos de incertidumbre.La interpretacin de esta informacin puede resultar una tarea difcil, si adems recordamos cuntas veces senos pretende manipular con ella. Para la obtencin, interpretacin y evaluacin de toda esta informacin resultaindispensable el conocimiento de los mtodos estadsticos.La estadstica pretende determinar formas ecientes de obtener informacin sobre un fenmeno o poblaciny cmo analizar dicha informacin para hacer inferencias sobre la poblacin, siempre tomando en cuenta lapresencia de perturbaciones originadas por el azar, ya sean inherentes al objeto de estudio o debidas a erroresde medicin. Los mtodos y conceptos que desarrolla la estadstica pueden aplicarse, con las modicacionesadecuada, en muchos campos diferentes: como la medicina, la biologa, la ingeniera, la educacin, la industria,los gobiernos, etc.La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los trabajos matemticos de aquel-los hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri a la Estadstica a las cienciasformales.1.1. Resea histrica de la estadsticaLos comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar,hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo alhistoriador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la con-struccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de las tierras con el objeto de vericarun nuevo reparto.En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos obtenidos endos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab, general del ejrcito hacer uncenso de Israel con la nalidad de conocer el nmero de la poblacin.Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos peridica-mente con nes tributarios, sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles).La investigacin histrica revela que se realizaron 69 censos para calcular los impuestos, determinar los dere-chos de voto y ponderar la potencia guerrera.Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los recursosde la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan laobligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganadoy de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos em-padronamientos de la poblacin bajo la autoridad del imperio.Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy pocas operaciones Estadsti-cas, con la notable excepcin de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino elBreve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censosparciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del GranCatastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esaobra fue el primer compendio estadstico de Inglaterra.Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica ro-1 INTRODUCCIN A LA ESTADSTICA. 7mana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media.Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper,William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes aportaciones al mtodo cientco, de talforma que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional exista yaun mtodo capaz de aplicarse a los datos econmicos.Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales parala teora Estadstica; la teora de los errores de observacin, aportada por Laplace y Gauss; y la teora de losmnimos cuadrados desarrollada por Laplace, Gauss y Legendre. A nales del siglo XIX, Sir Francis Gastonide el mtodo conocido por Correlacin, que tena por objeto medir la inuencia relativa de los factores sobrelas variables.Hasta mediados del siglo XIX la palabra Estadstica se usaba con referencia a informaciones o datos de tipoSocio-econmico sobre la realidad de un estado.A nales del siglo XIX, con Galton y Karl Pearson nace la inferencia estadstica, como fruto del encuentroentre la antigua Estadstica (de carcter descriptivo) y el clculo de probabilidades.Karl Pearson, es considerado el fundador de la Ciencia Estadstica, por sus aportes en reas como la teora delas distribuciones, teora de la correlacin, errores probables de estadsticos, distribucin Gi-Dos, sistemticasaplicaciones realizadas junto a alumnos como Yule o Shepard a numerosos problemas reales, fundaron la re-vista Biometrika publicaron numerosas tablas estadsticas. Tambin contribuyeron Neyman y Ego Pearson enel rea de contraste de hiptesis y Ronald Aylmer Fisher con sus aportaciones en la estimacin y en la teora delos modelos lineales.En 1940, lo que hoy en da entendemos como inferencia estadstica ya estaba establecida. El clculo de prob-abilidades, con las aportaciones de Misses y sobre todo de Kolmogorov, basados en los trabajos de Borel yLebesgue, constituye ya una teora matemtica rme con una base axiomtica. Los trabajos de Wald, Von New-mann y Savage permiten un enfoque unicado de la Teora de Decisin Estadstica.En la decada de los ochenta, se aplica la estadstica como herramienta para la mejora de procesos en la in-dustria, y alcanza su auge con su utilizacin masiva en Japn bajo la losofa del Dr. Deming sobre calidad yproductividad.Los progresos ms recientes en el campo de la Estadstica se reeren al ulterior desarrollo del clculo de prob-abilidades, particularmente en la rama denominada indeterminismo o mecnica cuantica, se ha demostradoque el indeterminismo fue reconocido en la Fsica como resultado de las investigaciones atmicas y que esteprincipio se juzga aplicable tanto a las ciencias sociales como a las fsicas.1.2. Importancia de la estadstica y denicin.La estadstica es una herramienta fundamental para la investigacin cientca o estudio de fenmenos inciertos(aleatorios), ya que ha desarrollado mtodos1y tcnicas2estadsticas para apoyar el trabajo de los inves-tigadores para describir lo que ven, tratar de explicar lo observado y usar esos conocimientos para predecireventos del mundo en que vivimos. Entre los problemas que se presentan en este proceso de investigacin, yque trata de resolver la Estadstica podemos mencionar los siguientes:1. La descripcin de datos:Es muy poca la informacin til que podemos obtener simplemente observando una tabla de datos. Nece-sitamos, entonces, procedimientos para resumir ecientemente la informacin ya sea de tipo grco onumrico. En este caso suele hablarse de Estadstica Descriptiva.1Mtodo es una palabra que proviene del griego methodos, meta, y odos, va y que se interpreta como la va con la cual se lograalgo y que se puede generalizar como un modo razonado de obrar.2Del griego tchne, que signica arte, la tcnica es un conjunto de saberes prcticos o procedimintos para obtener el resultadodeseado. La tnica requiere de destreza manual y/o intelectual, generalmente con el uso de herramientas.1 INTRODUCCIN A LA ESTADSTICA. 82. La eleccin y anlisis de muestras:Al estudiar una poblacin o fenmeno, en general es imposible (o muy costoso) obtener informacinsobre todos los elementos de la poblacin o repetir un nmero grande de veces un experimento. Por con-siguiente, nos vemos en la necesidad de usar informacin parcial, y deseamos que est sea lo mejor posi-ble. Nos enfrentamos, entonces, al problema de cmo elegir un subconjunto signicativo de la poblacin(Teora de Muestreo) o de cmo disear un experimento que nos proporcione la mayor cantidad posiblede informacin sobre el fenmeno de inters (Diseo de Experimentos). As mismo, deseamos utilizarest informacin parcial para obtener inferencias sobre el total de la poblacin o fenmeno estudiado enbase a los resultados de la muestra. Para ello, suponemos que el azar afecta los resultados que hemosobtenido y empleamos Modelos Probabilsticos.3. El contraste o prueba de Hiptesis:Cuando se desea probar la validez de alguna hiptesis, es necesario recabar informacin que sea per-tinenteadichahiptesisyquenospermitaobservarelfenmenodeparticularinters. Paraello, esnecesario en general el Diseo de Experimentos con el n de obtener informacin relevante al problema.De la misma manera, una vez recabada dicha informacin, es necesario disponer de mtodos que permi-tan la interpretacin de los resultados, es decir, que permitan decidir si la informacin obtenida apoya ocontradice la hiptesis planteada.4. La medicin de relaciones entre variables:En muchos casos es interesante estudiar las relaciones entre las diferentes variables que intervienen enel problema. Por ejemplo, cmo se relaciona el tabaquismo con el nmero de horas dedicadas a estudiar,o cul es el efecto de la alimentacin sobre el incremento de peso de los pollos en una granja avcola.De esta manera, al conocerse una de las variables puede predecirse el valor de la otra. Para hacer esto,recurrimos al ajuste de modelos Modelos Probabilsticos, pues suponemos la presencia de perturbacionesen los datos, las cuales atribumos al azar.5. La prediccin:En muchas ocasiones deseamos predecir eventos futuros, como por ejemplo cul ser el precio de un bar-ril de petroleo durante el prximo ao, o cunto alcanzar la inacin. La estadstica desarrolla metodospara realizar estas predicciones dentro de ciertos mrgenes de error conocidos.6. La decisin:Ante cualquier situacin, distintas decisiones producirn ganancias o prdidas diferentes. Cmo pode-mos elegir aquella decisin o lnea de accin que produzca la mayor ganancia esperada? A esta rama dela Estadstica suele denominrsele Teoria de Decisin.Denicin:ESTADSTICAEs una ciencia interdisciplinar que utiliza un conjunto de tcnicas y mtodos para recoger, preparar,organizar, resumir, hallar regularidades, analizar e interpretar datos del fenmeno en estudio, siemprey cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; con el n de obtenerconclusiones o hacer predicciones sobre el fenmeno y tomar decisiones ms acertadas.Qu son los mtodos estadsticos?Son tcnicas y mtodos estadsticos con los que se toman decisiones basadas en el anlisis de datos recopiladosen experimentos de diseo minucioso. Puesto que los experimentos no pueden disearse para tener en cuentatoda posible contingencia, siempre existe algo de incertidumbre en la ciencia experimental. Los mtodos es-tadsticos estn ideados para permitir la evaluacin del grado de incertidumbre de los resultados.Es posible clasicar los mtodos estadsticos de manera general en tres categoras: estadstica descriptiva, es-tadstica inferencial y construccin de modelos.1 INTRODUCCIN A LA ESTADSTICA. 9La estadstica descriptiva, actualmente tambin conocida como Anlisis Exploratorio de Datos (AED), se puededenir como los mtodos que permiten recoger, organizar, representar, resumir y analizar una o varias carac-tersticas de todos los individuos u objetos de un conjunto con la nalidad de explicar en forma apropiada lasrelaciones de interdependencia y dependencia de las caractersticas, de dicho conjunto.A la estadstica inferencial o inferencia estadstica le conciernen los mtodos que hacen posible obtener con-clusionesrelevantesyvlidassobreungrupooconjuntodeobjetos,alestudiarnicamenteunaporcinosubconjunto de los elementos de dicho grupo. La conabilidad de las conclusiones basadas en los datos puedeser evaluada objetivamente por medio del uso de la probabilidad, ya que la teora de la probabilidad permitepasar de datos especcos a conclusiones generales. Este concepto conlleva a la denicin de poblacin y demuestra que se har ms adelante.Por otra parte la construccin de modelos comprende los mtodos estadsticos que buscan encontrar una ley,mediante el el desarrollo de ecuaciones predictivas a partir de datos experimentales, que explique tanto la partesistemtica o previsible del fenmeno en estudio como la parte aleatoria del mismo.No se trata de categoras mutuamente excluyentes. Dicho de otra manera, los mtodos creados para solucionarproblemas en un rea suelen tener aplicacin en otra.1.2.1. Qu es investigar en educacin?En el campo educativo, como en el resto de las ciencias, la investigacin se ha constituido en una actividadprecisa y elemental. Por este motivo, se ha originado la investigacin educativa, como disciplina que trata lascuestiones y problemas relativos a la naturaleza, epistemologa, metodologa, nes y objetivos en el marco dela bsqueda progresiva de conocimiento en el mbito educativo. [?]Los orgenes de la investigacin educativa se sitan a nes del siglo XIX, cuando en pedagoga se adopta lametodologa cientca. Esta investigacin, como disciplina de base emprica, se llam primeramente pedagogaexperimental, designacin similar a la de psicologa experimental, utilizada por Wundt en 1880.La pedagoga experimental nace en un contexto histrico-social en el cual se resalta el inters por aanzar laeducacin sobre fundamentos empricos e incorporar el mtodo experimental en las ciencias humanas.Segn los estudios de Buyse (1949), se pueden diferenciar tres inuencias principales en la pedagoga ex-perimental: el pensamiento losco reinante en el siglo XIX, el surgimiento de la pedagoga cientca y elcrecimiento de la metodologa experimental.El pensamiento losco imperante en el siglo XIX, se caracteriz por corrientes loscas que fueron funda-mentales para la independencia de las ciencias sociales, contribuyendo en gran medida a dotar de cienticidada la pedagoga. Estas corrientes son el positivismo, cuyo representante es Comte; el pragmatismo, representadopor James; el sociologismo de Durkheim; y el experimentalismo de Dewey.El surgimiento de la pedagoga cientca, basada en la experimentacin, fue otro factor de importancia parael desarrollo de la pedagoga experimental. Esto se produce gracias a los aportes del racionalismo del sigloXVIII; el crecimiento de las ciencias naturales con la contribucin de las ideas de Darwin, Cournot y de Bain;la publicacin de las obras de autores como C.Bernard, Galton, Burt, Cattell y Rice, entre otros. Tambin sondestacables las ideas educativas de Rousseau, Pestalozzi, Froebel y Herbart para establecer los pilares empri-cos de la educacin. (Arnal, J. y otros, 1994, Pg.24-25.) El desarrollo de la metodologa experimental es elproducto de numerosos elementos de carcter poltico, social y cultural. Se produce inicialmente en el rea dela medicina y de la psicologa, para propagarse posteriormente al mbito educativo.El concepto de investigacin educativa se ha ido modicando a medida que han surgido nuevos enfoques para eltratamiento de los fenmenos educativos. Actualmente, son variados los signicados atribuidos a la expresinInvestigacin Educativa, dependiendo de la diversidad de objetivos y caractersticas que se le establecen. Estatemtica nos conduce a abordar el siguiente apartado vinculado con los paradigmas en el estudio de los sucesoseducativos.1 INTRODUCCIN A LA ESTADSTICA. 101.2.2. Particularidades de la investigacin educativa.Frente a la investigacin en las ciencias naturales, la investigacin en el mbito educativo (como en todas lasciencias sociales), presenta diversas particularidades que se relacionan justamente con la especicidad de losfenmenos que estudia. Siguiendo el desarrollo realizado por J. Arnal, Del Rincn y Latorre sobre esta temti-ca, podemos establecer las siguientes caractersticas de la Investigacin Educativa.Los fenmenos educativos, debido a su complejidad, presentan una dicultad epistemolgica mayor, ya queen los mismos interaccionan una diversidad de variables que no permiten un estudio preciso y exacto como elque se realiza en las ciencias naturales. Cuestiones importantes de los hechos educativos (como son los valores,signicados, intenciones y creencias) no son directamente observables ni susceptibles de experimentacin. Enel mbito educativo la conducta debe contextualizarse (Guba, 1982), esto hace difcil su generalizacin, porquela misma debe estar desligada del contexto.La diversidad de paradigmas existentes, conformados por supuestos, perspectivas tericas y metodologas dif-ciles de armonizar y articular.(A diferencia de las ciencias naturales que se orientan por paradigmas integrados).La variedad de metodologas que se utilizan, ya que las caractersticas de los hechos educativos generan la in-strumentacin de mltiples mtodos y modelos de investigacin. (Cuestin relacionada con la diversidad deparadigmas).El carcter pluridisciplinar de los fenmenos educativos lleva a que su estudio requiera de los aportes coordi-nados de diferentes disciplinas, como la psicologa, la sociologa, la pedagoga, etc.La variacin de los fenmenos educativos en el tiempo y en el espacio no facilitan el proceso de generalizaciny el establecimiento de regularidades. Esto hace ms complicado el alcance de uno de los objetivos de la cien-cia.El investigador (como en todas las ciencias sociales) forma parte del objeto de estudio que investiga. Esto pro-duce que no pueda mantenerse neutral y ajeno a la problemtica educativa que investiga, lo cual no implica quedeba abandonar la necesidad de ser lo ms objetivo posible.Se hace necesario aclarar que el concepto de investigacin educativa no tiene un marco denido y claro paradelimitar lo que es considerado propiamente de la disciplina. Esto exige mantener una actitud abierta hacia susdiferentes modalidades y realizar un esfuerzo de claricacin.1.3. La investigacin educativa y su relacin con la estadstica.La investigacin educativa es investigacin cientca, por eso en su bsqueda de conocimiento objetivo se apoyaen el mtodo cientco. La observacin directa de los hechos, la bsqueda de evidencias que sustenten las ideas,permiten alcanzar un conocimiento ms exacto y conable. La historia del hombre ha demostrado que este esel mtodo ms seguro y productivo para obtener conocimiento. En el campo educativo la Estadstica contribuyeal conocimiento de las condiciones siolgicas, psicolgicas y sociales de los alumnos y de los profesores.Al perfeccionamiento de los mtodos de enseanza y de evaluacin. Los investigadores, los educadores, losprofesionales, los grupos privados, las fundaciones, el gobierno y otros interesados que intentan entender yexplicar racionalmente los problemas o fenmenos del proceso educativo, siguen ms o menos las etapas delprocedimiento que se muestra en la siguiente gura.1 INTRODUCCIN A LA ESTADSTICA. 11Figura 1: Etapas que comprende la investigacin educativa1. Seleccin del problema.Laideaoproblemadebesurgirdeaspectosimportantesparanuestrasvidas. Esdecirtienequein-teresarnossaberalgodenuestracotidianeidad, puesesteesnuestroprincipal puntodereferenciayconocimiento previo. Jams debe pensarse que una idea es estpida y descabellada.Una idea inicialsiempre es vaga y cargada de confusin pero eso no signica que no sea importante. No existen ideasobvias que no deban ser consideradas. Lo obvio sin anlisis previo es prejuicio. El prejuicio es loopuesto a la verdadera ciencia, por lo tanto se debe tener mucho cuidado en este aspecto.2. Revisin bibliogrca.Laideaoproblemadebesurgirdeaspectosimportantesparanuestrasvidas. Esdecirtienequein-teresarnossaberalgodenuestracotidianeidad, puesesteesnuestroprincipal puntodereferenciayconocimiento previo. Jams debe pensarse que una idea es estpida y descabellada.Una idea inicialsiempre es vaga y cargada de confusin pero eso no signica que no sea importante. No existen ideasobvias que no deban ser consideradas. Lo obvio sin anlisis previo es prejuicio. El prejuicio es loopuesto a la verdadera ciencia, por lo tanto se debe tener mucho cuidado en este aspecto.3. Las restantes etapas estan incluidas en el Proceso de Anlisis Estadstico que se detalla en la pgina12.La Investigacin Educativa presenta una serie de caractersticas particulares. La multiplicidad de los objetivosy nes que pretende, la singularidad de los fenmenos que estudia y la pluralidad de los mtodos que empleason dimensiones que le otorgan especicidad propia a la vez que hacen ms compleja y ardua su descripcin yestudio. El mtodo es un modo de abordar los problemas, siendo la naturaleza del objeto a estudiar, la que hacerecomendables posibles mtodos y tcnicas especcas.La estadstica es una de las herramientas fundamentales en la aplicacin del mtodo cientco. As, cuando serealiza un experimento y se miden determinadas variables como resultado del mismo (nivel de colesterol, peso,etc.) y se desea sacar alguna conclusin del estilo de qu tratamiento es mejor o aumenta o disminuye elpeso, ser necesario realizar un anlisis estadstico de los datos.Conclusiones basadas en la pura observacin de los resultados, o en la observacin de algunos estadsticosdescriptivos, tales como la media aritmtica o el valor mximo, pueden conducir a error y son inadmisibles enla ciencia moderna. El motivo de ello es que al realizar cualquier medida en el transcurso de un experimentosiempre existe un componente muy importante debido al azar. La estadstica es, por lo tanto, un conjunto deconocimientos y tcnicas que permiten cuanticar el azar.La mayora de las veces el investigador quiere inferir resultados sobre toda una poblacin a partir de una mues-tra reducida sobre la cual se llevar a cabo el experimento. Es importante conocer a priori cul es el tamao de1 INTRODUCCIN A LA ESTADSTICA. 12la muestra, lo cual depender estrechamente del tipo de anlisis estadstico que se realizar posteriormente, ascomo de la precisin con la que se desea trabajar. A lo largo de este documento se hablar de los mtodos ytcnicas estadsticas usadas ms frecuentemente en los anlisis y diseos estadsticos de investigaciones exper-imentales, as como del clculo de los tamaos muestrales adecuados. El empleo de la estadstica dentro de lainvestigacin basada en el uso del mtodo cientco, tanto en Ciencias Sociales como en aspectos administra-tivos relacionados con la toma de decisiones resulta cada vez ms importante. En general, como veremos msadelante, se puede decir que la metodologa de investigacin determina la calidad de la informacin en la cualse basan tanto la descripcin del comportamiento de variables e indicadores, como la toma de decisiones.La estadstica es un campo del conocimiento que permite al investigador deducir y evaluar conclusiones acercade una poblacin a partir de la informacin proporcionada por una muestra, por medio de mtodos y tcnicasnecesarias para recolectar y analizar los datos requeridos en una investigacin, este procedimiento se denominaProceso de Anlisis Estadstico y se puede sintetizar en los siguientes pasos:1. Formulacindelproblemaespeccodelainvestigacin. Enbasealconocimientoconocimientodelproblema Problemtica, justicacin, antecedentes, y objetivos especcos, hiptesis.2. Desarrollo de un mtodo para la obtencin de datos. Denir las caractersticas o variables a estudiary su operacionalidad; la obtencin de los datos puede requirir disear un experimento, disear chas,disear un cuestionario, o extraerlos de una base de datos, para lo cual podra ser necesario denir: lapoblacin objetivo, la poblacin muestreada, la unidad de observacin, el marco de muestreo, el tamaode la muestra muestra; y elegir el mtodo de seleccin de la muestra ms adecuado.3. Recoleccin de los datos. Seleccionar las unidades a observar o medir y que integraran la muestra; disearun plan para la recoleccin, preparar los materiales; y realizar el experimento, entrevista, o encuesta.4. Organizacin y presentacin de los datos. Despus que los datos han sido recolectados, estos se pre-sentan en su forma primaria, sin ninguna organizacin, lo que hace imposible el anlisis de ellos; enconsecuencia, se hace necesario clasicar estos datos, a travs de la revisin, el agrupamiento y pre-sentacin. Revisin en la inspeccin de los formularios y de los registros donde se han reunido los datospara corregir los errores, las respuestas ilgicas y encontrar las omisiones. Agrupamiento es volcar enuna sola hoja o base de datos todos los datos contenidos en los cuestionarios. La presentacin (tablas ygrcos) de los datos: Luego de la agrupacin de los datos estos se pueden presentar ordenados en tablas cuadros y mediante de representaciones grcas.5. Anlisis Estadstico. Despus de clasicar los datos, se encuentran en condiciones de ser analizados des-de el punto de vista estadstico, haciendo uso de las medidas de las caractersticas, relaciones entre ellasy de mtodos descriptivos e inductivos, simples y compuestos. Es decir, los datos obtenidos a travs dela recoleccin se condensan, se estiman las medidas en funcin de la poblacin, se determinan sus rela-ciones y se prueban las hiptesis. , para interpretar los resultados en funcin de los objetivos y preguntasplanteadas.6. Interpretacin de los resultados. Consiste en traducir las medidas estadsticas obtenidas, de acuerdo allenguaje del fenmeno o hecho estudiado. Se interpretar lo hallado y emitir principios, leyes, etc.,sobre el problema investigado.7. Presentacin de los resultados. Se dan a conocer los resultados obtenidos considerando en lo posiblehacia quienes va dirigido, hacindolo en forma comprensible y efectiva. Esta presentacin puede hacerseen forma: textual a travs de letras y smbolos algebraicos; tabular o semitabular a travs de los cuadrosestadsticos, grca a travs de esquemas y diagramas; y por medio de modicaciones de la forma grcacomo son las formas pictricas.2 CONCEPTOS BSICOS 13El mtodo de investigacin que se apli-ca al anlisis de problemas de nuestrarealidad esta basado en el proceso es-tadstico planteado anteriormente y enel uso de herramientas tecnolgicas, talcomo lo muestra la gura de la derecha.Figura 2: La estadstica en la investigacin educativa2. Conceptos bsicosA n de ayudar al maestro en sus trabajos de investigacin, en esta seccin se revisa una serie de conceptosbsicos para aplicar la estadstica.2.1. AleatoriedadLa aleatoriedad es un campo de denicin que, en matemticas, se asocia a todo proceso cuyo resultado noes previsible ms que en razn de la intervencin del azar. La consecuencia de todo suceso aleatorio no puededeterminarse en ningn caso antes de que este se produzca. Por consiguiente, los procesos aleatorios quedanenglobados dentro del rea del clculo de probabilidad y, en un marco ms amplio en el de la estadstica. Lapalabra aleatorio se usa para expresar una aparente carencia de propsito, causa, u orden. El diccionario del usodel espaol, dene la cualidad de ser aleatorio como aquello que es incierto.2.2. Poblacin, muestra, parmetro y estadstico.El libro Women and Love: A Cultural Revolution in Progress (1987), de Shere Hite, tiene varios resultadosampliamente citados:El 84 % de las mujeres no estn satisfechas emocionalmente con sus relaciones (pgina 804).El 70 % de las mujeres con cinco o ms aos de casadas tienen relaciones sexuales fuera del matrimonio(pgina 856).El 95 % de las mujeres informan de diversas maneras de acoso emocional y psicolgico por parte de loshombres con los que mantuvieron alguna relacin sentimental (pgina 810).El 84 % de las mujeres informan de ciertos sentimientos de superioridad por parte de los hombres conlos que mantuvieron relaciones sentimentales (pgina 809).El libro fue muy criticado en los artculos de peridicos y revistas a lo largo de los Estados Unidos.Por qu fue tan criticado el estudio de Hite?Fue incorrecto que citara a las mujeres que sentan que los hom-bres de sus vidas se resistan a tratarlas como iguales, fminas que posiblemente no haban tenido la oportunidadde hablar anteriormente?Era incorrecto informar de los porcentajes de estas mujeres que no se sentan felicescon la relacin que llevaban con los hombres?Por supuesto que no. La investigacin de Hite permiti a las mujeres analizar una visin de sus experienciasy reej la riqueza de las experiencias de estas mujeres de una forma que no lo lograra un examen de opcinmltiple. El error de Hite fue generalizar estos resultados a todas las mujeres, hayan participado en la encuestao no, y armar que los porcentajes se aplicaban a todas las mujeres.EnlaencuestadeHite, comolasmujeresquerecibieroncuestionarios(de127preguntas)fueronelegidasa propsito y un porcentaje extremadamente pequeo de ellas regres los cuestionarios, las estadsticas calcu-ladas a partir de estos datos no sirven para indicar la actitud de todas las mujeres de Estados Unidos. La muestra2 CONCEPTOS BSICOS 14nal no es representativa de todas las mujeres de Estados Unidos y las estadsticas slo sirven para describir alas mujeres que contestaron la encuesta.Una muestra perfecta, una versin a escala de la poblacin, que reejara cada una de las caractersticas de todala poblacin, por supuesto que no puede existir para poblaciones complejas (aunque existiera, no sabramosque es perfecta sin antes medir toda la poblacin). Pero una buena muestra reproduce las caractersticas deinters que existen en la poblacin de la manera ms cercana posible. Esta muestra ser representativa, en elsentido de que cada unidad muestreada representar las caractersticas de una cantidad conocida de unidadesde la poblacin.Necesitamos algunas deniciones para precisar el concepto de buena muestra.Unidad de observacin. Es el objeto sobre el cual se realiza una medicin de la caracterstica a investigar.Esta es la unidad bsica de observaci, a veces llamada elemento. En los estudios de poblacin humana,con frecuencia ocurre que las unidades de observacin son los individuos.Poblacin: es el conjunto de elementos u objetos que satisfacen una denicin comn y en los que in-teresa analizar una o varias caractersticas observables y medibles. Aqu el trmino poblacin tiene unsignicado mucho ms amplio que el usual, ya que puede referirse a personas, animales, cosas, actos,reas geogrcas e incluso al tiempo.Una poblacin se precisa como un conjunto nito o innito de personas que presentan caractersticascomunes, por lo que debe estar perfectamente denida en el espacio y en el tiempo, de modo que antela presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la poblacinbajo estudio. Por lo tanto, al denir una poblacin, se debe cuidar que el conjunto de elementos que laintegran quede perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias,debemos especicar cules y cundo, por ejemplo: Escuelas primarias de San Salvador, ao 2010.El tamao Nde una poblacin viene dado por la cantidad de elementos que la componen, en el caso enque sea una poblacin nita, es decir, que podemos contabilizar y establecer un lmite de existencia.Hay que distinguir entre la "poblacin objetivo"formada por todos los elementos que poseen la(s) carac-terstica(s) que deseamos estudiar; y la poblacin muestreada formada por aquellas unidades (elemen-tos o grupos de elementos) que posiblemente puedan ser miembros de una muestra.Unidad de muestreo: es la unidad (individuos, objetos o grupos) de la poblacin muestreada sobre la quese mide la(s) caracterstica(s) que se estudia(n). Por ejemplo, podramos querer estudiar a las personas,pero no tenemos una lista de todos los individuos que pertenecen a la poblacin objetivo. En vez de esto,las familias sirven como las unidades de muestreo y las unidades de observacin son los indiduos queviven en una familia.Marco de muestreo: es una una lista de de las unidades de mustreo. Para las encuestas telefnicas, elmarco de muestreo podra ser una lista de todos los nmeros telefnicos residenciales de la ciudad; paralas entrevistas personales, una lista de las direcciones de todas las calles.Censo: es el proceso de estudiar todos los elementos que conforman la poblacin. Es decir, tomar unamuestra igual a la poblacin.Muestra: es un subconjunto de unidades (elementos o grupos de elementos) de la poblacin muestrea-da, que se seleccionan a partir del marco de muestreo, destinado a suministrar informacin sobre dichapoblacin. Para que este subconjunto de unidades sea de utilidad estadstica, deben reunirse ciertos req-uisitos en la seleccin de los elementos.Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la poblacin que se denatenga tamao innito (incontable), y en consecuencia, no fuera posible observar a todos sus elementos.En otras ocasiones, el costo de la observacin exhaustiva puede ser muy elevado, el extenso tiempo derecoleccin de la informacin, o ms an, la observacin de los elementos puede ser destructiva.2 CONCEPTOS BSICOS 15En todos estos casos, la nica manera de estudiar la poblacin es obteniendo muestras de ella. El tamaode la muestra queda determinado por el nmero de elementos que la forman y se simboliza con la letran.Parmetro: es un valor (nico) que resume la caracterstica que se investiga en una poblacin, se clculaconsiderando a todos los elementos. Los parmetros de una caracterstica que usualmente interesan son:el promedio, la proporcin, la razn, el total, la varianza o variabilidad.Estadstico:esunvaloromedidaqueresumelacaractersticaqueseinvestigaenunapoblacin,seobtiene considerando a todos los elementos o unidades de una muestra particular, por lo tanto puedetomardistintosvaloresdependiendodelamuestraseleccionada. Formalmente, unestadsticoesunafuncin matemtica de una muestra, que mediante mtodos inferenciales permite aproximar o estimar alrespectivo parmetro poblacional.Figura 3: Relacin poblacin, muestra, parmetro y estadsticoLas encuestas de opinin pblica se realizan con frecuencia para predecir el candidato que ganar en las prx-imas elecciones. Por ejemplo, en la eleccin del alcalde de San Salvador. La poblacin objetivo est formadapor las personas que viven en San Salvador y que votarn en la prxima eleccin de alcaldes, ao 2012; lapoblacin muestreada podra estar formada por las personas que pueden ser localizadas por telfono y dicenestar dispuestas a votar en la prxima eleccin. El marco de muestreo puede ser el directorio telefnico (listade nmeros telefnicos).En la Encuesta de Hogares y Propsitos Mltiples, que se realiza en El Salvador, la poblacin objetivo estformada por todos los hogares del pas. La poblacin muestreada estara formada por todas las viviendas reg-istradas hasta cierta fecha, anterior a la realizacin de la Encuesta. El marco de muestreo sera un listado deviviendas registradas hasta la fecha establecida. Entonces la unidad de muestreo es la vivienda pero la unidadde observacin (elemento) podra ser el hogar (jef o jefa del hogar), observe que la vivienda A del registropodra contener 3 hogares al momento de la realizar la encuesta.La calidad de una muestra, o la conanza que se pueda depositar en ella, depende exclusivamente de la calidaddel mtodo usado para obtenerla, o de la conanza que l merezca. En la prctica, lo nico que puede legtima-mente hacerse es aplicar un mtodo que, por el modo de hacerse la seleccin y por el tamao del subconjuntoelegido, produzca un alto porcentaje de muestras buenas, de manera que resulte muy probable que la queseleccionemos en suerte pertenezca al subgrupo especco de muestras posibles que tienen ese atributo. Laseleccin de la muestra se hace por un procedimiento que asegure en alto grado que sea representativa de lapoblacin. Los mtodos de seleccin de muestras se describen ms adelante.2 CONCEPTOS BSICOS 162.3. Variables y tipos de variables.Datos Estadsticos: son los resultados del experimento o mediciones de las observaciones realizadas, son engeneral, el producto de las observaciones efectuadas en los cuales se produce el fenmeno que queremos estu-diar. Los datos (valores o modalidades) de una caracterstica o cualidad que se observa o mide y que es comnen todos los elementos de una poblacin o muestra son variables, su resultado varia aleatoriamente de unamedicin a otra. Debido lo a los datos estadsticos los denominamos variables aleatorias. Por ejemplo, Ingresosmensuales de los miembros de una comunidad, Calicaciones de un examen, nmero de asesinatos por mes enEl Salvador en el 2010, estado civil, etc.Nota: En trminos prcticos, los instrumentos de medicin presentan ciertas limitaciones de tipo fsico querestringen el grado de precisin, a pesar de esto los datos siguen siendo continuos. Este es el caso de datosque representan la estatura de una persona. Usando una cinta mtrica tradicional, se habla por ejemplo, de queuna persona mide 1.73 mts. Pero si tuvisemos a disposicin algn instrumento electrnico sosticado podraobtenerse que est persona mide 1.7287253046301 mts. Debemos tener claro que una variable no es el objetode estudio en s, sino sus caractersticas, por ejemplo si estuviramos analizando un local para alquilar el localno es la variable, variables son sus atributos: ubicacin, tamao, iluminacin, ventilacin, etc.La denicin operacional de una variable es el proceso que que permite pasar de las preguntas de investigacinformuladas a nivel conceptual (calidad de vida, edad, tabaquismo, mortalidad, etc.) desde el plano terico aloperativo, a su medicin (o clasicacin) en cada unidad de observacin o de anlisis especca. Es algo quetiene el mismo signicado ayer, hoy y maana para todos los individuos.Consideremos un ejemplo simple y familiar: la edad. Formalmente, la edad de un sujeto habra de dirse comoel nmero de vueltas que ha dado la tierra en torno al sol, ms la fraccin del recorrido realizado desde la ltimavuelta completa hasta el instante en que se hace la indagacin. Sin embargo, en la mayora de los estudios, laedad se operacionaliza tomando simplemente el nmero de aos cumplidos (vueltas completas).Dependiendo de los valores o modalidades que tomen las variable, estas se pueden clasicar de la siguientemanera:Figura 4: Clasicacin de variablesVariables cualitativas: son aquellas que describen cualidades oatributos. No son numricas, sus valores posible son categoraso modalidades, y se subdividen en:Nominales: sus valores soncategoras onombres que noguardan un orden. Ej. Estado civil, preferencia por una mar-ca, sexo, lugar de residencia.Ordinales: sus valores son categoras o nombres que represen-tan un orden y jerarqua. Ej. Nivel educacional, das de la se-mana, calidad de la atencin, nivel socioeconmico.Variables cuantitativas: son aquellas cuyo conjunto de valoresposibles son valores numricos. Dentro de ella, se subdividenen:Discretas: toman valores enteros. Ej. No. de hijos de una famil-ia, no. de alumnos de un curso. Continuas: son valores reales.Pueden tomar cualquier valor dentro de un intervalo. Ej. Peso,estatura, salarios.Existe otra clasicacin de acuerdo al nmero de variables que se analizan conjuntamente. Cuando las vari-ables se presentan y analizan individualmente, se habla de variable univariante. Alternativamente, cuando seanalizan simultneamente dos, tres o ms variables se habla de variable bivariante, trivariante o multivariante.Por ejemplo, de una encuesta se obtienen los datos sobre tipo de sangre, peso, ingreso y sexo de los estudiantesde un curso de Estadstica; y se analiza cada una de estas variables separadamente. En este caso se tienen cuatro2 CONCEPTOS BSICOS 17variables univariantes.Por otro lado, si es de inters analizar conjuntamente las variables tipo de sangre y peso se est ante la presenciade una variable bivariante. Pero, si se analizan simultneamente las cuatro variables entonces se habla de unavariable multivariante.Sea, X : Tipo de sangre,Y: Peso,W: Ingreso,Z : Sexo.Figura 5: Clasicacin segn el nmero de variables2.4. Medicin de variables y escalas de medicin.Datos Estadsticos: son los resultados del experimento o mediciones de las observaciones realizadas,sonelgeneral, elproductodelasobservacionesefectuadasenloscualesseproduceelfenmenoocaracterstica que queremos estudiar.Medicin. Es la observacin de un fenmeno o propiedad, y la asignacin de un nmero o categora,como forma de representar ese fenmeno. Suele usarse el trmino observar como sinnimo de medir.Por ejemplo, pesar un objeto es observar una propiedad, su peso, y asignarle un nmero, el nmero dekilogramos que pesa. Determinar el estado civil de una persona tambin es efectuar una medicin, queconsiste en clasicar esa propiedad en una de varias categoras: soltera, casada, etc.Dato o medida: es el valor (nmero) o atributo (categora) que se asigna al medir un fenmeno o unacaracterstica. Un sinnimo de medida es observacin.Escala de Medida: una escala de medida es el conjunto de valores que puede tomar una determinadamedida. Los tipos de escala se estudian a continuacin.2.5. Tipos de escalas de medicinExisten distintas formas de medir las variables, distintos tipos de escalas de medicin con uno o ms de lossiguientes atributos matemticos: magnitud, un intervalo igual entre unidades adyacentes y un cero absoluto.No podemos decir que una sea mejor que otra, sino que cada una tiene sus propiedades y responde mejor a unproblema, y sobre todo que condiciona las tcnicas que se pueden utilizar para analizarla. Podemos distinguircuatro escalas o niveles de medicin, en orden ascendente:1. Escalasnominales:alutilizarunaescalanominal,lacaractersticaovariablesedivideensusdiver-sas categoras. Estas categoras comprenden las unidades de la escala y los elementos se miden aldeterminar la categora a la cual pertenecen. As, la medicin con una escala nominal equivale, en re-alidad, a clasicar los elementos y a darles el nombre (de ah lo de escala nominal) de la categora a lacual pertenecen. Las categoras deben ser mutuamente excluyentes y colectivamente exhaustivas. Mutu-amente excluyentes signica que un individuo, objeto o medicin pertenece nicamente a una categora,y exhaustiva signica que ningn individuo, objeto o medicin puede quedar sin categora, por ejemplo:En un aula de clases vamos a clasicar las personas por lugar de nacimiento, una misma persona no2 CONCEPTOS BSICOS 18puede haber nacido en dos lugares, pero tampoco se puede decir que no naci en ningn lado, por lotanto, todos tenemos que estar en una sola categora. A cada categora se le puede asignar un nmero,por ejemplo, la variable sexo puede tomar dos valores:mujer=1,hombre=2. Estos numeros sonnicamente un identicador o cdigo, pues no existe siquiera una relacin de orden entre ellas. No existerelacin de magnitud entre las categoras, representa el nivel mnimo de medicin y se utiliza con fre-cuencia para variables cualitativas. Por ejemplo, marcas de zapatos, los das de la semana, nacionalidad,preferencia poltica, creencia religiosa, etc. Las nicas operaciones que se pueden efectuar con medidas(datos) de variables nominales estn basadas en la relacin de equivalencia: frecuencias, modas, tablasde contingencia, etc.2. Escalas ordinales: adems de las propiedades de la escala nominal permite establecer un orden entre loselementos medidos. La escala ordinal representa el siguiente nivel de medicin, el cual es relativamentebajo de acuerdo con la propiedad de magnitud. Con esta escala, ordenamos los elementos medidos segnsi poseen ms, menos o la misma cantidad de la variable medida. As, una escala ordinal para medir elrendimiento de los alumnos A y B, permite determinar si A>B,A =B,o AB,A =B,o AC D,AB = C D,o AB< C D, por ejemplo, la diferencia entre un C.I. de 120 a 125 es lamisma que entre 112 y 117 (125-120=5, 117-112=5). Las medidas de este tipo de escala permiten utilizarcasi todas las operaciones estadsticas para analizar los resultados: la media, la desviacin estndar, elcoeciente de correlacin, test paramtricos, etc.4. Escalas de razn y proporcin: posee magnitud, intervalos iguales entre unidades adyacentes y cero ab-soluto. Por ejemplo, la escala de temperatura Kelvin que posee un cero absoluto denido por la ausenciacompleta de calor, es el punto menor en la escala, y por lo tanto permite proporciones, una lectura de20oKelvin es el doble de caliente que 10oKelvin. Otro ejemplo, de escala de razn se tiene al querermedir la edad, el salario. Sobre medidas de este tipo de escala se pueden efectuar todas las operacionesmatemticas clsicas: suma, resta, multiplicacin y divisin, y las operaciones estadsticas: media, vari-anza, moda, coeciente de correlacin, etc.Otra manera de expresar esta escala es la siguiente. Supongamos que tenemos un grupo de estudiantesque incluye 6 hombres y 14 mujeres: la proporcin de hombres en el grupo es:620= 0.30 la proporcinde mujeres es:1420= 0.70. Es lo que posteriormente llamaremos frecuencia relativa.Porcentaje. Es la proporcin multiplicada por 100: porcentaje de hombres 30 %, de mujeres 70 %.Cociente. El cociente o relacin entre mujeres y hombres es146=2.33 a 1. Siempre va arriba lo masfrecuente. Se usa en casos como "la posibilidad de contraer cncer de pulmn es 7 veces mayor (o 7 a 1)entre los fumadores".Tasa. Se usan en dos situaciones: cuando el denominador es muy bajo (por ejemplo la tasa de mortalidades de 10 en 100,000, si furamos a expresarnos en porcentaje sera de 0.0001 lo que es imprctico detrabajar) o en casos en que no es una frecuencia relativa (el numerador no forma parte del denominador,como por ejemplo la tasa de autos por habitante es de 0.7 autos por persona).3 FUENTES Y RECOLECCIN DE DATOS. 19Como vamos a ver ms adelante el concepto de la frecuencia relativa nos lleva al concepto de probabili-dad.5. Relaciones entre escalas: los cuatro tipos de escalas estn ligados por una relacin de jerarqua, desde laescala de razn, que posee mayores propiedades, hasta la nominal, la menos operativa. De las escalas derazn se puede pasar a las de intervalos, a las de orden y a las nominales. As, por ejemplo, la edad sepuede asociar a una variable de razn (edad, un nmero exacto), a una variable de intervalos (la clase deedad), a una variable de orden (clases de edad representados por un ordinal) y nominal (grupo de jvenesy no jvenes).Una variable siempre puede bajar de escala pero no subir. Por ejemplo el peso de los nios al nacer se puedecategorizar en bajo peso, medio, y sobrepeso. Pero si nos dicen que un nio es de bajo peso, no sabemos cualfue exactamente ese peso. Una denicin operacional proporciona un signicado a un concepto o variable quepuede comunicarse a otros individuos. Es algo que tiene el mismo signicado ayer, hoy y maana para todoslos individuos. En la tabla 1 se muestra un ejemplo.Tabla 1: Diferentes formas de medir la presencia del hbito tabquico.3. Fuentes y recoleccin de datos.La base para el trabajo estadstico, es decir los datos, se pueden obtener de manera indirecta, por ejemploal utilizar la informacin de los censos nacionales o de algn tipo de organizacin o institucin, o de maneradirecta, llenando chas, cdulas de observacin o aplicando cuestionarios. En aplicaciones reales, lo ms comnes que la parte inicial o bsica de un estudio se apoye en datos generales que no se hayan obtenido de maneradirecta (por ejemplo, distribucin general de la poblacin por edades, niveles de escolaridad, distribucin deactividades por entidad federativa) y que la parte medular y las conclusiones descansen en datos obtenidos enforma directa, por ser especcos para el problema que se est analizando.En muchas ocasiones en la investigacin cientca es necesario recurrir a la obtencin directa de datos, ya seaal emplear chas o cdulas de observacin en las que se registran caractersticas de inters, o bien al disearun cuestionario cuyas respuestas nos permitan conocer las caractersticas de quien responde, su opinin, lascondiciones reales en las cuales se encuentra en relacin con algn aspecto especco, como podra ser trabajo,educacin y capacitacin, salud, relaciones interpersonales, empleo del tiempo libre, etctera.Cuando los datos se obtengan de manera directa, ser necesario apoyarse en el muestreo, disear el instrumentode recoleccin, coordinar la recopilacin de datos y su procesamiento, para nalmente hacer en anlisis de lainformacin y efectuar el informe o informes nales en que se basar la toma de decisiones.3 FUENTES Y RECOLECCIN DE DATOS. 203.1. Fuentes.Las fuentes de recoleccin de datos de una investigacin estadstica son:1. Fuentes Primarias: Es cuando la persona o institucin ha recolectado los datos.2. Fuentes Secundarias: Si la persona o institucin que ha publicado los datos, no es la que ha efectuado lainvestigacin. Se utilizan cuando la ocina que las publica tenga suciente solvencia tcnica.3. Fuentes Ociales: Es cuando los datos son provistos por cualquier dependencia gubernamental.4. Fuentes Privadas: Es cuando son provistos por agencias, personas, organizaciones, etc., no gubernamen-tales.3.2. Tcnicas e instrumentos de recoleccin de datosTcnica: Se entiende como tcnica, el procedimiento o forma particular de obtener datos o informacin.La aplicacin de una tcnica conduce a la obtencin de informacin, la cual debe ser resguardada mediante uninstrumento de recoleccin de datos.Instrumento de recoleccin de datos: Es un dispositivo o formato (en papel o digital), que se utiliza para obtener,registrar o almacenar informacin. Son ejemplos de instrumentosUncuestionarioencuyaestructuraquedaregistradaslasrespuestassuministradaspor el encuesta-do.(Formulario para rellenar)Una libreta en la que el investigador anota lo observado.Computadora porttil con sus respectivos medios de almacenajeDispositivos como cmara fotogrca, video- lmadora, grabador de audio, etc.Figura 6: Diagrama de tcnicas e instrumentos para la recoleccin de datos3 FUENTES Y RECOLECCIN DE DATOS. 21Las tres tcnicas para la investigacin de campo son utilizadas frecuentemente. Por su importancia, en estematerial vamos a revisar la tcnica de la encuesta.Encuesta: Se dene como una tcnica que pretende obtener informacin que suministra un grupo, muestra opoblacin de sujetos acerca de si mismo, o en relacin a un tema en particular. La encuesta puede ser oral oescrita.Encuesta Oral: Se fundamenta en un interrogatorio cara a cara o va telefnica en el cual el encuestadorpregunta y el encuestado responde. Su duracin es bastante corta por lo cual se realizan poca preguntas.Esta modalidad utiliza como instrumento la Gua de encuesta.Encuesta escrita: Se realiza a travs de un cuestionario autoadministrado, el cual como su nombre loindica, siempre es respondido de forma escrita por el encuestado.Cuestionario: Se realiza de forma escrita mediante un instrumento o formato en papel, medios magnti-cos o electrnicos contentivo de una serie de preguntas. Se le denomina cuestionario auto administradoporque debe ser llenado por el encuestado sin intervencin del encuestadorTipos de cuestionarios:Preguntas Cerradas: Son aquellas que establecen previamente las opciones de respuesta. Ejemplo: Posee ustedun televisor? Si NoPreguntas Abiertas o de desarrollo: Son las que no ofrecen opciones de respuesta, sino que se da la libertad deresponder al encuestado, quien construye su respuesta de manera independiente. Que actividades deportivasrealiza durante el ultimo mes?Preguntas Mixtas: Es aquel cuestionario que combina preguntas abierta y cerradas.Recomendaciones para la elaboracin del cuestionario:1. Las preguntas del cuestionario no se inventan a capricho, es decir estas deben tener una correspondenciacon los objetivos especcos de la investigacin.2. Ordena las preguntas de lo general a lo particular.3. Evitar preguntas que abusen de la memoria del encuestado4. Obviar preguntas sobre temas o conocimientos especializados.5. No incluir preguntas que induzcan a la respuesta (preguntas guas).6. Omitir preguntas que originen mltiples interpretaciones.7. Separar las preguntas de doble can, es decir, aquellas que se interroga sobre dos puntos en una mismapregunta.8. Incluir preguntas que permitan vericar respuesta anteriores o preguntas de control.9. Emplear frases de enlace cuando sea necesario.10. Utilizar escalas de rangos para preguntas sobre tpicos muy personales, tales como, la edad y el salario11. Una vez construido el cuestionario se recomienda aplicar una prueba piloto o sondeo preliminar a unpequeo grupo que no forme parte de la muestra, pero que sea equivalente en cuanto a su caracterstica.Esto con la nalidad de establecer la validez, corregir cualquier falla y elaborar una versin denitiva delinstrumento.4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 224. Organizacin y presentacin de los datos.Una vez que se han recolectado los datos necesarios, es importante organizarlos o agruparlos de alguna manerapara poder manejarlos ms fcilmente. Sin la ayuda de la estadstica, los datos recolectados para una inves-tigacin podran resultar algo as como una masa catica de nmeros. La presentacin de estos datos en tablaso grcos permite apreciarlos con mayor claridad, permitiendo explorar la informacin antes de analizarla.Mientras que las tablas aportan una descripcin ms detallada de los datos, los grcos permiten observar lospatrones generales. Veremos, entonces, cmo organizar los datos en tablas y, posteriormente, cmo presentarlosen grcos.4.1. Presentacin de datos en tablasPara organizar los datos y presentarlos en forma de tabla lo primero que tenemos que hacer es agrupar a losindividuos o unidades del estudio (personas, viviendas, enfermedades, etc.) segn alguna de sus caractersticas.La forma de agrupacin depender de la escala que hayamos utilizado para medir la variable.Si la escala que utilizamos es nominal u ordinal deberemos agrupar los datos de acuerdo a las diferentes cate-goras de la variable.Si la escala que utilizamos es numrica discreta, deberemos observar el rango de valores diferentes que adoptesa variable. Si este rango es pequeo, entonces los datos se agruparn de acuerdo a cada uno de los valores dela variable. Pero si dicho rango de valores es muy amplio, entonces, debern construirse intervalos.Si la escala que utilizamos para medir la variable es numrica continua, siempre deben formarse intervalos oclases.Una vez lograda la agrupacin de los datos en diferentes categoras o intervalos, determinar la frecuencia deobservaciones en cada categora o intervalo de la variable y construir la Tabla de Distribucin de Frecuencias,en el primero de los casos, y la Tabla de Frecuencias con Intervalos de Clases, en el segundo de los casos.Las tablas para facilitar su lectura e interpretacin deben contener las siguientes partes:Ttulo. Este describe la informacin ms importante del problema como es: la variable, la muestra opoblacin, a quin corresponde la muestra.Encabezado. Este describe el tipo de informacin que se describe en cada columna.Cuerpo. El cuerpo agrupa el contenido de la informacin.Final. En el nal se registran los totales.Fuente. En esta parte se debe especicar: cmo, quin, en dnde y cundo se tomaron los datos.4.2. Distribuciones de frecuenciaSupongamos que tenemos recogidos un conjunto deNdatos de una variableX. La tabla que recoge de unmodo sistemtico estos datos se denomina distribucin de frecuencias. Una distrubucin de frecuencias puedeser de dos tipos: simple o agrupada. La siguiente tabla recoge las principales caractersticas de una distribucinde frecuencia simple o no agrupada.La primera columna representa los distintos valores de esos datos y la segunda la frecuencia simple, es decir,el nmero de veces que se ha observado el correspondiente valor. La tercera columna recoge la frecuenciaacumulada, es decir, el nmero de veces que se han observado valores menores o iguales que el correspondientea dicha la. Las frecuencias relativas se obtienen a partir de las frecuencias absolutas, dividiendo por el tamaode la muestra.4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 23Datos Frecuencias Frecuencias F. absolutasabsolutas relativas acumuladasx1n1f1 = n1/N N1 = n1x2n2f2 = n2/N N2 = n1 +n2............xknkfk = nk/N Nk = n1 +n2 +. . . +nkTotaleski=1ni = Nki=1fi = 1Tabla 2: Distribucin de frecuencias simpleCuando en la muestra hay muchos valores diferentes y mucha variabilidad se recomienda, an a costa de perderinformacin, agrupar los datos en clases, en lo que se denomina distribucin de frecuencias agrupadas enintervalos. La siguiente tabla recoge las principales caractersticas de una distribucin de frecuencia agrupada.Intervalos Marcas Frecuencias Frecuencias F. Absolutas Amplitudes Densidadesde clase absolutas relativas acumuladas (longitudes)Iixinifi = ni/N Ni =ij=1njci = LiLi1di =nici[L0, L1] x1n1f1N1c1d1[L1, L2] x2n2f2N2c2d2.....................[Lk1, Lk] xknkfkNkckdkTotaleski=1ni = Nki=1fi = 1Tabla 3: Distribucin de frecuencia agrupadaA cada uno de los intervalos se les denomina clase; a los extremos, extremos de la clase, y al punto medio decada clase se le llama marca de la clase. Para efectos de clculo se elige a la marca de clase como representantedel intervalo. El nmero de clases en que se dividen los datos no debe ser excesivo, puesto que pueden aparecerirregularidadesaccidentalessihaypocasobservacionesenalgunasclases.Porelcontrario,siseeligenunnmero reducido, se producir una prdida importante de informacin. A modo orientativo, el nmero de clasesse puede obtener mediante la siguiente frmula emprica, llamada frmula emprica de Sturges:k = nmero de clases =_32 +log(N)log(2)_(1)donde los corchetes en la ecuacin anterior signica que se toma la parte entera de la expresin.4.3. Presentacin de datos en grcos.En ocasiones, preferir representar grcamente sus datos, con el objeto de obtener una rpida impresin vi-sual del conjunto. Para ello podr utilizar diferentes tipos de grcos, pero lo que nunca debe olvidar son lassiguientes aspectos:4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 24El grco debe ser sencillo y explicarse por s mismo.No intente gracar todos los datos que tiene en un solo grco; por el contrario, es preferible que nocontenga demasiada informacin y su lectura sea fcil.Utilice un diseo atractivo, pero sin deformar los hechos que est describiendo.Seleccione el grco ms apropiado de acuerdo al tipo de variable y la escala de medicin utilizada paramedirla.Los grcos son importantes porque permiten:Organizar los datosObservar patronesObservar agrupamientosObservar relacionesComparar distribucionesVisualizar rpidamentela distribucinde los datosVisualizar, obtenery comparar medidas estadsticasEl tipo de grco est condicionado por el tipo de escala utilizada para medir la variable que desea gracar.4.4. Representacin GrcaEl objetivo esencial de las representaciones grcas de las distribuciones de frecuencias es obtener una ideageneral sobre sus propiedades en un simple vistazo, as por ejemplo, observando un histograma de frecuenciaspodemos ver si la variable se aproxima a una distribucin normal, o si es simtrica, as como otras propiedadesque posteriormente pueden ser analizadas utilizando herramientas estadstica avanzadas.Alahoraderepresentardistribucionesdefrecuenciassernecesariotenerpresenteenprimerlugarsi lavariable es cualitativa o cuantitativa. En segundo lugar, y ya dentro de las variables cuantitativas, habr quetener presente si la variable es agrupada o no agrupada. Teniendo en cuenta estas caractersticas de la variablecuya distribucin de frecuencias se presenta se pueden clasicar los grcos como sigue:Variables___Cuantitativas___Datos agrupados___Histograma de frecuenciasPolgono de frecuenciasPoligono de frecuencias acumuladasDatos sin agrupar___Diagrama de barrasDiagrama escalonadoPolgono de frecuenciasPolgono de frecuencia acumuladasCualitativaso Categricas___Diagramas de sectoresDiagramas de rectngulosPictogramas4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 254.5. Representaciones para variables cualitativas o CategricasDespus de que han sido reunidos los datos, se consolidan y resumen para mostrar la siguiente informacin:Qu valores de la variable han sido medidos?Con qu frecuencia ha ocurrido cada valor?Para este propsito, se construyen las tablas estadsticas para mostrar los datos en forma grca como unadistribucin de datos. El tipo de grco que elija depende del tipo de variable que ha medido.Cuando la variable de inters es cualitativa, la tabla estadstica es una lista de las categoras consideradas juntoa una medida de la frecuencia con que ocurri cada valor. Puede medir la frecuencia de tres maneras distintas:La frecuencia absoluta o el nmero de mediciones en cada categora,La frecuencia relativa o proporcin de mediciones en cada categora,El porcentaje de mediciones en cada categoraPor ejemplo, siNes el nmero total de mediciones, encontrar la frecuencia relativa (denotada porf) y elporcentaje (denotado por p), mediante las siguientes relaciones:f=FN, p = f 100donde Fes la frecuencia absoluta de la categora.Las categoras para una variable cualitativa se deben elegir de modo queuna medicin pertenecer a una y solo una categora,cada medicin tiene una categora a la cual se asignaUna vez que las mediciones han sido clasicadas y resumidas en una tabla estadstica puede usar una grcade sectores (de pastel) o una grca de barras para mostrar las distribucin de los datos.Denicin 4.1. Diagramas de BarrasLos diagramas de barras o rectngulos se construyen asignando a cada modalidad de la variable cualitativa unrectngulo con altura igual (o proporcional) a su frecuencia absoluta ni y con base constante.Ejemplo 4.1. En la siguiente gura se muestra el grco de barras para la pregunta de la encuesta nacionalLocal de uso pblico de internet ms cercano?, las categoras son: A pie, Carreta, Microbs, Bus, Pick-up oCamin, Bicicleta, Auto particular, Caballo, Otros, No sabe-no utiliza, No se desplazaDe la Figura 7 se desprende que la gente que tiene acceso a internet se traslada a pie, sin embargo, una granmayora no sabe o no utiliza internet.Denicin 4.2. Diagramas CircularesTambin llamados Grcos de pastel, constituyen el tipo de grco ms utilizado para representar distribu-cionesdefrecuenciasdevariablescualitativas. Lavariableserepresentaenuncrculocuyasproporciones(sectores circulares) tienen un rea proporcional a las frecuencias absolutas de las modalidades de la variable.Para realizar el grco basta con asignar a cada modalidad de la variable un sector circular cuyo ngulo cen-tral sea proporcional a la frecuencia absoluta de la modalidad. Matemticamente, el ngulo centralide lamodalidad isima cuya frecuencia absoluta es ni se expresa como sigue:i =360Nni = 360niN= 360fi4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 26Figura 7: Grco de barrasEjemplo 4.2. En la Figura 8 se presenta el grco de pastel para la pregunta de la encuenta nacional A quejornada (escolar o universitaria) asiste predominantemente?. (Aqu se toma el total sobre todas las personasque antes haban contestado positivamente a la pregunta Estudia actualmente?, que son 20,915)Ejercicio 1. Interprete los grcos de las Figuras 7 y 8, y diga cual le resulta ms simple de entender.Otra forma habitual de construir grcos de sectores consiste en asignar al sector circular relativo a la modalidadisima un porcentaje igual al tanto por ciento que representa su frecuencia absolutani sobre la frecuenciatotal N=ni. Matemticamente, la expresin del porcentaje pi relativo a la modalidad isima se expresacomo sigue:pi = 100niN= 100fiDenicin 4.3. PictogramasEs un grco con dibujos alusivos al carcter que se est estudiando y cuyo tamao es proporcional a la fre-cuencia que representan, dicha frecuencia se suele indicar.Su formato es libre,Emplean una secuencia de smbolos para representar frecuencias,Se emplean para el tratamiento de datos tanto cualitativos como cuantitativos.Ejemplo 4.3. La Figura 9, representa el nmero de rboles plantados cada mes durante un ao.Ejercicio 2. En base al grco de la Figura 9, explique: en qu mes se plantaron menos rboles?, y en culse hicieron ms plantaciones?4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 27Figura 8: Grco de pastelFigura 9: Pictograma4.6. Representaciones para variables cuantitativas sin agrupamientoLas variables cuantitativas miden una cantidad en cada unidad experimental. Si la variable toma slo un nmeronito o contable de valores, es una variable discreta. Una variable con un nmro innito de valores que corre-sponden a puntos en un intervalo lineal se llama continua.Algunas veces la informacin que se reune para una variable cuantitativa es medida en segmentos distintos de lapoblacin, o para diferentes categoras de clasicacin. Por ejemplo se podra medir el ingreso promedio parapersonas de distintos grupos de edad, generos diferentes o que viven en distintas zonas geogrcas del pas.En estos casos se pueden usar grcas de sectores o de barras para describir los datos, con la cantidad medidaen cada categora y no la frecuencia de ocurrencia en cada cateora. La grca de sectores muestra como sedistribuye la cantidad total entre las categoras y la grca de barras usa la altura de la barra para mostrar lacantidad en una categora particular.4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 28Denicin 4.4. Diagramas de barrasPara variables cuantitativas sin agrupar se construyen situando sobre el eje de las abscisas los valores de lavariable y sobre el eje de ordenaddas los valores de sus frecuencias absolutas.Ejemplo 4.4. En el siguiente grco se muestran las notas en el examen parcial 1 del curso de posgrado encierta sede, las categoras son: mal, para los que tengan menos de 5; bueno, para los que tengan ms de 5 ymenos o igual que 7.5; muy bueno para los que tengan mas de 7.5 y menos o igual que 8.5; excelente para elresto.Figura 10: Grco de barras para las notasEjercicio 3. En base al grco de la Figura 10, explique el rendimiento de los docentes en el examen parcial.Denicin 4.5. Polgono de frecuenciasParaconstruir el polgono de frecuencias se unen los puntos (xi, ni), tambin pueden unirse los puntos (xi, fi).Finalmente para construir el polgono de frecuencias acumuladas se unen los puntos (xi, Ni). Tmbin puedenunirse los puntos (xi, Fi).Ejemplo 4.5. SepresentaelpolgonodefrecuenciasparaelejemplodelasnotasdelcursodeposgradoanteriorEjercicio 4. Explique el grco de la Figura 11, su explicacin coincde con la que dio anteriormente?4.7. Representaciones para variables cuantitativas agrupadasLos anlisis anteriores parten de la idea que la cantidad de datos con que se est trabajando es poca, sin embargo,cuando se hacen encuestas nacionales (como por ejemplo, consumo de canasta bsica por hogar) se obtienengrandes cantidades de datos y los anteriores grcos no son viables.En lo que sigue se estudiaran las representaciones ms importantes y conocidas para variables cuantitativas quetienen una gran cantidad de datos y cuyos valores se repiten muchas veces.4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 29Figura 11: Polgono de frecuenciasDenicin 4.6. Histogramas de frecuenciasLos histogramas de frecuencias para variables cuantitativas agrupadas en intervalos se construyen levantandosobrecadaintervalounrectngulodereaproporcional alafrecuenciaabsolutacorrespondienteadichointervalo. Hayquetenermuypresentequesi losintervalossondeamplitudconstante, lasalturasdelosrectngulos seran iguales a las frecuencias absolutas respctivas (en este caso las reas dependen solo de lasalturas porque las bases de los rectngulos son iguales). Si las amplitudes de los intervalos son desiguales, lasalturas de los rectngulos (densidades de frecuencias) deben calcularse dividiendo la frecuencia absoluta porla amplitud del intervalo.Si llamamos di a la altura del intervalo isimo, ci a su longitud (amplitud) y ni a sus frecuencias absolutas,la densidad de frecuencia di vendr dada pordi =niciComo norma, el nmero de clases o intervalos en que se agrupa la variable debe variar de 5 a 12, cuantos msdatos disponibles haya, ms clases son necesarias. Las clases o intervalos deben ser elegidas de modo que cadaobservacin en uno y solo un intervalo.La Tabla 2 resume los valores necesarios para construir el histograma de frecuencias, que como ya se sabe,consta de rectngulos cuyas bases sobre el eje de abscisas son los intervalos Ii y cuyas alturas son las densidadesde frecuencias di.Ejemplo 4.6. La Figura 12 muestra el histograma para la variable gasto de dlares en lea de los hogaresen el pas.Ejemplo 4.7. La Figura 13 muestra el histograma para la variable cantidad de ayuda en remesas en loshogares nacionales, la divisin de los intervalos se hizo as: intervalo 1, de cero a 100; intervalo 2, de 100 a200; intervalo 3, de 200 a 500; itervalo 4, de 500 a 1000; y el intervalo 5, mayor que 1000. (todo en dlares).En ocasiones suele sustituirse el histograma por el polgono de frecuencias simple, grco que se forma al unirlos puntos medios de cada intervalos xi (marcas de clase) a una altura proporcional a la frecuencia (para interva-los iguales). La unin de estos puntos (xi, ni) o (xi, di) forman una lnea quebrada rectilnea que al prolongarlaporlosextremoscortaal ejeX(estaprolongacinsuelehacersehastalospuntosmediosdelacategorainferior y superior inmediatos que corresponden a la clase de frecuencia cero). De esta forma, el rea que queda4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 30Figura 12: Gasto en leaFigura 13: Ayuda en remesaspor debajo del polgono de frecuencias es igual al rea contenida dentro del correspondiente histograma. Estegrco permite comparar las distribuciones de varios grupos observando las reas donde coincden o se separan.Otro instrumento grco esencial para representar una distribucin de frecuencias es el polgono de frecuen-4 ORGANIZACIN Y PRESENTACIN DE LOS DATOS. 31cias acumuladas, que se utiliza cuando se trabaja con frecuencias absolutas o relativas acumuladas y que seconstruye levantando en el extremo superior de cada intervalo de clase una ordenada igual a la frecuencia acu-mulada correspondiente y uniendo a continuacin dichas ordenadas. Los puntos que se unen sern (Li+1, Ni).La primera ordenada se une al extremo inferior del primer intervalo prolongndose el polgono desde este pun-to hasta la izquierda sobre el eje X, y prolongndose tambin el polgono a partir de la ordenada del extremosuperior del ltimo entervalo con una paralela al eje de abscisas. De esta forma, la ordenada correspondiente acada valor de la variable X mide el nmero de observaciones para las cuales la variable toma valores menoreso iguales que la abscisa (este concepto aproxima la idea de funcin de distribucin de la variable x).Figura 14: Poligono de frecuencias acumuladasEjercicio 5. Interprete el grco de la Figura 14Denicin 4.7. Serie TemporalHasta ahora todas las variables que se han estudiado tenan en c