Profdosa - Estadistica Aplicada Educacion

139
UNIVERSIDAD NACIONAL “JOSÉ FAUSTINO SÁNCHEZ CARRIÓN” FACULTAD DE EDUCACIÓN ESCUELA ACADÉMICO PROFESIONAL DE EDUCACIÓN A DISTANCIA PROFDOSA PROGRAMA DE FORMACIÓN DOCENTE SEMIESCOLARIZADO Y AUTOFINANCIADO ESTADÍSTICA APLICADA A LA EDUCACIÓN JULIÁN PEDRO ESPINOZA ROSALES HUACHO – PERÚ 2004

description

Profdosa Estadistica

Transcript of Profdosa - Estadistica Aplicada Educacion

Page 1: Profdosa - Estadistica Aplicada Educacion

UNIVERSIDAD NACIONAL

“JOSÉ FAUSTINO SÁNCHEZ CARRIÓN”

FACULTAD DE EDUCACIÓNESCUELA ACADÉMICO PROFESIONAL DE

EDUCACIÓN A DISTANCIA

PROFDOSAPROGRAMA DE FORMACIÓN DOCENTE

SEMIESCOLARIZADO Y AUTOFINANCIADO

ESTADÍSTICA APLICADA

A LA EDUCACIÓN

JULIÁN PEDRO ESPINOZA ROSALES

HUACHO – PERÚ2004

Page 2: Profdosa - Estadistica Aplicada Educacion

3ESTADÍSTICA APLICADA A LA EDUCACIÓN

UNIVERSIDAD NACIONALJOSÉ FAUSTINO SÁNCHEZ CARRIÓN

AUTORIDADES DE LA ALTA DIRECCIÓN UNIVERSITARIA

Rector : Dr. Carlos Chuquilin TeránVice-Rector Académico : Mg. César Zelada MendozaVice-Rector Administrativo : Mg. Carlos Morales ChiritoSecretario General : Lic. Adelfio Bacilio Alvarado

FACULTAD DE EDUCACIÓN

UNIVERSIDAD NACIONALJOSÉ FAUSTINO SÁNCHEZ CARRIÓN

AUTORIDADES DE LA ALTA DIRECCIÓN UNIVERSITARIA

Rector : Dr. Carlos Chuquilin TeránVice-Rector Académico : Mg. César Zelada MendozaVice-Rector Administrativo : Mg. Carlos Morales ChiritoSecretario General : Lic. Adelfio Bacilio Alvarado

FACULTAD DE EDUCACIÓN

Decano : Dr. Manuel Mendoza Cruz

Jefe Académico Administrativo : Lic. Eliseo Toro Dextre

Director de la Escuela Académica ProfesionalBásico Científico Humanístico Dual : Lic. Melchor Escudero Escudero

Director de la Escuela Académica ProfesionalDe Educación a Distancia : Lic. César La Cruz Salvador

Director de la Escuela de EducaciónFísica y Deporte : Lic. Pascual Cornejo Bazalar

Director de la Escuela Académica Profesionalde Educación Tecnológica : Lic. Aldo Gonzales Rivera

Jefe del Departamento Académico deCiencias Sociales y Humanidades : Lic. Ricardo Bustamante Abad

Jefe del Departamento Académico deCiencias Formales y Naturales : Lic. Segundo Martínez Namay

Jefe del Departamento Académico deEducación y Tecnología : Lic. Climaco Vergara Guadalupe

Director del Instituto de Investigación : Dr. Guillermo Aguilar Claros

Page 3: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES4 5ESTADÍSTICA APLICADA A LA EDUCACIÓN

ÍNDICE

Créditos. 8Introducción. 9Presentación. 11Instrucciones para el uso del texto. 12

PRIMERA UNIDAD- NOCIONES BÁSICAS DE ESTADÍSTICAObjetivo general 21Lección N° 1.1: ¿Qué es la Estadística? 22Examenes Capítulo 1 38Lección N° 1.2: Conceptos Matemáticos Fundamentales 41Práctica N° 1 50Lección N° 1.3: Organización, Clasificación, Representación,Tabulación y Gráfica de los Datos 53Práctica N° 2 91Prueba de Autoevaluación de la Primera Unidad 93

SEGUNDA UNIDAD - ANÁLISIS E INTERPRETACIÓN DE LOS DATOSObjetivo general 99Lección N° 2.1: Análisis e Interpretación de los Datos 100Lección N° 2.2: Mediana en una Distribución de Frecuencias 117Ejercicios 134Prueba de Autoevaluación de la Segunda Unidad 136

TERCERA UNIDAD - MEDIDAS DE DISPERSIÓN Y ASIMETRÍAObjetivo general 143Lección N° 3.1: Medidas de Dispersión 144Lección N° 3.2: Medidas de Deformación 160Prueba de Autoevaluación de la Tercera Unidad 165

CUARTA UNIDAD - DISTRIBUCIÓN NORMALObjetivo general 169Lección N° 4.1: La Distribución Normal 170Lección N° 4.2: Distribución Bidimensional 193Ejercicios 207Prueba de Autoevaluación de la Lección 208

Ciudad Universitaria - Prolong. Mercedes Indacochea S/N.Fax: 232-5816 Teléfono: 239-4010 Anexo: 225

Huacho

PROGRAMA DE FORMACIÓN DOCENTESEMIESCOLARIZADO Y AUTOFINANCIADO

DIRECTORIO DE PROFDOSA

Director : Lic. César La Cruz SalvadorSub Director : Lic. Segundo Martínez NamayCoordinador General de Sedes : Lic. Ricardo de la Cruz DurandCoordinador de Evaluación : Lic. Marcial Ramos GonzálesCoordinador de Tutoría : Lic. Ruth Padilla DelgadilloCoord. Administrativo Contable : CPC Gilmar Rodríguez NúñezCoord. del Centro de Asesoramiento Virtual: Lic. Víctor Huaranga García

SEDES Y COORDINADORES A NIVEL NACIONAL

Huacho : Lic. David Zavala ZavalaLima : Lic. Luzmila Guzmán GuzmánBarranca : Lic. Daniel Lecca AscateHuaral : Lic. Felipa Apolinario RiveraChincha : Mg. Graciela Molina del RíoPuno : Lic. Uriel Arpasi MamaníPucallpa : Lic. Mauro Arroyo AbregúJaén : Lic. Elizabeth Rojas de CamposBagua : Lic. Mary Vilchez SalazarOyón : Lic. Miguel Garro ZuloagaHuancayo : Lic. Jorge Salazar JaureguiCañete : Lic. Andrés Hurtado SaccsaSatipo : Lic. Teódulo Santos AranaSanta Cruz : Lic. William A. Colichón DíazMatucana : Lic. Carlos Fredi Herrera GarcíaHuayopampa : Lic. César Rizabal AguedoCanta : Lic. Fidencio Yacachin RojasChepen : Lic. Ramón Andrés Rivera RomeroTumbes : Lic. Elber Barreto Chapilliquen

Page 4: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES6 7ESTADÍSTICA APLICADA A LA EDUCACIÓN

Lección N° 4.3: Regresión Lineal 210Ejercicios 220Prueba de Autoevaluación de la Lección 221

QUINTA UNIDAD - PROBABILIDADESObjetivo general 225Lección N° 5.1: Probabilidades 226Lección N° 5.2: Distribución en el Muestreo 239Ejercicios 242Prueba de Autoevaluación de la Quinta Unidad 256

SEXTA UNIDAD - DESARROLLO DE MODELOS Y TÉCNICAS PARAEL PLANEAMIENTO EDUCATIVOObjetivo general 261Lección N° 6.1: Metodología para la Determinación de Metas 262Prueba de Autoevaluación de la Sexta Unidad 274Bibliografía 275

JULIÁN PEDRO ESPINOZA ROSALESNatural de la ciudad de Jauja (departamento de Junín).

Estudios realizados, Educación Superior Universidad Nacional de Trujillo.

Grados y Títulos:- Lic. en Educación: Especialidad Matemáticas (Universidad Nacional de

Trujillo).- Maestría en Educación Superior UNMSM.

Estudio de Post Grado:- Especialista en Estadística Educativa (INIDE).- Planificador de los Recursos Humanos y de la Educación (Universidad

Nacional de Panamá).- Diploma de Estudios en Población (Pontificia Universidad Católica del

Perú).

Estímulos:- Condecoración de las Palmas Magisteriales en el Grado de Educador.

Cargos Desempeñados:- Docente adscrito a la Facultad de Educación en la Categoría de Asociado

Dedicación Exclusiva.- Director de la Escuela Académica Profesional de Educación a Distancia

de la facultad de Educación.- Director de la Escuela Académica Profesional de Educación Básica

Científico Humanístico Dual.

Page 5: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES8 9ESTADÍSTICA APLICADA A LA EDUCACIÓN

INTRODUCCIÓN

El propósito del presente libro es llenar un vacío en la bibliografía referentea la experimentación del método de enseñanza personalizada para la asignaturade Estadística y Estadística Aplicada a la Educación. La comprensión delfenómeno de la variabilidad que es lenguaje de la estadística y por ende de laEducación tiene que hacerse a base de un conocimiento matemático de los datosque se interpretan. Tanto para el investigador como para el estudioso de losfenómenos educativos, del bosque de los números ha de ser sometido a unainterpretación estadística.

El planteamiento estadístico de los trabajos de investigación es algoimperceptible hoy en el estado actual de nuestros conocimientos por eso esfundamental el familiarizarse en estas tareas desde el momento mismo en que sepisan los umbrales de nuestras universidades. En este aspecto creemos que estelibro aportará una gran contribución al estudio y compresión de estas materias.En el espiral de la Educación al precisar objetivos programación y evolución detantos problemas que nos permitan tomar decisiones, es pues fundamental elconocimiento de esta herramienta describiendo su manejo, e interpretación cuantonos puede aportar si es eficazmente utilizado para considerar la precaución.Esperamos que esta obra cubra los objetivos instituidos en la facultad deEducación de la Universidad José Faustino Sánchez Carrión de Huacho.

En primer lugar se debe reconocer la imperfección del conocimiento humano.Después debe entenderse que el conocimiento actual no es más que la base paranuevas hipótesis, sabiendo estos los métodos del pensamiento mencionados antespueden ser útiles para profundizar muestro entendimiento del proceso deproducción y de las formas de mejorarlo.El propósito de este libro es mostrar como aplicar los métodos estadísticos a losproblemas del mundo real, quienes tengan poco conocimiento del análisisestadístico también pueden beneficiarse por la forma sencilla y práctica que sepresentan los temas.

En seguida se presentan los capítulos del libro que son seis unidades:Unidad I: Que es la Estadística.Unidad II: Análisis e Interpretación de los Datos.Unidad III: Medidas de Dispersión y Asimetría.Unidad IV: La Distribución Normal, Distribución Bidimensional.Unidad V: Probabilidades, Distribución en el Muestreo.Unidad VI: Modelos y Técnicas para el Planeamiento Educativo.

Suponemos que la secuencia y desarrollo de los conceptos de esta obraayudarán a comprender la utilidad de la metodología de la inferencia estadísticaen la consideración y soluciones de problemas educativos.

CRÉDITOS

I. DATOS GENERALES

Departamento Académico: Educación Tecnológica y Actividades

Escuela Académica: Educación a Distancia

Nombre de la Asignatura: Estadística Aplicada a la Educación

Ciclo: III

Código: FG 304

Peso Académico: TH = 6 A.D = 3 A.A = 2 I.A = 1

Créditos: 5

Área Curricular: Formación General

Page 6: Profdosa - Estadistica Aplicada Educacion

11ESTADÍSTICA APLICADA A LA EDUCACIÓN

PRESENTACIÓN

El presente Texto tiene en cuenta que la educación cumple un papelprimordial en la adecuación de nuestra sociedad a este mundo cambiante,el sistema educativo, Peruano se ha visto afectado por cambios sustancialestanto en su concepción como en su contenido, los cuales han sufrido ciertosreajustes con miras a un mejoramiento.

El programa desarrollado en Estadística y estadística Aplicada a laEducación, obedece a estas características y especialmente está diseñadopara orientar el estudio independiente en forma lógica y gradual. Primerodando las herramientas necesarias para observar e investigar es decirintroducir en la metodología estadística al estudiante de pedagogía, conprecisión, claridad y sencillez. Estas cualidades pedagógicas esenciales parauna primera experiencia.

El presente texto tiene solo un propósito didáctico y constituyente untexto de iniciación para el estudio en esta técnica cuantitativa. Esta destinadaa facilitar el dominio de un instrumental mínimo indispensable en materiasde pedagogía, proporcionando un conjunto de conceptos que aseguren alestudiante la posibilidad de percibir tanto la ventaja como las limitacionesdel empleo de indicadores estadísticos y permitan interpretar cabalmentelos estadígrafos de uso más frecuentes.

Interesa al mismo tiempo que el estudiante pueda establecer más adelanteun estudio más profundo relacionado al trabajo eficiente y contar con unconjunto de indicadores educativos a fin de apoyar a los diversos proyectoseducativos orientados al mejor análisis de la problemática educacional, afin de dar propuesta de nuevos indicadores educativos, el objetivo perseguidoes brindar un texto didáctico que incluya un conjunto de temas íntimamenterelacionados con la problemática educativa complementados con ejerciciosque ilustren conceptos de manejos cotidianos en la práctica docente.

Por lo expuesto, los estudiantes que hagan uso del TAI, lo tienen adisposición, cuando y las veces que quieran y donde se encuentren, por loque recomendamos que los estudien de manera comprensiva y crítica. Soloasí se beneficiaran de sus ventajas didácticas, ya que un buen lector dehecho es un autodidacta.

El presente texto está organizado en seis unidades integradas por nuevelecciones en las cuales se enfoca el aprendizaje de la estadística comoinstrumento esencial para la investigación educacional.

J. E. R.

Page 7: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES12 13ESTADÍSTICA APLICADA A LA EDUCACIÓN

UBICACIÓN DEL TEXTO DENTRO DE LAESTRUCTURA CURRICULAR

Dimensión de Área Formación Profesional Básica

Dominio Técnico Didáctico

Asignatura Estadística Aplicada a la Educación

Fase Estudio Independiente Autoaprendizaje

Ciclo – Código III – FG0301

Peso Académico Total Aprendizaje Auto Inter

Horas Dirigido Aprendizaje Aprendizaje

6 3 2 1

INSTRUCCIONES PARA EL USO DEL TEXTO

1. Instrucciones Generales.-Aquí se orienta sobre la forma de usar los Textos Auto Instructivos (TAI)

en base a su estructura interna.En primer lugar, es necesario que comprendas que un Texto

Autoinstructivo cuando contiene todos los medios necesarios para que elestudiante logre, por sí mismo y siguiendo los pasos señalados, los objetivosplanteados. Es decir cuando el texto orienta y controla el proceso deautoaprendizaje, en función de los objetivos de las asignaturascorrespondientes.

Para un mejor aprovechamiento de los TAIs, debes conocer su estructurageneral y que objetivos persigue cada uno de los elementos o partes, los quehan sido ordenados de acuerdo con una secuencia a seguir en el proceso deautoaprendizaje.

A continuación, se describen los elementos componentes de cada TAI:

a) Introducción General. Explica por qué se estudia cada asignatura y dauna visión general del contenido de la misma, haciendo notar la relaciónque guarda con el perfil profesional del educador.

b) Objetivos Generales y Temas-eje de la Asignatura. Especifica loslogros a alcanzar al término del estudio de todo el TAI. En un recuadro,

que se presenta en una sola página, tendrás una visión general de losobjetivos con su respectivo temario y la secuencia instruccional de laasignatura.

c) Unidades Didácticas. Una unidad agrupa objetivos y temas afines,alrededor de la cual se cumple todo el proceso de aprendizaje y surespectiva evaluación. Desarrollo un objetivo de la asignatura. De allíque habrá tantas unidades como objetivos generales posea la asignatura.Cada unidad tiene una numeración que coincide con la del objetivo generalque desarrolla además de un título que resume el contenido del objetivogeneral. Este último figura después del, título para cumplir con su papelorientador del aprendizaje de la unidad respectiva.La introducción de la unidad, precisa el por qué de su estudio y da unavisión general de la misma.Finalmente, contiene los objetivos específicos de la unidad.Estos se derivan del temario que acompaña a cada objetivo general de laasignatura. Tendrás una visión general de los objetivos específicos, desus contenidos básicos respectivos y la secuencia instruccional de launidad, en un recuadro que se presenta en una sola página.Hasta aquí debes tener muy claro el para qué (objetivo) y el qué(contenido) debes estudiar tanto a nivel de la asignatura en general comode cada unidad.

d) Lecciones. La lección constituye la parte medular del texto. Desarrolla demanera concreta un objetivo específico.Está conformada por los subtemas que se derivan del contenido básicodel objetivo específico que desarrolla.Proporciona toda la información básica de las actividades necesarias parael logro del objetivo específico. Aquí, debes desarrollar determinadasactividades, de acuerdo con las siguientes fases:

d.1 Estudio Independiente y Autoaprendizaje, aplicados: Las técnicasgenerales de estudio (lectura, elaboración de resúmenes y cuadrossinópticos) o Informe Didáctico debe cumplir con todas las actividadesy tareas que se te indiquen en el texto. Todo ello está, destinado aprovoca las experiencias convenientes para el logro de losaprendizajes.En caso de no comprender y tener dudas por el grado de dificultad ola poca claridad de los contenidos, formula tus preguntas al términodel informe didáctico de cada lección.

Page 8: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES14 15ESTADÍSTICA APLICADA A LA EDUCACIÓN

d.2 Estudio socializado e interaprendizaje, constituido por círculos deestudio para absolver las preguntas y dudas.

e) Elementos Complementarios de la Unidad. Al término de las leccionesque conforman una unidad se presentan los siguientes elementos, loscuales buscan consolidar el aprendizaje del objetivo general de laasignatura.- Las Actividades: Están conformadas por un conjunto de preguntas,

situaciones problemáticas u otras actividades que permitan laaplicación de los conocimientos adquiridos.Apoya al recuerdo, la transferencia y la aplicación del aprendizaje;se desarrollan en forma individual y grupal. Esto último permitirá unintercambio de conocimientos y una confrontación de las respuestasa soluciones planteadas.Dada su importancia en el autoaprendizaje, no debes dejar dedesarrollarlas. En el caso de no encontrar las respuestas o solucionessatisfactorias, consulta a los especialistas del lugar donde trabajas, enlos centros de asesoramiento de la Universidad o a través de las hojasde consulta.

- Glosario: Incluye la acepción de términos nuevos usados en laasignatura, para hacer más accesible la información. Si encuentrasotros términos obscuros no consignados en este glosario, anótalospara consultarlos con un especialista en la materia.

- Bibliografía: Considera los libros empleados en el desarrollo de launidad que te servirán como fuente de consulta para ampliar tusconocimientos.Esto último es importante en el nivel universitario, ya que los TAIssolo te proporcionarán una información básica.

- Anexos: Aquí figuran las lecturas, cuadros estadísticos, tec., que seconsideran necesarios para ampliar la información en el desarrollode las lecciones, Su inclusión es opcional.Al término del autoaprendizaje de las lecciones debes haber alcanzadolos objetivos generales y específicos de la unidad correspondiente.Pero, para estar seguro de ello, tienes que autoevaluarte, tal como seindica seguidamente.

f) Prueba de Autoevaluación de Lección. Estas pruebas tienen por finalidadque tú mismo puedas averiguar el nivel de logro de los objetivosespecíficos de la lección estudiada. Responde la pregunta en formaindividual, sin consultar el texto ni el patrón de respuestas, pues, debes

recordar que la autoevaluación es un elemento para el proceso deautoaprendizaje.Cuando hayas terminado de resolver todos los ítems, desglosa la hoja ola pestaña de respuestas, depositándolo en un sobre, para entregarlo,adjunto a tu informe, luego, verifica tu patrón de respuestas, para obtenerel puntaje que te corresponde al profesor-tutor; luego, verifica tu patrónde respuestas, para obtener el puntaje que te corresponde.Si éste es por debajo del promedio, deberás revisar nuevamente la leccióny someterte a otra autoevaluación hasta alcanzar el nivel deseado.

2. Instrucciones Especificas:Dadas las características de la asignatura, la cual se distingue por ser

eminentemente práctica y teórica, es importante que incidas en la captaciónde los conceptos, así como en las características fundamentales y los diversosenfoques existentes sobre los asuntos tratados.

De allí que, al estudiar el TAI, es importante que:- Te esfuerces en focalizar y subrayar las palabras y frases que expresan

las ideas-eje.- Elabores fichas resúmenes, cuadros sinópticos y un informe didáctico

con las palabras y frases subrayadas.- Amplíes la información con la lectura de los anexos y de la bibliografía

recomendada al término de cada unidad; y- Tomes una actitud crítica frente a las diversas posiciones y, en general,

sobre el contenido de la asignatura.

Page 9: Profdosa - Estadistica Aplicada Educacion

17ESTADÍSTICA APLICADA A LA EDUCACIÓN

UNIDADES, OBJETIVOS YCONTENIDOS DE LA

ASIGNATURA

Page 10: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES18 19ESTADÍSTICA APLICADA A LA EDUCACIÓN

PRIMERA UNIDADNOCIONES BÁSICAS DE

ESTADÍSTICA

UNIDAD

INOCIONESBÁSICAS

DEESTADÍSTICA

IIANÁLISIS E

INTERPRETACIÓNDE LOS DATOS

IIIMEDIDAS DEDISPERSIÓN Y

ASIMETRIA

IVDISTRIBUCIÓN

NORMAL

VPROBABILIDADES

VIDESARROLLO DE

MODELOS YTÉCNICAS PARA EL

PLANEAMIENTOEDUCATIVO

OBJETIVOSGENERAL

Al finalizar el estudio de loscontenidos de la primera unidadel alumno será capaz de utilizar,identificar, conocer lanaturaleza y la terminología dela estadística aplicada a laeducación en el campo de lainvestigación.

Al finalizar el estudio de loscontenidos de la segundaunidad el estudiante será capazde calcular analizar e interpretarlos estadígrafos de tendenciacentral.

Al finalizar el estudio de loscontenidos de la tercera unidadel estudiante será capaz deconocer y utilizar las medidasde dispersión en el análisis delgrado de concentración.

Al finalizar el estudio de loscontenidos de la cuarta unidadel estudiante será capaz deconocer, identificar e interpretarvariables bidimensionales yhacer proyecciones.

Al finalizar el estudio de loscontenidos de la quinta unidadel estudiante será capaz deconocer, identificar e interpretary resolver problemas aplicadosa la teoría elemental deprobabilidades.

Al finalizar el estudio de loscontenidos de la sexta unidad elestudiante será capaz deconocer, analizar presentarmetodologías para lapresentación de los recursoshumanos físicos y financieros.

CONTENIDOS

1.1 Nociones Básicas de laEstadística.

1.2 Conceptos Matemáticos1.3 Representación, Tabulación

y Gráfica de Datos.

2.1 Análisis e interpretación delos datos.

2.2 La Mediana de una Distri-bución de Frecuencias.

3.1 Medidas de Dispersión.3.2 Medidas de Deformación.

4.1 La Distribución Normal.4.2 Distribución Bidimensio-

nales.4.3 Regresión Lineal.

5.1 Probabilidades.5.2 Distribución en el Muestreo.

6.1 Metodología para ladeterminación de Metas.

6.2 Enfoques para laPlanificación.

6.3 Elaboración de Metas deOcupación.

Page 11: Profdosa - Estadistica Aplicada Educacion

21ESTADÍSTICA APLICADA A LA EDUCACIÓN

OBJETIVO GENERALAl finalizar el estudio de los contenidos de la primera unidad

el alumno será capaz de utilizar, identificar, conocer lanaturaleza y la terminología de la estadística aplicada a laeducación en el campo de la investigación.

LECCIONES

1.1Nociones Básicas deEstadística.

1.2Conceptos Matemá-ticos Fundamentales.

1.3R e p r e s e n t a c i ó n ,Tabulación y Gráficade Datos.

OBJETIVOSESPECIFICOS

1.1 Definir, conocer, interpretarla terminología que se utilizaen la estadística aplicada ala Educación.

1.2 Conocer, definir einterpretar los métodos ytécnicas para obtener losDatos Estadísticos.

1.3 Conocer la naturaleza delProceso de Organización yPresentación de los Datos.

CONTENIDOSANALÍTICOS

1.1 ¿Qué es Estadística?1.1.1 Nociones sobre qué

es Estadística.1.1.2 División en la

Estadística.1.1.3 Variables.

1.2 Conceptos MatemáticosFundamentales.1.2.1 Introducción.1.2.2 Métodos Estadísticos.1.2.3 Recolección de

Datos.1.2.4 Organización y

Clasificación deDatos.

1.3 Representación yclasificación de los datos.1.3.1 Revisión y corrección

de los datos.1.3.2 Construcción de la

Distribución deFrecuencias.

1.3.3 Elaboración de laDistribución deFrecuencias por elMétodo de Sturges.

1.3.4 Representación entablas estadísticas.

1.3.5 R e p r e s e n t a c i ó nGráfica de la Distri-bución de Frecuencias.

1.3.6 Gráfico de Sector oPastel.

Page 12: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES22 23ESTADÍSTICA APLICADA A LA EDUCACIÓN

Muchas personas se enfrentan por primera vez con cierto temor a la aplicaciónde datos numéricos para resolver un problema. Esto se debe a que han escuchadocon frecuencia frases como “las estadísticas mienten”, y tal vez hayan miradoen las librerías un libro titulado Como mentir con las estadísticas. Las estadísticas

“mienten” solo si no se interpretan en forma correcta. Como ejemplo considéreseque las ventas de “productos de precisión” durante los últimos 18 años serepresentan como se ve en el diagrama 1-1. En primer lugar se podría llegar a laconclusión de que las ventas aumentaron con mucha rapidez desde 1980 (estaes la mentira).

Los objetivos de este libro son muchos. Desde luego, uno de ellos es ponersobre aviso al lector acerca del posible uso incorrecto de graficas, promedios,técnicas de correlación y regresión, y de otras técnicas estadísticas. Otro consisteen presentar al lector la utilidad de dichas técnicas en investigación de mercados,contabilidad, finanzas, comercio internacional, economía, aplicación de leyes yotros campos. En forma especifica, ¿quién utiliza la estadística?

¿QUIÉN UTILIZA LA ESTADÍSTICA?

Según se indico, las técnicas estadísticas se aplican de manera ampliaeducación: promoción repitencia y deserción escolar, contabilidad, control decalidad y en otras actividades; estudios de consumidores; análisis de resultadosen deportes; administradores de instituciones; organismos políticos; médicos; y

Diagrama 1-1

100

101

1980 1990 2000

LECCIÓN N ° 1.1

¿QUÉ ES LA ESTADÍSTICA?

OBJETIVO ESPECÍFICO N ° 1.1Explicar lo que significa Estadística Descriptiva y Estadística

Inferencial.

1.1.1 Nociones sobre qué es Estadística.-Si uno ve el fútbol por televisión por la noche, o escucha un juego de béisbol

por la radio, o lee alguna de las revistas deportivas o de negocios mas conocidosen su localidad, se vera sometido a (y algunas veces abrumado por) una grancantidad de cifras a las que comúnmente se denomina estadística. Estas cifraspueden referirse a deportes, al mercado de valores, al desempleo, a la producciónindustrial o a la esperanza de vida por ejemplo:

A un dato numérico o valor aislado se le denomina dato, o valor estadístico.El precio al cierre de acciones comunes de una empresa (48˚) es un datoestadístico. Un promedio de calificaciones (6,5 también es un valor estadístico.Las ventas totales al menudeo en un cierto mes, 297,000 miles de soles, esasimismo un dato estadístico. A un conjunto de datos numéricos se le denominaestadística. Por ejemplo, las cifras que se mencionaron antes (300 pedidos deflores para el Día de la madre; 16 agencias de viajes, 2.2% de la fuerza detrabajo dedicada a la agricultura, y 7,6 millones de alumnos), por lo general sedesignan como “estadísticas”

Sin embargo, el estudio de las estadísticas según se expondrá en este librotiene un significado mucho mas amplio que la simple recopilación y publicaciónde hechos y datos numéricos, El estudio general de las estadísticas se definecomo la ciencia estadística o Estadística.*

Estadística: Ciencia que trata de la recopilación, organización, presentación,análisis o interpretación de datos numéricos (estadística) con el fin realizar

una toma de decisiones mas efectiva.

Así como los abogados tienen “reglas de evidencia” y los contadores“prácticas de uso común”, las personas que trabajan con datos numéricos siguenciertos lineamientos estándares. En los capítulos que siguen se presentanalgunas de las técnicas estadísticas básicas que se aplican en los problemas dedecisión.

LECCIÓN N ° 1.1

Page 13: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES24 25ESTADÍSTICA APLICADA A LA EDUCACIÓN

5. Los resultados de varios sondeos de opinión realizados por Apoyo, Data,la Universidad de Lima, se publican en los diarios y revistas y se presentanen la radio y en la televisión. Estos sondeos abarcan muchos temas, comoevaluación del desempeño del presidente del Perú y su gabinete, el sentirde los peruanos acerca de problemas de educación, transportes, salud comoel sida y el tabaquismo, si debe continuar el programa de apoyo social alos más necesitados, la importancia de la religión y si las líneas aéreascomerciales son tan seguras como lo eran hace cinco años. Como ejemploespecífico un estudio realizado por la Universidad de Lima en marzo del2003 indico que cerca de 3 de cada 10 adultos peruanos fumaban. Esto eramenos del 38% en 1993 y de 45% en 1975. Además se informó que elporcentaje de mujeres que fuman es ahora aproximadamente igual al dehombres. En 1997 33% de los hombres lo hacían y de las mujeres el 28%resulta interesante saber que 77% de los fumadores indicaron que lesgustaría dejar de hacerlo.

1.1.2 División de la Estadística.-

Estadística Descriptiva.-La definición de Estadística presentada en la introducción se refiere a la

“organización, presentación y análisis de datos numéricos”. A este aspecto de laestadística por lo común se le denomina Estadística descriptiva.

Estadística descriptiva Procedimientos empleados paraorganizar y resumir conjuntos de datos numéricos.

Los conjuntos de datos numéricos no organizados (como en censo depoblación, las retribuciones por hora de miles de programadores de computadoray las respuestas individuales de 8. millones de votantes registrados en lo referentea la elección del presidente del Perú resultan de poco valor. Sin embargo, sedispone de técnicas estadísticas para organizar este tipo de datos en formasignificativa. Algunos pueden organizarse en una distribución de frecuencias.(El procedimiento para hacerlo se expone en le capitulo 2). Pueden utilizarsediversos tipos de graficas para escribir los datos; en el capitulo 2 también sepresentan varias formas básicas de graficas.

Los promedios especializados, como la mediana, pueden calcularse paradescribir el valor central de un grupo de datos numéricos. Estos promedios sepresentan en el capitulo 3. Puede utilizarse un cierto numero de medidasestadísticas para describir como se agrupan estrechamente los datos con respectoa un promedio.

por otras personas que intervienen en la toma de decisiones. Los ejemplos quesiguen sugieren el amplio uso de la Estadística en los problemas de decisión.

1. El Director de un centro educativo debe tomar decisiones acerca de lapropuesta para aumentar el número de seccione a fin de atender la demandaescolar. Para determinar si en realidad es necesario o no nuevas secciones eldirector debe recopilar y evaluar datos como tasas de promoción, repitencia,deserción tasa de crecimiento poblacional. Después debe reunir datos sobrecostos de la construcción, fuentes de financiamiento e ingresos proyectados,para justificar la nueva edificación ante la junta directiva.

2. El contador y el departamento de contabilidad de una empresa se encargande la exactitud de los cálculos financieros. Ya que resulta físicamenteimposible verificar cada documento y determinar su exactitud, se realiza unmuestreo de las facturas y se toman decisiones con base en los resultados delas muestras.

3. El departamento de mercadotecnia de una empresa fabricante de jabón estaencargado de hacer recomendaciones acerca de la posible rentabilidad de ungrupo de jabones faciales recientemente producidos que tienen aromas defrutas. En forma semejante, el departamento de mercadotecnia de unaembotelladora de bebidas gaseosas de distribución nacional debe tomar unadecisión similar en lo que se refiere a un grupo de bebidas de recienteelaboración que tienen sabores tan especiales como aguacate y ciruela. Ambosdepartamentos realizaran pruebas con consumidores y proyectaran lasganancias con base en resultados de las muestras.

4. El gobierno central del Perú esta interesado especialmente en la condiciónactual de la economía y en la predicción de las técnicas económicas futuras.El gobierno realiza un gran número de encuestas para determinar la confianzade los consumidores y las perspectivas de los directores de empresas en loque se refiere a ventas y producción para los próximos 12 meses. Cada messe elaboran índices, como el índice de precios al consumidor Consumer PriceIndex, con objeto de evaluar la tendencia inflacionaria. Las ventas enalmacenes de departamentos, los inicios de construcciones habitacionales,el movimiento monetario, y las estadísticas de producción industrial sonunos cuantos de los cientos de indicadores económicos que se evalúan cadames. Estas evaluaciones se utilizan para tomar decisiones en lo que se refierea las tasas preferenciales (prime rate) aplicadas por los bancos y las utilizaun banco central a fin de decidir el nivel de control sobre la oferta de dinero.

Page 14: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES26 27ESTADÍSTICA APLICADA A LA EDUCACIÓN

incluir: 1.5 de cada 100 empleados cambiaron de trabajo el último mes; elsalario mínimo es de S/. 450 (soles); y el número promedio de horas detrabajo fue de 30.5.

4. Las cadenas de televisión constantemente vigilan la popularidad de susprogramas contratando a organizaciones de encuestas para muestrear laspreferencias del auditorio. Estas apreciaciones de la audiencia de un programase utilizan para fijar precios a la publicidad y para cancelar programas.

5. Los biólogos marinos marcan unas cuantas focas para graficar sus patronesmigratorios.

6. Los catadores de vino degustan unas cuantas gotas de vino para tomar unadecisión en lo que se refiere a todo el vino preparado para la venta.

7. El departamento de contabilidad verifica sólo unas cuantas facturas paradeterminar la exactitud de todas ellas.

8. Los consumidores prueban muestras de pizzas y otros productos en unestablecimiento. Si les gusta la muestra, pueden comprar una pizza completa.

¿Por qué tomar una muestra en vez de estudiar todos los elementos de lapoblación? Debido al costo prohibitivo de tener contacto con los millones devotantes antes de una elección, es necesaria una muestra de los votantesregistrados. Al probar trigo para determinar el contenido de humedad se destruyenlos granos, lo que hace forzoso utilizar una muestra. Si los catadores de vinoprobaran todo el vino, no quedaría nada que vender. Para unos cuantos geólogosmarinos sería físicamente imposible capturar y marcar todas las focas del océano.

Existen ciertos riesgos relacionados con el empleo de resultados de lasmuestras para deducir algo acerca de una población desconocida. Cinco engranesseleccionados al azar por el departamento de control de calidad, entre todos losengranes fabricados durante una hora podrían ser perfectos. Podría concluirse apartir de esta muestra que todos los engranes producidos fueron satisfactorios.Pero ya que esta inferencia se basó en una muestra, existe cierta probabilidad deque no todos los engranes producidos sean satisfactorios. Cuando se realiza unsondeo de opinión o se investiga el mercado para un nuevo cereal, jabón odentífrico con base en una muestra, es necesario considerar que existe un riesgoal realizar inferencias con respecto al comportamiento de la población. El sondeode opinión o la prueba de mercado podrían indicar que el candidato X ganará

ESTADISTICA INFERENCIAL

Otra división de la estadística es la llamada Estadística Inferencial, tambiéndenominada Inferencia Estadística y estadística inductiva. Lo mas importantecon respecto a la Estadística Inferencial es determinar algo acerca de unapoblación. Una población puede estar formada por personas como todos losestudiantes inscritos en una universidad, todos los alumno de una clase decontabilidad, o todos los reclusos de una prisión. Una población también puedeestar formada por un grupo de medidas, como podrían ser los pesos de losjugadores de un equipo de fútbol, o las estaturas de todos los jugadores debásquetbol de una liga. Obsérvese que una población en sentido estadístico nonecesariamente se refiere a personas.

Población Conjunto de todos los posibles individuos;personas, objetos o mediciones de interés.

Para deducir algo acerca de una población, por lo general se toma una muestrade dicha población.

Muestra una parte, o parte de una población de interés.

Con mucha frecuencia se toma una muestra para determinar algo referentea una población en educación, administración, agricultura, política ygobierno, según se indica en los ejemplos que siguen:

1. Antes de una elección, las empresas de sondeo de opinión, como Data yApoyo, muestran solo aproximadamente 3000 votantes registrados demillones elegibles para votar. Con base en los resultados de muestreo, serealizan ciertas inferencias en lo referente a la forma en que todos los votantesllenará sus boletas el día de la elección. Sería interesante comparar lasestimaciones finales de Data y Apoyo con los resultados reales de laselecciones.

2. Mientras un camión espera para descargar en un almacén de granos se tomaun poco de trigo. Con base en los resultados de esta muestra, se establece elprecio de toda la carga de camión.

3. El Departamento de Trabajo de dicho Ministerio vigila constantemente lascifras sobre empleo, desempleo, salarios movimiento laboral, etc. Con baseen encuestas, el departamento presenta las estadísticas. Las de un mes podrían

Page 15: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES28 29ESTADÍSTICA APLICADA A LA EDUCACIÓN

por mayoría, o que, si se pone a la venta, una gran proporción de la poblaciónadquirirá un nuevo cereal. Sin embargo, existe cierta probabilidad de que ganeel candidato Y el cereal podrían rechazarlo los consumidores, dando comoresultado una perdida importante para el fabricante. El análisis de las técnicasde muestreo (que empieza en el capitulo 5) servirá para evaluar los riesgos detomar una decisión incorrecto.

Con base en el análisis anterior, la Estadística inferencial puede definirsecomo sigue:

Estadística Inferencial Métodos empleados para determinar algoacerca de una población, con base en una muestra.

A continuación se presenta un problema para autoexamen. En cada capitulose expone un cierto número de estos problemas. Sirven para poner a prueba lacomprensión del lector acerca del material precedente, al final del capitulo sepresentan las respuestas y el método de solución. Se recomienda al lector queresuelva cada uno de estos problemas y después verifique su respuesta.

1.1.3 Variables.-Es un aspecto específico de la realidad referido a una unidad de análisis.

Una variable es una característica de la población que interesa estudiar y quepuede tomar diferentes valores. Los datos pueden representarse simbólicamenteo matemáticamente mediante variables o letras, por ejemplo: los n datosmuestráles se representasn por Z

1, Z

2, .... Z

n, y los valores de las variables se

designan con las letras minúsculas, x1, x

2,...., x

n. Es decir en general una variable

es una característica que pueden ser categorizada mientras que las que

permanecen inalterables se llaman constantes. Ejemplo la Universidad de Huachorealiza a este estudio económico de sus docentes que laboran en ella, en relacióna este estudio identifique las propiedades siguientes: constantes y variables.

Clasificacion De Las Variables.-Las variables se clasifican en:

i. Según su generalidad o nivel de abstracción.ii. Por su naturaleza causal.iii. Según la naturaleza de la variable.iv. Según el orden de las observaciones.v. Según la escala de medición.

i. Según su generalidad o nivel de abstracción.- Puden ser:a. Teóricas.- Son aquellas variables que necesitan definirse operacional-

mente, por que sus cualidades o características no son fácilmenteobservables o medibles,ejemplo crecimiento económico, estrato socioeconómico, rendimiento intelectual, hábitos de higiene, etc.

b. Intermedias.- Son aquellas que permiten especificar a las variablesteóricas con el fin de hacerlas observables y medibles.

c. Empíricas.- Son aquellas variables que no necesitan definirseoperacionalmente por que sus valores identifican en forma inmediatay son fácilmente medibles, ejemplo talla, peso, edad, sexo.Operacionalizar una variable significa transformar las variablesteóricas (no observables ni medibles) en variables intermedias y luegoen variables empíricas (observables y medibles).

VARIABLETEORICA

VARIABLEINTERMEDIAS

VARIABLEEMPIRICAS

BUENA 20 - 16REGULAR 15 - 11DEFICIENTE 10 - 00

RE AN CD AI DM EI ME IN CT OO

CALIFICACIONES

CUMPLIMIENTO DE LASASIGNACIONES

PRACTICA PROFESIONALINTEGRAL

ALTA 100% - 80%MEDIA 79% - 55%BAJA 54% a menos

EFICIENTE AREGULAR BMEDIA CDEFICIENTE D

AUTOEXAMEN 1-1

En la use 19 de Huacho se pidió a una muestra de 1 970 alumnos que opinencon respecto a la gestión del director de dicha use. De los 1 970 estudiantesconsultados 1 248 dijeron que están de acuerdo con la gestión del actualdirector.

1. ¿Qué informará la encuestadora respecto a la gestión del actual Director?

2. ¿Es este un ejemplo de Estadística descriptiva o inferencial? Justifique surespuesta.

Page 16: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES30 31ESTADÍSTICA APLICADA A LA EDUCACIÓN

número real, ejemplo la tasa de mortalidad infantil, talla, peso delos estudiantes de la Universidad de Huacho, temperatura de lospacientes de un hospital.

iv. Según el orden de las observaciones

v. Según escala de mediciónLas variables no solo se clasifican sino que también hay necesidad demedirlas, la medición se realiza con el fin de diferenciar por comparaciónun elemento de otro, en las características de la variable y estas puden ser:

Nivel NominalLa información presentada en las tablas 1-1 y 1-2 representa mediciónnominal. A este nivel se le considera el más “primitivo”, el “más bajo”, otipo más limitado de medición.

Por lo común los términos nivel nominal de medición y escala nominalse emplean para hacer referencia a los datos que solo pueden clasificarse encategoría s. Sin embargo, en el sentido exacto de las palabras, no intervienenmediciones ni escalas. En vez de esto solo hay cuentas o conteos.Las disposiciones de las religiones de la tabla 1-1 podrían habersemodificado. Se podría haber enlistado la católica romana en primer lugar,la judía en segundo, y así sucesivamente. Esto indica fundamentalmenteque para el nivel nominal de medición no existe orden particular paralos grupos. Además, las categorías se consideran como mutuamente

Tabla 1-1Religión indicada por la poblacióndel Perú por personas con edades

de 14 años o mayores

Religión Total

Protestante 68 952Católica 120 669Judía 868Otra religión 4 545Ninguna Religión 3 195Religión no indicada 1 104Total 199 333

Tabla 1-2Población de docentespor centro educativo

Docentes Total

Bellavista 112Rímac 126San Martín de Porres 120Surquillo 113S. J. de Lurigancho 165S. J. de Miraflores 244Comas 188

ii. Por su relación causala. Independientes (X).- Es la que supone que es el factor que causa,

afecta o condiciona en forma determinante a la variable independienteo sea indica: causa antecedentes determinante.

b. Dependientes (Y).- Llamada también efecto o condicionada es lavariable que es afectada por la presencia de la variable independienteen sus resultados. Indice: Efecto, resultado, consecuente.

c. Interviniente (Z).- Y son aquellas que van a especificar las condicioneso requisitos para que las variables X e Y tomen sus correspondientesvalores. En algunos casos de análisis de la relación causa efecto seintroducen una o más variables de enlace interpretativo entre lasvariables dependientes e independientes, ejemplo el bajo presupuestodestinado al sector educación aumenta el índice de analfabetismo enlas familias de escasos recursos económicos.

Vemos que en este ejemplo las variables son:Bajo presupuesto= X ______ varible independiente.Índice de analfabetismo= Y ______ variable dependiente.Familias de escasos recursos económicos = Z ______ variable interviniente.

iii. Según la naturaleza de la variablea. Variable Cualitativas.- Son aquellas cuyos elementos de variación

tienen carácter cualitativo o no numérico, ejemplo estado civil, colorde la piel, comportamiento social, sexo, características de lapersonalidad.

b. Variable Cuantitativas.- Son aquellas variables que se obtiene comoresultado de mediciones o conteos, es decir en aquellos cuyoselementos de variación pueden presentarse en diversos grados eintensidad, por ejemplo la talla, edad, pesos de las personas, el cocienteintelectual, el numero de alumnos y profesores de la Universidad deHuacho, la presión sanguínea, etc. las variables cuantitativas puedenser discretas o continuas.b.1Variables Discretas.- Son las que no pueden tomar valores

intermedios entre dos valores y resulta de la operación de contarsu valor, está representada solo por los números naturales o losenteros positivos, ejemplo número de alumnos de Profdosa,profesores de la universidad de Huacho, población por provincias,estudiantes de un centro esucativo, dormitorios por vivienda, etc.

b.2Variables Continuas.- Son aquellas que pueden tomar cualquiervalor dentro de un intermedio dado, se expresa por cualquier

Page 17: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES32 33ESTADÍSTICA APLICADA A LA EDUCACIÓN

más competente que uno considerado como bueno. Solo puede decirseque una clasificación de superior es mayor que una de bueno, y que unaclasificación de bueno está por encima de una puntuación promedio.

En resumen, la principal diferencia entre un nivel de medición nominal yuno ordinal es la relación “mayor que” entre las categorías de nivel ordinal.Por otra parte, la escala ordinal de medición tiene las mismascaracterísticas que la escala nominal, es decir, las categorías sonmutuamente excluyentes y exhaustivas.

Nivel de Intervalo.-La escala de medición de intervalo es el siguiente nivel más alto. Incluyetodas las características de la escala ordinal, pero además la distanciaentre los valores es constante. Un ejemplo de esto es la temperaturaFahrenheit. Supóngase que las temperaturas máximas durante tres díasconsecutivos en enero en un lugar de Pesco, son de 28, 31 y 20 gradosFahrenheit. Estas temperaturas pueden clasificarse por categoría confacilidad, pero también es posible determinar la diferencia entre cada parde temperatura. Esto es posible debido a que 1 grado Fahrenheit representauna cantidad una unidad constante de medición. Es importante observarque el punto cero es arbitrario: tan sólo otro punto en la escala Fahrenheit.0° F no representa la ausencia de temperatura, sino sólo un estado defrío. Supóngase que la temperatura en agosto de 96° F va a compararsecon las tres temperaturas de enero de dicho lugar (Huancayo, Lima,Iquitos) aproximadamente de 30° F. Puede decirse que en un día de agostose tiene una temperatura de 60° más cálida que en un día de enero, perono es posible afirmar que haya tres veces más calor. Las puntuaciones esun cierto examen y las calificaciones en uno de historia o de matemáticas,también son ejemplo de la escala de medición de intervalo.

Tabla 1-3Calificaciones de estudiantes, semestre del II

Calificaciones Número de Calificaciones

Excelente 20Muy bien 18Bien 15Suficiente 7Deficiente 0

excluyentes, lo cual significa por ejemplo, que una persona no podríaser protestante y al mismo tiempo no tener religión. En el caso de la tabla1-2 un indígena no podría ser navajo y chotaw al mismo tiempo.

Mutuamente excluyente Una persona, objeto o mediciónse incluye solamente en una categoría

Debe observarse que en las tablas 1-1 y 1-2 las categorías son exhaustivas,lo cual significa que los miembros de la población, o muestra, debenaparecer en una de las categorías. Si una persona se negara a indicar cuales la religión, o se le incluirá en la categoría de “religión no indicada”. Sise convirtiera al budismo su religión se incluirá en la categoría de “otrareligión”.

Exhaustiva Cada individuo, objeto o medición debeaparecer en una categoría

A fin de procesar datos sobre preferencia religiosa, sexo, empleo porindustria, etc. Con frecuencia las categorías se codifican como 1, 2, 3, ...,en donde (por ejemplo) 1 representa protestante, 2 católico, y asísucesivamente Esto facilita el conteo cuando se utiliza una computadorau otro dispositivo. Sin embargo, no se permite utilizar estos númerosalgebraicamente. Por ejemplo 1+2 no es igual a 3; esto es, un protestante+ un católico no es igual a una persona de religión judía. Asimismo, si unnavajo + un cherokee no es igual a un indígena creek.Las pruebas aplicadas a los datos de escala nominal no implican ningunaconsideración en lo que se refiere a la distribución básica de la poblacióna partir de la cual se seleccionó la muestra. Por tanto, a estas pruebas seles denomina pruebas libres de distribución, o pruebas no paramétricas.

Nivel Ordinal.-La tabla 1-3, en la siguiente página, es un ejemplo de medición de nivelordinal . Una categoría es mayor que la siguiente, esto es, “superior” esuna calificación mayor que “bueno” es mayor que “promedio”, y asísucesivamente.Si se sustituye superior por 1, bueno por 2, etc. Es obvio que una categoría1 es mayor que una categoría 2, y que una categoría 2 es mayor que unacategoría 3. sin embargo, no puede decirse (como ejemplo) que u instructorclasificado como bueno es dos veces más competente que uno clasificadocomo promedio, o que uno con clasificación de superior es dos veces

Page 18: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES34 35ESTADÍSTICA APLICADA A LA EDUCACIÓN

ALGUNAS AYUDAS PARA EL APRENDIZAJE

A medida que se estudia cada capitulo, se observará un cierto número deauxiliares para el aprendizaje diseñados para ayudarle a determinar de inmediatosi ha comprendido o no el material del capitulo anterior. Entre ellos se encuentranlos problemas de autoexamen repartidos en cada capitulo. Se sugiere queresuelva cada uno de dichos problemas de repaso y compruebe sus respuestascon las que se representan al final del capitulo; además, hay ejerciciosintercalados a través del mismo. Las respuestas y el método de solución para losejercicios de número impar se dan al final del libro. También hay una seccióntitulada “Aplicación de conceptos” al final de la mayoría de los capítulos.Contiene también problemas más complicados y conjuntos mayores de datos.Es posible que se necesite una computadora para resolver algunos de ellos, y setiene al final de cada capitulo un examen. Se incluyen preguntas de tipo objetivoy problemas que abarcan todo el capitulo. Esta prueba permite integrar las ideasprincipales presentadas en el capitulo. Las respuestas se dan al final del mismo.Por último, después de un grupo de capítulos hay una sección de repaso en laque se consideran los puntos principales de los capítulos precedentes, un glosarioy un amplio examen.

¡Esto no debe intimidar ni desanimar a nadie! Dichos símbolos y fórmulasson simplemente un medio para resumir el tema. Sin embargo, ya que muchosde los símbolos, fórmulas y términos (desviación estándar, coeficiente decorrelación, ji cuadrada y regla de decisión) pueden resultar poco conocidos, lalectura de este material le resultará más difícil. Si necesita conocer el significadode ciertos símbolos, al final del texto se presenta una lista de estos.

APLICACIONES PARA COMPUTADORA

El uso de la computadora en Educación se ha incrementado mucho en losúltimos años. Esto es especialmente cierto en el área de la Estadística. Antes de1940, la mayoría de los cálculos relacionados con la aplicación de la Estadísticaen problemas de Educación se realizaban a mano o mediante las máquinassumadoras. Cálculos amplios como los del capítulo 15 acerca de Regresiónmúltiple y correlación, tomaban mucho tiempo y la exactitud de los cientos desumas y multiplicaciones necesarias era cuestionable.

La creación de las calculadoras rotatorias por empresas como Friden,Marchant y Monroe fue el siguiente paso en la solución de problemas. Estascalculadoras las sustituyeron por calculadoras electrónicas de mano y

La escala de medición de intervalo tiene las propiedades de sermutuamente exclusiva y exhaustiva. Por ejemplo, una temperaturamáxima de agosto no puede ser al mismo tiempo 88 y 76. Por tanto, secumplen la característica de mutua exclusividad. Podemos enlistar todaslas temperaturas máximas para todos los días de agosto. De esta forma,se cumple las características exhaustivas.

Nivel de Razón (o cociente).-El nivel de razón (o cociente) es el nivel de medición “más alto”. Estenivel tiene todas las características del de intervalo: la distancia entrenúmeros son de un tamaño conocido y constante; las categorías sonmutuamente excluyentes y así sucesivamente. Las principales diferenciasentre los niveles de intervalo y de razón son : 1) los datos del nivel derazón tienen un punto cero significativo, 2) la razón o cociente de dosnúmeros es significativa. El dinero es un buen ejemplo. Tener ceropesos (o soles) tiene significado: ¡No se tiene ningún dinero! Unaunidad monetaria es otra medición de nivel de razón. Si el indicadorde una báscula marca 0, existe una ausencia completa de peso.Asimismo si usted gana unos S/. 24 000 (soles) al año y otra persona(Telma) gana S/. 6 000, usted gana cuatro veces más que ella. Demanera semejante que si usted pesa 90 Kilogramos y su hija solo 30,usted pesará tres veces más que ella. Puede decirse que usted gana S/. 18 000 al año más que Telma, y pesa 60 Kilogramos más que su hija.Otros ejemplos de medición del nivel de razón son el número de añosque los médicos dedican a la práctica y el número de motocicletasvendidas el último mes por los promotores de una marca japonesa.

AUTOEXAMEN 1-2

1. El Instituto Nacional de Estadística dela población del Perú: informó acercade la población en las siguientesprovincias:

Provincia del Callao: 2002Callao 417 587Bellavista 82 816Carmen de Legua 43 989La Perla 66 826La Punta 7 246Ventanilla 168 690

¿Qué nivel de medición reflejan estosdatos? ¿Por qué?

2. La calificación de un examen deSuficiencia Profesional en la Facultadde Educación 2003.

Puntuaciones Núm de alumnos50-59 1260-69 3670-79 9980-89 13890-99 184

¿Qué nivel de medición representan estosdatos? Explique su respuesta.

Page 19: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES36 37ESTADÍSTICA APLICADA A LA EDUCACIÓN

RECAPITULACIÓN

I. Definición de estadística.A. Una estadística puede considerarse como un conjunto de datos numéricosB. En sentido más amplio, se llama Estadística a la ciencia que trae de los

métodos y medios para recolectar, presentar, analizar e interpretar datos,con el objeto de tomar decisiones más eficaces.

II. Subdivisiones de la estadística.A. La Estadística descriptiva trata de la presentación de datos en gráficos o

en distribuciones de frecuencias, y de aplicar diversos promedios y mediasde dispersión.

B. La Estadística inferencial funciona tomando de una población yefectuando estimaciones acerca de una característica de esa poblacióncon base en los resultados de muestreo.

III. Niveles de mediciónA. El nivel nominal de medición se refiere a los datos que solo pueden

contarse y colocarse en categorías. No existe un orden específico paraéstas.

B. El nivel ordinal de medición implica que una categoría es mayor queotra. Al clasificar estudiantes en principiantes, intermedios y avanzados,se está utilizando este tipo de medición por categoría.

C. El nivel de medición de intervalo incluye las características declasificación por categoría de mediciones ordinales, y especifica que ladistancia entre números es la misma.

D. El nivel de medición de razón (o cociente) tiene todas las característicasdel nivel de intervalo, pero además posee un punto cero significativo, yla razón, relación por cociente, entre dos números también es significativa.

EJERCICIOS

Las respuestas a los ejercicios de número impar se dan al final del libro.

1. Un concepto común de una estadística es que se trata de un conjunto decifras y datos. En administración y otros campos, se considera laEstadística, que es una ciencia matemática. Analice la diferencia entre losdos conceptos.

computadoras. Actualmente, en la mayor parte de los colegios y universidadeshay computadoras para uso de los estudiantes, así como sistemas programáticoso de software, como MINITAB, SAS, y el Statistical Package for the SocialSciencies (SBSSx). Se ha elegido MINITAB para la mayor parte de lasaplicaciones estadísticas en este libro, por ser propicio para el usuario, lo quesignifica que es fácil operar y no requiere aprendizaje de un lenguaje especialde programación. Para ayudarle, se proporcionan los comandos MINITAB en laparte superior de cada listado de computadora.

El sistema MINITAB puede instalarse en un amplia variedad demicrocomputadoras y de mini microcompuatoras.

Se emplea un paquete muy eficiente de Computarizad Business Statistics(SBS), por Owen P. Hall y harvey M. Adelman (publicado en Estados Unidospor Richard D. Irwin, Inc.) en el capítulo de series de tiempos, para resolverproblemas de variación estacional. Se maneja por menús y es muy fácil de operar.Según lo decida el instructor y dependiendo del sistema operativo y del equipodisponible, se recomienda al lector que aplique un paquete estadístico decomputación a los ejercicios que tienen conjuntos de datos grandes. Esto loliberará de operaciones tediosas y le permitirá concentrarse en el análisis dedatos.

RESUMEN

La noción de estadísticas, en su acepción cotidiana, se refiere a conjuntos dehechos o datos. Los datos pueden ser, por ejemplo, los registros de pérdidas yganancias de todos los equipos de béisbol de una liga, los precios al cierre deacciones comunes seleccionadas, o los activos de los 10 bancos más grandes enSud América.

Sin embargo, en un sentido más amplio, el término Estadística se refiere algrupo de valiosos medios analíticos utilizados para recopilar, organizar, analizare interpretar información numérica para tomar decisiones eficaces y adecuadas.

A una faceta de la estadística se le denomina Estadística Descriptiva. Estarama incluye las técnicas que se aplican para organizar los datos no procesados(en bruto) en una distribución de frecuencias, representarlos en un gráfica yresumirlos para calcular un promedio o una medida de dispersión.

A otra faceta se le conoce como Estadística inferencial. Sus técnicas tratande sacar conclusiones acerca de una población con base en muestreos.

Se analizaron los cuatro niveles de medición si se va a aplicar la técnicaestadística correcta. Por ejemplo, en le capítulo 3 se verá que para calcular lamedia aritmética, los datos deben ser por lo menos de nivel de intervalo.

Page 20: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES38 39ESTADÍSTICA APLICADA A LA EDUCACIÓN

4. Un total de 9 386 madres solteras menores de 15 años tuvieron un hijo elaño pasado, hubo 6 950 muertes accidentales en enero, y la mayor truchapescada en un lago pesó 25 kilogramos. A este conjunto de cifras y datosse le denomina estadística.

5. Los métodos empleados para saber algo acerca de la población de truchasen el parque Nacional Yellowstone, con base en una muestra de 40 truchasse denomina estadística inferencial.

6. Gallup y otras empresas de sondeos de opinión rara vez emplean métodosde muestreo por que las poblaciones con las que trabajan son muy grandes.

7. La Cámara de Comercio preguntó a una muestra de personas que seasoleaban en Siesta Beach, Sarasota, Florida, si vivían en Sarasota o enuna zona a menos de 30 millas de la playa, si vivían fuera del estado, o enun país extranjero. Este proyecto de investigación se relaciona con datosde nivel nominal.

8. La Oficina del Cenco informó que hay 12 955 000 trabajadores deproducción en la industria manufacturera. A esta cifra s ele denominavalor estadístico.

9. El nivel nominal se considera como el “más bajo” nivel de datos y éstosdeben ser mutuamente excluyentes.

10. Se seleccionó una muestra de 3 014 trabajadores en la industria del aceropara determinar si irían a la huelga el lunes. Más de 50% de las personasde la muestra indicaron que lo harían. Puesto que el número muestreadoes grande y los que están a favor de la huelga constituyen más de 50%,puede suponerse que la mayoría de los trabajadores de la industria delacero están a favor de una huelga.

2. Explique la diferencia entre Estadística descriptiva y estadísticainferencial.

3. Una muestra de 200 ejecutivos reveló que 60 de ellos tenían algún gradode hipertensión arterial debido, en parte, a su trabajo ¿Qué podría inferirseacerca de todos los ejecutivos? ¿Por qué?.

4. el gerente de la planta procesadora de alimentos en la que se supone queel lector trabaja, medio tiempo, ha recibido numerosas quejas. Se afirmaque hay una cantidad excesiva de líquido en algunas latas de cerezas. Laplanta no tiene programa sistemático de control de calidad. Si lo nombrarangerente de control y certificación de calidad, ¿Qué acciones tomaría paracomprobar la producción?

5. Supóngase que lo acaban de nombrar ejecutivo principal de mercadotecniapara Fun Enterprise (F.E.), compañía que se especializa en diseñar yconstruir parques de diversiones cerca de grandes ciudades. F.E. se interesaprincipalmente en un sitio en el sureste de una región. Una vez seleccionadoeste, se debe considerar si el parque habrá de orientarse hacia personas detodas las edades, solo para niños o solo para jubilados. ¿Cómo procederíapara formular recomendaciones acerca de 1)la ubicación del parque y 2)laorientación grupal? ¿para todas las edades, jóvenes, personas mayores?

EXAMEN CAPITULO 1

Las respuestas se dan al final del capítuloIndique si la expresión es verdadera o falsa. Si es falsa, anote la respuesta

correcta.

1. Otro nombre para la estadística inferencial es Estadística descriptiva.

2. una muestra de consumidores probó una nueva hojuela de queso y laclasifico de excelente, muy buena, regular o mala. El nivel de mediciónpara esta investigación de mercado es ordinal.

3. Un sindicato de plomeros y colocadores de tubería tienen 5 020agremiados. Se seleccionó e interrogó a un grupo representativo de 248integrantes. Se considera que 248 es la población.

Page 21: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES40 41ESTADÍSTICA APLICADA A LA EDUCACIÓN

AUTOEXÁMENES

1-1 1 Con base en la muestra de 1960 consumidores, se estima quesi se pone a la venta, 60% de todoslos consumidores comprará FishDelight (1 176/1 960 x 100 =60%)

2 Estadística inferencial, por que seutilizó una muestra para realizaruna inferencia acerca de la formacomo todos los consumidores dela población reaccionarían si FishDelight se pusiera a la venta.

1-2 1 Nivel nominal. No hay un ordenespecífico para las provincias yterritorios. Por ejemplo, Yukonpodría haberse enlistado primero.

Las categorías son mutuamenteexcluyentes, lo cual significa queuna persona no podría serresidente en Yukon y en NuevaEscocia al mismo tiempo.

2 Las puntuaciones puedenclasificarse por categorías, peroademás se puede determinar ladiferencia entre esaspuntuaciones. Tales diferenciasson de un tamaño constante yconocido. La puntuación 95 está10 puntos por encima de una de85, una puntuación de 85 está 10puntos por encima de una de 75, yasí sucesivamente. Por lo tanto, elnivel de medición es de intervalo.

EXAMEN CAPÍTULO 1

1. Falso. Estadística inductiva.

2. Verdadero.

3. Falso. Una muestra.

4. Verdadero.

5. Verdadero.

6. Falso. La mayoría de los sondeosde opinión y encuestas implicanel manejo de una muestra

seleccionada a partir de lapoblación de interés.

7. Verdadero.

8. Verdadero.

9. Verdadero.

10.Falso. Siempre existe laprobabilidad de que una muestrano sea un reflejo exacto de lascaracterísticas de la población.

LECCIÓN N ° 1.2

CONCEPTOS MATEMÁTICOS FUNDAMENTALES

OBJETIVO ESPECÍFICO N ° 1.2Identificar, construir, explicar la gramática de la notación

matemática aplicada a la estadística.

1.2.1 Introducción.-“Yo no estoy muy fuerte en matemáticas. ¿Cómo podría en estas condiciones

aprobar estadística?” El autor de este libro ha escuchado tales palabras de labiosde gran número de estudiantes. Para muchos de ellos esto es una granpreocupación legitima, basada en experiencias desalentadoras que han tenidopreviamente con las matemáticas. Una breve ojeada a este libro podría tan soloservir para aumentar esta sociedad, puesto que a primera vista muchas de susformulas dan la impresión de ser verdaderamente indescifrables para elprincipiante y pueden parecerle imposibles de dominar. Por tanto, es muyimportante aclarar las cosas desde un principio.

El lector no necesita ser un genio matemático para dominar los principiosestadísticos presentados en esta obra. El caudal de conocimientos matemáticosnecesarios para dominar los fundamentos de la estadística ha sido frecuentementeexagerado. En realidad, lo que se requiere para aprender estadística es tan sólouna buena dosis de cálculo aritmético, lógica y tesón para no pasar un puntohasta haberlo dominado por completo. Según Carlyle, el éxito en el aprendizajede la estadística depende de poseer una capacidad limitada de paciencia. A partede estos modestos requisitos, solo se precisa un conocimiento adecuado dediversos procedimientos algebraicos y aritméticos que la mayoría de losestudiantes aprenden en el transcurso de su bachillerato. En este capitulo serevisa la gramática de la notación matemática, se discuten varios tipos de escalasnuméricas y se adoptan ciertas reglas para el redondeo de números.

El estudiante que desee repasar sus conocimientos matemáticos elementalespuede acudir al apéndice I, que contiene una revisión de los conceptos necesariospara dominar este texto.

La gramática de la notación matemática.-A través del libro iremos encontrando nuevos símbolos matemáticos. La mayor

parte se definirán cuando aparezcan por primera vez. Sin embargo, hay en esasimbolización tres notaciones que, por aparecer con mucha frecuencia, queda

Page 22: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES42 43ESTADÍSTICA APLICADA A LA EDUCACIÓN

¿Dónde se va realizar la investigación?¿Cuando se va a realizar la investigación?

Determinación de Objetivos.- Determinar el objetivo final significaexplicar las posibilidades de aplicación práctica de la investigación, esdecir explicar para que se realizan. Determina los objetivos inmediatoses explicar como se va a ser la investigación es decir señalar la estrategiaque se utilizará y los procedimientos generales que se usarán en eldesarrollo de la misma.

La Hipótesis Estadísticas.- Es un supuesto acerca de determinadoshechos que sobrepasan a los datos que se intentan explicar, es decir queuna hipótesis es una herramienta en la tarea científica que pretendeexplicar o interpretar ciertos hechos, tratando de pronosticar sobre losmismos, aspirando a dar cuenta explicativa o predecir algunos hechosindependientes de aquellos que los originaron. “La Hipótesis essimplemente un problema científico y se a logrado formar una hipótesisen relación al mismo al mismo la labor investigativa posee un grado delucidez y de claridad la que permite objetivos con mucha mayor precisióny orienta la realización de los experimentos o la práctica de lasobservaciones con un alto grado de confianza.

1.2.3 Recolección de Datos.-Tiene mucha importancia para la investigación pues si la información a sido

recogido de la manera correcta podrían tener validez las conclusiones que deella se deriven en caso contrario ninguna técnica podrá corregir los errorespresentes en los datos básicos recogidos, vamos a estudiar dos métodos básicos:

a. Fuentes de informaciónb. Encuestas

a. Fuentes de Información.- Es el lugar, la institución, la persona dondeestán los datos que se necesita para cada una de las variables o aspectosde la investigación, las fuentes de información pude ser:

a.1 Fuentes de datos internos.- Es la información recogida por lainstitución de los resultados de su propia gestión, son las observacionesque constantemente realizan las direcciones de personal, direccionesde planificación, direcciones de administración, direcciones técnicopedagógicos, etc., ejemplo información de la deserción escolar,

justificado que sean tratadas ahora por separado. Estas notaciones son: ∑ (léasesigma), X y N. A la vez que definimos estos símbolos e indicamos el modo deutilizarlos, revisemos lo que denominaremos gramática de la notación matemática.

1.2.2 Métodos Estadísticos.-Es un conjunto de procedimientos que se aplican en una secuencia lógica

con el fin de recopilar, organizar, presentar, analizar, e interpretar datos defenómenos sujetos a variaciones. El método científico de investigación estábasada en dos tipos de razonamiento: El deductivo y El inductivo.

El Método Deductivo procede de lo general a lo particular y utilizaespecialmente el razonamiento matemático, en el que se establecen hipótesisgenerales que caracterizan un problema y se deducen ciertas propiedadesparticulares por razonamientos lógicos.

El Método Inductivo realiza el proceso inverso a partir de observacionesparticulares de ciertos fenómenos se intenta deducir unas reglas generalesaplicables a todos ellos. La investigación estadística emplea el método deductivoe inductivo en las 4 etapas siguientes:

i.- Planteamiento del problema.ii.- Recolección de la información.iii.- Organización y clasificación de los datos recogidos.iv.- Análisis e interpretación.

i.- Planteamiento del problema.- Es el primer paso de la investigaciónestadística que consiste en definir claramente los objetivos del estudio yrelacionar los objetivos con los valores numéricos de las variablesobservables. La investigación científica es una actividad con propósitos(finalidad, meta) y como tal para quedar enteramente caracterizada, debedar respuesta a las interrogantes siguientes:¿En qué consiste el problema objeto de investigación? O bien ¿Qué vamosa estudiar? No vasta por ejemplo decir que vamos a estudiar la baja calidadde la educación, pues probablemente seria muy dificultoso que algúninvestigador pueda estudiar todos los aspectos de la baja calidad de laeducación.Definir la importancia del problema es cuantificar su extensión y equivalea explicar por que se va a estudiar.¿Por qué y para qué se plantea su investigación?¿Sobre quién recae la investigación?¿Cómo se va a investigar?¿Quién va realizar la investigación?

Page 23: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES44 45ESTADÍSTICA APLICADA A LA EDUCACIÓN

Desventajas de la Observación:Requiere d personal especializado.Puede resultar ser un método costoso.Cuando se estudia grandes masas humanas no es conveniente, es invalidadala observación cuando se pretende investigar las manifestaciones subjetivasde las personas, ejemplo saber si un alumno no tiene ganas de asistir a lasclases de matemática.

Ventajas del Interrogatorio.- Las limitaciones de la observación son ventajasdel interrogatorio, ya que cuando se indaga el pasado futuro así como lascondiciones subjetivas del individuo obtenemos mejores resultados.

Desventajas del interrogatorio.Se apela a la memoria y/o a la buena fe del interrogado.Produce diferente resultados según el tipo de preguntas y la manera deformularlos para lo cual debe observarse los aspectos siguientes:Las preguntas deber ser claras y precisasLas preguntas no deben ser capciosas o ambiguas.Las preguntas no deben anticipar hechos.Las preguntas no deben sugerir respuestas.

Métodos interrogatorios.- El interrogatorio puede hacerse mediante dosmétodos. Método Directo (se efectúa por medio de la entrevista)Método Indirecto (se efectúa de cuestionarios)

La Entrevista.- Tiene una ventaja principal que la acentúa y es que puedecompletar con la observación directa y su principal desventaja es lapersonalidad, la posición social, la inflexión de la voz, la manera de hacerpreguntas, etc. El entrevistador puede hacer variar las preguntas.

El Cuestionario.- Es menos costosa y como desventaja es que utiliza solopreguntas sencillas y a veces no llena todos los requerimientos adecuados.

Censo.- Constituye una indagación completa sobre las variables que interesainvestigar de los elementos que componen una población claramente definida.

1.2.4 Organización y Clasificación de los datos.-Se trata de asegurar la validez y confiabilidad de los datos recopilados, se lleva

a cabo la clasificación, tabulación, presentación en cuadros y gráficos estadísticos.Hay tres formas para presentar los datos organizados: 1.- Presentación con palabras.

reportes del porcentaje de aprobados desaprobados de los alumnosde educación regular, PROFDOSA de la Universidad de Huacho,información de la inasistencia de los profesores de un C.E.

a.2 Fuentes de Datos Externos.- Son informaciones elaborados porinstituciones de investigación (públicas o privadas) o dependenciasespecializadas generalmente requeridas a nivel nacional, regional osectorial.

a.3 Fuentes Primarias.- Cuando la información estadística es obtenidodirectamente de la unidad de observación, ejemplo los resultados delos censos poblaciones de vivienda, de infraestructura de educación,de salud, etc.

a.4 Fuentes Secundarias.- Cuando se obtienen información estadísticaelaborada a base de los datos de fuentes primarias, el organismo oficial enel Perú es el Instituto Nacional de Estadística e Informática (INEI) es elque se encarga de formular y desarrollar el sistema estadístico nacional depoblación y vivienda, en el sector educación la dirección de estadística einformática elabora las estadísticas a nivel nacional alumnos matriculados,número de profesores, aulas, centros educativos, laboratorios, etc.

b. Encuestas.- Es el procedimiento de obtención de informaciónestructurando según criterios previos de sistematización que se efectúacon un propósito específico en un sector de la población.

Tipos de Encuestas

b.1Encuestas retrospectivas.- Se parten de datos conocidos y lainvestigación consiste en descubrir características de su historia porejemplo se selecciona un grupo de alumnos de un C:E. remitentes, seescoge su ficha de matrícula, se observa en que grados a repetido y sedetecta algunas causas del motivo de la repitencia escolar, se ve susantecedentes escolares, etc.

b.2Encuestas Prospectivas.- Se comienza con una muestra de lapoblación estudiando una o más características a través del tiempo.

Procedimientos para recolectar información en educación:Fuentes de Obtención.- Puede ser: Primarias y secundaria.

Métodos de recolección.- Cuando se utiliza una fuente primaria pararecolectar información se distingue dos procedimientos fundamentales: laobservación y el interrogatorio.

Page 24: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES46 47ESTADÍSTICA APLICADA A LA EDUCACIÓN

1.3.- El criterio de la clasificación de los datos. Responde a la pregunta:¿Cómo se presenta el contenido de la tabla? Ejemplo: Por añossegún especialidades.

1.4.- El espacio temporal o periodo que abarca la información que sepresenta responde a la pregunta ¿Cuándo Ejemplo. Periodo 200-2003.

2.- Encabezado.- Es la descripción de las filas y columnas de un cuadroestadístico, se ubica en la parte superior del cuerpo de la tabla, indicalas variables y sus categorías o intervalos, puede indicar un periodode tiempo.

3.- Columna Matriz.- Esta formada por la primera fila superior y nosindica las características (variables) del fenómeno que se investiga.Ejemplo. Años.

4.- Cuerpo.- Es el contenido de los datos estadísticos, es decir es lainformación que se presentan en filas y columnas.

5.- Nota de Encabezado.- Son usualmente escritas arriba de losencabezados y abajo del titulo, son usados para explicar ciertos puntosrelacionados con la tabla, que no han sido incluidos en el titulo, ni enlos encabezados, no en los conceptos. Por ejemplo la unidad de losdatos es frecuentemente escrita como una nota de encabezados, talcomo “en miles”, “en millones”.

6.- Fuente.-Son escritas abajo de las notas de pie y nos indica el lugar dedonde se obtuvieron los datos contenidos en la tabla que no sonexplicadas en otra parte.

7.- Fuentes.-Son escritas abajo de las notas de pie y nos indica el lugarde donde se obtuvieron los datos contenidos en la tabla. Ejemplo,Universidad Nacional José Faustino Sánchez Carrión, oficina deestadística.

2.- Tablas estadísticas y 3.- Gráficas estadísticas. Cuando una serie de datos incluyesolo unos pocos ítems, la palabra escrita puede ser usado para presentarapropiadamente los hechos, cuando los datos estadísticos se presentan en forma detablas los datos son ordenados estadísticamente en columnas o hileras. Un diagramaestadístico o gráfico es un medio plástico para presentar datos estadísticos. Seconstruye usualmente de acuerdo con la información proporcionada en una tabla.

Tablas o Cuadros Estadísticos.- Consiste en la presentación ordenada de losdatos en filas y columnas con el objeto de facilitar su lectura y posterior análisise interpretación.

a.- Tipos de Tablas Estadísticas.- Las tablas estadísticas pueden seragrupadas en dos tipos de acuerdo con los propósitos para las cualessirven las tablas,

1.- Tablas para propósitos generales también llamadas tablas de referenciao tablas repositorias.- Estas tablas nos proporcionan información parareferencia o uso general, nos sirven como banco de información porlo tanto incluyen información detallada.

2.- Tablas para propósitos especiales llamadas también tablas resumen,tablas de texto.- Estas tablas nos proporcionan información para unaexposición particular por consiguiente es diseñada de tal forma queel usuario puede captar fácilmente la tabla para hacer comparaciones,análisis concerniente a la exposición particular, por consiguiente deberser construida de una manera breve y simple.

b.- Partes principales de una tabla.- El número de partes de una tablaestadística puede variar. En general una tabla completa incluye lassiguientes partes principales:

1.- Título.- Es una descripción del contenido de la tabla deberá ser breve,claro y completo, debe indicar:1.1.- La Circunscripción espacial es decir, debe indicar la institución

o área geográfica al que pertenecen los datos.Responder a la pregunta ¿A dónde pertenece la información?Ejemplo. Universidad Nacional José Faustino Sánchez Carriónde Huacho.

1.2.- El Fenómeno de que se está tratando, o la naturaleza de losdatos. Responde a la pregunta: ¿Qué contiene la tabla? Ejemplo.Alumnos matriculados en la Universidad de Huacho.

Page 25: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES48 49ESTADÍSTICA APLICADA A LA EDUCACIÓN

b.2.- Tablas dobles.- En estas tablas de clasificación se dedica aexponer los datos en dos análisis.Ejemplo N°. 2 Centros Educativos.

Años N°. de Mat.1999 3482000 3602001 4002002 4202003 440

TOTAL 1968

Años Nro. de Mat. Doc1999 348 92000 360 102001 400 112002 420 112003 440 12

TOTAL 1968 53

b.3.- Tablas Complejas.- Tiene por objeto hacer un estudio simultáneode varios datos, que se encuentran analizados en tres o más fasesdistintas:Ejemplo Nro. 3 Matricula – Docente – Secciones

C. E. Matricula Docentes Sec.T H M T H M

x 150 80 70 5 3 2 6y 250 250 100 10 8 2 10z 240 150 90 7 5 2 8

TOTAL 740 480 260 22 16 6 24

1.2.5 Análisis e Interpretación de los Resultados.-Se calculan los diferentes estadísticos de medidas de posición, variabilidad,

asimetrías y curtósis que describen al conjunto de datos, con estas medidas sepueden analizar e interpretar el contenido de los datos.

Obtenidos de los datos se pasa a la presentación o exposición de ellos enforma de cuadros o tablas y de gráficos. Toda exposición o presentaciónestadística tiene por objeto el agrupamiento y presentación de datoshomogéneos en una forma clara para que las tendencias salten a la vistay con el fin de interpretarlos correctamente.

a.- Tablas estadísticas.- Una tabla es una superficie plana en la que sedistribuyen los datos en forma ordenada, mediante una clasificaciónlineal y otra columna de tal manera que puedan ser leídas en dosdirecciones de izquierda a derecha y de arriba hacia abajo.

b.- Clases de Tablas.- De a cuerdo con la manera de presentar los datos,las tablas puede ser simples, dobles y complejas.

b.1.- Tablas Simples.- Son las que exponen un solo análisis de losdatos como tabla.Ejemplo N°.1 Centros Educativos.

Cuadro N°.1.1

Universidad Nacional José Faustino Sánchez CarriónTITULO Alumnos matriculados por facultades según años

NOTA DE ENCABEZADO Unidades

AÑOSFACULTADES

2000 2001 2002 2003

Contabilidad 460 520 570 603Educación 830 950 1080 1230Administración 320 350 410 480Enfermería 180 210 250 305Economía 220 258 304 354Cien. Agrarias 120 145 170 210

Total 2130 2433 2784 3209

Nota de Pie .- Inscripción al segundo semestre de cada año Fuente .- UNJFSC Oficina de EstadísticaElaborado .- J.E.R.

ENCABEZADO

CUERPO

CUERPO

Page 26: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES50 51ESTADÍSTICA APLICADA A LA EDUCACIÓN

13. Entonces una muestra es al azar o aleatoria cuando los elementos de unapoblación tienen oportunidad de ser seleccionadas.

14. Una muestra es sesgada o viciada cuando los elementos o datos de unapoblación sometidas no tienen la misma oportunidad de ser...........oincluidas en la...............

15. Una muestra es................cuando sus elementos presentan las mismascaracterísticas de la población de estudio, la muestra es..............en relacióna la.................

16. En síntesis, al porcentaje o número proporcional de elementos deuna.............con las mismas características se denomina.................

17. Existen varios procedimientos para seleccionar una muestra representativael más recomendado es al azar o.................se puede proceder comosigue......... se escribe el nombre de cada uno de los elementos dela................en tarjetas individuales, estas tarjetas se enumeran o codifican,para colocarlos en un archivador de donde se selecciona un númeropertinente de tarjetas al...........Las tarjetas seleccionadas identifican a loselementos de la............

18. Cuando seleccionamos las tarjetas del total de los elementos de unapoblación, cada miembro tiene...............oportunidad de ser seleccionados.Entonces la.............al azar es representativa.

19. identifique cada una de las variables siguientes de acuerdo a la clasificaciónpor su naturaleza, por su escala o por su nivel de medición.a. Número de niños nacidos en el hospital del seguro de Huacho en

diferentes horas del día.b. Edad de los alumnos de PROFDOSA de la Universidad de Huacho.c. Grado de instrucción de los reclusos.d. Caso de anemia en los niños menores de 6 años.e. Candidatos a la alcaldía de Huacho según votos obtenidos.f. Ingreso per-capita.g. Docentes por niveles y modalidades.h. Lugar de nacimiento de los alumnos de educación inicial.i. Sueldo del personal administrativo de la universidad.j. Nivel de inflación mensual.

PRACTICA N ° 1

1. Todos los estudiantes de un centro educativo, por ejemplo que rindieronsu prueba de aptitud constituyen una.................o...............

2. Al conjunto finito o infinito de datos que tienen algunas característicascomún observables se le denomina...................

3. Se denomina DATO Estadístico, todo número que mide la intensidad deuna característica correspondiente a una población o................................

4. Los datos necesarios para la investigación estadística de una.............puedenser obtenidos en fuentes primarias o en fuentes secundarias.

5. Se sabe que una población o universo estadístico es la agrupación de unconjunto..............o............de datos con una característica comúnobservable.

6. Población finita es un conjunto de datos.............es decir que pueden sermedibles por tener principio y fin.

7. De un ejemplo de población infinita....................

8. Si observamos el cielo, encontramos un conjunto de estrellas es un ejemplode datos.......................

9. Si en una población de 650 alumnas eligiéramos al azar 200 paraexperimentar un determinado texto programado, entonces tendríamosuna.................de la población escolar de ese centro.

10. En muchas investigaciones estadísticas se estudia una.................... y nouna población entera.

11. Si una población tiene 6 000 habitantes y de ella sólo encuestamos 600decimos que tenemos una muestra cuyo tamaño es de................o un décimo(1/10) de la..........

12. Muestra al azar o aleatoria se denomina así cuado todos los elementos odatos de una...............o universo...................sometidas a muestreo tieneigual oportunidad de estar consignados dentro de una muestra.

Page 27: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES52 53ESTADÍSTICA APLICADA A LA EDUCACIÓN

20. Se ha llevado a cabo un estudio sobre el alcoholismo en adolescentesmujeres en la provincia de Huaura. Identifique como variable (V) oconstante (C) en los siguientes:( ) 1. Sexo( ) 2. Edad( ) 3. Nivel de instrucción.( ) 4. Lugar de residencia.( ) 5. Padres vivos o fallecidos.( ) 6. Vive con sus padres o sólo.

LECCIÓN N ° 1.3

ORGANIZACIÓN, CLASIFICACIÓN, REPRESENTACIÓNTABULACIÓN Y GRÁFICA DE LOS DATOS

OBJETIVO ESPECÍFICO N ° 1.3Identificar, elaborar y utilizar gráficos estadísticos para la

representación de cuadros de estadísticas.

Una vez recogida la información se hace necesario revisarla cuidadosamentey luego revisarla y presentarla convenientemente, antes de que sea posibleanalizarla. En esta etapa de organización consideraremos los siguientes pasos:

i.- Revisión y corrección de los datos obtenidos.ii.- Construcción de la distribución de frecuencias.iii.- Representación gráfica de la distribución de frecuencias.

1.3.1 Revisión y corrección de los datos obtenidos.-En los datos recolectados deben ser corregidos los errores de medición,

transcripción, haber si ellos representan al grupo que se desea estudiar. Este pasoes necesario antes de la clasificación y computación de los datos.

1.3.2 Construcción de la distribución de frecuencias.-

a. Construcción de la distribución de frecuencias para datos cuantitativos.1° Caso: Para datos de variables continuas.2° Caso: Para datos de variables discretas.

b. Construcción de la distribución de frecuencias para datos cualitativos.

Construcción de la distribución de frecuencias para datos cuantitativos.-

1° Caso: Datos de variables continuas.-En este caso debido a la gran cantidad de valores, es necesario la reducción,clasificación de los datos originales en una distribución de frecuencias.

Distribución de frecuencias.-Es un cuadro estadístico, en donde los datos están ordenados, clasificados

Page 28: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES54 55ESTADÍSTICA APLICADA A LA EDUCACIÓN

A = [Min., Max.] Ejemplo A = [06 , 40]

A

06 40

Rango.-Rango es la longitud del AlcanceEjemplo:R = |40-6| = 34El alcance es un intervalo y el rango es un número.

Intervalos de Clase.-Clasificar equivale a dividir el alcance en partes iguales o no. Cada unade estas partes se llama Intervalo de Clase o simplemente Clase.

Limites de Clase.-Son los extremos de cada intervalo de clase.Cuando un dato coincide con algún límite se presenta la dificultad deidentificar el intervalo de clase a la que pertenece. Para despejar estaduda se conviene que los intervalos de clase sean semiabiertos por laderecha (o por la izquierda); la primera clase y la última pueden resultarabiertas y/o cerradas.

Números de Clases.-¿En cuántas partes o clases dividimos el alcance?El criterio a seguir para determinar el número de clases es que el mismosea suficientemente pequeño para lograr la simplificación deseada, pero losuficientemente grande para minimizar los posibles errores de clasificación.Representado por M el número de clases, diremos que el valor de Mdepende del estadístico o investigador, en el campo educativo escostumbre usar M = 5. Se recomienda que: 5 ≤ M ≤ 15

Ancho de Clase.-Ancho de clase (C

i) es la longitud de un intervalo de clase.

Lo deseable es que los anchos de clase sean iguales; en este caso, unancho de clase común se denota por W y es igual al rango dividido por el

número de clases:

en categorías, con sus respectivas frecuencias, que tienen la formasiguiente:

1.3.3 Elaboración de la distribución de frecuencias por el método de SturgesProblema 1: La siguiente información corresponde a los porcentajes

obtenidos en un grupo de 60 niños de 8 años en un test, en un centro educativode la ciudad de Huacho, con estos datos construir la distribución de frecuenciaspor el método de Sturges. Los datos son los siguientes:

24 33 23 16 32 11 14 30 35 25 25 13 37 34 36 1135 15 32 20 22 27 30 31 27 26 22 20 06 25 40 2718 09 24 31 23 19 23 24 19 32 16 16 23 31 26 1921 28 34 22 30 29 24 17 18 10 23 22

Al observar los datos podemos apreciar su variabilidad el desorden enque se encuentran, lo cual no permite destacar los hechos más importantespara obtener conclusiones y realizar un análisis que ayuden en la toma dedecisiones, lo cual se hace necesario ordenar los datos en una tabla dedistribución de frecuencias, procedemos a organizar usando Excel en laclasificación ya ordenadas se observa que la calificativa mínima es de 6 y lamáxima es de 40, además se nota que se repite el puntaje 23 (5 veces), y elnúmero de datos es de 60 (n = 60), pero si clasificamos podemos encontrarotras características.Para tratar la técnica de clasificación daremos algunas definiciones:

Alcance.-Alcance (A), es un intervalo cerrado cuyo extremo inferior es el dato demenor valor y el extremo superior es el dato de mayor valor.

Tabla N° 2-1

Int. de clase Marca de clase Tabulación Frec. Abs.[Y’¡-1 – Y’¡ > Y¡

Y’0 – Y’1 Y1 f1Y’1 – Y’2 Y2 f2Y’2 – Y’3 Y3 f3

. . .

. . .Y’m – 1 – Y’m Ym fm

n

Page 29: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES56 57ESTADÍSTICA APLICADA A LA EDUCACIÓN

R=Vmáx - Vmin

Para el ejemplo tenemos: Vmáx = 40Vmin = 06

Luego: R = 40 – 06 = 34

También se define al rango como intervalo cerrado por los datos demenor y mayor valor (mínimo y máximo).

R = 40 – 06 = 34

b. Determinación del número de clases (m).- El número de clases esel número de categorías o intervalos en la que se va a interpretar lainformación.El número de clases se puede fijar arbitrariamente, dependiendo delnúmero de datos con que se está trabajando, se recomienda que elnúmero de clases a elegir varía entre 5 ≤ con ≤ 15.Es conveniente usar la regla de Sturges para determinar un primervalor aproximado de (m) número de clases, el que puede sufrirmodificaciones de acuerdo al criterio del estadístico y problemas deredondeo y responde a la siguiente forma:

m = 1 + 3.3 log. n

Para el ejemplo propuesto:m = 1+3.3 lóg. 60m = 1+3.3 (1.778)m = 7Esto significa que la tabla se dividirá en 7 clases.

Determinación del ancho de clase (c

RC = o

m

Para nuestro ejemplo: c = = 4.85 c = 5

Para un ejemplo, sea M = 7,

Ancho de clase común igual a tres (C = 3)

4 7 10 13 16 19

Primera Clase : I1 = [ 4,7 >

Segunda Clase : I2 = [ 7,10 >

Tercera Clase : I3 = [ 10,13 >

Cuarta Clase : I4 = [ 13,16 >

Quinta Clase : I5 = [ 16,19 ]

Todos los intervalos de clase son semiabiertos mutuamente excluyentes(sin traslapos) y colectivamente exhaustivas tal que la unión de las clasessea igual al alcance.

Los límites de clase son: L1 = 4 L

2 = 7 L

3 = 10 L

4 = 13 L

5 = 16 L

6 = 19

Marcas de Clase.-Son los puntos medios de cada intervalo de clase.Una marca de clase (x

i) es un número que se obtiene sumando dos límites

consecutivos divididos por dos (semisuma de dos límites consecutivos)

Las marcas de clase obtenidas mediante esta regla:

Entonces, las marcas de clase, resultan: 5.5, 8.5, 11.5 14.5, 17.5Cuando se clasifica, un dato pierde su identidad personal (su valorespecífico) para sumergirse en el intervalo de clase correspondiente,aunque adquiere un valor típico representativo que ostenta una marca declase. Esta pérdida de información reduce la precisión que se conocecomo el error de clasificación.

a.- Cálculo del recorrido o rango (R)

Page 30: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES58 59ESTADÍSTICA APLICADA A LA EDUCACIÓN

Los intervalos no siempre tienen la misma amplitud, esto estará de acuerdoa la investigación y a la necesidad de presentar la información para elanálisis correspondiente.Se tiene los siguientes intervalos:

a.- Intervalos de igual amplitud.b.- Intervalos de diferente amplitud.c.- Intervalos abiertos.

Ejemplo:

a) Talla1.50-1.601.60-1701.70-1.801.80-1.901.90-2.00

b) Edades3-56-1415-2425-40

c) Ingresos MensualesMenos de 450451-900901-13501351-18001801-22502250-27002700-Más

1.3.4 Presentación en Tablas.-En esta etapa el estadístico se preocupa que las tablas y gráficos puedan

cumplir con su finalidad:

Desarrollo de los elementos de una distribución de frecuencias:

Tabla N° 1.2.2

Int. de clase Marca de clase Tabulación Frec. Abs.Y´¡ - 1 - Y´¡> Y¡

06 – 11 8.5 ||| 311 – 06 13.5 |||| 516 – 21 18.5 |||| |||| | 1121 – 26 23.5 |||| |||| |||| | 1626 – 31 28.5 |||| |||| 1031 – 36 33.5 |||| |||| || 1236 - 41 38.5 ||| 3

60

c. Formación de los intervalos de clase (Y).- Hallar el intervalo declase, significa determinar los límites inferiores y superiores de cadaintervalo, para ello partiremos del valor mínimo (Vmin = 60) y se lesuma la amplitud del intervalo (c = 8) de la siguiente manera:A partir del número 06 agregamos sucesivamente la amplitud 5 yobtenemos los puntos de división que determinaran los 7 intervalos.

Fig. N° 1.2.1

06 11 16 21 26 31 36 41

Sin embargo una dificultad se presenta cuando alguno de los datoscoincide con algunos de los puntos de división:

11, 16, 21, 26, 31, 36

Supongamos que un dato es 11 ¿En qué intervalo está ubicado locolocamos en el primer intervalo cuyos extremos son 6 y 11 o en elsegundo que tiene por extremos 1 y 6? Para esta ambigüedad se adoptapor convenio el intervalo cerrado por la izquierda que incluya al número6 (extremo inferior del intervalo) y abierto por la derecha que no incluyeal número 11 (extremos superior del intervalo). Matemáticamente serepresenta por el símbolo [06 – 11>.El número 11 sólo sirve de referencia superior para indicar que el intervalopuede contener números anteriores al 11. por ejemplo podría contenernúmeros anteriores al 11 pero no el 11. por ejemplo podría contener elnúmero 10.9 o el número 10.99 o también 10.999, pero nunca llegaráincluir al número 11.El siguiente intervalo (11-16) contiene al número 1 pero no al número 16.En la práctica los intervalos se colocan uno debajo de otros formandouna columna que se llama columna matriz del cuadro o tabla defrecuencias. Así para nuestro ejemplo.

Y´Y = = 06

Y´1 = Y´

Y + c 06 + 5 = 11

Y´2 = Y´

1 + c 11 + 5 = 16

. .Y´

7 = Y´

6 + c 31 + 5 = 36

Page 31: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES60 61ESTADÍSTICA APLICADA A LA EDUCACIÓN

Para nuestro ejemplo:

F1 = 3

F2 = 3 +5 = 8

F3 = 3 +5 + 11 = 19

F4 = 3 +5 + 11 + 16 = 35

F5 = 3 +5 + 11 + 16 + 10 = 45

F6 = 3 +5 + 11 + 16 + 10 + 12 = 57

F7 = 3 +5 + 11 + 16 + 10 + 12 + 3 = 60

Frecuencia Relativa Acumulada (Hi).- Se obtiene sumando yacumulando los valores relativos clase por clase en orden ascendente.En nuestro ejemplo:

H1 = 0.05

H2 = 0.05 + 0.083 = 0.133

H3 = 0.05 + 0.083 + 0.183 = 0.316

H4 = 0.05 + 0.083 + 0.183 + 0.267 = 0.583

H5 = 0.05 + 0.083 + 0.183 + 0.267 + 0.167 = 0.750

H6 = 0.05 + 0.083 + 0.183 + 0.167 + 0.200 = 0.950

H7 = 0.05 + 0.083 + 0.183 + 0.167 + 0.200 + 0.05 = 1.00

Frecuencia Relativa Porcentual (100hi%).- Es la frecuencia relativa

acumulada hi multiplicado por 100%, el 100 h

i 100% representa el

porcentaje de observaciones que pertenece a la clase i-ésima.Para nuestro ejemplo:

100h1% = 100(0.050) = 5.00

100h2% = 100(0.083) = 8.30

Frecuencia Relativa Acumulada Porcentual (100Hi%).- Es la frecuencia

relativa acumulada Hi multiplicada por 100. Es decir 100 H

i %.

Para nuestro ejemplo:100 H

i % = 100(0.050) = 5.00

100 Hi % = 100(0.133) = 13.30

Datos de Variables Discretas.- Cuando el valor de la variable resulta dela operación de contar su valor está representado sólo por por númerosnaturales (entero, positivos), ejemplo número de hijos por familia,vivienda por centros poblados, número de admisiones a la universidadpara el año académico de 2004.

Frecuencia Absoluta.- Es el número de veces que se repite o sucede enun intervalo de clase, cuya notación es:

fi = 1,2,3,...m

Ejemplo:f

1= 3, f

2= 5, f

3= 11,...., f

7= 3,

Frecuencia Relativa.- Es el valor que resulta al dividir cada una de lasfrecuencias absolutas entre el total de datos:

Ejemplo:

Frecuencia Absoluta Acumulada (Fi).- Se obtiene sumando yacumulando los valores absolutos, clase por clase en orden ascendente.Se representa por F

i:

Tabla N° 1.2.3

Y´¡ - 1 - Y´¡> Y¡ fi hi Fi Hi 100hi% 100Hi%06 -11 8.5 3 0.050 3 0.50 5.00 5.0011 – 16 13.5 5 0.083 8 0.133 8.30 13.3016 – 21 18.5 11 0.183 19 0.136 18.30 31.6021 – 26 23.5 16 0.267 35 0.583 26.70 58.3026 – 31 28.5 10 0.167 45 0.750 16.70 75.0031 – 36 33.5 12 0.200 57 0.900 20.00 90.0036 - 41 38.5 3 0.050 60 1.000 5.00 100.00

60 100.00

Page 32: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES62 63ESTADÍSTICA APLICADA A LA EDUCACIÓN

Conjunto de observaciones cuyos valores son:

Y1= 2, Y

2= 3, Y

3= 4, Y

4= 5, Y

5= 6, Y

6= 7

Clases.- Es el número de observaciones diferentes (6).

Frecuencias Absolutas (fi).- Número de casos que repite cada una delas observaciones.

f1= 5, f

2= 6, f

3= 9, f

4= 9, f

5= 6, f

6= 5

Frecuencias Absolutas Acumuladas (Fi).- Es el número deobservaciones que resulta de acumular sucesivamente las frecuenciasabsolutas, se representa (Fi).

F1 = 5

F2 = 5 + 6 = 11

F3 = 5 + 6 + 9 = 20

F4 = 5 + 6 + 9 + 9 = 29

F5 = 5 + 6 + 9 + 9 + 6 = 35

F6 = 5 + 6 + 9 + 9 + 6 + 5 = 40

Interpretación:F

2 = 11, significa que en la encuesta hay 1 familias con 3 o menos hijos,

dicho de otra manera en la encuesta se ha encontrado 11 familias con a lomás tres hijos.

Frecuencia Relativa (hi).- Es el cociente entre la frecuencia absoluta yla frecuencia total correspondiente a una clase, cuya notación es:

Tabla N° 1.2.5

Yi fi Fi Fi* hi Hi 100hi% 100Hi%2 5 5 40 0.125 0.125 12.50 12.503 6 11 35 0.150 0.275 15.00 27.504 9 20 29 0.225 0.500 22.50 50.005 9 29 20 0.225 0.725 22.50 72.506 6 35 11 0.150 0.875 15.00 87.507 5 40 5 0.125 1.000 12.50 100.00

Total 40

Problema: Los siguientes datos indican una encuesta realizada a 40familias en la ciudad de Huacho, se registraron los siguientes datos sobrelos números de hijos por familia.

7 5 3 3 4 3 2 5 5 47 7 4 2 7 4 3 4 3 66 6 4 2 6 7 2 6 4 36 2 4 4 5 5 5 5 5 5

Solución:

1.- Agrupamos los datos en orden decreciente:

7 7 7 7 7 = 56 6 6 6 6 6 = 65 5 5 5 5 5 5 5 5 = 94 4 4 4 4 4 4 4 4 = 93 3 3 3 3 3 = 62 2 2 2 2 = 5

2.- Como el rango es pequeño agrupamos los datos en clases o grupos:

3.- Desarrollo de los elementos de una distribución de frecuenciasdel número de hijos.

Tabla N° 1.2.4

N° de Hijos Conteo FrecuenciaYi Abs2 |||| 53 |||| | 64 |||| |||| 95 |||| |||| 96 |||| | 67 |||| 5

Total 40

Page 33: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES64 65ESTADÍSTICA APLICADA A LA EDUCACIÓN

100h1% = 100(0.125) = 12.50%

100h2% = 100(0.150) = 15.00%

. . . . . .100h

6% = 100(0.125) = 12.50%

Interpretación:100h

1% = 12.50% familias que tienen dos hijos.

100h2% = 15.00% familias que tienen tres hijos.

. .

. .100h

6% = 12.50% familias que tienen siete hijos.

Frecuencia relativa Acumulada Porcentual (100Hi%).- Es la frecuenciarelativa acumulada multiplicado por 100. se representa: 100%Hi%.

Ejemplo:

100H1% = 100(0.125) = 12.50%

100H2% = 100(0.275) = 27.50%

. . . . . .100H

6% = 100(1.000) = 100.00%

Interpretación: 100H

1% = 12.50% familias que tienen a los más dos hijos.

100H2% = 27.50% familias que tienen al menos tres hijos.

Construccion de da Distribucion para Frecuencias de DatosCualitativos.-Es simple basta enumerar los diversos atributos con sus respectivasfrecuencias en un cuadro estadísticos.

Ejemplo:

36 alumnos de educación inicial de la facultad de Educación susexámenes de admisión según su lugar de procedencia fueron de:Cajamarca, Trujillo, Piura, Lima, Junín y Puno.

Construir la distribución de frecuencias.

hi i= 2, 3.....,m

Ejemplo:

Interpretación:h

1 = 0.125, es la proporción de familias que tienen 2 hijos.

Frecuencia Relativa Acumulada (Hi).- Que resulta de acumular o sumarsucesivamente las frecuencias relativas, se representa por (Hi).

Ejemplo:

H1 = 0.125

H2 = 0.125 + 0.150 = 0.275

H3 = 0.125 + 0.150 + 0.225 = 0.500

H4 = 0.125 + 0.150 + 0.225 + 0.225 = 0.725

H5 = 0.125 + 0.150 + 0.225 + 0.225 + 0.150 = 0.875

H6 = 0.125 + 0.150 + 0.225 + 0.225 + 0.150 + 0.125 = 1.000

Interpretación:H

2 = 0.275, es la 5proporción de familias que tiene a los más tres

hijos.

Frecuencia Relativa Porcentual (100hi%).- Es la frecuencia relativahi multiplicada por 100%, representa el porcentaje de observaciones quecorresponden a Yi , cuya notación es: 100h

i %.

Page 34: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES66 67ESTADÍSTICA APLICADA A LA EDUCACIÓN

- Gráfico de frecuencias acumuladas- Histograma de frecuencias- Polígono de frecuencias- Polígono de frecuencias acumuladas u ojivas

I.1.2. Series CronológicasI.1.3. Correlación y Líneas de RegresiónI.1.4. Tasas Específicas

I.2. En coordenadas Polares (diagrama de telaraña)II. Gráficos de Superficie

II.1. De barras (rectangulares)- Simples (verticales y horizontales)- Compuestas (verticales y horizontales)

II.2. Sectores circulares en forma de tortaII.3. Coronas circulares (bandas concéntricas)II.4. Pirámides

III. Pictogramas o dibujosIV. Mapas estadísticos o cartogramasV. Gráfico de dimensiones

V.1. De áreas (dos dimensiones)V.2. De volumen (tres dimensiones)

a.3.- En la representación Gráfica de la distribución de frecuenciasse consideran:a.3.1. Representación gráfico para datos cuantitativosa.3.2. Representación gráfica para datos cualitativos

Representación Gráfica para datos Cuantitativos1° Para datos de Variables Continuas.2° Para datos de variables Discretos.

Primer Caso: Datos de Variables Continuas. Entre las más usualestenemos:1. Histograma de frecuencias Absolutas o Relativas.2. Polígono de frecuencias Absolutas o Relativas.3. Polígono de frecuencias Absolutas Acumuladas o ojivas “menor que” o “mayor o igual que”4. Diagramas escalonadas o función escalonadas.

Histogramas de Frecuencia Absolutas o Relativas.- Son gráficade rectángulos cuyas bases representan los intervalos de clase y

1.3.5 Representación Gráfica de la Distribución de Frecuencias.-

a.- GeneralidadesMediante una representación gráfica es, generalmente, más sencilloformarse una idea del comportamiento de una serie estadística y de lasvariaciones que sufren, que mediante la inspección de los datos numéricosseriados, ya que cuando son numerosos conducen más bien a confusióny hacen casi imposible la comparación entre series estadísticas extensas.Los gráficos va, pues, a construir un método de estudio sumamente eficaz.Cualquiera que sea el método adoptado, un gráfico debe ir acompañadode las siguientes indicaciones.- Un título general, que describa claramente el objeto del dibujo.- Los elementos geométricos de referencia (ejes coordenadas, eje

polar...) con expresión de la variable que sobre cada uno va arepresentarse.

- Escala de representación adoptada para cada variable.- Fuente de los datos estadísticos representados.

a.1.- Consideraciones Generales para el trazo de Gráficos.- La frecuencia se pone en el eje de las coordenadas o eje de las Y.- La variable o los intervalos de clase en el eje de las ordenadas

o eje de las X.- El trazo se hace una proporción de:

a.2.- Principales Tipos de Gráficos.I. Gráficos Lineales

I.1. En coordenadas rectangulares.I.1.1. Distribución de frecuencias

- Diagrama de frecuencia

Tabla N° 1.2.6

Lugar de Procedencia Conteo N° de alumnosCajamarca || 2Trujillo |||| | 6Piura |||| 5Lima |||| |||| || 12Junín |||| | 6Puno |||| 5

Total 36

Page 35: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES68 69ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ojivas.- Son gráficos que se utilizan para representar las frecuenciasacumuladas absolutas o relativas y consiste en un gráfico lineal quenos permite observar la cantidad de elementos que quedan por encimao por debajo de determinados valores, las ojivas son de dos tiposojivas “menor que” y “mayor que”. Para su elaboración de las ojivas“menor que” de cada intervalo de clase y las frecuencias acumuladascorrespondientes y se añade una clase en función cero antes de laprimera clase y para la elaboración de las ojivas “mayor que”

Ejemplo: Se pide elaborar las ojivas “menor que” con lainformación del cuadro N° 1.2.1

Desarrollo: Se calcula la frecuencia acumulada teniendo comointervalo el límite superior de cada clase.

Distribución de Frecuencias Absolutas Acumuladas ofrecuencias Relativas “Menor que”.

Tabla N° 1.2.7Edad Años Frecuencia Acumulada H

i“Menor Que”

Menor que 16 0 0.000Menor que 18 0+22 = 22 0.182Menor que 20 22+36 = 58 0.480Menor que 22 22+36+29 = 87 0.720Menor que 24 22+36+29+21 = 108 0.893Menor que 26 22+36+29+21+13 = 121 1.000

las alturas de frecuencias Absolutas o Relativas. Los rectángulosdeben tocarse unos a otros sin brecha, excepto para clase vacía.

Intervalo de Clase vs. Frecuencia Absoluta o Relativa

Ejemplo: Representar Gráficamente la siguiente información:

Cuadro N° 1.2.1

FACULTAD DE EDUCACIONEdad de alumnos en la especialidad de Inicial

<Edad en Años] N° de Alumnos16 - 18 2218 – 20 3620 - 22 2922 - 24 2124 - 26 13Total 121

Fuente: UNJFSC – Huacho Facultad de Educación

Solución:En el eje de las Abcisas se representan los intervalos de cada clasey en el eje de las Abcisas cada intervalo está representado por unrectángulo; estos son adyacentes. Como nos ilustra el gráfico N°1 (Facultad de Educación, edad de alumnos de Educación Inicial,Huacho Agosto de 2003).

Polígono de Frecuencia.- Es una poligonal construida uniendolos puntos (x

i, n

i) o (x

i, h

i) mediante segmentos de recta o también

se define como una poligonal construida uniendo, mediante segmentosde recta, los puntos medios de los “techos” de los rectángulos delhistograma, para fines gráficos se hace necesario incrementar unintervalo de clase en cada extremo, con frecuencia cero.Ejemplo: Construir el polígono de frecuencias para el cuadro 1.2.1Para su elaboración hallamos las marcas de clase o punto mediode cada intervalo incrementando una anterior a la primera clase, yotra posterior a la segunda clase, ambas con frecuencia 0. Comose puede apreciar en el gráfico N° 2 (Facultad de Educación, edadde los Alumnos de Educación Inicial, Huacho Agosto de 2003)

Gráfico N° 1Histograma de Frecuencias Absolutas

05

10152025303540

AL

UM

NO

S

16 18 20 22 24 26

EDAD (AÑOS) ALUMNOS DE EDUCACION INICIAL

Page 36: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES70 71ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ojiva “Mayor o Igual Que”.- Es la representación gráfica deuna distribución de frecuencias absolutas “Mayor o Igual Que” olas frecuencias relativas “Mayor o Igual Que”. Como se puedeapreciar en el gráfico N° 5.

Diagrama Escalonado o Función Escalonada “Mayor o IgualQue”.- Es la representación gráfica de una distribución defrecuencias absolutas mayor o igual que o las frecuencias relativasacumuladas mayor o igual que. Como observamos en el gráficoN° 6.

Gráfico Nº 3Ojiva “MENOR QUE”

Gráfico Nº 4Diagrama Escalonado “MENOR QUE”

0102030405060708090

100110120130

16 18 20 22 24 26 28

0

10

20

30

40

50

60

70

80

90

100

110

120

130

16 18 20 22 24 26

Gráfico N° 2Poligono de Frecuencias

Gráfico de Ojiva “Menor Que”.- Es la representación Gráficade una distribución de frecuencias absolutas acumuladas “menorque” o las frecuencias relativas acumuladas menor que. Comopuede apreciarse en el gráfico N° 3.

Diagrama Escalonada o Función Escalonada “Menor Que”.-Es la representación gráfica de una distribución de frecuenciasabsolutas “menor que” o las frecuencias relativas acumuladasmenor que. Como nos ilustra el gráfico N° 4.

Ojivas “Mayor o Igual Que”.- Es la representación gráfica deuna distribución de frecuencias absolutas “mayor o igual que” olas frecuencias relativas “mayor o igual que”.

Ejemplo: Se pide elaborar ojivas “mayor o igual que” con lareferencia del Cuadro 1.2.2

0

10

20

30

40

15 17 19 21 23 25 27

EDAD (AÑOS)

AL

UM

NO

S

Tabla N° 1.2.8Edad Años Frecuencia Acumulada H

i

“Mayor o Igual Que”16 o más que 22+36+29+21+13 = 121 1.00018 o más que 36+29+21+13 = 99 0.18120 o más que 29+21+13 = 63 0.52022 o más que 121+13 = 34 0.28024 o más que 0+13 = 13 0.10726 o más que 0 0.000

Page 37: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES72 73ESTADÍSTICA APLICADA A LA EDUCACIÓN

Diagrama de Frecuencias.- Es una representación gráfica de unadistribución de frecuencias de datos discretos que vienen a sersegmentos verticales de longitud igual a la frecuencia absoluta (ofrecuencia relativa), se levante en el eje de las X sobre cada unode los valores X

1, X

2, ..., X

n.

Ejemplo: Dada las siguiente distribución de frecuencias construyael diagrama de frecuencias.

1.3.6 Gráfico de Sector o Pastel.-Para construir el gráfico se utiliza una circunferencia, cuyo círculo se

divide en sectores tales que sus medidas angulares centrales sonproporcionales a las frecuencias absolutas y el total del circulo completo esde 360°. El número de grados que corresponde a cada frecuencia absoluta,se obtiene mediante la siguiente formula:

X° = N° de Grados =

Donde: fi = frecuencia absoluta

n = total de frecuencias.

Aplicación: Representar los gastos generales de una familia quetrabaja en la UNJFSC de Huacho a fin de hacer resaltar laimportancia respectiva de cada una de las clases de gastosenumerados a continuación:

alimentación B1 = 300

pasajes B2 = 100

Tabla N° 1.2.9

Xi

Fi

2 093 124 215 206 137 06

Total 81

Diagrama de Frecuencias

0

3

6

9

12

15

18

21

2 3 4 5 6 7 X

Gráfico Nº 5Ojiva “MAYOR O IGUAL QUE”

Gráfico Nº 6Diagrama Escalonado “MAYOR O IGUAL QUE”

Segundo Caso:

N Para Datos Diversos.- Se utiliza los siguientes gráficos:1.- Diagrama de frecuencias2.- Gráfico de sector o pastel3.- Gráfico acumulada de frecuencias “Menor Que”4.- Gráfico acumulado de frecuencias “Mayor o Igual Que”

0

20

40

60

80

100

120

140

16 18 20 22 24 26 28

0

10

20

30

40

50

60

70

80

90

100

110

120

130

16 18 20 22 24 26

Page 38: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES74 75ESTADÍSTICA APLICADA A LA EDUCACIÓN

se construyen en el eje horizontal los diferentes valores de X1,

X2,..., X

n levantando sobre cada uno de estos valores, un segmento

vertical de longitud igual a la frecuencia acumuladacorrespondiente y completando con trozos horizontales hasta elvalor inmediato siguiente.

Gráfico N° 7Representacion de los Gastos Generales de una Familia que

Trabaja en la UNJFSC de Huacho

Ejemplo: Tabla N° 1.2.10

Xi

fi

Hi

2 09 0.1113 12 0.2564 21 0.5185 20 0.7656 13 0.9267 06 1.000

6.30%

6.30%

6.30%

6.30%

6.30%

Gráfico N° 8Acumulado de Frecuencias

“Menor Que”

01020304050607080

2 3 4 5 6 7 X

educación B3 = 150

alquiler de vivienda B4 = 200

gastos diversos B5 = 50

TOTAL DE GASTOS S/. A = 800

Solución: Se obtendrá el tamaño de los sectores dividiendo lacircunferencia (360°) por el total de los gastos (A) y multiplicadoel cociente por el importe de cada clase (B

1, B

2,..., B

5) o sea:

Así para el sector alimentación:

Para el sector pasajes:

Para el sector educación:

Para el sector alquiler de vivienda:

Para el sector de gastos diversos:

Un transportador permitirá dividir la circunferencia en sectorescorrespondientes a la importancia de los elementos que presentan.Como se puede apreciar a través del gráfico N° 7 (Representaciónde los gastos generales de una familia que trabaja en la UNJFSCde Huacho).

Grafica Acumulada de Frecuencias “Menor Que”.- Es unarepresentación gráfica de la distribución de frecuencias “menorque”, pueden ser de frecuencias absolutas o frecuencias relativas,

Page 39: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES76 77ESTADÍSTICA APLICADA A LA EDUCACIÓN

Como se observa en el gráfico N° 10 de la elaboración de la tabla1.2.12

Gráfico N° 10Profesores en la UNJFSC de Huacho según facultades

Tabla N° 1.2.12

Facultades N° de ProfesoresAdministración 12Contabilidad 18Economía 8Educación 30Enfermería 16Ciencias Agrarias 20

Total 104

b.- Diagramas Rectangulares (Escalas Ordinarias)Sean dos ejes perpendiculares que se cortan en un punto O llamadoorigen de coordenadas. La recta OX es llamada eje de las abscisas(figura 1.2.2) y va graduada de izquierda a derecha. La recta OY es eleje de ordenadas y se gradúa de abajo arriba. Un punto P de abscisas4 y ordenada 2 se determinan por la intersección de las rectas AP yPB paralela a los ejes OY y OX, respectivamente. Un punto como elQ de coordenadas 3 y -3 se halla por la intersección de las paralelas alos ejes por los puntos C y D, etc. Los ejes dividen el plano en 4

0

10

20

30

1 2 3 4 5 6

Distribución de Frecuencias Absolutas o Relativas Acumuladas“Mayor o Igual Que”

Ejemplo:

Construcción de la Distribución de Frecuencias para datosCualitativosLos datos cualitativos pueden ser representados mediante losgráficos siguientes:

- Gráficos de barras- Gráfico de sectores o de pastel

a.- Gráfico de BarrasEstá formado por un conjunto de barras, la altura de cada barra esproporcional a la frecuencia del atributo que representa. Las barrasdeben ser del mismo ancho y el espacio entre ellas, uniforme.

Ejemplo: Dado la distribución de frecuencias construir elgráfico de barras.

Tabla N° 1.2.11

Xi

fi

Hi

2 06 1.0003 13 0.9264 20 0.7655 21 0.5186 12 0.2567 09 0.111

Gráfico N° 9Acumulado de Frecuencias

“Mayor o Igual Que”

01020304050607080

2 3 4 5 6 7 X

Page 40: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES78 79ESTADÍSTICA APLICADA A LA EDUCACIÓN

De estos datos puede deducirse el gráfico N° 11.Cada una de las tres clases de medios de pago consideradas se hallarepresentada por una banda o faja, de anchura igual a la cuantía dedichos medios de pago en miles de soles. El origen en el eje decoordenadas se ha hecho coincidir con 140,000 mil soles. Como seobserva en el gráfico N° 11

Gráfico N° 11Diagrama Rectangular

Cada poligonal señala el total de medios de pago correspondiente alas clases de ellos que tienen debajo. La poligonal superior señala portanto el total absoluto de medios de pago correspondiente a la columna“Totales” del cuadro numérico; es la que ha servido de punto departida. El gráfico N° 11, nos permite observar en seguida la tendenciacontinuamente creciente de los medios de pago, se observa enparticular una expansión de la circulación crediticia durante el añode 2001, seguida de una contracción de la misma durante los dosprimeros trimestres del año 2002 para iniciar durante el primertrimestre de 2002, una nueva expansión. Respecto a la creación demedios de pago por cuentas corrientes y depósitos ene l banco de lanación, el gráfico indica su ligera disminución durante el año 2001para aumentar seguidamente durante el primer trimestre de 2002 ypermanecer sensiblemente constante durante los dos siguientestrimestres del año.En cuanto a los medios de pagos correspondientes a la banca privada,el gráfico permite apreciar un crecimiento apreciable durante el año2001, que se mantiene sin grandes modificaciones durante los trestrimestres del año siguiente.

31-12-0031-12-01 31-03-02 30-06-02 30-09-02

146156166176186196206216226236246256266

cuadrantes I, II, III, IV, numerados sucesivamente en orden contrarioal movimiento de las agujas de un reloj. Los puntos del primercuadrante tienen positivas ambas coordenadas: los del segundo tienennegativa la abscisa y positiva la ordenada; los tercero tienen negativasamabas coordenadas, y los del cuarto, positiva la abscisa y negativala ordenada.

Y

II

B I

2 P

X, O 3 A

X

C

D

3 Q

III IVY

,

Veamos ahora algún ejemplo de construcción de diagramasrectangulares.

I.- Serie de los medios de pago en Huacho en las Fechas que seindican, como especificación de circulación crediticia, cuentascorrientes y depósitos en el Banco de la Nación y en la BancaPrivada, según datos de la memoria del Banco de Crédito para2003:

Cuadro N° 1.2.2En miles de Soles

Fechas Circulación Bco. de la Banca TotalesCrediticia Nación Privada

31-12-01 55,821.3 13,137.8 148,178.6 217,137.731-12-01 66,653.3 12,366.0 165,178.6 244,280.931-03-02 65,638.3 13,463.4 168,141.5 247,243.230-06-02 64,905.0 12,131.8 174,387.8 251,424.630-09-02 69,038.5 14,399.9 178,845.6 262,248.0

Cuentas corrientes y depósitos

Page 41: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES80 81ESTADÍSTICA APLICADA A LA EDUCACIÓN

al pasar de 400 a 700... log. 700-log.

Por tanto utilizando escala logarítmica en el eje de coordenadas,las variaciones relativas iguales se deducen en variaciones de alturade los puntos representativos, también iguales. Como es sabido yse ha indicado una escala logarítmica no es sino una escala en laque las distancias al origen no son los números representados sinosus logaritmos, en la figura adjunta se representa una escala naturaly otra logarítmica a fin de facilitar su comparación.

Escala Natural

0 0.3010 1 2 3 4

Escala Logarítmica

0 2 10 100 1000 10000

Observamos en la escala logarítmica, el punto 2 no dista dosunidades del origen, sino 0.3010, que es el logaritmo de 2, el punto10, no dista 10 unidades sino una unidad, ya que el logaritmo de10 es 1, etc. Cuando en un diagrama solo se utiliza escalalogarítmica sobre uno de los ejes, se llama diagramasemilogarítmico.

Dos diagramas semilogarítmicos se utilizan preferentementecuando las variaciones absolutas son muy grandes, ya que en talcaso la escala normal no permitirá hacer una representación delfenómeno en los límites de una hoja corriente del papel. Ejemplo:Representar la siguiente serie constituida por un postulante a unauniversidad del Perú durante varios años según los datos de lasiguiente tabla:

b.1.- Diagrama Rectangulares a Escala Semilogaritmica oLogarítmica.En los gráficos rectangulares de escala normal antes mencionados,las variaciones absolutas de los datos por ejemplo una producciónque pasa de 4 a 7, de 40 a 70, de 400 a 700 etc, viene representadaspor variaciones de las ordenadas muy diferentes entre sí, ahorabien si como en las cifras numéricas que acabamos de expresar,las variaciones absolutas de los datos por ejemplo una producciónque pasa de 4 a 7, de 40 a 70, de 400 a 700, etc. viene representadaspor variaciones de las ordenadas muy diferentes entre sí, ahorabien si como en las cifras numéricas que acabamos de expresar,las variaciones relativas o en porcentajes son las mismas, y sequiere poner en evidencia en el gráfico esa igualdad de variacionesrelativas es preciso recurrir a la escala logarítmica. En efecto alpasar de 4 a7 el incremento absoluto es 7 - 4 = 3 y el relativo:

La igualdad de variaciones relativas:

Puede escribirse en la forma:

o sea

Que prueba una igualdad de razones entre los valores dados comoconsecuencia de la igualdad de las variaciones relativas. Si ahoraen lugar de utilizar la escala natural utilizamos la logarítmica osea, si en vez de construir en el eje de ordenadas distancias de 4,7, 40, 70, 400, 700...tomamos el dicho eje los logaritmos de esosnúmeros, log 4, log 7, log 40,... las variaciones absolutas de dichográfico serán:

al pasar de 4 a 7... log.

al pasar de 40 a 70 ... log. 70-log.

Page 42: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES82 83ESTADÍSTICA APLICADA A LA EDUCACIÓN

1998-1999-2000 y 2001-2002-2003 son iguales lo cual nos indicaque el porcentaje de incrementos de ingresantes es el mismo.

Podemos en efecto comparar según la tabla de ingresantes delaño 1998 es de 240% de la del año de 2003 ya que:

= 240%

Así mismo la del año de 2001 con respecto a la de 2000 representatambién:

= 240%

b.2.- Otras representaciones Gráficasb.2.1 Diagramas Polares.- En estos diagramas los elementos

geométricos representativos son:Una longitud tomada sobre una recta que gira alrededor de unpunto fijo llamado polo. El ángulo de esta recta con unadirección fija (eje polar). Vamos a representar, por ejemplolos ingresos propios de la Facultad de Educación de UNJFSCde Huacho, durante el año de 2001 en los distintos meses, segúnlos datos de la siguiente tabla:

Representaremos al diagrama polar a través del gráfico N° 13

Meses Ingresos PropiosEnero 1450

Febrero 1570Marzo 1990Abril 2650Mayo 2500Junio 3410Julio 5200

Agosto 6260Setiembre 4320Octubre 2260

Noviembre 1850Diciembre 1544

Total 35004

Vamos a representar la serie en escala natural y en escalalogarítmica a fin de hacer la comparación correspondiente. Segúnpodamos observar en el gráfico N° 12

Gráfico N° 12

Años Postulantes1998 571999 1382000 3322001 7962002 19112003 4586

Podemos observar en el gráfico N° 12 como los incrementosmarcados con trazos gruesos, correspondiente a los intervalos

4000

2000

800

400

200

100

98 99 00 01 02 03

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

98 99 00 01 03 94

Page 43: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES84 85ESTADÍSTICA APLICADA A LA EDUCACIÓN

c.- Representación Gráfica de Casos Especiales

Cursos Psicoestadísticas.- Las curvas psicoestadísticas se basan enlos principios matemáticos expuestos; las más usadas son: curvas defrecuencias, psicografías, diagramas de progreso, histogramasindividuales, y los diagramas de dispersión. Expongamos las técnicasde la elaboración de éstas.

Curvas de Frecuencias.- En la tabla N° 1.2.13 se ve que 20 es lafrecuencia máxima. Dividimos el eje de las Y en 20 partes igualespor conveniencia hasta en 25. Para determinar las partes en que se ade dividir el eje de las X, hallamos los valores máximos (20) y mínimo(3) el puntaje 3 significa que todos los alumnos re3solvieroncorrectamente 3 problemas; 20 fue el puntaje mas elevado alcanzandopor un solo alumno. Luego la línea OX, debe ser dividida en 10 partesiguales anotando el valor 3 a la izquierda y 20 a la derecha. En elgráfico N° 14 las frecuencias están indicada sobre el eje de lasordenadas; los calificativos sobre el eje de las abscisas. Las magnitudesde las frecuencias y medidas aparecen de menor a mayor partiendodel punto de origen. Como se puede apreciar en el gráfico N° 14(curvas de frecuencia).

Curva Normal de Frecuencia.- La curva de frecuencias trazadascon los datos de la tabla N° 1.2.14 se convierte en una curva simétrica,conocida por curva normal de frecuencia, como observamos en elgráfico N° 15; aunque no todas las curvas simétricas son curvasnormales.

Tabla N° 1.2.13Test de Lenguaje

Puntaje = Xi Frecuencias = fiXi 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3fi 1 1 2 5 9 10 16 20 18 14 10 8 9 5 7 4 - 1

Total = 140 = fi

Gráfico N° 13Diagrama Polar

Observamos que la circunferencia del gráfico N° 13 seadividido en 12 partes iguales mediante radios que forman entresí ángulos de 30° y sobre dichos radios mediante una escalaadecuada llevamos los valores de la serie; uniendo los puntosobtenidos tendremos el gráfico deseado, como es natural lospuntos más próximos corresponden a meses de menos ingresospropios y viceversa.

b.2.2. Gráfico Triangular Equilátero.- Este gráfico está fundadosobre la siguiente propiedad de triángulo equilátero: “La sumade las distancias de un punto interior en triángulo a los treslados es igual a la altura, es decir dicha suma es constante”. Elgráfico sirve para representar las proporciones relativas de tresvariables cuya suma es igual al 100%.

b.2.3. Cartogramas.- Se utilizan para representar la distribucióngeográfica de un determinado fenómeno sobre el mapacorrespondiente se señalan los números absolutos oporcentajes correspondientes a cada departamento o regióncon el cual el cartograma es poco más elocuente que un cuadrode cifras.

Abril

Marzo Mayo

Junio

Febrero

Julio

Enero

10002000

3000Diciembre 4000

5000 Setiembre

6000

Noviembre Octubre Agosto

Page 44: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES86 87ESTADÍSTICA APLICADA A LA EDUCACIÓN

Curvas Asimétricas.- Los gráficos N° 16 y 17, ilustran 2 tipos desimetría, positiva y negativa, Así tenemos el siguiente ejemplo:

El gráfico N° 16 muestra una curva cuya asimetría se inclina a la derecha.En casos como este, se dice que la asimetría es positiva por que hay unaespecie de cola hacia la derecha. Cuando una curva muestra asimetríahacia la derecha indica que hay más notas inferiores que superiores. Sinson calificativos de los alumnos quiere decir que la prueba fue difícilpara los alumnos o que no hubo esfuerzo por parte de éstos.

Tabla N° 1.2.15Test de Aritmética

Puntajes (Xi) Frecuencia (fi)18 - 19 116 - 17 214 - 15 212 - 13 310 - 11 58 - 9 126 - 7 104 - 5 62 - 3 20 - 1 1Total 44

Tabla N° 1.2.16 Distribución de Edades

Edad en Años fi14.0 113.5 513.0 812.5 1012.0 911.5 711.0 510.5 410.0 39.5 39.0 18.5 1

Total 57

Gráfico N° 14Test de Inteligencia

Gráfico N° 15Test de Inteligencia

Tabla N° 1.2.14Test de Inteligencia

Cociente de Inteligencia FrecuenciaXi fi

130 y más 1120 – 129 5110 – 119 14100 – 109 3090 – 99 3080 – 89 1470 – 79 5

Menos de 70 1

0

2

4

6

8

10

12

14

16

18

20

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Calificaciones

Fre

cuen

cias

0

10

20

30

40

70 80 90 100 110 120 130 +

Cociente de Inteligencia

Frec

uenc

ias

Page 45: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES88 89ESTADÍSTICA APLICADA A LA EDUCACIÓN

año de estudios se representa por una línea gruesa, como se ve en elgráfico N° 18. El promedio de año se puede indicar en el gráfico; estopermitirá al profesor no sólo comparar la nota alcanzada por el alumnopor la norma estandarizada, sino también con el promedio de año.Si el valor de la edad mental de un alumno cae en la parte superior dela norma estandarizada indica que es uno de los más inteligentes dela clase; si cae en la parte inferior, es menos inteligente que un alumnomediocre del salón. Si la edad cronológica de un alumno es superiora la norma significa que es demasiado viejo para pertenecer a esegrupo. Si su medida cae sobre la línea normal quiere decir que esealumno no necesita una atención individual. Si su edad Aritméticacae en la parte inferior de la línea normal, significa que esta ejecutandolabor deficiente en dicha materia, comparado con los alumnos de aquelaño de estudios; si se halla a una distancia notablemente inferior,significa que su trabajo es muy deficiente.

Ejercicios: Trazar un Psicograma para un alumno del sexto año de primariaque alcanzó los siguientes puntajes en el Test de AprovechamientoStanford. El alumno tiene una edad mental de 12 años 10 meses. Elpromedio de la edad mental de la clase es de 13 años 10 meses.

Interpretación:a. El Alumno

1. Es muy aprovechado2. Muy débil en lengua materna3. Se halla sobre la norma en Lectura, Naturaleza y Ciencias Sociales, Lengua Materna y Ejercicio de Dictado.

Cuadro N° 1.2.3

Edades Alumno ClaseAños Meses Años Meses

(EC) Edad Cronológica 13 10 12 8(EE) Edad Educacional 12 11 14 6(EL) Edad en lectura 11 11 14 0(EA) Edad en Aritmética 15 2 14 8(NCS) Natur. y Cienc. Soc. 11 8 13 2(HL) Hist. Literatura 13 4 14 0(LM) Lengua Materna 9 8 15 0(ED) Ejerc. de Dictado 12 3 13 10

Gráfico N° 16Asimetria Positiva

El gráfico N° 17 muestra una asimetría negativa; indica que hay mayornúmero de niños mayores en el grupo. Si las medidas expresan loscalificativos de un examen, revelarían que el test no fue lo bastantefuerte para el grupo; que el grupo es superior o hizo un esfuerzo nocomún.

Gráfico N° 17Asimetria Positiva

Psicogramas.- Se traza esta clase de gráficos con el propósito decomparar las medidas individuales o las del grupo. En larepresentación gráfica de las mediciones educacionales, muestran siel aprovechamiento de un alumno es normal, el año estudios o lostítulos de las medidas, según el caso, se indica sobre el eje de las X.Las medidas s e transmutan a edades. La norma estandarizada del

0

5

10

15

1 3 5 7 9 11 13 15 17 19

PUNTAJES

FR

EC

UE

NC

IAS

0

5

10

15

FR

EC

UE

NC

IAS

8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14

EDADES

Page 46: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES90 91ESTADÍSTICA APLICADA A LA EDUCACIÓN

PRACTICA Nº 2

1. En una prueba de Estadística tomada de 30 alumnos de Educación Inicialde la Facultad de Educación se a obtenido los siguientes resultados:

12 14 09 13 14 16 06 15 14 1214 11 13 14 09 18 10 10 08 1510 13 13 07 14 10 08 12 10 11

Se pide:a. Elabore una tabla de distribución de frecuenciasb. Interprete algunos valores de la frecuencia Absoluta.c. Gráfica el histograma y el polígono de frecuencias.

2. Los siguientes datos corresponden al salario de los docentes de la UNJFSCde Huacho.

300 195 430 190 175 190 310 390 244 280180 350 290 240 350 400 310 260 250 390185 320 245 244 350 310 310 360 360 290280 250 400 290 320 290 240 175 190 310

Se pide:a. Elabore un atabla de frecuencias empleando la fórmula de Sturges para hallar los intervalos de clase.b. ¿Cuántos profesores ganan menos de 310 soles?c. ¿Qué porcentaje de profesores ganan más de 260 soles?d. Represente gráficamente el histograma y el polígono de frecuencias relativas.e. Elabore la ojiva “menor que” y la ojiva “mayor o igual que”

3. El Ministerio de Educación a través del Censo Educativo efectuado elaño de 2003, estima construir locales escolares en el ámbito de la USE 19de Guacho, empleando los siguientes materiales para construir localesescolares: De material noble 120 C.E., de Adobe 210 C.E., usando losrecursos propios de la zona 180 y prefabricados 300 C.E.

Se pide:a. Ordenar los datos en una tabla de frecuencia.b. Efectuar el análisis del cuadro.c. Represente gráficamente utilizando el gráfico circular.

b. La Clase1. Es superior a la norma de año en todas las materias.2. Revela máximo aprovechamiento en Lengua Materna.

Gráfico Nº 18Psicograma Educacional

8

9

10

11

12

13

14

15

16

EC EE EL EA NCS HL LM ED

EDAD EDUCACIONAL Y OTRAS EDADES

EDA

D C

RON

OLO

GIC

A E

N A

ÑO

S Y

MES

ES

Page 47: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES92 93ESTADÍSTICA APLICADA A LA EDUCACIÓN

6. Hallar los límites y las frecuencias que faltan en el siguiente cuadro dondela amplitud de clase son iguales.

[Y’i-1

- y’i > h

iH

if

iF

i

.. - 24 0.25 ... ... ..... - .. 0.25 ... ... ..... - .. ... 0.70 ... ...46 - .. ... ... 6 ..... - .. ... ... ... 60

PRUEBA DE AUTOEVALUACIÓN DE LA PRIMERA UNIDAD

1. A cualquier conjunto de Entes que presenta algunas características comunesse llama:

a. Muestra Aleatoria. c. Muestra Representativa.b. Universo Estadístico. d. Muestra Sesgada.

2. La estadística descriptiva es la que se ocupa de la............................. y.............................de datos en forma útil de fácil comunicación.

a. Solución Generalización c. Descripción Compensaciónb. Organización Presentación d. Análisis Solución

3. La estadística inferencial se orienta a la ........................... del problema afin de lograr ...................... amplias a partir de datos de una muestra.

a. Generalización Aplicaciones c. Descripción Análisisb. Organización Proyecciones d. Solución Generalizaciones

4. El color del cabello, ojos y piel de las personas son ejemplos de variables:

a. Ordenadas escalares continuas.b. Ordenadas escalares discretas.c. Ordenadas no escalaresd. No ordenadas

4. En una encuesta realizada en la UNJFSC de Guacho se obtiene la siguienteinformación sobre el tipo de profesión que desea seguir una muestra de45 alumnos:

E, E, M, M, I, C, C, C, A, A, A, M, M, E, P,n = P, P, P, C, C, A, A, A, B, B, B, M, M, M, B

P, E, E, C, C, C, I, I, I, B, B, A, A, P, B

Donde: A = Agronomía B = Biología C = ContabilidadE = Economía P = Psicología I = IngenieríaM = Medicina

Se pide:a. Elaborar el cuadro de distribución de frecuenciasb. Identifique que tipo de variable esc. Represente el histograma del polígono de frecuencias absolutas respectivamented. Represente la función escalonada.

5. Dada la siguiente información complete el cuadro d distribución defrecuencias con relación a una variable continua. Sabiendo que ladistribución es simétrica y continua alrededor del 40% y que los intervalosson de igual amplitud y que 172 es el 86% de los datos agrupados.

Se pide:a. Analizar la frecuencia relativa acumulada “mayor o igual que”.b. Elabore el histograma y el polígono de frecuencias relativas.

[Y’ i-1 - y’

i > h

iH

if

iF

i

10 - .. ... 0.1 ... ..... - .. ... ... ... ..... - .. 0.4 ... ... ..... - .. ... ... ... ..... - 60 ... ... ... ...

Page 48: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES94 95ESTADÍSTICA APLICADA A LA EDUCACIÓN

Yi F frecuencia F* Descendente F Ascendentei absoluta

11 5 70 510 10 65 159 13 55 288 18 42 467 13 24 596 5 11 645 3 6 674 2 .. ..3 1 .. ..

a. ¿Cuál es el número total de datos? ...........b. La frecuencia acumulada ascendente (f) que corresponde al puntaje

(Yi) 9 es .............

c. La frecuencia acumulada descendente (F*) que corresponde al puntaje(Y

i) 6 es.........

8. Dado la siguiente información y sabiendo que los intervalos sonsemiencerrados y que el número de datos es 80, se pide completar elcuadro.

[Y’i-1

- y’i > Y

if

ih

iH

i

.. - .. ... 12 ... ...

.. - .. ... ... 0.225 ..... - 15.5 14 ... ... 0.5625

.. - .. ... ... 0.2375 ...

.. - .. ... ... ... ..

9. Se tiene una distribución de frecuencias con 4 intervalos de clase y deancho constante para 50 datos. Se pide completar el cuadro.

[Y’i-1

- y’i > Y

if

ih

iH

i

.. - .. ... ... 0.08 ...

.. - .. 5 ... ... 0.40 .. - .. ... 12 ... ..... - .. 9 ... 0.36 ...Total .... .... .... ....

5. La población escolar de la USE Nº 19 de Huacho en los niveles deinicial y primaria es de 8960 alumnos, se lleva a cabo una investigaciónsobre estados nutricionales de esta población escolar, se escogieron2240 alumnos. El grupo seleccionado será en un primer momentocalificado de acuerdo a las siguientes variables: Sexo (hombres ymujeres), zona de procedencia (rural o urbano), nivel (inicial oprimaria), capacidad económica de los padres (baja, media o alta) yedad en meses cumplidos, en base a este problema resuelva lassiguientes interrogativas:

a. La investigación será ejecutado a nivel:a.1 Censal a.2 Muestral a.3 Sub Muestrala.4 Población Total

b. Si el procedimiento usado para elegir a los 2240 alumnos brindó igualoportunidad de ser seleccionados a los 8900 alumnos podemos afirmarque la muestra es:b.1 Sesgada b.2 Conglomeradab.3 Aleatoria b.4 Viciada

c. Si a partir de los datos que obtenemos acerca de las variables de estudio,se comienza a describir:c.1 Descriptiva c.2 Inductiva c.3 Matemática c.4 Inferencial

d. La edad en meses cumplidos es una variable:d.1 Escala Discretad.2 Escala Continuad.3 No escalar discretad.4 No escalar Continua

e. En el problema presente, son variables no ordenadas (cualitativas):e.1 Sexo, zona de procedencia y edad.e.2 Zona de procedencia, capacidad económica y edad.e.3 Sexo, zona de procedencia y capacidad económicae.4 Nivel escolar, sexo y edad.

6. Los polígonos de frecuencia y los histogramas de frecuencia:a. Se construyen cuando conocemos variables continuas.b. Cuando conocemos variables cualitativos .c. Cuando conocemos variables discretos o discontinuos.d. No se construyen para variables continuas ni para variables cualitativas.

7. Con los datos del siguiente cuadro y con las frecuencias acumuladas tantoascendentes como descendentes que se presenta responde a las siguientesinterrogantes:

Page 49: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES96 97ESTADÍSTICA APLICADA A LA EDUCACIÓN

10. Los siguientes datos son los elementos de una distribución de frecuencias.Reconstruir la distribución.

Donde: c = ancho de clase = 3

f5 = f

3/3 Y

3 = 15 f

4 = f

2 - 2

f2 = 2f

5h

5 = 12.5%

5 fi = 24i=1∑

SEGUNDA UNIDADANÁLISIS E INTERPRETACIÓN

DE LOS DATOS

Page 50: Profdosa - Estadistica Aplicada Educacion

99ESTADÍSTICA APLICADA A LA EDUCACIÓN

OBJETIVO GENERALAl finalizar el estudio de los contenidos de la segunda

unidad el estudiante será capaz de calcular analizar e interpretarlos estadígrafos de tendencia central.

LECCIONES

2.1Análisis e interpre-tación de los datos.

2.2La Mediana.

OBJETIVOSESPECÍFICOS

2.1 Diferenciar las caracte-rísticas de las principalesmedidas de tendencia cen-tral.

2.2 Aplicación, representación,interpretación adecuada dela Mediana.

CONTENIDOSANALÍTICOS

2.1 Concepto.2.1.1 Análisis e interpre-

tación de los datos.2.1.2 Descripción de los

Datos.2.1.3 La Media Aritmética.2.1.4 La Media Geomé-

trica.2.1.5 La Media Cuadrática.2.1.6 La Media Armónica.

2.2 Concepto.2.2.1 Mediana para datos

no agrupados.2.2.2 Mediana para datos

Agrupados.2.2.3 La Moda.2.2.4 Cuantilas.

Page 51: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES100 101ESTADÍSTICA APLICADA A LA EDUCACIÓN

valor en una serie de datos y además describen resumidamente alconjunto de observaciones. Los estadígrafos de posición de uso másfrecuente son:

2.1.3 La Media Aritmética.- Es el estadígrafo más utilizado sobre todo enla cuantificación de variables educativas, su simbología es:

X = M(x)Se presentan los siguientes casos generales:

a. Media Aritmética para datos no agrupados.b. Media aritmética para datos agrupados.c. Cálculo de la Media Aritmética por métodos abreviados.

a. Media Aritmética para datos no agrupados.- Pueden ser:a.1 Media Aritmética Simple.a.2 Media Aritmética Ponderada.

a.1 Media Aritmética Simple.- Se calcula sumando todos losdatos de la distribución y dividiendo dicha suma entre el totalde los datos. Cuando se habla de entre << media >> en lapráctica se entiende la media aritmética.Se expresa mediante la siguiente fórmula:

Ejemplo: El calificativo de 8 cursos de un alumno de educacióninicial es:

13 15 12 10 14 19 16 16

El promedio será:

LECCIÓN N ° 2.1

ANÁLISIS E INTERPRETACIÓN DE LOS DATOS

OBJETIVO ESPECÍFICO N ° 2.1Calcular e interpretar la Media Aritmética.

2.1 Concepto.-

2.1.1 Análisis e Interpretación de los datos.-Los investigadores sociales enmuchos campos utilizan el término “promedios” para hacer algunasinterrogantes tales como: ¿Cuál es el ingreso promedio que perciben losprofesores y el personal administrativo de la UNJFSC de Huacho?, ¿Cuántosaccidentes automovilísticos ocurren como resultado directo de las drogas oel alcohol?. Por consiguiente hay necesidad de encontrar u número únicoque representa lo “promedio” o típico de ese conjunto de puntaje en lainvestigación social, a ese valor se le conoce como medidas de tendenciacentral ya que esta generalmente localizada hacia el medio o centro de unadistribución en que la mayoría de los puntaje tiende a concentrarse.

2.1.2 Descripción de Datos.- En esta etapa se hace necesario del cálculo yestudio de las medidas descriptivas que se agrupan en:

a.- Medidas de Posición o localización:- Medidas de tendencia central

i) Promedios: Media aritmética, media geométrica, mediaarmónica, media cuadrática, media cúbica.

ii) Mediana- Moda- Cuantillas

b.- Medidas de variabilidad o DispersiónVarianza, desviación típica, coeficiente desvariación, desviaciónmedia, rango, rango intercuartílico, desviación cuartílica.

c.- Medidas de Deformación o Asimetríad.- Medidas de Apuntamiento o Kurtosis.

a.- Medidas de Posición o Localización.- Son estadígrafos cuyos valoresse representa de manera condensada, es decir representan un solo

Page 52: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES102 103ESTADÍSTICA APLICADA A LA EDUCACIÓN

Cuadro Nº 2.1.1Cálculo de la media correspondiente al Nº de viajes que realizan

los alumnos

Viajes Nº Alumnos Xi fi1 10 (1) (10) = 102 12 (2) (12) = 243 10 (3) (10) = 30

Total fi = 32 Xi. fi = 64

b. Media Aritmética para datos agrupados.- Se puede presentar entablas sin intervalos y en tablas con intervalos en ambos casos seusa la media aritmética ponderada, cuya fórmula es:

b.1 Tablas sin intervalos.Ejemplo: Los siguientes datos corresponden al número de viajes querealizan por día 32 alumnos encuestados en la UNJFSC de Huacho.

Luego:

Esto quiere decir que realizan dos viajes por alumno. Se debetener en cuenta que es una variable discreta.

b.2 Tablas con Intervalos.- en el cálculo de la media a partir detablas de frecuencias con intervalos, se usa “la marca de claseX

1” y definiremos de la siguiente manera:

Sean: X1, X

2, X

3, ..., X

n las marcas de clase f

1, f

2, ...f

k, las frecuencias

absolutas correspondientes, k = Nº de clases y n = tamaño de lamuestra, que se define a media muestral de la diguiente forma:

Observamos que la suma es de 104 se ha dividido entre 8 quees el número de cursos que lleva el alumno. El cociente 13viene a ser el promedio de los calificativos que se simbolizapor la letra mayúscula X.

a.2 Media Aritmética Ponderada para datos no agrupados.-Es la media obtenida cuando prevalece cierto peso, importanciao repetición de los datos en la investigación. Se utiliza lasiguiente fórmula:

Ejemplo: La edad de los alumnos de educación inicial en elC.E. “San José” es la siguiente: 12 alumnos de 3 años, 15alumnos de 4 años y 17 alumnos de 5 años, hallar la edadpromedio de dichos alumnos.

Solución: Ordenamos la información de la siguiente manera:

Donde:Cuadro Nº 2.1.0

Edad Años Nº Alumnos Xi fi3 12 (3) (12) =364 15 (4) (15) = 605 17 (5) (17) = 85

∑fi = 44 ∑xi.fi = 181

Interpretación: la edad promedio de los alumnos de ese C.E.es de 4 años.

Page 53: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES104 105ESTADÍSTICA APLICADA A LA EDUCACIÓN

iii) “La Media de la suma de dos o más variables, es igual a lasuma de las medias de cada una de dichas variables”.

M (X + Y) = M (X) + M (Y)

iv) “La suma de las desviaciones (diferencias) entre los valoresde la variable respecto a la media aritmética es cero”.

v) “Si una muestra se divide en s muestras, entonces la mediatotal de la muestra, es igual a la suma de las medias de lasubmuestras ponderadas por sus respectivos tamañosdividido entre el tamaño de la muestra total” .Sea una muestra de tamaño n con media x, consideremosdos sub muestras y con sus respectivas medias X

1 y X

2

con n = n1 + n

2.

Se tiene:

Generalizando para las submuestras se tendrá:

∑ ( )

( ) ( ) ( ) ( )n

...n

1nn2121111

k

1i YX++YX+YX=

YX=Y+XM =

Ejemplo: Tomemos los datos muéstrales que representan lasedades registradas por 30 trabajadores de la universidad al 30de diciembre de 1993.Representada en la siguiente tabla:

Según la formula reemplazando valores tenemos:

Interpretando el promedio de la edad de los trabajadores “X”es 40.93 años.

b.3 Propiedades de la media Aritmética.-i) “La Media Aritmética de una constante es igual a la misma

constante” .M(K) = k k = constante

ii) “La Media del producto de una constante por una variablees, igual al producto de la constante por la media de lavariable” .

M(k . x) = k . M (x) k = constante

Tabla Nº 2.1.2

Edad Años Marca de Nº Frecuencia(Intervalo) Clase Trabajadores Relativa Xi fi Xi hi

Xi fi hi20 – 28 24 4 0.134 96 3.21628 – 36 32 12 0400 384 12.80036 – 44 40 7 0.233 280 9.32044 – 52 48 4 0.134 192 6.43252 – 60 56 2 0.066 112 3.69660 - 68 64 1 0.033 64 2.102Total 30 1000 1228 37.566

Page 54: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES106 107ESTADÍSTICA APLICADA A LA EDUCACIÓN

Solución: tomando el origen de trabajo 0t = 5, tenemos:

Por tanto = 5.1

c.2 Segundo Caso: Método abreviado para el cálculo de la media.Este procedimiento es particularmente útil para ser aplicadocuando los valores X son grandes y la amplitud de claseconstante. Pasos a seguir:

Primer paso: Se efectúa el cambio de variable (de X a µ) parael cual se utilizará la siguiente fórmula.

(1)

Donde: X1

= Valores de la variableO

1= Origen de Trabajo

µi

= Valores transformadosc = Amplitud de Intervalo de clase

Segundo paso.- Cálculo de la media . Tenemos de (1): queX

1 = (0

t + Cµ

i) :

Aplicación práctica:

Tabla N° 2.1.4Cálculo para emplear el método abreviado

Intervalo Marca de Clase Frecuenciade Clase Xi fi di fi di

[ >0 – 2 1 2 -4 -82 – 4 3 5 -2 -104 – 6 5 4 0 -18/208 – 6 7 8 2 168 – 10 9 1 4 4Total 20 2

Ósea:

Ejercicio: El promedio en la asignatura de estadística delos 11 alumnos del segundo año de la especialidad deMatemática es 14 y el promedio de los 9 alumnos deeducación inicial es 13.3 ¿Cuál es el promedio de ambasespecialidades en la asignatura de estadística?.

Se tiene la siguiente tabla:

De acuerdo a la propiedad y la media aritmética total:

c. Método Abreviado para el cálculo de la media Aritmética.-c.1. Primer Caso: Sea 0

t (el origen del trabajo) el valor más

frecuente de la variable x o aquella que está hacia el centro dela distribución de frecuencias, y sea: d

1 = X

1 - 0

t ( i = 1, 2,

.........., k ) la desviación de x1 respecto a 0

t entonces es:

X1 = d

1+ 0

t

Luego:

Tabla N° 2.13Especialidad N° Alumnos Nota PromedioMatemáticas n1 = 11 x1 = 14

Inicial n2 = 9 x2 = 13.3Total n = 20 x = ?

Page 55: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES108 109ESTADÍSTICA APLICADA A LA EDUCACIÓN

O si están referidas a toda población:

Media Global.- Una ventaja que ofrece la Media es la que si una muestra separticiona en k sub-muestras y se conocen las medias y los tamaños de cadasub-muestra se puede determinar la Media de toda la muestra sin necesidadde conocer los datos originales. Esta media, así determinada, se denominaMedia Global o Promedio Global, que se define como sigue: yiiiii

1, iiii

2,.....

k son las Medias de las K sub-muestras de tamaños n

1, n

2,.....n

k,

respectivamente; entonces:

Se observa que la Media Global es una media ponderada.Algunos autores consideran que todas las medias son ponderadas; aun en elcaso de datos no clasificadas, a cada observación le asignan el peso 1.

Ejemplo: Calcular la Media Aritmética de los sueldos de un conjunto de 70profesores de la UNJFSC de Huacho que se percibe empleando los diferentescriterios:

Hallamos la media aritmética

Tabla N° 2.1.6

[intervalo > Xi fi Xi . fi Di fi . di220 – 320 270 6 1620 -3 -18320 – 420 370 9 3330 -2 -18420 – 520 470 13 6110 -1 -13520 – 620 570 18 10260 0 -49/35620 – 720 670 15 10050 1 15720 – 820 770 7 5390 2 14820 – 920 870 2 1740 3 6

Total 70 38500 - -14

Por lo tanto

Ejemplo se tiene información en la siguiente tabla:

Aplicando la formula tenemos:

Media Ponderada.- Ocurren ocasiones en que algunos tienen mayorimportancia que otros; por ejemplo, el Examen Final (que abarca todo elcurso) es más importante o tiene mayor peso que el Examen Parcial, comoconsecuencia, generalmente, se le asigna peso 2 y peso 1 al Parcial. Esto nosconduce al concepto de media ponderada, que se formula como sigue:Sean P

1, P

2...... P

k los pesos o ponderaciones asociados a X

1, X

2,...... X

k,

respectivamente; entonces la Mediana Ponderada se define:

Tabla N° 2.1.5

Intervalos de Clase Marca de Clase fi µ i fi µ i[ > Xi0 - 4 2 1 -2 -24 - 8 6 4 -1 -48 - 12 10 9 0 -6/1912 - 16 14 6 1 616 - 20 6 1 2 420 - 24 22 3 3 3Total 25 13

Page 56: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES110 111ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ejemplo, la media geométrica de 2,8 y 32 es:

En las investigaciones de carácter educacional es muy limitado el uso dela media geométrica; sin embargo se apela a ella en aquellas indicacionessobre incremento positivo; ejemplo, la ejecución específica de unindividuo, observado por medio de test, ha incrementado en 50% en 10meses de práctica. ¿Cuál es el promedio de incremento semanal?Será 5% hallado por la media aritmética? No. Este promedio se hallaextrayendo la raíz de índice 10 de 1.50; sustrayendo al resultado el valorde la eficiencia inicial.

La media geométrica usada en series cortas, se calcula por logaritmos.

De donde se deduce: el logaritmo de la media geométrica es igual alpromedio de los logaritmos de N ítems.

Ejemplo: hallar la media geométrica de los siguientes números: 12, 17,21, 26, 33.

X log x12 1.07918 6.56533 = 1.3130617 1.27045 521 1.3222226 1.4149733 1.51851 Antilog. 1.31306 = 20.56109 6.56533

Pasos para computar su valor:1. Tomar el logaritmo de cada ítem.2. Calcular la media aritmética de la serie de los logaritmos.

a. Empleado:

Interpretación: La muestra de los 70 profesores tienen un salario promediode 550 soles mensuales.Calculo de la Media Aritmética por el método abreviado para el ejemploanterior:Aplicamos la formula.

Características más Relevantes de la Media Aritmética:

a. La Media Aritmética es la Media Descriptiva más conocida y usada enEstadística.

b. Es una media única; es decir, un conjunto de datos tiene solamente unamedia.

c. Es calculada tomando en cuenta la magnitud de todos y cada uno delos datos bajo consideración.

d. Como la medida localizada el centro físico (centro de gravedad) deuna distribución de datos, es una medida de Tendencia Centralmuy sensible a los valores extremos, y estos valores conmagnitudes desproporcionados desplazan el valor de la media haciasus extremos.

e. También se usa la media cuando la distribución de frecuencia de losdatos es simétrica o tiene poca asimetría; igualmente cuando seaproxima a la Distribución Normal de Probabilidades por que estadistribución es simétrica.

2.1.4 La Media Geométrica.-a. Para Datos No Agrupados.- La media geométrica de una serie de datos

es igual a la raíz enésima del producto de n términos. Su fórmula es:

Page 57: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES112 113ESTADÍSTICA APLICADA A LA EDUCACIÓN

Aplicando la formula tenemos:

Antilog. 1.6967372=49.7

Características de la Media Geométrica.-a. El valor de la media geométrica depende de la magnitud de todos

los valores de la serie.b. Su valor es siempre menor que la media aritmética.c. Representa mejor que la media aritmética la tendencia central, por

que su valor es el menos afectado por los valores extremos.

Ventajas.-a. Su valor se calcula algebraicamente.b. El valor computado particularmente para estudiar la fluctuación

media de los precios y de las tasas de crecimiento (matriculaescolar, crecimiento demográfico).

Inconvenientes.-a. Es un promedio poco conocido.b. Relativamente de difícil computación.

2.1.5 Media Cuadratica.- Es la raíz cuadrada de media aritmética de loscuadrados de los datos de la serie o en otros términos es la raíz cuadrada

Tabla N° 2.1.7

Intervalo Marca de Clase fi Log. Xi fi log. Xi[ > Xi0-10 5 2 0.30103 1.3979410-20 15 3 1.17609 3.5282720-30 25 7 1.39794 9.7855830-40 35 11 1.54406 16.9847540-50 45 15 1.65321 24.7931850-60 55 20 1.74036 34.8072560-70 65 18 1.81291 32.6324470-80 75 13 1.87506 24.3757980-90 85 8 1.92941 15.4353590-100 95 3 1.97772 5.93317Total 100

3. Hallar el antilogaritmo de la media anterior; este es el valor de lamedia geométrica.

Ejercicio: Un atleta aspirante al campeonato mundial de carrera de 100 y200 metros se entrenó intensamente durante 3 semanas. Al finalizar elentrenamiento logró el 60% de eficiencia sobre su velocidad inicial ¿Cuálfue el incremento promediar por semana?

Solución:a. No fue 60/3 = 20%b. Su incremento medio semanal fue:

En efecto, ese atleta, a fines de la primera semana incrementó 17% de100, su velocidad inicial. ¿Cuál fue el incremento promediar por semana?

Solución:a. No fue 60/3=20%b. Su incremento medio semanal fue:

En efecto, ese atleta, a fines de la primera semana incremento 17% de100, su velocidad inicial; es eficiencia de esa semana: 100 + 7=1175. Afines de la segunda semana ganó 17% de 117%. A fines de la tercerasemana, aumento 17% de 137 (17 x 137=23) o sea 23%; eficiencia de laúltima semana; 137+23=160%.

Ganancias Parciales:Primera Semana: 17%Segunda Semana: 20%Tercera Semana: 23%

Total 60%

b. Para Datos Agrupados.- La media geométrica de datos agrupados secomputa por el procedimiento de la media aritmética ponderadausando los logaritmos de los puntos medios.

Ejemplo: Hallar la media geométrica en una prueba de matemáticastomados a 100 alumnos de la facultad de educación, cuyos resultadosse presentan en la siguiente tabla.

Page 58: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES114 115ESTADÍSTICA APLICADA A LA EDUCACIÓN

Con el objeto de comprender la significación de esta mediaconsideraremos el siguiente ejemplo: Supongamos que hemos recorridola distancia de Lima a Huacho a razón de 80 Km/hora, y que hemosefectuado el regreso de Huacho a Lima a razón de 60 Km/hora ¿Cuál esla velocidad media en el trayecto de ida y vuelta?

Solución:La media aritmética daría como respuesta:

Km/hora que sería un resultado erróneo.

Para calcular el tiempo intervalo en recorrer la distancia D entre Lima yHuacho sería D/80 y el regreso D/60. La velocidad media de ida y vueltaserá pues:

Por consiguiente la respuesta correcta de la velocidad media de ida yvuelta es 68.57 km/hora.

Ejercicio: Para el caso de datos agrupados, la media armónica de unadistribución de frecuencias se halla siguiendo el procedimiento de lasponderaciones. Como ilustra la tabla adjunta, los pasos a seguir.

Tabla N° 2.1.9Intervalo Marca de Clase fi

[ > Xi Fi Xi0-10 5 2 0.4000010-20 15 3 0.2000020-30 25 7 0.2800030-40 35 11 0.3142840-50 45 15 0.3333350-60 55 20 0.3636360-70 65 18 0.2769270-80 75 13 01733380-90 85 8 0.0941290-100 95 3 0.03157Total 100 2.46719

del cuadrado de la media aritmética. Puede ser también ponderada encuyo caso su expresión teórica es:

O bien:

Para el cálculo se adopta la siguiente disposición práctica:

2.1.6 Media Armónica.- Se define como el inverso de la media aritméticade los inversos de los datos de la serie.Su expresión teórica será:

O bien:

Que en caso de datos que no presenten frecuencias o pesos, es decir, siY

1 = 1, toma la forma:

Tabla N° 2.1.8

X1 Y1 X Y 1 X1 3 1 32 4 4 165 9 25 2257 10 49 49010 7 100 70013 2 169 338

35 1772

21

21

Page 59: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES116 117ESTADÍSTICA APLICADA A LA EDUCACIÓN

Aplicando la fórmula:

NOTA : De las cuatro medias estudiadas se ve inmediatamente que lamedia aritmética es la que mejor reúne las condiciones Yule. En particularla media aritmética y cuadrática dan mucho relieve a los elementosgrandes de la serie y, desde luego la cuadrática más que la aritmética. Porel contrario, las medias geométrica y armónica destacan la influencia delos valores pequeños y reducen la influencia de los valores grandes. Lascuatro medias expuestas quedan ordenadas con arreglo a su magnituddel modo siguiente:

armónica < geométrica < aritmética < cuadrática

LECCIÓN N ° 2.2

MEDIANA EN UNA DISTRIBUCIÓN DE FRECUENCIAS

OBJETIVO ESPECÍFICO N ° 2.2Calcular e interpretar la Mediana.

2.2 Concepto.-Es una medida de tendencia central que localiza “el centro” de la distribución

de datos en base a su ubicación central una vez ordenados. Mediana es aquelvalor que no es superado ni supera más del 50% de los datos. La medianadistribuye o clasifica el 50% de los datos de un lado y los otros 50% del otrolado se obtiene de la siguiente manera.

2.2.1 Para Datos No Agrupados.- Para calcular la mediana los “n” datosoriginales de Xi se ordenan de forma ascendente o descendente, luego secalculan n +1/2 que determina el lugar donde estará ubicado el valor dela mediana. Se presentan dos casos.

a.1Cuando se tiene un número impar de datos, la mediana es igual alvalor del término central, por ejemplo: Hallar la mediana de losvalores:

2 5 7 9 13

La mediana es siete para esta serie.

a.2Cuando se tiene un número par de datos.- Se toma como mediana lamedia aritmética de los términos centrales. Por ejemplo de la serie: 12 5 7 9 10 13 14 es pues:

7 + 9/2 = 8

Page 60: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES118 119ESTADÍSTICA APLICADA A LA EDUCACIÓN

Datos: Lk-500 que es el límite inferior de la cuarta clase; n/2 = 70/2 =

35; ck = 100 que es la amplitud del intervalo; n = 70 número total de

observaciones; Fk-1

= 28 frecuencia absoluta acumulada hasta la claseanterior a la clase mediana.f

k = 18 frecuencia absoluta de la clase mediana.

Características de la Mediana:1. Es una medida única; esto es, una distribución de datos, tiene

solamente una mediana.2. La suma de valores absolutas de las desviaciones de los datos con

respecto a la mediana es mínima.3. El valor de la mediana depende únicamente de los valores centrados;

no cambia de valor si se agrega un mismo número de datos mayoresy menores que ella, no es sensible a los valores extremos como lamedia. La mediana puede ser más representativa que la media, enel sentido que localiza mejor el “centro” de la distribución de datos.

2.2.3 Moda.- Es el valor más frecuente de una variable. La moda de unconjunto de observaciones es “el valor de la variable que se presenta conmayor frecuencia en la distribución”. La moda también se llama modo,valor modal o promedio típico, se simboliza con Mo.

Para Datos No AgrupadosEjemplo: Determinar la moda en los siguientes conjuntos de datos no agrupados:

1. 3 7 8 8 6 11 18 5 42. 4 8 10 11 12 13 12 15 16 123. 2 5 7 4 7 7 6 3

Solución:Ordenamos los datos ya sea en forma creciente o en forma decreciente.

1. 3 4 5 6 7 8 8 11 18 se observa que el dato que se repite conmayor frecuencia es el 8; entonces la Mo = 8.

2. 4 8 10 11 12 12 12 13 15 16 Se observa que el dato que serepite con mayor frecuencia es el 12; luego la Mo = 12.

3. 2 3 4 5 6 7 7 7 se observa que el dato que se repite con mayorfrecuencia es el 7; entonces la Mo = 7.

Tabla N° 2.1.10

[Intervalo> Xi fi Fi220-320 270 6 6320-420 370 9 15420-520 470 13 28520-620 570 18 46620-720 670 15 61720-820 770 7 68820-920 870 2 70

Total 70

2.2.2 Para Datos Agrupados.- Cuando los datos se encuentran agrupadosen una tabla de distribución de frecuencias la Mediana se halla utilizandola siguiente formula:

donde:Lk

= Límite inferior (real) de la clase mediana.C

k= Amplitud de la clase mediana.

n = Número total de observaciones.F

k-1= Frecuencia Absoluta Acumulada hasta la clase anterior a la clase mediana.

fk

= Frecuencia Absoluta de clase mediana.

Ejemplo: Calcular la mediana de la tabla N° 2.1.9 que corresponde alos salarios de 70 profesores de la UNJFSC de Huacho.

Se debe seguir los siguientes pasos:

1. Se obtiene las frecuencias acumuladas.2. Se determina la clase donde se encuentra la mediana para esto

se hace la división:n/2 = 70/2 = 35. Luego la mediana ocupa el lugar 35 y por lotanto se encuentra en la clase cuarta, puesto que en esta claseestán los elementos que ocupan los lugares 29° hasta el 46°

3. Se aplica la formula:

Page 61: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES120 121ESTADÍSTICA APLICADA A LA EDUCACIÓN

b.- Criterio de KingEste criterio se basa en la influencia de las frecuencias absolutas delas clases adyacentes sobre la clase modal.

Procedimiento:i. Identificar la clase modalii. Aplicar a formula

c.- Criterio de PearsonKart Pearson desarrolló una formula empírica de relación entre lamedia, la moda y la mediana.

Mo = 3Md - 2X

Ejemplo: Calcular la Moda (Mo) de la tabla N° 2.1.11. que correspondea los salarios de 70 profesores de la UNJFSC de huacho:

Resolveremos el ejemplo empleando el criterio de CZBER. Se debeseguir los siguientes pasos:

i. Ubicación de la clase Modal.- Se ubica en aquella clase quetiene mayor frecuencia en nuestro ejemplo la mayor frecuenciaes 18 que corresponde a la cuarta clase por consiguiente lacuarta clase constituye la clase modal.

ii. Hallamos el límite inferior = 520 es el límite inferior de la clasemodal.

Clase Modal

Tabla N° 2.1.12

[Intervalo> Xi fi Fi220-320 270 6 6320-420 370 9 15420-520 470 13 28520-620 570 18 46620-720 670 15 61720-820 770 7 68820-920 870 2 70

Total 70

La moda es útil cuando la variable de estudios pertenece a la escalanominal, ejemplo: Hallar la moda para la siguiente información queconsiste en una muestra de 1200 televidentes según preferencias por losacanales de televisión.

Observamos que el canal de mayor preferencia es América por tanto;Mo = América

Para Datos Clasificados o Agrupados.- Cuando los datos estánagrupados formando una distribución de frecuencias se puede calcular lamoda empleando las siguientes formulas:

a.- Criterio de Czberi. Identificar la clase modal (aquella que posee la máxima frecuencia

absoluta).ii. Aplicar la formula:

Donde Lk

= Limite inferior de la clase modalC

k= Amplitud de clase modal

fk

= frecuencia absoluta máxima de la clase modalf

k-1= Frecuencia absoluta de clase adyacente anterior a la clase modal

fk+1

= Frecuencia absoluta de la clase posterior a la clase modal

Tabla N° 2.1.11

Canales de T.V. TelevidentesPanamericana 320América 370RTP 60Frecuencia Latina 200Global 90ATV 80RBC 80

Total 1200

Page 62: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES122 123ESTADÍSTICA APLICADA A LA EDUCACIÓN

Tabla N° 2.1.13

[intervalo > Xi fi fiXi Fi5 - 15 10 8 80 815 - 25 20 20 400 2825 - 35 30 42 1260 7035 - 45 40 60 2400 13045 - 55 50 42 2100 17255 - 65 60 20 1200 19265 - 75 70 8 560 200Total 200 8000

iii. El cálculo de la moda es independiente de la magnitud de lasobservaciones, como tal puede permanecer igual variado losvalores o incremento el número de ellos.

iv. En algunas distribuciones, en ves de los máximos relativos sepuede considerar los mínimos y determinar lo que se llamaANTIMODA (Amo) que es el valor de la variable que menos serepite o tiene menor frecuencia.

Relaciones entre la Media, Mediana y Moda.-i. En una distribución unimodal, si la distribución es simétrica;

entonces la media, la mediana y la moda son iguales.ii. Si la media la mediana y la moda son diferentes por lo menos de

dos en dos; entonces la distribución es asimétrica o sesgada. SiMo < Md < es una distribución asimétrica.Se dice que esta sesgada a la derecha, la distribución presenta unalarga cola hacia la derecha.Si < Md < Mo es una distribución asimétrica.Se dice que esta sesgada a la izquierda. La distribución presentauna larga cola hacia la izquierda.Es decir la Media se desvía en dirección del sesgo (cola larga)con respecto a la Moda y la Mediana tiende a ubicarse entre estasmedidas.En una distribución moderada asimétrica o ligeramente sesgadase tiene: - Mo = 3 ( - Md)Esta igualdad se hará mas notoria cuanto menos asimétrica es ladistribución y discrepante si es muy segada.Dada la siguiente distribución Simétrica verificar que la Media,la Moda y la Mediana son iguales ilustre gráficamente.

Ck

= 100 que es la amplitud de clasef

k= 18 frecuencia absoluta máxima de la clase modal

fk-1

= 13 frecuencia absoluta de clase anterior a la clase modalf

k+1= 15 frecuencia absoluta de la clase posterior a la clase modal

Reemplazando valores en la formula:

Interpretación: Mo = 582.5. La Moda indica que el sueldo mas frecuentede los profesores en estudio es 582.5, o también que la mayoría de losprofesores tienen sueldos aproximados a los 582.5 soles.Con los datos antes mencionados:

Mo = 573.6 Valor aproximado a la anterior calculada.Nota: Cuando la distribución es casi simétrica es conveniente utilizarel criterio de Pearson.

Mo = 3Md - 2 = 3 (558.88) - 2 (550)Mo = 1576.64 - 1100 = 576.64

Características:i. Su uso se hace imperativo cuando los datos son de tipo cualitativo.

Su fácil interpretación y su cálculo sencillo hacen de la Moda unamedida de localización más usual.

ii. La moda puede no existir. Si existe, no siempre es la única cuandoen un conjunto de valores una distribución existe una sola modase trata de una distribución UNIMODAL; si hay dos modas seráBIMODAL; si se presentan varias Modas se llamaráPLURIMODAL.

Page 63: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES124 125ESTADÍSTICA APLICADA A LA EDUCACIÓN

Tabla N° 2.1.15[intervalo> Xi fi fiXi Fi

25-30 27.5 2 55.00 230-35 32.5 10 325.00 1235-40 37.5 15 562.50 2740-45 42.5 18 765.00 4545-50 47.5 20 950.00 6550-55 52.5 30 1575.00 9555-60 57.5 5 287.50 100Total 100 4520.00

Se tiene: Mo < Md < ...33.57 < 38.75 < 39.79Representación gráfica:

Mo = 33.57 = 39.79 X Md = 38.75

El dibujo nos ilustra que es una distribución asimétrica, sesgada ala derecha presenta una larga cola hacia la derecha.Dada la siguiente distribución de frecuencias comparar la Media,la Mediana y Moda.

0

5

10

15

20

25

3030

5

1820

15

10

2

25 30 35 40 45 50 55 60

Tabla N° 2.1.14

[intervalo> Xi Fi fiXi Fi25-30 27.5 5 137.50 530-35 32.5 30 975.00 3535-40 37.5 20 750.00 5540-45 42.5 18 765.00 7345-50 47.5 15 712.50 8850-55 55.5 10 525.00 9855-60 57.5 2 114.40 100Total 100 3979.40

Reemplazando las formulas respectivas tenemos:

Gráficamente:

Mo = Md = X

Dada la siguiente distribución de frecuencias discutir el sesgo:

0

10

20

30

40

50

60

5 15 25 35 40 45 55 65 75

8

20

42

8

20

42

60

Page 64: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES126 127ESTADÍSTICA APLICADA A LA EDUCACIÓN

< 25% > Q1 75%

El 25% de los datos son inferiores o iguales que Q1 y los 75%restantes son superiores a Q1.

EL SEGUNDO CUARTIL Q2.- Coinciden con la mediana luegoQ2 = Md.

EL TERCER CUARTIL Q3.- Clasifica a los datos colocando allado izquierdo el 75% de l número de datos y al otro el 25%.

75% Q3 < 25% >

El 75% de las observaciones son menores o iguales que Q3 y el

25% son mayores que Q3.

Las formulas para calcular los cuartiles se derivan de la formulautilizada para calcular la mediana y los pasos para el cálculo sonlos mismos.

Para el Primer Cuartil Para el Tercer Cuartil

b. Decil.- Son medidas de posición que dividen en 10 partes igualesal conjunto de valores ordenados en una distribución defrecuencias, estas medidas son: el primer Decil D

1, el segundo D

2

y sí sucesivamente hasta el noveno Decil D9 .

El Primer Decil.- Distribuye al lado izquierdo el 10% de los datosy al motor lado el 90%, es decir que ocupa la posición n/10.

El Segundo Decil.- Clasifica los datos colocando al lado izquierdoel 20% del número de datos y al otro lado el 805, o sea ocupa laposición 2n/10.En igual forma para los demás Deciles hasta el noveno Decil9n610, que coloca a la izquierda el 90% de los datos y a la derechael 10% y su posición es 9n/10. Ver figura adjunta.

Entonces: < Md < Mo 45.20 < 46.25 < 51.43Por consiguiente la distribución es segada a la izquierda.

Representación gráfica:

Md = 46.25 Mo = 51.43X = 45.2

2.2.4 Cuantilas.- Son medidas descriptivas que distribuyen o clasifican losdatos, una vez ordenados a uno otro lado en porcentajes dados. O sonestadígrafos que dividen a una distribución de frecuencias en cuatro, 10o 100 partes iguales.

Descripción:a. Cuartiles.- Son medidas de posición que dividen en cuatro partes

iguales al conjunto de valores ordenados en una distribución defrecuencias. Estas medidas son:

EL PRIMER CUARTIL Q1.- Distribuye al lado izquierdo el 25%de los datos y el otro lado el 75%.

0

5

10

15

20

25

30

25 30 35 40 45 50 55 60

5

30

1820

15

10

2

Page 65: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES128 129ESTADÍSTICA APLICADA A LA EDUCACIÓN

100, ocupa el 90° (el lugar novegésimo). Decir percentil nosignifica que el número de sujetos que rinden una prueba esexactamente 100, ni que el número de preguntas es 100 lo que seexpresa es el lugar que ocuparía un puntaje dentro de una escalaordenada de 100 elementos. La formula es:

En donde Pr = indica el Percentil buscado, Lk = el extremo inferiordel intervalo donde se halla el percentil.r = es el rango Percentil, es decir la situación dentro de la escalaordinal de 100 elementos.r m/100 = el valor de este término indica el intervalo o la clase dedistribución de frecuencias, los demás valores son los mismosque los de la Mediana.

Ejemplo: en una prueba de matemáticas tomadas a 100 alumnosde la facultad de educación, cuyos resultados se presentan en lasiguiente tabla. Calcular.

a. El Cuartil Q3.

b. El Decil D5 y D

7.

c. El Percentil P10

y P90

.

Tabla N° 2.1.16

[Intervalo> Marca de Clase X1 f1 F1

0 - 10 5 2 510 - 20 15 3 520 - 30 25 7 1230 - 40 35 11 2340 - 50 45 15 3850 - 60 55 20 5860 - 70 65 18 7670 - 80 75 13 8980 - 90 85 8 9790 - 100 95 3 100

Total 100

0 D1 D2 D3 D4 D5 D6 D7 D8 D9

0 n 2n 3n 4n 9n10 10 10 10 10

Entre cada dos Deciles consecutivos debe encontrarsecomprendidos el 10% del número de datos. La formula paracalcular cualquier Decil es:

En donde Dr = es el Decil buscado; Lk = Extremo inferior del

intervalo donde se halla el Decil buscado; r = Indica el Decil. Porejemplo si queremos determinar el Segundo Decil entonces r = 2.Por tanto la variable r puede tomar valores que van desde 1 hasta9. Simbólicamente 1 < r < 9.r m 610 = Indica la situación del Decil es decir la clase donde estael Decil, n = número de elementos de la distribución, los demásvalores tienen el mismo significado que para la Mediana.

c. Percentiles.- Son medianas de posición que indican el lugar quecorresponde a un puntaje dentro de una escala ordenada de 100elementos. En el concepto de Percentil debemos distinguir dosaspectos que son:

Primero del Rango Percentil.- Que señala el orden o situacióndentro de una escala ordenada de 100 elementos colocados enorden creciente de magnitud. El Rango Percentil se denota con elsímbolo r que es que es una variable ordinal cuyos valores sonnúmeros naturales que van del 1 hasta el 100 en símbolo1 < r < 100

Segundo Rango Percentil.- Que se representa por le símbolo Pr;por ejemplo, P

30 se lee (Percentil 30). Es el puntaje o puntuación

alcanzado por una persona en una prueba, al que se le asigna unrango percentil dado, por ejemplo en la aplicación y clasificaciónde una prueba de rendimiento el alumno José Vásquez alcanza elP

90 , significa que su porcentaje colocado dentro de una escala

Page 66: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES130 131ESTADÍSTICA APLICADA A LA EDUCACIÓN

Datos Lk = 80, C

k= 100, F

9-1 = F

8 = 89.

Aplicamos la fórmula:

Uso del Percentil.-Estas medidas son de gran unidad, en los trabajos y estudioseducativos.

En la evaluación del aprendizaje, cuando se quiere estimar ycomparar el rendimiento de un alumno en las diferentes materiasdel currículo se tiene que transformar todos los puntajes delenguaje, matemáticas, química, estadística, etc., a la escalaPercentil y se hace un perfil gráfico que nos muestra con granclaridad en que asignaturas el alumno tiene buen rendimiento yen cuales su aprendizaje es diferente. Si aplicamos un test deinteligencia y su puntaje se convierte a percentil, podemoscomparar el rendimiento académico con su capacidad intelectual.

Aplicaciones de los Percentiles.-A cien alumnos de la especialidad de Educación Primaria se lesha examinado en las asignaturas de Matemática, lenguaje yrindieron una prueba de inteligencia. Cutos puntajes están en lastablas N° 2.1.16 (Matemática), 2.1.17 (Lenguaje) y 2.18 (Test deInteligencia). El alumno Juan Cornejo está ubicado el curso deMatemáticas en el percentil 88 (P88), en el curso de Lenguaje enel percentil 78 (P78) y en el Test de Inteligencia en el percentil61 (P61), compare su rendimiento en las asignaturas deMatemática y Lenguaje, relacione ese rendimiento con sucapacidad intelectual.

Elabore un perfil gráfico.

a. Solución: a. Cálculo de Q3;

Tenemos que hallar el 3n/4 = 75, debe estar en la séptima clase.Datos: L

k = 60, C

k = 100, F

7-1= = F

6 = 20.

Aplicando la formula:

Q3 = 69.44

b. Cálculo del D5 y D

7

b.1. Cálculo del D5

hallamos el 5 n/10 = (100)/10 = 50, debe estar en la sextaclase.Datos L

k = 50, C

k= 100, F

6-1 = F

5 = 38.

Aplicando la formula:

D3 = 58.

b.2. Calculamos el D7.Encontramos el 7n/10 = 7(100)/10 = 70, debe estar en laséptima clase.Datos L

k = 60, C

k= 100, F

7-1 = F

6 = 58.

Aplicando la formula:

c. Cálculo del P10 y del P90´c.1 Cálculo del P10.

Hallamos el rm/100 = 10 (100)/100 = 10 debe estar en latercera clase.Datos L

k = 20, C

k= 100, F

3-1 = F

2 = 5.

Aplicando la fórmula:

P 10 = 20 + 10 [10-5] = 20 + 7.14 = 27.14

c.2 Cálculo del P90Hallamos el rm/100 = (100)/100 = 90 debe estar en lanovena clase.

Page 67: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES132 133ESTADÍSTICA APLICADA A LA EDUCACIÓN

Hallamos el

El puntaje de Test de Inteligencia es 68.

Primero.- Dentro de la especialidad de Educación Primaria elalumno Juan Cornejo en Matemáticas es alto su puntaje, enLenguaje es ligeramente inferior al de Matemáticas.

Segundo.- El rendimiento en Matemáticas concuerda con sucapacidad intelectual. En cambio en Lenguaje es un poco inferiorcon su inteligencia pero en términos generales hay una correlaciónentre su rendimiento en matemáticas, Lenguaje y su CapacidadIntelectual, como se aprecia en el gráfico adjunto.

0

10

20

30

40

50

60

70

80

90

100

Lenguaje Matemáticas Inteligencia

Tabla N° 2.1.16 (Matemáticas)

[Intervalo> Marca de Clase X1 f1 F1

0 – 10 5 2 510 - 20 15 3 520 – 30 25 7 1230 – 40 35 11 2340 – 50 45 15 3850 – 60 55 20 5860 – 70 65 18 7670 – 80 75 13 8980 – 90 85 8 9790 – 100 95 3 100

Total 100

Solución:

Hallar el

Entonces el puntaje de Matemáticas es 70 Puntos.

Hallamos el

El puntaje alcanzado en Lenguaje es de 64 puntos.

Tabla N° 2.1.18 (Inteligencia)

[Intervalo> Marca de Clase X1 f1 F1

0 - 10 5 1 110 - 20 15 3 420 - 30 25 12 1630 - 40 35 19 3540 - 50 45 21 5650 - 60 55 17 7360 - 70 65 12 8570 - 80 75 8 9380 - 90 85 5 9890 - 100 95 2 100

Total 100

Tabla N° 2.1.17 (Lenguaje)

[Intervalo> Marca de Clase X1 f1 F1

0 - 10 5 1 110 - 20 15 1 220 - 30 25 2 430 - 40 35 5 940 - 50 45 13 2250 - 60 55 17 3960 - 70 65 26 6570 - 80 75 24 8980 - 90 85 7 9690 - 100 95 4 100

Total 100

Page 68: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES134 135ESTADÍSTICA APLICADA A LA EDUCACIÓN

3. Calcular el valor de la moda en las siguientes distribucionesa. 35 35 50 63 63 80 95b. 20 17 17 17 13 11 11 10 10 10 10c. Intervalo Fi

60 - 65 565 - 70 770 – 75 9

d. Intervalo fi80 – 84 584 – 88 788 – 92 1092 – 96 2

e. Calcula el valor de la moda valiéndote de la misma distribución defrecuencias de los ejercicios números 1.d. y 2.e.

4. Utilizando el polígono de frecuencia, gráfica la ubicación de las 3 medidasde tendencia central (Media Aritmética, Mediana y Moda).

5. De acuerdo al gráfico obtenido; interprete:- La curva es _____________________________________________- Demuestre que la prueba ha sido ______________ o que los alumnos no

lograron los ______________________Así mismo, se observa que elpuntaje promedio es _________________y 73.2 es ele puntaje obtenidopor el _____________________________número de participantes.

Y

0 X

EJERCICIOS

1. Calcular el valor de la media aritmética en las siguientes distribucionesde datos no agrupados:a. 08 12 13 14 20b. 70 30 80 50 45c. 60 28 35 40 83 90 77d. En la siguiente tabla de distribución de frecuencias compuestas, calcular

el mismo valor:

[Intervalo> fi xi fixi50-56 4 5356-62 7 5962-68 9 6568-74 11 7174-80 6 7780-86 3 8386-92 2 8992-98 1 9598-104 0 101

i=6 = 43 ∑ =

2. Calcular el valor de la Media e indicar el lugar que ocupa en las siguientesdistribuciones de datos no agrupados:a. 10 18 13 09 17 14b. 20 16 14 12 11 09 05c. 98 90 83 80 75 72 63 48d. 40 75 50 63 95 80 48 90 55e. Haciendo uso de la tabla de distribución de frecuencias siguientes,

calcular el valor de la mediana:[Intervalo> fi fi

50-56 456-62 762-68 968-74 1174-80 680-86 386-92 292-98 198-104 0

i=6 = 43

Page 69: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES136 137ESTADÍSTICA APLICADA A LA EDUCACIÓN

REGIÓN POBLACIÓN ACTUAL EN TASA PORCENTUAL ENMILLONES DE HABITANTES CRECIMIENTO

Cent. Y Sur-Amr 276 2,9Norte América 225 1,1

Europa 456 0,8U.R.S.S 241 1,0África 344 2,4Asia 1990 2,0

En base al cuadro anterior responda las preguntas 4 y 5.

4. Cuál es el promedio de la población que representa mejor la poblaciónactual de las regiones Centro y Sur América, África y Asia.

a. 2,160 millones de personas.b. 870 millones de personas.c. 1,388 millones de personasd. 858 millones de personas.

5. Cuál es la diferencia entre la tasa porcentual promedio de crecimiento enel continente americano con respecto a la de Europa incluyendo U.R.S.S.

a. 4.0% b. 0.9% c. 2.2% d. 1.1%

6. Un estudiante de la Facultad de Educación en la asignatura de Químicaobtuvo 17, 18 y 19 puntos, en el primer segundo y tercer examenrespectivamente, si el profesor de la signatura piensa que el segundoexamen es tres veces más importante que el primero y que el tercer examenlo es tres veces más que el segundo. Para determinar el resultado final¿Cuál es el promedio del estudiante en este curso?

7. La nota de los alumnos de la especialidad de matemáticas y física, en unexamen de estadística obtuvieron como promedio 8.5, si todos dansustitutorio, cuál sería la media si en este nuevo examen:

a. Todos aumentan en5 puntos.b. Todos duplican sus notas.

8. La Asamblea de Rectores realiza una auditoria a la U.N.J.F.S.C. de Huacho,empleando un tiempo necesario para hacer una auditoria de 50 balances

PRUEBA DE AUTOEVALUACIÓN DE LA SEGUNDA UNIDAD

1. Las medias de tendencia central son:

a. Procedimiento que, al distribuir las variables en frecuencias, permitecaracterizar un conjunto de datos.

b. El conjunto de datos que se dispersan y distribuyen alrededor de unvalor central.

c. Valor que indican la localización central de un conjunto de datosrepresentados así a la población.

d. Los datos de una población cuyos valores no son ni altos ni bajos.

2. A continuación se presentan en la columna de la izquierda un conjunto dedefiniciones de las medidas de tendencia central y en la derecha lasdenominaciones de dichas medidas.

Establece las relaciones correctas entre ambas columnas indicando dentrode los paréntesis el símbolo de la medida que corresponde a cada definición,luego señala la alternativa que identifica dicha relación:

- Valor que divide una población en dos partes exactamente iguales.a. X - Mo - Md.

- Valor que representa el dato que aparece con mayor frecuencia.b. Md - Mo - X

- Valor resultante de la división de la suma de valores entre el númerototal de datos.c. Mo - X - Md

3. La mediana es útil por que:

a. No es una medida que se altera con la presencia de una población condatos de valores muy altos o muy bajos.

b. Constituye la medida mas estable o confiable.c. Permite trabajar no sólo con datos agrupados si no con los datos no

agrupados.d. Generalmente coincide con los valores de la moda y la media aritmética.

En el cuadro siguiente se indica la población en millones de habitantes yla tasa porcentual de crecimiento en algunas regiones geográficas delmundo.

Page 70: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES138 139ESTADÍSTICA APLICADA A LA EDUCACIÓN

11. Un estudiante de la Facultad de Educación obtuvo 17, 14 y 12, en leprimero, segundo y tercer examen de estadística respectivamente. Si elprofesor piensa que el segundo examen es tres veces más importante queel primero y el tercer examen lo es más que el segundo para determinar elresultado final. ¿Cuál es el promedio del estudiante en este curso?

12. Las notas de los alumnos de la especialidad de educación inicial en unexamen de matemáticas tuvieron como promedio 9.5, si todo dansustitutorios cual sería la media si en este nuevo examen:

a. Todos aumentan en 4 puntos.b. Todos duplican su nota.

13. Dos fabricantes de carpetas anuncian que la vida “promedio” de suscarpetas es de 7 años. Sin embargo al obtener una muestra aleatoria de laduración de las carpetas, un Director de un C.E. encuentra que la vida enaños de las carpetas de cada fabricantes es: Muestra de duración de lascarpetas del fabricante “A”:

5 5 5 6 6 6 6 7 7 7 7 7 7 7 8 8 8 8 9 9 9

Muestra de duración de las carpetas del fabricante “B”

2 3 4 5 5 5 5 6 6 6 7 7 7 7 8 8 20 20 20

a. Cuál vida promedio señalo cada fabricante.b. La compra de cada fabricante representa la mejor inversión.c. Con que fabricante A ó B se sentiría más seguro al afirmar que su vida

“Promedio” es de 7 años

contables, que corresponden a las diferentes Facultades, como se indicaen el siguiente cuadro:

TIEMPO DE AUDITORIA (en minutos) NUMERO DE BALANCES10 – 20 320 – 30 530 – 40 1040 – 50 1250 – 60 20Total 50

Se pide:

a. Determinar el tiempo mínimo en el que comienza a registrarse el 75%de los balances.

b. Determinar el porcentaje de balances concluidos en el minuto 42.

9. Los siguientes datos corresponden al peso en kg. de 10 alumnos deeducación inicial:

40.8 52.5 49.2 40.8 62.252.5 58.0 60.0 40.8 52.5

Calcular:a. Media Aritmética, Mediana, Moda, interpretar.b. Cuál de los tres indicadores mide con precisión el centro de los datos.c. Construir el gráfico más apropiado para la información que se presenta.

10. Dada la siguiente distribución de frecuencias calcular el primer cuartil, eltercer decil y el percentil 80 y graficar el Histograma, el Polígono y OjivaMayor Que.

[intervalo > fi5-10 410-15 915-20 1520-25 4525-30 3730-35 2935-40 11

Page 71: Profdosa - Estadistica Aplicada Educacion

141ESTADÍSTICA APLICADA A LA EDUCACIÓN

TERCERA UNIDADMEDIDAS DE DISPERSIÓN Y

ASIMETRÍA

Page 72: Profdosa - Estadistica Aplicada Educacion

143ESTADÍSTICA APLICADA A LA EDUCACIÓN

OBJETIVO GENERALAl finalizar el estudio de los contenidos de la tercera unidad el

estudiante será capaz de conocer y utilizar las medidas dedispersión en el análisis del grado de concentración.

LECCIONES

3.1 Medidas deDispersión.

3.2 Medidas deDeformación.

OBJETIVOSESPECÍFICOS

3.1 Conocer e internar laamplitud de los valores quetoma la variable en unadistribución de frecuencias.

3.2 Conocer utilizar estadí-grafos de deformación.

CONTENIDOSANALÍTICOS

3.1 Concepto.3.1.1 Recorrido o Rango.3.1.2 Desviación Medida3.1.3 Recorrido intercuar-

tílico.3.1.4 La Varianza.3.1.5 Desviación Típica o

Desviación Estándar.3.1.6 Coeficiente de

variación.

3.2 Concepto.3.2.1 Estadígrafos de

Deformación.3.2.2 Estadígrafos de

Apuntamiento oKurtosis.

3.2.3 Relaciones másimportantes entre lasMedidas Descrip-tivas.

Page 73: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES144 145ESTADÍSTICA APLICADA A LA EDUCACIÓN

alguna sobre si los elementos pequeños son más numerosos que los mayores,ni si las diferencias y desviaciones entre los elementos varían o no regularmentey si son grandes o pequeños; así por ejemplo si comparamos estas dos series:

3 7 42 67 81 y 15 38 42 52 53

Que siendo evidentemente muy diferentes, tienen sin embargo la mismamediana 42 y la misma media aritmética 25. el estudio de la dispersión oseparación de los datos de la serie se conoce con el nombre de la teoríade la dispersión. Esta se mide mediante los estadígrafos siguientes:

Entre los estadígrafos de dispersión de mayor uso es:

a. Recorrido o rango (R).b. Desviación Media (D.M.).c. Recorrido Semi Intercuartil (Q).d. Varianza (S

2).

e. Desviación Estándar o Típica (s).f. Coeficiente de Variación (CV).

3.1.1 Recorrido O Rango (R).- Es la longitud de alcance, es una medidade variabilidad sencilla y directa que nos proporciona la magnitud globalde la distribución de datos, es decir la diferencia entre el mayor y elmenor valor de ella. Si bien brinda una primera idea acerca de laheterogeneidad, tiene el inconveniente que solo toma en cuenta los dosvalores extremos, descuidando el conjunto de valores intermedios. Puedesuceder que uno de los valores extremos esté accidentalmente desplazadoy no constituya por tanto un valor representativo; en este caso el recorridosería exagerado y la dispersión aparecería distorsionada. En la primeraserie del ejemplo anterior el recorrido (R) es de 81 - 3 = 78, mientrasque en el segundo es de 53 – 15 = 38. Si los calificativos del curso dematemáticas tiene un recorrido (04 - 18) y el de estadística (02 - 20)considerando que en ambos cursos asisten igual número de estudiantes,diremos que el curso de estadística tiene un rango de calificaciones mayorque el de matemáticas. Esto es que en estadística las calificaciones estánmás dispersas o diseminadas que en matemáticas.

Su representación simbólica es:

R = Valor máximo - Valor mínimo

LECCIÓN N ° 3.1

MEDIDAS DE DISPERSIÓN

OBJETIVO ESPECÍFICO N ° 3.1Descubrir, identificar y explicar los Estadígrafos de Dispersión.

3.1 Concepto.-Una vez caracterizada la distribución a través de estadígrafos de tendenciacentral y conocido el tipo de asimetría, interesa tener indicaciones a travésdel grado de heterogeneidad con que la variable se distribuye en un conjuntode observaciones. Dos distribuciones pueden tener iguales estadígrafos detendencia central, sin embargo pueden mostrar grado de dispersión diferente,como se puede observar en el gráfico que a continuación se muestra:

Gráfico N° 19

Evidentemente en la primera distribución (línea continua) los valores aparecenmás concentrados en torno al eje central, en tanto que en la otra aparecenmucho más dispersos. Si ambas distribuciones representan ingresos de dospaíses, se concluirá que en la primera distribución los ingresos son máshomogéneos, mientras que en la segunda se observará gran disparidad entreingresos altos, medios y bajos. Por consiguiente es necesario destacar laimportancia que tiene contar con indicadores que pudieran mostrar este tipode características en una distribución; sobre todo en lo que se refiere adistribución de ingresos, distribución de puntajes. En la lección anterior noshemos limitado a poner de manifiesto un valor conjunto de todos los datos dela serie, pero no la describen de un modo perfecto ya que no dan indicación

Fi

Xi

Page 74: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES146 147ESTADÍSTICA APLICADA A LA EDUCACIÓN

Aplicando la formula:

Reemplazando valores tenemos:

Interpretando; hay una desviación de 2.78 con respecto al valor central.La desviación media es un estadígrafo mejor que el rango ya quetoma en cuenta todas las observaciones o datos.

Propiedades:1. La desviación media es superior al recorrido y a la desviación

cuartílica, pues toma en cuenta cada elemento y es más simpley se ve menos afectada por la presencia de valores extremos,por lo tanto se usa a menudo en muestras pequeñas que incluyenvalores extremos

2. La principal deficiencia surge del hecho que promedia losvalores absolutos de las desviaciones, esto es que reconoce elsigno de las desviaciones. Esto se hace menos convenienteque la desviación Standard.

Cuartiles, Deciles y Percentiles de Datos No ClasificadosUna vez ordenados los datos tales que x

1 ≤ x

2 ≤ ... ≤ x

n. El Cuartil

j-ésimo es el valor del dato que ocupa la posición (j/4) (n+1) en elordenamiento. El Decil j-ésimo es el valor del dato que ocupa laposición (1/10) (n+1) en el ordenamiento. El percentil j-ésimo.Es el valor del dato que ocupa la posición (j/100) (n+1) en elordenamiento.Si la posición no resulta entera, se hace una interpolación linealentre los dos valores correspondientes a las dos observacionesentre las cuales se encuentran la fracción.

Ejemplo 1:Dado el siguiente conjunto de datos: 28, 34, 12, 25, 31, 14Calcular los tres cuartilesOrdenando: 12 14 25 28 31 34

x1

x2

x3

x4

x5

x6

Primer Cuartil: j = 1 y n =6(1/4) (6+1) = 1.75

Posición o 12 14 25 28 31 34 Posición n + 1

o x1

x2

x3

x4

x5

x6

Q1

Md. Q3

Estableciendo proporciones, se tiene:

Q1 = x

1 + (x

2 - x

1) (0.75)

= 12 + (14-12) (0.75)= 12+ (2) (0.75)= 12+ 1.5= 13.5

3.1.2 Desviacion Media (D.M.).- Es una medida de variabilidad que seobtiene promediando los valores absolutos de las desviaciones delos datos con respecto a su media.La formula para calcular es:

Ejemplo: Hallar la desviación Media de la Tabla adjunta:

Tabla N° 3.1.1

[Intervalo> f i Xi fi Xi|Xi – X |f i

0 – 3 8 1.5 12 45.63 – 6 14 4.5 53 37.86 – 9 20 7.5 150 6.09 – 12 12 10.5 126 39.612 – 15 6 13.5 81 37.8Total 60 432 166.8

Page 75: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES148 149ESTADÍSTICA APLICADA A LA EDUCACIÓN

La varianza se define como:

V(X) = M [Xi – M(X)] 2

“La varianza es la medida o promedio del cuadrado de lasdesviaciones de la variable respecto a su media”

Se escribe también simbólicamente de la siguiente manera:

Cálculo de la Varianza.-i. Método Directo

a. Para Datos No Agrupados (Datos originales Xi):

Ejemplo: Sean los valores: 5, 6.5, 5, 7, 6.5. Hallar lavarianza.Solución: Primero hallamos la media aritmética. AquíX = 6.Luego aplicamos la fórmula:

b. Para Datos Agrupados

Ejemplo: Calcular la varianza de los sueldos de unconjunto de 70 profesores de la UNJFSC de Huachoque se percibe.

Segunda Cuartil: j = 2 y n = 6(2/4) (7) = 3.5 Posición no entera. Se procede como en el casoanterior. Donde Q= 26.5.

El número de observaciones menores que 26.5 son iguales alnúmero de observaciones mayores que 26.5.

Tercer Cuartil: j = 3(3/4) (n +1) = (7) = 5.25 Posición no entera luego Q

3 estará entre

x5 y x

6

Q3 = X5 + 0.25 (x6 – x

5) = 31 + (0.25) 3 = 0.75 = 31.75

3.1.3 El Recorrido Intercuartílico (Q).- La desviación cuartíl es unconjunto de datos que esta definido por:

Donde: Q1 y Q3 son el primer y tercer cuartíl de los datos a vecesse usa el “Recorrido Intercuartílico Q3 y Q1”.El recorrido intercuartílico o desviación cuartíl da una idea dedispersión del 50% de los datos centrales.

Ejemplo: Considerando que los sueldos de 65 trabajadores de laUNJFSC de Huacho. Se tiene que Q1 = 68.25 soles y que Q3 =90.75 hallar la desviación cuartíl.

Observación: También se puede considerar que ˚ (Q1/Q3) comouna medida de tendencia central, que permitirá obtener un valoraproximado de la media o sueldo promedio.

(68.25 + 90.75) = 79.5 soles

3.1.4 La Varianza (S2).- Es el estadígrafo de dispersión másimportante y expresa el grado de dispersión de las observacionesrespecto a la media aritmética. Se denota de diferentes maneras:s2; V(X); V(Y), s2

Page 76: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES150 151ESTADÍSTICA APLICADA A LA EDUCACIÓN

M(X) = 550; Media AritméticaV(X) = S2 = 23028.6, Varianza.

Al duplicarse los sueldos K = 2.V (2X) = 22V(X) = 4(230.28.6) = 92112 Poraplicación de la cuarta propiedad.

El nuevo sueldo promedio al duplicarse los sueldos es:M (2X) = 2M(X) = 2(550) = 1100

5. La varianza de la suma de una variable mas unaconstante, es igual a la varianza de la variable.

V (X + k) = V (X)

Ejemplo: Si a cada uno de los 70 trabajadores seincrementa su sueldo en 50 soles. ¿Cuál será lanueva varianza y el sueldo promedio? Para hallar lanueva varianza emplearemos la quinta propiedad:

k = 50 entonces V (X + 50) = V (X) = 550, es decirun incremento constante a cada elemento no alterala distribución de la dispersión.

Por su parte el nuevo sueldo promedio quedaríaincrementado en 50 soles. Aplicando la propiedadde la Media Aritmética* tenemos:V (X + 50) = V (X) + 50

= 550+50= 600 soles

Si se incrementa en 50 soles el nuevo sueldopromedio sería de 600 soles.*”La Media de una variable más una constante esigual a la media de la variable más la constante”.

ii. Método Corto o Práctico para calcular la Varianza

Apliquemos la fórmula:

Propiedades de la Varianza.-1. La varianza de una constante es cero.

Si Xi = k; Vi -> V(X) = V(k) = 0

2. Si a todos los valores de una variable se le suma unaconstante k, su varianza no altera de valor.

Si Xi = Yi + c; Vi -> V(X) = V(Y+k) = V(X)

3. Si el valor de las observaciones son todas igualesentonces la varianza es cero. En este caso lasobservaciones se confunden con un punto, la mediaes el mismo punto y la desviación es cero:

S2 = 0/n = 0

4. La varianza del producto de una constante por unavariable es igual al cuadrado de la constante por lavarianza de la variable.

V (k.X) = k2 V (X)

Ejemplo: Supongamos que se duplica los sueldosde los 70 trabajadores ¿cuál es ahora la varianza yel nuevo sueldo promedio?, sabemos que:

Tabla N° 3.1.2

[Intervalo> X i fi (Xi – X) (Xi – X)2 (Xi – X)2 fi

220 – 320 270 6 - 280 78400 470400320 – 420 370 9 -180 32400 29160042 – 520 470 13 -80 6400 83200520 – 620 570 18 20 400 7200620 – 720 670 15 120 14400 216000720 – 820 770 7 220 48400 338800820 – 920 870 2 320 102400 204800

Total 70 1612000

Page 77: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES152 153ESTADÍSTICA APLICADA A LA EDUCACIÓN

Donde:X

r = media Aritmética del estrato r.

X = media aritmética total.n

r = tamaño del estrato r.

También:

Nota 1: El caso más simple es cuando se tiene dos estratos,dos subconjuntos o submuestras.Para dos estratos de medias X

1, X

2, de tamaño n

1, n

2 y

varianzas S21, S2

2 respectivamente.

n1 + n

2 =n

La varianza total es:

Luego:

Nota 2: Para dos estratos de tamaño n1 y n

2 que tienen

medias iguales y varianzas S1

2, S

2

2 respectivamente, la

varianza total está dada por:

n1

X1 S

1

2

n2

S2

2 X

2

Donde:

Componentes de la Varianza.-Si un conjunto de datos se divide en subconjuntos,categorías o estratos, es posible descomponer la varianzaen dos componentes.

Supongamos que un conjunto de datos ha sido dividido enF estratos o subconjuntos, cada estrato tendrá un tamaño(n

r) su respectiva Media Aritmética (X

r) y la varianza (S

2

r),

valores que expresan la importancia de cada uno de losestratos en el total del conjunto. En este caso la dispersióno variabilidad total puede estar afectado por:

- Las variaciones DENTRO DE CADA ESTRATO,esta variación en cada estrato se llama laINTRAVARIANZA (S

2

w).

- Las variaciones ENTRE LOS DIFERENTESESTRATOS, se llama la INTERVARIANZA (S

2

b)

Se expresa la Varianza Total = S2 = S2

w + S

2

b

i. Intravarianza: S2

w = M(S

2

r) Es el estadígrafo que

representa la variabilidad dentro de los estratos; definecomo el promedio de la Varianza de los estratos:

Donde:S

2

r = varianza del estrato r.

nr = tamaño de cada estrato.

ii. Intervarianza: S2

b =V (X

r) En el estadígrafo que expresa

la variación entre los estratos; se define como “lavarianza entre la media de los estratos”.

Page 78: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES154 155ESTADÍSTICA APLICADA A LA EDUCACIÓN

Reemplazando valores:

La Varianza Total es:

S = 6204.3 + 37145.3 = 43349.6

Aquí resultó que:

Lo que podemos concluir que la Variación o dispersióntotal se debe principalmente a la variación de los sueldosentre las diversas categorías de los trabajadores en laUNJFSC.

3.1.5 Desviación Típica o Desviación “Standard”.-Se llama así a la raíz cuadrada de la Media Aritmética de loscuadrados de las desviaciones de los datos de la serie respecto asu media Aritmética.

Se representa por la letra “s”, su expresión teórica a partir de ladefinición es pues:

Si en N el número de términos de la serie X su Media Aritmética.El cuadrado de la desviación s típica recibe el nombre de varianza.Su expresión teórica es:

Si se trata de una serie de términos agrupados, la desviación“Standard” tiene como expresión.

Tabla N° 3.1.3

Categorías Nº de Trab. Sueldo Prom. Varianzanr Xr Sr

2

Directivos 60 800 6400Profesores 100 500 400Empleados 300 250 8100

Ejemplo: En la UNJFSC de Huacho los trabajadores estánclasificados en directivos, profesores y empleados, delos cuales se conocen los siguientes indicadores:

¿Cuál es la varianza para la totalidad de trabajadores?Solución: Para lo cual elaboramos la siguiente tablaadjunta:

Según la fórmula:

Primero: Calculamos la INTRAVARIANZA

Segundo calculamos la INTERVARIANZA

2r

2r

2r

∑ 2r ∑ 2

r∑

Tabla N° 3.1.4

Categorías nr X r S S nr X r nr X nr

Directivos 60 800 6400 384000 48000 38400000Profesores 100 500 400 40000 50000 25000000Empleados 300 250 8100 2430000 75000 18750000

460 2854000 173000 82150000 nr S nr Xr nr X nr

Page 79: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES156 157ESTADÍSTICA APLICADA A LA EDUCACIÓN

Se considera alumnos normales cuya calificación quedacomprendida entre X – s y X + s, en nuestro caso:12.84 – 3.40 = 9.44 y 12.84 + 3.40 = 16.24

Como bueno los calificativos entre X + s y X + 2s, esto es entre12.84 + 3.40 = 16.40 y 12.84 + 2 (3.40) = 19.64.

Como extraordinario los de puntuación superior a X + 2 esto essuperior s 19.64.

Como medianos se estima los de calificación comprendidas entreX – s y X - 2s, es decir 12.84 - 3.40 = 9.44 y 12.84 - 6.8 = 6.04 ypor último como malos clasificaremos a los que han obtenidopuntajes inferiores a X - 2s esto es inferior a 6.04.

La distribución típica tiene en cuenta todas las observaciones y esde significación sencilla ya que es de la misma naturaleza que losdatos utilizados. Es particularmente útil en las distribucionesllamadas normales.

La varianza es una medida que tiene como unidades el cuadradode las unidades originales, tomando la raíz cuadrada obtendremosuna medida de dispersión en las unidades originales; razón por lacual la Desviación Típica es mas usual que la varianza sobre todoen el campo de estadística aplicada a la educación. La DesviaciónTípica poblacional se denota como.

3.1.6 Coeficiente de Variación.-Cuando es preciso comparar la distribución de varias series de datosEstadísticos, es preciso recurrir a un coeficiente de dispersiónrelativa. Este coeficiente, llamado Coeficiente de Variación CV, esel cociente de dividir la Desviación Típica por la Media Aritmética.Suele expresarse en forma de porcentaje; su expresión es, pues:

Con respecto a la distribución cuya Desviación Típica se adeterminado en el ejemplo anterior, el Coeficiente de Variaciónresulta ser:

Tabla N°. 3.1.5.

Inter. Xi fi Xifi Xi-X (Xi-X) 2 Fi(Xi-X) 2

2 – 4 3 4 12 -9.84 96.8256 387.30244 – 6 5 6 30 -7.84 61.4656 368.79366 – 8 7 10 70 -5.84 34.1056 341.05608 – 10 9 14 126 -3.84 14.7456 206.438410 – 12 11 28 308 -1.84 3.3856 94.796812 – 14 13 65 845 0.16 0.0256 1.664014 – 16 15 40 600 2.16 4.6656 186.624016 – 18 17 25 425 4.16 17.3056 432.640018 – 20 19 8 152 6.16 37.9456 303.5648Total 200 2568 2754.8800

Donde Fi es la frecuencia de cada clase, con ∑fi = N

Con referencia a la misma distribución, considerada en el párrafoanterior, la disposición del cálculo de la “Standard” sería:

Ejemplo: Calcular la Desviación Típica o Desviación Standardde la serie expresada en la tabla adjunta correspondiente a lospuntajes obtenidos por 200 alumnos en la especialidad de CienciasHistóricos Sociales.

Hallamos la Media Aritmética:

Calculamos la Desviación Típica:

S =3.4 La significación que en Estadística se da a la DesviaciónTípica (s) es la siguiente, con referencia al ejercicio efectuado.

Page 80: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES158 159ESTADÍSTICA APLICADA A LA EDUCACIÓN

tiene un rendimiento más homogéneo, es decir con menordispersión.

Solución: Empleamos el:

Para la especialidad de Primaria.Datos s1 = 20; X1 = 56

Para la especialidad de Inicial.Datos s2 = 20; X2 = 44.5

Para la especialidad de Matemáticas.Datos s3 = 20; X3 = 37.8

Comparando los resultados podemos afirmar que el rendimiento dela especialidad de Primaria es más homogéneo por que la dispersióne s menor que la de Inicial y de Matemáticas, en segundo lugar laespecialidad de Inicial y por último la especialidad de Matemática.

Características más Relevantes de la Varianza, la DesviaciónTípica y el Coeficiente de Variacióna) Las medidas de posición no son suficientes para caracterizar una

a distribución puesto que otro aspecto que debe tomarse en cuenta,es la variabilidad de las observaciones.

b) La varianza y la Desviación Típica sirven para verificar la confiabilidadde los promedio. Cuando la Varianza es pequeña la Media presentafielmente los valores individuales y es lo suficientemente confiablepara que sea un buen estimador de la Media poblacional. Cuando laVarianza es grande el promedio no es tan Típico y es poco confiable.

c) En el área de la investigación educativa donde se tiene datos deexperimentos previos, el Coeficiente de Variación es muy usadopara evaluar la precisión de los experimentos, comparando elCoeficiente de Variación de experimento en cuestión con losvalores del mismo en experiencias anteriores.

Que representa que la Desviación Standard es el 26.5 % del valorde la Media Aritmética.

Nota: Es una media de variabilidad relativa, por que es el cocienteentre la desviación Standard y la Media, y como tal es una númeroabstracto libre de especies y que generalmente se expresa enporcentajes.

A menudo estaremos interesados en comparar la variabilidad entredos o más conjuntos de datos cuando sus medias son iguales oaproximadamente iguales y expresadas en las mismas unidades,diremos que la distribución que tiene menos varianza, o menorDesviación Típica es la mas homogénea y la que tiene mayorvarianza o mayor Desviación Típica es la más heterogénea. Cuandolas medias no son iguales o las medias presentan distintas especieses imperativo el uso de una Media relativa de dispersión como ELCOEFICIENTE DE VARIACIÓN Diremos que es la máshomogénea la distribución que tiene menor Coeficiente deVariación o más heterogénea la distribución que tiene menorCoeficiente de Variación o más heterogénea la que tiene mayorCoeficiente de Variación.El Coeficiente de Variación Poblacional se define:

Este índice de dispersión es muy útil cuando se quiere compararla variabilidad entre dos o más distribuciones de datos para explicarsu importancia considerando el ejemplo siguiente:

Supongamos que se administra una misma prueba de evaluacióno tres especialidades:

Educación Primaria, Inicial, Matemática.

Con los puntajes se calculan los rendimientos medios 56, 44.5 y37.8 puntos respectivamente y las dispersiones de los puntajes,obteniendo una desviación Standard de 20 puntos igual para lastres especialidades. Queremos saber cuál de las especialidades

Page 81: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES160 161ESTADÍSTICA APLICADA A LA EDUCACIÓN

b) Si Sk < 0 la distribución es sesgada a la izquierda, es decir tiene

asimetría negativa. La distribución extiende la cola hacia losvalores pequeños de la variable.Por otra parte también se deduce que hay asimetría cuando:Mo < Md < X Asimetría positiva X < Md < Mo Asimetría negativa.

Sesgada a la Der. Aprox. Simétrica Sesgada a la Izq.

Ejemplo: En la distribución de sueldos de los 70 profesores de la UNJFSCde Huacho se conoce: Que la X = 550 la Md = 558.80 Mo = 573.6, elQ1 = 439.2 Q3 = 633.3, S = 151.7.

Diga usted que tipo de asimetría hay en relación a los sueldos deprofesores.

Solución:Vamos a calcular con todas las fórmulas de Asimetría.

Observamos que con cualquiera de las fórmulas Sk es negativo por tantotiene asimetría negativa, es decir que hay un ligero promedio de sueldos

(Sk > 0) (S

k - > 0) (S

k < 0)

LECCIÓN N ° 3.2

MEDIDAS DE DEFORMACIÓN

OBJETIVO ESPECÍFICO N ° 3.2Descubrir, identificar y explicar los Estadígrafos de Deformación.

3.2Concepto.-3.2.1.- La deformación consiste en analizar la Simetría o Asimetría de las

distribuciones. Entre los estadígrafos de Asimetría o de Deformación setiene los propuestos por Karl Pearson.

El primer coeficiente:

Es el más usual.

El segundo coeficiente:

Se utiliza cuando la distribución es unimodal.También existe el coeficiente propuesto por Arthir Boeley:

El tercer coeficiente se utiliza cuando existen intervalos con extremosabiertos ilimitados y no es posible calcular la Media y consecuentementela Varianza Coeficiente Percentil de Asimetría.

Que se le llama el “Coeficiente Cuartíl de Deformación”. Si unadistribución es Simétrica entonces S

k = 0. El recíproco no siempre es

cierto, es decir si Sk = 0 no necesariamente implica que la distribución

sea simétrica.

De acuerdo al valor de Sk se tiene:

a) Si Sk > 0 la distribución es sesgada a la derecha. Es decir tiene

asimetría positiva. La distribución extiende la cola hacia los valoresgrandes de la variable.

Page 82: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES162 163ESTADÍSTICA APLICADA A LA EDUCACIÓN

Donde: Q es el recorrido SemiIntercuartil; P10

y P90

son los percentiles 10y 90

Platikurtica Mesokurtica Leptokurtica

3.2.3 Relaciones más Importantes entre las Medidas Descriptivas.-a) En distribuciones unimodales y simétricas o ligeramente

asimétricas, con n grande, ocurre lo siguiente.Entre X - S y X + S están incluidos aproximadamente el 67% delas observaciones.Entre están X - 2S y X + 2S incluidos aproximadamente el 95%de las observaciones.Entre X - 3S y X + 3S están incluidos aproximadamente el 99%de las observaciones.Los porcentajes dados están basados en la Curva Normal, queincluye el 68.27% en el primer intervalo (a una Desviación Típica),el 95.45% en el segundo intervalo (a dos Desviaciones Típicas) yel 99.73% en el tercer intervalo (a tres Desviaciones Típicas).

b) En distribuciones aproximadamente simétricas, la DesviaciónCuartílica es la más pequeña, le sigue en magnitud de DesviaciónMedia y la Desviación Standard es la más grande (Q DM S).Además Q (2/3)S; DM (4/5) S.

c) La transformación inicial:

mayores. Frecuentemente la distribución de salarios tiene asimetríapositiva por que existen muchos trabajadores que ganan poco y pocostrabajadores que ganan bien.

3.2.2 Estadígrafos de Apuntamiento o Kurtosis.-Se entiende por Kurtosis al grado de apuntamiento de una distribución.La Kurtosis se analiza comparando la distribución con la forma de unacurva normal o simétrica, con igual media aritmética y DesviaciónStandard que la distribución que se estudia.Si una distribución tiene relativamente un elevado pico o apuntamientose llama

LeptokurticaUna distribución Leptokurtica tiene concentradas la mayoría de susmediciones en el centro, por ello la diferencia entre las dos distanciasQ3 - Q1 y P90 - P10 tienden a ser muy pequeña; cuanto más elevado seael pico tanto menor es la diferencia entre estos dos rangos y cuandoQ3 - Q1 = P90 - P10.K -> , como límite.

Platikurtica si la distribución es achatada o plana.Cuanto más Platikurtica es la distribución tanto más el RangoInterpercentil tiende a superar al Rango Intercuartil y para una distribucióncasi plana.K -> 0, como límite.

Mesokurtica si la distribución es moderada o normal.

Nota:Para la curva normal K = 0.2630.Será mesokurtica si K tiende a 0.2630 por ambos lados.Será leptokurtica cuando la distribución se aleja hacia la derechatendiendo a .

Será platikurtica si se aleja hacia la izquierda tendiendo a cero.El estadígrafo más utilizado para analizar el apuntamiento es:

Page 83: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES164 165ESTADÍSTICA APLICADA A LA EDUCACIÓN

PRUEBA DE AUTOEVALUACION DE LA TERCERA UNIDA D

1. Dos distribuciones pueden tener iguales estadígrafos ......... sin embargopueden mostrar grado de:

2. El rango es una medida de ..........y discreta que nos proporciona la .......de la distribución de clases.

3. Desviación Media es una medida de variabilidad que se obtiene .........................los valores absolutos de la desviación de los datos con respecto a su ...................

4. Los recorridos intercuatílicos dan una idea de .............................. de losdatos centrales.

5. La varianza es la medida o promedios de ......................... de la .....................respecto a su media.

6. Los componentes de la varianza son: ............................................- Las variaciones de cada estrato se llama ..................................- Las variaciones entre los diferentes estratos se llaman ................................

7. La desviación Standard conocida también como ............................., sellama así a la ....................... de las desviaciones, de los de la serie respectode su .............................

8. Halle la medida de tendencia central y de variabilidad adecuada en cadauno de los siguientes conjuntos de datos y dar su significados.a) 45, 70, 5, 62, 50, 60, 150b) 1/20, 1/40, 1/60, 1/80, 1/100c) 20%, 60%, 100%, 140%

9. En la Universidad de Huacho se hizo un estudio sobre la edad de los trabajadoresa fin de establecer un plan de seguro, los resultados fueron los siguientes:

22 34 60 33 32 30 47 37 61 3834 30 47 41 55 67 32 49 46 4842 42 46 43 53 48 46 26 51 5355 41 57 44 45 68 31 51 47 5220 45 39 34 29 38 45 40 43 4448 27 58 45 49 42 28 56 58 5233 48 40 25 59 65 35 43 46 49 Se pide:

Estandarizada la variable X, en el sentido que la transformada Xes una variable con

Media O y Varianza 1.

Gráfico Nº 21Curva Normal Estandar Porcentaje de Área

y Dos Desviaciones Estandar

Page 84: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES166 167ESTADÍSTICA APLICADA A LA EDUCACIÓN

a) Halle el primer segundo coeficiente de asimetría o deformaciónpropuesto por Kart Pearson.

b) El coeficiente de asimetría de Boeley.c) ¿Cuántos trabajadores tiene por lo menos 50 años? Y que porcentaje

representan.d) ¿Qué porcentaje de trabajadores tienen entre 30 y 45 años?

10. La siguiente tabla de distribución de frecuencias representa los impuestospersonales de un conjunto de profesionales:

Impuestos (soles) ProfesionalesY, 1-1 Y,1 n10 20 3020 40 2540 60 1560 80 1380 100 12100 120 5 Se pide:

a) Calcule la varianza por lo métodos que conoceb) Calcule el coeficiente de variabilidadc) Si se reajusta los impuestos por persona en 20% ¿Cuál es la varianza?

11. En un examen de matemáticas de las 4 especialidades: Biología y Química,Matemática, Ciencias Sociales y Literatura, se obtuvieron los puntajes:12.4, 11.6, 13.8, y 10.5 con sus respectivas desviaciones Standard: 6.1,6.9, 5.4 y 7.1. ¿Cuáles son sus dispersiones relativas y en que orden debencolocarse las especialidades según su homogeneidad?.

CUARTA UNIDADDISTRIBUCIÓN NORMAL

Page 85: Profdosa - Estadistica Aplicada Educacion

169ESTADÍSTICA APLICADA A LA EDUCACIÓN

OBJETIVO GENERALAl finalizar el estudio de los contenidos de la cuarta unidad

el estudiante será capaz de conocer, identificar e interpretarvariables bidimensionales y hacer proyecciones.

LECCIONES

4.1 La Distribución Nor-mal.

4.2 Distribuciones Bidi-mensionales.

4.3 Regresión Lineal.

OBJETIVOSESPECÍFICOS

4.1 Interpretación de los datosderivados de la investiga-ción educativa

4.2 Interpretar, analizar,construir tablas bidimen-sionales de frecuencias

4.3 Analizar interpretar yaplicación de la regresiónlineal

CONTENIDOSANALÍTICOS

4.1 Concepto.4.1.1 Características de la

Curva Normal.4.1.2 Propiedades de la

Curva Normal.4.1.3 Prueba de normalidad.4.1.4 Aplicaciones de la

curva Normal deFrecuencias.

4.1.5 Áreas comprendidasen las Curvas.

4.2 Concepto4.2.1 Variables estadísticas

Bidimensionales.4.2.2 Distribuciones Biva-

riadas de frecuencias.4.2.3 Distribuciones Bidi-

mensionales de Datosclasificados.

4.2.4 D i s t r i b u c i o n e sMarginales.

4.2.5 Medias para Distri-buciones Bidimen-sionales.

4.2.6 Varianza para Distri-buciones Bidimen-sionales.

4.2.7 Covarianza.4.2.8 Correlación Lineal de

Pearson.4.2.9 Coeficiente de

Correlación Linea.

4.3 Diagrama de dispersión.4.3.1 Regresión.4.3.2 Regresión Lineal.4.3.3 Coeficiente de Deter-

minación.4.3.4 Error Típico de la

Estima.4.3.5 Observaciones Multi-

variadas Mixtas.

Page 86: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES170 171ESTADÍSTICA APLICADA A LA EDUCACIÓN

Gráfico Nº22Distribución del C.I de 742 niños tomados al azar

Gráfico Nº 23Rendimiento en Lenguaje

Puntaje obtenido en un Test de Lenguaje por 800 alumnos

La construcción de la curva normal se presenta en los cuadros adjuntos.Los gráficos N° 14, 15, 22 y 23, son curvas de frecuencias e histogramas,trazados con datos de mediciones mentales y educacionales. Por lo queobservamos entre sus características principales se puede anotar:

200

150

100

50

80 90 100 110 120Cociente de inteligencia

LECCIÓN N ° 4.1

LA DISTRIBUCIÓN NORMAL

OBJETIVO ESPECÍFICO N ° 4.1Identificar, explicar el comportamiento de la Distribución

Normal.

4.1 Concepto.-Muchos datos estadísticos relacionados con problemas educativos y sociales

se comportan conforme a la distribución normal, es, por lo tanto consideradacomo el tipo más importante entre las diferentes distribuciones de probabilidad.Cuando la distribución normal se muestra gráficamente la curva que representala distribución llamada la CURVA NORMAL , es simétrica o en forma decampana. Puesto que la distribución normal es simétrica, el punto medio bajo lacurva es la media de la distribución. La forma de la curva normal indica que lasfrecuencias de una distribución normal están concentradas en la porción centralde la distribución y los valores hacia arriba y hacia abajo de la Media estánigualmente distribuidos.

4.1.1 Características de la Curva Normal.-La Curva Normal es un tipo de curva uniforme y simétrica cuya formarecuerda a muchos una campana y por lo tanto se conoce como “Curva enforma de Campana”. Tal vez el rasgo más sobresaliente de la curva normales su simetría, si doblamos la curva en su punto más alto al centro,crearíamos dos mitades iguales, cada una fiel imagen de la otra. Además,la curva normal es unimodal, ya que solamente tiene un pico o puntomáximo de frecuencia, aquel punto en la mitad de la curva en el cualcoincide la media, la mediana y la moda. Desde el pico central. La Curvacae gradualmente a ambas colas extendiéndose indefinidamente en una yotra dirección, acercándose más y más a la línea de base sin alcanzarlorealmente.

250

200

150

100

50

20 30 40 50 60 70 80 90 100Rendimiento de Lenguaje

Page 87: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES172 173ESTADÍSTICA APLICADA A LA EDUCACIÓN

Desviaciones Típicas; 99.7% probabilidades, en 100, para quecaiga entre la Media y ± 3 Desviaciones Típicas.

2. El 50% (constituyen el grupo medio) de los casos, se hallacomprendido entre los límites de ± 1 error de Probabilidad el82.26%, entre los límites señalados por ± 2 error de Probabilidad;el 95.70% entre los de ± 3 error de probabilidad; el 99.30%, entrelos de ± 4 error de probabilidad.

c) Entre las medidas de variabilidad existen las siguientes relacionesconstantes.

1. E. P = 0.6745 s.2. s = 1,4826 E.P3. E.P = 0.8453 D.M4. s = 1.2533 D.M5. D.M. = 0.7979 s.6. D.M. = 1.1843 E.P

4.1.3 Prueba de Normalidad.-Es posible descubrir si una curva es o no aproximadamente normal, poruno de estos métodos.

a) Viendo en una tabla de frecuencias si hay o no tendencia a formarsegrandes masas en los intervalos centrales y pequeños en losextremos.

b) Trazando una curva de frecuencias a fin de ver si esta tomo laforma general de la curva normal.

c) Investigando si, más o menos, el 68% de los casos está incluido enel área señalado por + 1 s; tomado a ambos lados de la Media.

d) Calculando si el valor de Q es aproximadamente igual a los dostercios del valor de s.

e) Trazando la ojiva de los datos en el “papel de probabilidad” paraver si los datos se atienden en línea recta.

Tablas de Frecuencias de las Distribuciones Normales.-La ecuación de la curva es:

Donde se tiene:

a) Todos presentan la misma forma general.b) Que los datos se concentran alrededor del promedio.c) Que las medias se dispersan simétricamente desde el valor central

hacia los extremos.d) Que el incremento de las frecuencias de los puntajes obtenidos de

menos a mayor hasta el valor central es continuo y regular.e) Que el incremento de las frecuencias desde el valor promedio,

hacia el extremo superior también es regular y continua. si selevanta una perpendicular desde el valor de la Media Aritméticasobre el eje de las abscisas. Ella dividirá el gráfico en dos partesde forma semejantes y de áreas casi iguales. En consecuenciacada gráfico mostrará una simetría bilateral casi perfecta. La curvaperfectamente simétrica (superficie de frecuencia) hacia la cualtienden todas las curvas de adecuación es la que se observa en elgráfico N°. 24.

Esta es la Curva Normal de Probabilidades o simplemente la CurvaNormal.La interpretación de sus características es esencial para los estudiantesde Educación, estudiantes de Psicología Experimental y de MedicionesMentales Antes de proceder a un estudio de las técnicas de la toma dedecisiones es necesario lograr primero una comprensión de laspropiedades de la curva normal.

4.1.2 Propiedades de la Curva.-a) En la curva, la Mediana y la Moda son equivalente. Debido a la

simetría bilateral de la Curva, estas medidas deben caer exactamentesobre el punto medio de la distribución.

b) En la curva, las medidas de variabilidad comprenden ciertas fraccionesconstantes de su área:

1. Entre la Media y ± 1 Desviación Típica, están comprendidos,aproximadamente, los dos tercios de los casos de la distribución,constituyendo el grupo central; entre la media y ± 2 DesviacionesTípicas, aproximadamente, el 95%; entre la Media y ± 3Desviaciones Típicas, aproximadamente, el 99.70% de los casosde las distribución. Es una distribución de calificativos,aproximadamente hay 68 probabilidades, en 100, para que unanota caiga entre la Media y ± 1 Desviación Típica; 95probabilidades, en 100, para que caiga entre la Media y ± 2

Page 88: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES174 175ESTADÍSTICA APLICADA A LA EDUCACIÓN

frente a 1.0 se halla el número 3.413 ésta cifra indica que hay 3.413 casos de10,000 (el 34.13% del área total de la curva) entre la media y 1 sigma.Concretamente: el 34.13% de los casos de una distribución normal se hallaen el intervalo delimitado por la curva, la línea de la base y las ordenadaslevantadas sobre la media aritmética y sobre el valor de 1 sigma. Esta es larazón por qué se dice que entre la media y ± 1 sigma hay el 68.26% de loscasos de una distribución normal. Véase el gráfico Nº 24, para hallar elporcentaje de la distribución entre la media y 1,72 sigma, se localiza 1.7 enla columna x/; luego horizontalmente, en la columna 0.02 se lee 45.43 estacifra quiere decir que el 45.73% de los casos de una distribución normal caeentre la media y 1.72 sigma.

Debido a la simetría bilateral de la curva, las distancias anteriormentelocalizadas pueden ser tomadas a ambos lados de la media. Así, para hallarel porcentaje de la distribución comprendido entre la media y 1.32 sigma, selee en la columna 0.02, frente a 1.3 de la columna x/ la cifra 40.66.

Esta cantidad quiere decir que el 40.66% de los casos de la distribuciónnormal cae entre la media y -1.33 sigma.

Nota:La curva normal debe concebirse encerrando un área sujeta adeterminadas relaciones matemáticas. Por ejemplo, consecuentemente consu perfecta simetría, el área total se divide por el eje en dos áreas iguales. entanto que la curva sea efectivamente “normal”, se puede inferirmatemáticamente y por medio de las tablas elaboradas al efecto los tamañosparciales que resultan de sus división por ordenadas levantadas a distanciasdeterminadas. Para explicar esto es necesario hacer ver que el concepto de ladesviación Estándar o Sigma se liga estrechamente la de la Curva normal deFrecuencias. Como explicaremos luego si se levanta una ordenada a ladistancia y el eje, representa el 34.13% del área total. Claro está que podemosmedir esta sigma a un lado o al otro del eje, si la tomamos a ambos lados delárea comprendida entre las dos ordenes correspondientes abarcará el 68.26%del área total. Supongamos que hemos examinado a_100 alumnos con unaprueba, siendo sus resultados: X = 40 y s =12 (s = desviación estándar).

Supongamos, además que el polígono de frecuencias de este resultadocoincide exactamente con la Curva Normal. Puesto que X = 40, una s(desviación estándar) hacia arriba alcanzará hasta el valor 52 (40+12=52)según lo expuesto anteriormente los alumnos cuyos cómputos se hallan entre40 y 52 constituirán el 34.13% o sea 341 de los alumnos, aproximadamente.

X = medias (expresadas en desviaciones tomadas desde la media aritmética)señaladas sobre el eje de las X.

Y = altura de la curva sobre la línea de base representa la frecuencia de unvalor dado de x, o el número de individuos que alcanza determinadoscalificativos.

e = 2.7183, base del sistema de los logaritmos neperianos.π = 3.1416, razón de la circunferencia de círculo a su diámetro.N = número de casos.δ = desviación estándar de la distribución.

De la ecuación anterior, es posible computar el valor de la frecuencia (Y),reconociendo el valor de X. por ejemplo, calcular el número de individuosque alcanza scores entre dos puntos. Esta no es una labor sencilla;afortunadamente, existen tablas que muestran la frecuencia o la partefuncional de una distribución normal. El conocimiento de la estructura deestas tablas es necesario para el estadígrafo. Conociendo su estructura esposible calcular el porcentaje del área comprendido dentro de la curva y lasperpendiculares levantas sobre la línea de la base. El número de casos, lepermiten realizar una descripción completa de una curva que realmente seanormal; conociendo estos tres valores es posible reconstruir la curva. Estoha hecho posible elaborar tablas que presentan el porcentaje del área totalque cae dentro de determinados valores de las desviaciones estándarestomados desde la media aritmética.

Estructura de las Tablas Nº 4.1.1 y 4.1.2.-Estas tablas han sido elaboradas considerando n el área de la curva normal,arbitrariamente, 10,000 casos. En la tabla Nº 4.1.1, se puede leer las partesporcentuales del área de la curva. Cada área se halla comprendida entre lasordenadas levantadas a cierta distancia tomadas desde la media aritméticade la distribución, en unidades de la desviación estándar (sigma), el eje de labase y la curva.

En la columna, x/ se lee las distancias en décimos de tomadas sobre el eje delas X, desde el valor de la media aritmética; las distancias en centésimos desigma se hallan expresadas por las cifras de las columnas correspondientes0.00,0.01, 0.02, etc.

Para hallar el número de casos comprendidos entre la media aritmética y laordenada levantada a una distancia igual a 1 sigma, se procede así; se leeuno (1.0) en la columna que corresponde a X, debajo de la columna 0.00,

Page 89: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES176 177ESTADÍSTICA APLICADA A LA EDUCACIÓN

En tanto que, por su naturaleza, los datos obtenidos en un examen sean delos que tienden a distribuirse según los lineamientos de una Curva Normal,es posible interpretarlos según las propiedades de esta última. En ellosaplicamos los procedimientos y formulas estadísticas apropiadas de unadistribución normal, sin embargo, seria un error pretender a priori que entodos los rasgos y los grupos de individuos que se examinen sus resultadospuedan y deban ser manejados conforme con los principios citados. Puedendarse series de grupos, aun numerosos, cuya organización requiere de untratamiento distinto. El maestro y el investigador deben asumir siempre unaactitud crítica procurando apreciar, con el auxilio de las técnicas deestadísticas apropiadas, la naturaleza de los resultados que obtiene, a fin deno incurrir en falsas interpretaciones.

4.1.4 Aplicaciones de la Curva Normal de Frecuencias.-La Tabla N°. 4.1.1 que se muestra a sido elaborado por la aplicación dela fórmula básica de la Curva Normal de Frecuencias. Como veremos enseguida, el objeto de esta tabla es el de terminar las partes del área que selimitan entre la Media de ésta y las ordenes levantadas a diversas distanciass (desviación estándar). Las áreas parciales se expresan en términos deporcentajes. Por ejemplo en número 15.54 que aparece después del 0.4de la primera columna significa 15.54% del área total para ilustrar veamosel ejemplo siguiente ¿Qué parte del área total está comprendida entre laordenada a un s de distancia al eje? Si observamos el gráfico Nº 25 querepresenta la curva normal. Entre la ordenada levantada y el punto un s yel eje se halla la parte del área que tratamos de determinar (partesombreada). Consultando la tabla, buscamos en la columna X/ (primeacolumna) el número 1.0. A su lado derecho en la siguiente columna leemos34.13. este numero indica que el tamaño del área comprendida entre lamedia y la ordenada del punto es s es el 34.13% del área total.

Pongamos otro ejemplo ¿Qué parte del área total se encuentra entre laMedia y la ordenada del punto 2.55? en la columna x/ hallamos el número2.5 y en la hilera superior la fracción restante 0.5. El lugar que coincidede la hilera del valor 2.5 y de la columna de 00.5 es el porcentaje 49.46.La parte del área que se desea determinar comprende entonces el 49.46%del área total.Hasta el presente nos hemos referido a la parte de la curva que correspondea las sigmas del valor positivo. Dado el carácter simétrico de la curvanorma debe entenderse que para la determinación de las áreas parcialeshacia las distancias negativas, el procedimiento es exactamente el mismo.

Ahora ¿Cuántos alumnos se hallaran entre, -s (menos una desviación estándar)y la media? Restando una s de la Media tenemos: 40 – 12 = 28.13% abajo dela Media. Igualmente, tomando el área que se abarca hasta la distancia de 2s(dos desviaciones estándar) tendremos, entre la ordenada correspondiente yeje, un 47.72% del área total. En el ejemplo anterior sumando 2s = 24 a laMedia (40) se halla un 47.72% de los casos. Es decir entre 40 y 64 tenemoslos cómputos de 477 alumnos. Dado que la Curva Normal de Frecuencianunca llega a tocar su base, se puede tomar de ella un número infinito de s(desviación estándar) aunque prácticamente hasta la ordenada de los casos.Del eje hasta 3s, tenemos el 49.865%; tomando los porcentajes de amboslados tendremos el 99.73% del área total.

¿Qué importancia tiene el estudio de la Curva Normal de Frecuencias eninterpretación de los exámenes psicométricos?

El examen de grupos numerosos de alumnos, en algún rasgo físico opsicológico, generalmente arroja datos que se distribuyen en forma semejantea la Curva Normal de Frecuencias, así observamos los gráficos adjuntos 22y 23 representando sus distribuciones tienden a seguir los lineamientos delpolígono normal que se representa en la figura 25.

La razón por la cual muchas distribuciones de cómputos y de otrasmedidas son muy semejantes a las distribuciones que resultan en el azarde las moneadas o de los dados, puede deberse al hecho de que las primerascomo las segundas, son en sí distribuciones de probabilidades, ladistribución normal representa la probabilidad de la ocurrencia de variascombinaciones posibles de muchos factores (por ejemplo: monedas), enuna distribución normal todos los factores “n” vienen a ser independientesy de fuerza equivalente; la probabilidad de cada uno puede presentarse(por ejemplo que sea A) o de que no se presente (ejemplo que sea S) es lamisma. El hecho de que una moneda se presente una cara o un sello, esindudablemente determinado por un gran número de pequeñas (o“azarosas”) causas, las cuales pueden operar en un sentido o en otrodistinto; el impulso dado a la moneda, la altura desde la cual es arrojada,el peso de la moneda, la naturaleza del suelo en que caiga y otrascircunstancias semejantes. Por analogía la presencia o la ausencia de cadauno de numerosos y probables factores genéticos o ambientales, quepueden determinar la estatura o la inteligencia de los individuos, podrándepender de la recurrencia azarosa de un sin numero de causasimprevisibles”. (statistics. H.E. Garret).

Page 90: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES178 179ESTADÍSTICA APLICADA A LA EDUCACIÓN

restar 34.13 de 50.00 esto da 15.87.¿Qué parte del área se encuentra arriba de la ordenada de 1.55?

Hasta 1.55 del área parcial es de 43.94. Restando ésta de 50, resulta 6.06%del área total.

Para las sigmas tomadas en sentido negativo el procedimiento es elmismo. Por ejemplo: ¿Qué tanto por ciento del área se halla abajo de- 1.57? hasta -1.57 se abarca el 44.18% del área total. Restando estaparte del 50% que corresponde a la mitad inferior del área , nos da5.82% como respuesta.

Entre la ordenada de 1 y el eje hay un 34.13% del área total; hasta ladistancia de -2 se halla un área de 47.72%; etc.

Esta misma consideración nos permite comprender el procedimiento queen seguida se explica para determinar la parte del área total que se limitaentre coordenadas de sigmas tomadas a ambos lados de la curva.

¿Qué parte del área total se halla entre 1 y -1?

Véase en la figura 25 la parte del área buscada se halla entre los puntos 1y-1. Ya hemos visto, por la lectura de la tabla, que hasta 1 se halla el34.3% como esto es igual hacia ambos lados del eje, entonces el área quese desea determinar es igual a 34.13 más 34.13; esto es, a 68.26 podemosentonces decir que, tomando una sigma a ambos lados, es decir + 1 apartir del eje, abarcamos el 68.26% del área total.

Gráfico N° 25Curva Normal de Frecuecnias

¿Qué parte del área se encuentra hacia arriba de la ordenada de 1 ...?

Como hasta 1 tenemos un 34.13% del área total, para determinar la parterestante de la mitad del área, la que se halla arriba de 1.0..., debemos

-3s -2s -s 0 s 2s 3s

Page 91: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES180 181ESTADÍSTICA APLICADA A LA EDUCACIÓN

Tabla Nº4.1.2Tabla para determinar las partes delimitadas del Área Total de la Curva

Normal de Frecuencias según distancias tomadas desde la Media Aritméticay señaladas sobre el Eje de la Base en Unidades del E.P.

Por ejemplo: Entre la Media Aritmética y 1.85 E.P se halla el 39.39% del áreacomprendida dentro de la curva normal.

X 0.00EP0.0 00.000.1 02.690.2 05.370.3 08.020.4 10.630.5 13.200.6 15.710.7 18.160.8 20.530.9 22.81

1.0 25.001.1 27.091.2 29.091.3 30.971.4 32.751.5 34.421.6 35.971.7 37.421.8 38.761.9 40.00

2.0 41.132.1 42.172.2 43.112.3 43.962.4 44.732.5 45.412.6 46.032.7 46.572.8 47.052.9 47.48

0.05

01.3504.0306.7009.3311.9314.4716.9519.3521.6823.92

26.0628.1030.0431.8733.6035.2136.7138.1139.3940.58

41.6642.6543.5444.3545.0845.7346.3146.8247.2747.67

XEP3.03.13.23.33.43.53.63.73.83.9

4.04.14.24.34.44.54.64.74.84.9

5.05.15.25.35.45.55.65.75.85.9

0.00

47.8548.1748.4648.7048.9149.0949.2449.3749.4849.57

49.6549.7249.7749.8149.8549.8849.9049.9249.9449.95

49.9649.97149.97749.98249.98649.9949.99249.99449.995449.9965

0.05

48.0248.3248.5848.8149.0049.1749.3149.4349.5349.61

49.6849.7449.7949.8349.8749.8949.9149.9349.9549.96

49.9749.97449.9849.98549.98849.99149.99349.99549.99649.997

Tabla Nº4.1.1Tabla para determinar las delimitadas del area total de la Curva Normal

de Frecuencias, según las distancias sigma que se indican

x. .00 .01 .02 .03 .04 .05 .06 .07 .08 .090.0 00.00 00.40 00.80 01.20 01.60 01.99 02.39 02.79 03.19 03.590.1 03.98 04.38 04.78 05.17 05.57 05.96 06.36 06.75 07.14 07.530.2 07.93 08.32 08.71 09.10 09.48 09.87 10.26 10.64 11.03 11.4103 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.1704 15.544 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79

0.5 19.15 19.50 19.85 20.19 20.54 20.88 21.23 21.57 21.90 22.240.6 22.57 22.91 23.24 23.57 23.89 24.2 24.54 24.86 25.17 25.490.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.520.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.330.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.891.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.211.1 36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.301.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97 40.151.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62 41.771.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92 43.06 43.19

1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.411.6 44.52 44.63 44.74 44.84 44.95 44.05 45.15 45.25 45.35 45.451.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.331.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.061.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67

2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.172.1 48.21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.572.2 48.61 48.64 48.68 48.71 48.75 48.78 48.81 48.84 48.87 48.902.3 48.93 48.96 48.98 49.01 49.04 49.06 49.09 49.11 49.13 49.162.4 49.18 49.20 49.22 49.25 49.27 49.29 49.31 49.32 49.34 49.36

2.5 49.38 49.40 49.41 49.43 49.45 49.46 49.48 49.49 49.51 49.522.6 49.53 49.55 49.56 49.57 49.59 49.60 49.61 49.62 49.63 49.642.7 49.65 49.6 49.67 49.68 49.69 49.70 49.71 49.72 49.73 49.742.8 49.74 49.75 49.76 49.77 49.77 49.78 49.79 49.79 49.80 49.812.9 49.81 49.82 49.82 49.83 49.84 49.85 49.85 49.85 49.86 49.86

3.0 49.873.5 49.984.0 49.9975.0 49.99997

Page 92: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES182 183ESTADÍSTICA APLICADA A LA EDUCACIÓN

Fórmula para determinar el valor que corresponde a un cómputo (reglasa y b) es:

Donde:z = Valor sigmáticoC = CómputoX = Media AriméticaS = Desviación Estándar (o sigma)

Ejemplo:

¿Qué cómputo se halla a la siguiente distancia de 1.5 s de X?

Puesto que es igual a 6, 1.5s de Media será igual 1.5 x 6 = 9. Nuevepuntos arriba a la Media 25 es igual a 9 + 25 = 34 que es el cómputo quese halla 1.5 s arriba de la media.

a) ¿Qué cómputo es superado por el 65% de los casos de las series?Solución:El valor que se busca será aquel que sea superado por el 15% delos casos inferiores a la media. En la tabla vemos que el porcentajemás aproximada a ésta es 15.17 que corresponde 39s. Siendo s =6 el valor 0.39s será igual a 2.34 puntos. Restando este número depuntos de la Media 25 tenemos el cómputo 22.66 aproximadamente23, que es, el superado por el 65% de los casos.

b) Calificación SigmáticaQue los rangos porcentilares tienen por objeto asignar a losdiversos individuos de un grupo valores que, por hallarse basadosen porcentajes, nos permitían compararlos con los resultados deindividuos de otros grupos. Así por ejemplo: un alumno con unR.P. 70 es superior a otro con un R.P. de 50, puesto que el primerosupera al 70% de los individuos de su grupo, en tanto que elsegundo solo supera al 50% de su propio grupo.

Los valores sigmáticos tiene una utilidad semejante si decimosque el cómputo del alumno A en un examen determinadocorresponde al valor sigmático de 1.5 ¿Qué quiere decir esto?.Consultando la tabla diremos que 1.5s representa una superaciónde 43.32 sobre la Media, o sea 93.32 de la totalidad de la serie.

Aplicaciones a casos concretosSupongamos una serie que se forma con bastante aproximación a la CurvaNormal. Los datos que contamos son los siguientes:

N (Número de alumnos examinados) = 60X (Media Aritmética) = 25s (Desviación Estándar) = 6

1. ¿Qué porcentaje de los alumnos fueron superados por el cómputo 31?Puesto que la Media es 25, el Cómputo 31 la supera en 6 puntos se hallaarriba de esa Media con un s (s = 6 puntos). Buscamos en la tabla elporcentaje de casos que supera un s a partir de la Media. Este es 34.13pero además, la Media supera a un 50% de casos de la distribución,entonces concluimos que el computo 31 es superior al 84.13% de los 60casos, es decir a 50 de ello aproximadamente.

2. ¿Qué porcentaje y que numero de casos se hallan arriba del cómputo 20?Como este valor se halla a 5 puntos abajo de la Media 25 y como s = 6, ladistancia del cómputo con relación a la Media es de -.83 s. En la tablavemos que este punto somático limita el 29.67% del área a partir de laMedia. Es decir arriba del cómputo se halla el 29.67% de los casos másel 50% que supera a la Media Aritmética. En total, el porcentaje de casossuperiores al cómputo 20 es el 79.67% que corresponde a 48 casosaproximadamente.

Procedimiento seguido para la determinación de porcentajes de casosque supere o que son superados por un cómputo o valor determinado. Sesigue el siguiente procedimiento:

a) Restamos la Media del Cómputo dado.b) Dividimos este resultado entre el s de la serie.c) Este valor somático obtenido buscamos en la tabla, para determinar

el área limitada entre él y la Media.d) Si el valor sigmático buscado en la tabla es negativo el porcentaje

obtenido corresponde a casos inferiores a la Media y si es positivo,a los que se hallan arriba de ésta.

e) Una vez obtenido el porcentaje y enterados de que señala casosinferiores o superiores a la Media la resolución de cada problemaes fácil si se tiene en cuenta que cada mitad de la distribución a unlado y al otro de la Media tiene un valor de 50% de los casos.

Page 93: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES184 185ESTADÍSTICA APLICADA A LA EDUCACIÓN

a conservar las cifras decimales debido a que comprendenporcentajes considerables en el área o en el número de lasdistribuciones.

Con el objeto de corregir ambas deficiencias se ha ideado lasiguiente fórmula que convierte los valores z en números positivosy evitar el uso de los decimales, sin que por eso se alteren losvalores relativos que les corresponden.

Como se ve, a la fórmula de los valores z se le agrega un factorcomún (10) y sumando 50 como esta operación es general paratodos los casos, los resultados se mantienen entre sí en la mismarelación de los calores z.

Asignemos a los alumnos A. B. C.D y E.F. los valores T que lescorresponden según los cómputos que obtuvieron:

Para el alumno A. B.

Para el alumno C. D.

Para el alumno E. F.

En los valores T, puede observarse que un cómputo que correspondaa la Media Aritmética de la serie, obtendrá T = 50 además arriba deeste número corresponde aquellos valores T que superan a la mitad oa más de la mitad de los casos. Abajo del valor T 50 el porcentaje desuperación disminuye a medida que es menor el valor de T respectivo.

c) Calificación DecimalLa escala decimal, se aplica a la calificación de los exámenes segúndos procedimientos distintos:

1º El que podríamos llamarle cualitativo consiste en apreciarla claridad de cada uno de los trabajos de los alumnos

Ahora supongamos que se trata de comparar los siguientes 3alumnos según sus resultados en una prueba de inteligencia.

Ejemplo:Alberto Breña obtuvo cómputo de 15Carlos Díaz obtuvo cómputo de 30Eduardo Ferre obtuvo cómputo de 40.Los datos que tenemos del resultado de los exámenes son lossiguientes: Número de alumnos (N) = 120, Media X = 40, s = 8.Convirtiendo los cómputos en valores sigmáticos (z) que deacuerdo a la fórmula se tiene que:

El significado de estos valores z es el siguiente: (según la tabla)A.B. supera a 73.24% de los casos examinados, o sea a 88 de los120 alumnos, aproximadamente. C.D. supera a 10.56% de losalumnos examinados, o sea a 13 de los alumnos aproximadamente.

E. F, supera al 50% de los alumnos examinados, o sea 60 de los120.

Una vez que se adquiere cierta práctica en el manejo de los caloressigmáticos, basta el uso de ellos sin necesidad de transmutarlos anúmeros o porcentajes de alumnos para entender su significado.Un valor z de 0.0 significa que el cómputo correspondeexactamente a la Media aritmética de la serie. Un valor de 1.0suna superación de 48% en la distribución correspondiente -1scorresponde a un cómputo inferior que sólo supera al 16% de loscasos aproximadamente, etc. El defecto principal de los valores zradica en que expresan en unos casos en números negativos yotros, en positivos. Convendría mejor una valorización progresivade carácter positivo. Además, en los valores z, nos vemos obligados

Page 94: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES186 187ESTADÍSTICA APLICADA A LA EDUCACIÓN

alto coeficiente de validez. De hecho, las pruebas informales queelaboran los maestros se hallan muy lejos de satisfacerlas.Precisamente el contraste entre la supuesta exactitud de las pruebascomunes y la realidad de sus deficiencias es lo que da margen amuchos errores e injusticias en la realización de los exámenes.

Calificación Decimal conforme al procedimiento estadístico.-La figura siguiente explica la forma como se asigna lascalificaciones decimales sobre la base de los valores sigmáticos:

Se asigna 8 de calificación decimal a todos los cómputos que sehallan entre -0.5s y + 0.5s, 9 a los que estén entre -0.5s y 1.5s; 10a los superiores a 1,5s hacia abajo se asigna 7 a los casos que sehallan entre -0.5s y -1s; 6, a los que están entre -1s y -1.5s; 5, a losque queden comprendidos entre -1.5s y 2s; 4, a los inferiores a -2s.

Conforme esto, cuando se trata de calificar una serie de cómputos,primero hay que determinar la Media Aritmética y la DesviaciónEstándar; en seguida hay que determinar los puntos sigmáticosarriba indicados ya que para determinar el punto correspondientea -0.5s, basta restar de la Media Aritmética el número de puntosque corresponde a media sigma; para obtener el punto quecorresponde a 0.5s, debe sumar media sigma a la propia mediaetc.

Para ilustrar lo anteriormente explicado emplearemos el siguienteejemplo:

Se a tomado una prueba de 80 cuestiones de matemática aplicadaa la especialidad de inicial conformada por 30 alumnos. Loscómputos (aciertos) obtenidos por los alumnos son los siguientes:

a) Cómputos:50 47 46 46 44 43 42 41 41 4040 39 37 36 35 35 33 32 32 3130 30 28 27 27 22 21 19 15 11

b) Tabular los resultados anteriores y hallamos la Media Aritméticay la Desviación Estándar:

asignándole el valor decimal que le corresponde. De estamanera se califican los temas, las composiciones literarias,los dibujos, trabajos y aún las actuaciones personales delos examinados.

2º El procedimiento que llamaremos cuantitativos se basa enla aplicación de pruebas con un acierto numérico decuestiones, cada una de las cuales recibe una puntuaciónparticular, de modo que el alumno obtenga una calificaciónproporcional al número de sus aciertos. En este caso paraque una prueba merezca calificación de 10 deberá sertotalmente resuelta; si solo contesta el 90% de suscuestiones recibirá el valor de 9, etc.

a) Que la prueba fuera, en su conjunto, un instrumentode medida altamente válido, consistente y objetivo,puesto que sólo en estas condiciones podríaresponder a la importancia que se le concede a supuntuación para determinar la aprobación ycalificación de los alumnos.

b) Que la prueba representara en forma numéricamenteproporcional toda la extensión de la materia, demodo que el acierto o el error en un númerodeterminado de cuestiones correspondieranexactamente al conocimiento o desconocimientoproporcional de la materia.

c) Que las cuestiones fueran entre sí equivalentes desdeel punto de vista del contenido de la materiaconforme a la puntuación que se les asigna. Porejemplo, que una cuestión marcada con 2.5 puntosfuera equivalente por su contenido a todas lasdemás con la misma puntuación.

d) Que el desconocimiento por parte de los alumnosde un 59% de las cuestiones correspondieranrealmente al límite de deficiencia en la materia,puesto que un alumno sólo es aprobado si resuelvecomo mínimo un 60% de preguntas.

Como se ve, las condiciones antihéroes para la calificacióncuantitativa sólo les puede reunir una prueba estandarizada en un

Page 95: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES188 189ESTADÍSTICA APLICADA A LA EDUCACIÓN

c) Entonces teniendo en cuenta que X = 34; s = 9.42 y 0.5s = 4.71procedemos a determinar los límites entre los cuales se hallanlos cómputos correspondientes a cada grado de la escala decimal.

O sea: 34.00 + 4.71 = 38.71; para el límite inferior de loscómputos 9 de la calificación, se toma el superior de los 8, esdecir 38.71; el otro límite se obtiene sumando un sigma más a38.71; o sea 38.71 + 9.42 = 48.13. Los cómputos de las seriesque se hallen arriba de este último límite 48.13 obtienen 10 decalificación.

Para los casos de 7, el límite superior es el inferior de los de 8;29.29; su límite inferior se tiene restando media sigma a 29.29:29.29 -4.71=24.58

Este último valor es el límite inferior de los 5 y superior de losde 4. Todos los cómputos que se dan debajo de los 15.16, esdecir de -2.0s recibirán calificación de 4.

Las operaciones anteriores nos dan el siguiente cuadro: entrelos límites indicados se anotan los cómputos de la serie que sedesignan con la correspondiente calificación decimal:

Cal. Dec. Cómputos Límites10 50 48.139 47 - 46 - 46 - 44 - 43 - 42 - 41 - 41 - 40 - 40 - 39 38.719 37 - 36 - 35 - 35 - 33 - 32 - 32 - 31 - 30 - 30 29.907 28 - 27 - 27 24.586 22 - 21 19.875 19 15.164 15’–‘11

Observaciones:Solo un alumno obtuvo 10 calificacionesOnce alumnos obtuvieron 9 de calificaciónDiez fueron calificados con 8Tres con 7Dos con 6Uno con 5Dos con 4

[interv. > X Fi D fd fd 2

9 – 12 10.5 1 -7 -7 4912 – 15 13.5 0 -6 0 015 – 18 16.5 1 -5 -5 2518 – 21 19.5 1 -4 -4 1621 – 24 22.5 2 -3 -6 1824 – 27 25.5 0 -2 0 027 – 30 28.5 3 -1 -3 330 – 33 31.5 5 0 -25/55 0333 – 36 34.5 3 1 3 836 – 39 37.5 2 2 4 4539 – 42 40.5 5 3 1542 – 45 43.5 3 4 12 4845 – 48 46.5 3 5 15 75

[48 – 50] 49.5 1 6 6 36Total 30 30 326

Hallamos la Media Aritmética X, empleando el método breve:

Donde:∑fd = suma de la columna de los productos f.d. = 30c = anchura del intervalo de clase = 3n = número de casos en la serie = 30X s = media supuesta = 31

Reemplazando valores:

Hallamos las (Desviación Estándar) empleando el métodoabreviado:

Reemplazando valores:

Page 96: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES190 191ESTADÍSTICA APLICADA A LA EDUCACIÓN

Problema N° 2: Dada una distribución normal, cuya media es 58,50; sudesviación cuartil (Q) 8. Se pregunta:

a) ¿Qué porcentaje de la distribución cae entre las notas 30.10 y48.90?

b) ¿Cuáles son las probabilidades para que el calificativo de unalumno, tomado al azar, caiga entre 30.10 y 48.90?

En una distribución normal se tiene: Q = E. P. La nota 30.10 se hallará auna distancia de 28.40 unidades inferior a la media, o sea -3.55 E. P. queresulta de -28.40/8.00; la nota 48.90, a 9.60 unidades tomadas desde lamedia y -3.55 E. P. hay 49.17% de los casos de una distribución normal;el 29.0% de los casos caerá entre -1.20 E. P. y -3.55 E. P.; o sea entre loscalificativos correspondientes a 30.10 y 48.90. Las probabilidades sonde 20, en cada 100 casos, para que el calificativo de un alumno, tomadoal azar, caiga en el área de la curva delimitada por las notas 30.10 y48.90.

Problema N° 3: Dada una distribución normal, cuya media es 65 y sudesviación Standard 12, se pregunta: ¿entre qué límites de la zona centralse halla el 75% de los casos?

En una distribución normal, el grupo central, constituido por el 75% dela masa, está integrado por el 37.5% de los casos, tomados a ambos ladosde la media. En la tabla N° 13, se vé que 37.49 casos, de 10,000 (el37.49% de la distribución) cae entre la media y +1.15 desviacionesStandard, la misma proporción (37.49%), entre la media y -1.15desviaciones Standard. En consecuencia el 75% de los casos (el grupocentral), cae entre la media y ± 1.15 desviaciones Standard; o siendodesviación Standard = 12; entre la media ± 13.80 unidades. Añadiendo13.80 al valor de la media (65), se ve que el grupo central, constituidopor el 75% de la masa, se halla entre 51.20 y 78.80. Como se ilustra en elgráfico adjunto.

4.1.5 Áreas Comprendidas en la Curva.-Problema N° 1: La distribución de un examen final de Álgebra, delSegundo Año de Educación Secundaria, de 300 alumnos, se presentanormal; siendo su promedio de rendimiento 11.00 y su desviaciónStandard 3. Se pregunta:

a) ¿Qué tanto por ciento de los casos cae entre 8 y 14?b) ¿Qué tanto por ciento obtiene notas superiores a 14? ¿Inferiores a

8?c) ¿Qué tanto por ciento cae en la zona superior a 17?

La nota 14 es 3 puntos superior al promedio; 8.3 puntos inferior. Si seanaliza esta distancia de la escala tomando por unidad el valor de ladesviación estándar (desviación Standard = 3) de la distribución, se veque cada uno de estos puntos está a una distancia de una desviaciónStandard, considerada desde la Media. En una distribución normal, entrela media y ± 1 desviación Standard hay 68.26% de los casos de dichadistribución. Por consiguiente, el 68.26% de los casos de estádistribución caerá entre 8 y 14. Luego, las probabilidades son, de 6826en 10,000 o de 68 en 100, para que un calificativo cualquiera caigaentre 8 y 14. La nota 14 está en la zona superior de la curva, a 3 puntos(1 desviación Standard) de la Media; la nota 8, en la zona inferior, 3puntos (-1 desviación Standard) de este promedio. Por simetría bilateralde la curva, se tendrá:

31.74/2 = 15.87% de los casos obtendrán notas superiores a 14;el mismo porcentaje de alumnos, notas inferiores a 8.

La nota 17 es 6 puntos superior al promedio (2 desviaciones Standard).En las tablas respectivas se ve que el 47.72% de los casos cae entre lamedia y 2 desviaciones Standard. En consecuencia, 2.28% de los casos(5000 - 4772) debe caer en la zona superior a 17. En términos deprobabilidad hay 228 probabilidades en 10,000, (aproximadamente 2 encada 100) para que una nota cualquiera caiga en la zona superior a 17.

El calificativo final 5 es sigma inferior a la media. Entre la media 11 y lanota 5 hay 47.72% de los casos de la distribución. En consecuencia, 2,28%de los casos se hallará debajo de 5; las probabilidades son,aproximadamente, de 2 en 100 para que el calificativo de un alumnotomado al azar caiga debajo de la nota 5.

Page 97: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES192 193ESTADÍSTICA APLICADA A LA EDUCACIÓN

Gráfico N° 26

Problema N° 4: Dada una distribución normal, cuya mediana es 54 y sudesviación cuartil 14; se pregunta: ¿entre que límites se halla el grupoextremo superior, constituido por el 20% de la masa; y, el grupo inferior,por el 10%? Puesto que el 50%, de los casos de una distribución normal,se halla en la zona superior; el otro 50%, en la zona inferior; es naturalque el grupo extremo superior, constituido por el 20% de la masa, tengacomo límite inferior el 30% de los casos. En la tabla N° 4.1.2, se ve queel 30% de la distribución cae entre la mediana y 12.5 E.P. Como el valorde 1 E.P. de esta distribución es 14; el producto 12.5 x 14 = 17.50 indicaráque 1.25 E.P. se halla a 17.50 puntos sobre la mediana; o sea en el punto71.50. Por consiguiente, el límite inferior del 20% que se halla en elextremo superior del grupo es 71.50; el límite superior será el calificativomás alto logrado por un alumno de esta distribución.

El grupo extremo inferior, constituido por el 10% de la distribuciónnormal, tendrá, como límite superior el 40% de los casos, contables desa la mediana. Este 40% cae, justamente, entre la mediana y -1.90 E.P.el valor de 1 E.P. de la distribución normal es 14; por consiguiente. -1E.P. estará a 1.90 x 14= 26.60 unidades inferior a la mediana; es decir,en el punto 27.40. El límite superior del grupo extremo inferior,constituido por el 10% será 27.40; el límite inferior, la nota más bajade la distribución.

-37.5% +37.5%

+ 1.15s +1.15s

-3s 3s

51.2 0 78.8s = 12

LECCIÓN N ° 4.2

DISTRIBUCIÓN BIDIMENSIONAL

OBJETIVO ESPECÍFICO N ° 4.2Interpretar y construir tablas de frecuencias bidimensionales

4.2 Concepto.-En este capitulo se considera aquellas situaciones en las que el estadístico realiza

la observación simultanea de dos caracteres en el individuo, obteniéndose, portanto, pares de resultados. Tal es el caso de observar en una persona su peso y edad.

Los distintos valores de las modalidades que pueden adoptar estos caracteresforman un conjunto de pares, que presentaremos por (X, Y) y llamamos variableestadística bidimensional.

4.2.1 Variables Estadisticas Bidimensionales.-

Distribución de dos caracteres.-Los dos caracteres observados no tienen por qué ser de la misma clase.Así, se nos pueden presentar las situaciones siguientes:

- Dos caracteres cualitativos. El sexo y el color de la piel en unalumno.

- Dos caracteres cuantitativos. El peso y la estatura de una persona.- Uno cualitativo y otro cuantitativo. La profesión y los años de

servicio.

En el caso de dos caracteres cuantitativos las variables que representansus valores pueden clasificarse:

- X discreta e Y discreta. Número de hermanos y número de hijosde una persona.

- X continua e Ycontinua. Perímetro craneal y perímetro toráccicode una persona.

- X discreta e Y continua. Número de hijos de una famiia y estaturade alumno.

- Xcontinua e Y discreta. Temperatura y pulsaciones.

Page 98: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES194 195ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ordenación de datos en tablas de doble entrada.-Hemos de considerar ahora que nuestra unidad de estudio es el par (X,Y) y que dos pares serán repetidos sólo cuando sus respectivascomponentes sean iguales.De otra parte hemos de observar que el número de modalidades distintasque adopta el carácter X no tiene por qué ser el mismo que el que adoptael carácter Y:

X = X1, X

2 .... X

r Y = Y

1, Y

2 ..... Y

s

Por tanto, parece lógico ordenar los datos de la mejor forma posible enuna tabla de doble entrada donde tengan cabida los “r” valores distintosde la variable X y los “s” valores distintos de la variable Y.Allí podremos expresar el númeero de veces que se repite cada par devalores posibles formado en el producto cartesiano de los dos conjuntosnuméricos.

(Xj, Y

i) vs f

ij

Es una tabla de contngencia de r filas s columnas.X1, X2..., Xr son valores (o marcas de clase) de la variable XY1, Y2,...,Ys son valores (o marcas de clase) de la variable Y.

4.2.2 Distribución Bidimensionales de Frecuencias que pueden serAbsolutas o Relativas.-

Distribución Bidimensional de Frecuencias AbsolutasEstamos frente a una tabla de doble entrada que define una Distribución

Bidimensional denominada: Distribución Bivariada de FrecuenciaAbsoluta o Distribución Conjunta de las Variables X, Y de FrecuenciaAbsolutas.

fij: Representa la frecuencia absoluta correspondiente a la i- ésima

fila y j-ésima columna.f

ij : Ocupa una “celda” o “casilla” de una tabla de doble entrada.

Si las “casillas” o “celdas” son ocupadas por las frecuencias relativas: hij

la distribución correspondiente se denomina:

Distribución Bidimensional de Frecuencias RelativasDistribución Bivariada de Frecuencia Relativas o DistribuciónConjunta de las Variables X, Y de Frecuencias Relativas.

Donde fij es el numero de veces que aparece repetido el par (x

i, y

j) y que

llamaremos frecuencia absoluta del par (xi, y

j).

Notaremos por hij la frecuencia relativa correspondiente al par (x

i, y

j),

que vendrá dada por la expresión.

Siendo N el número total de pares observados.

Hay que destacar las dos propiedades siguientes:

1) La suma de las frecuencias absolutas es igual al número de paresobservados.

2) La suma de las frecuencias relativas es igual a la unidad.

Ejemplo 01:1. A cincuenta alumnos se les ha preguntado la edad y se ha medido su

estatura obteniéndose.

Tabla N°. 4.2.1.

yiXi

X1

X2

Xi

Xr

Y1

f11

f21

:fi1

:fr1

Y2

F12

F22

:fi2

:fr2

Yj

f1j

f2j

fij

frj

...

...

...

...

...

...

...

Ys

f1s

f2s

:fjs

:frs

...

...

...

...

...

...

...

Page 99: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES196 197ESTADÍSTICA APLICADA A LA EDUCACIÓN

(Xi, Y

j), donde i = 1, 2, 3, 4 y j = 1, 2, 3, 4 considerando las marcas de

clase de cada intervalo.

Ejemplo 02:En una clínica se pregunta a sesenta pacientes por el número de días quellevan ingresados (X) y el número de veces que sus familiares les hanvisitado (Y) obteniéndose.

(Xi, Y

j), donde i = 1, 2, 3, 4 y j = 1, 2, 3, 4, 5, 6

Ejemplo 03:Se ha medido la capacidad pulmonar (X) y el perímetro toráxico (Y) acincuanta atletas obteniéndose.

Donde la variable X toma valores desde 1.80 a 2.05 y la Y desde 1.00 a1.70, pero como hemos agrupado en intervalos de clase, en la práctica X

tomará cinco valores e Y otros cinco, que son los que corresponderán alas marcas de clase, respectivamente.

4.2.3 Distribuciones Bidimensionales de Datos Clasificados.-

es importante anotar que:

y

luego se puede afirmar:

Para determinar las frecuencias relativas marginales se procede de formaanáloga, es decir:

y

donde se cumple:

Ejemplo 04:En una muestra de cien viviendas familiares, se tiene la siguientedistribución de frecuencias absolutas conjunta de variables, donde seconsidera como primera variable (X) el número de personas por vivienday como segunda variable (Y) en número de habitaciones por vivienda.

X Y

1.65-1.70 1.70-1.75 1.75-1.80 1.80-1.85 fi.15 3 5 1 4 1316 4 6 2 5 1717 3 2 0 2 718 5 3 4 1 13f.j 15 16 7 12

X Y

0 1 2 3 4 5 6f

i.

2 3 2 1 2 5 1 0 143 2 1 3 4 2 1 0 135 4 5 6 0 1 3 1 207 1 4 1 3 2 2 0 13f.j 10 12 11 9 10 7 1 60

1.00-1.14 1.14-1.28 1.28-1.42 1.42-1.56 1.56-1.701.80-1.85 1 2 1 2 1 71.85-1.90 2 1 3 4 3 131.90-1.95 4 1 3 2 3 131.95-2.00 1 3 1 5 1 112.00-2.05 2 0 3 1 0 6

10 7 11 14 8 50

Tabla N° 4.2.2Tabla de Doble Entrada

Xi yi

Y1

Y2

... Yj

... Ys

fj.

X1

f11

F12

... f1j

... f1s

f1.

X2

f21

F22

... f2j

... f2s

f2..

: : ... ... : ...

Xj

fi1

Fi2

... fij

... fjs

fi.

: : ... ... : ...

Xr

fr1

fr2

... frj

... frs

fr.

f.j f..1

f.2

... f.i

... f.s

n

Page 100: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES198 199ESTADÍSTICA APLICADA A LA EDUCACIÓN

a) Dar el valos y significado a las siguientes frecuencias absolutas: f13

,f

35, f

54, f

65.

b) Ilustre mediante el ESTEREOGRAMA (Gráfica análoga alhistograma o gráfica de barras para el caso de distribucionesbidimensionales).

(Xi, Y

i) vs f

ij

f13

= 1 significa que hay 1 vivienda con 2 personas y 3 habitaciones.f

35 = 3 significa que hay 3 viviendas con 4 personas y 5 habitaciones.

f52

= 4 significa que hay 4 viviendas con 6 personas y 2 habitaciones.f

65 = 3 significa que hay 3 viviendas con 7 personas y 5 habitaciones.

b) Estereograma

4.2.4 Distribuciones Marginales.-Dada una distribución de frecuencias bidimensionales se pueden obtenerunívocamente dos distribuciones de frecuencias marginalesunidimensionales, denominadas: Marginal en X y marginal en Y.

Ejemplo 05:Dada la distribución conjunta de las variables X, Y del ejemplo 4.a) Construir las marginales.b) Dar el valor y significado a las siguientes frecuencias: f

2., f

4., f

5., f.

6,

f.3

c) f2. = 25, hay 25 familias que tienen 3 personas.

d) f4. = 20, hay 25 familias que tienen 5 personas.

e) f5. = 13, hay 13 familias que tienen 6 personas.

f) f.6 = 12, hay 12 familias que tienen 6 habitaciones.

g) f.3 = 13, hay 13 familias que tienen 3 habitaciones

Si consideramos las frecuencias Relativas Marginales, el procedimientoes similar al anterior, por lo tanto, de la tabla N° 4.2.4 obtendremos losiguiente.

Xi yi

1 2 3 4 5 6 fi.

X1 = 2 3 2 1 4 2 0 12

X2 = 3 4 5 2 5 6 3 25

X3 = 4 3 5 2 1 3 1 15

X4 = 5 3 4 3 1 5 4 20

X5 = 6 3 4 2 0 1 3 13

X6 = 7 5 1 3 2 3 1 15f

.j21 21 13 13 20 12 100

1 2 3 4 5 6 C1 = Habitaciones2 3 2 1 4 2 0 C2 = Habitaciones3 4 5 2 5 6 3 C3 = Habitaciones4 3 5 2 1 3 1 C4 = Habitaciones5 3 4 3 1 5 4 C5 = Habitaciones6 3 4 2 0 1 3 C6 = Habitaciones7 5 1 3 2 3 1 C7 = Habitaciones

Tabla N° 4.2.3

Marginal en X Marginal en YX

if

iY

jf

i

X1

f1

Y1

f.1

X2

f2

Y2

f.2

: : : :X

if

iY

jf.

j

: : : :X

rf

rY

sf.

s

n N

Marginal en X Marginal en YX

if

iY

jf.

j

2 12 1 213 25 2 214 15 3 135 20 4 136 13 5 207 15 6 12

Total 100 Total 100

Page 101: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES200 201ESTADÍSTICA APLICADA A LA EDUCACIÓN

4.2.5 Medias para Distribuciones Bidimensionales.-Usando las marginales:

Luego se define el Vector de Medias como un par ordenado, cuyoscomponentes son X e Y. Vector de Medias = (X, Y).Determinar el Vector de Medias para el ejemplo 04.

Solución:Usando las Distribuciones Marginales (tabla 2). De acuerdo a la fórmulapara la medida de X, es necesario calcular los productos Xi, fi. luego susumatoria.

X1f

1. = (2)(12) = 24

X2f

2. = (3)(25) = 75

X3f

3. = (4)(15) = 60

X4f

4. = (5)(20) = 100

X5f

5. = (6)(13) = 78

X6f

6. = (7)(15) = 105

Luego ∑Xi fi. = 24 + 75 + 60 + 100 + 78 + 105 = 442

Finalmente la Media para Xi es igual a:

Para la media de Yj se debe hallar los productos Y

j. f.

j y luego su sumatoria:

Y1f.

1 = (1)(21) = 21

Y2f.

2 = (2)(21) = 42

Y3f.

3 = (3)(13) = 39

Y4f.

4 = (4)(13) = 52

Y5f.

5 = (5)(20) = 100

Y6f.

6 = (6)(12) = 72

Luego ∑Yi f.i = 21+ 42 + 39 + 52 + 100 + 72 = 326

El vector de medias es: (4.42, 3.26) es decir que hay un promedio de 4personas y 3 habitaciones por vivienda.

4.2.6 Varianza para Distribuciones Bidimensionales.-Siendo X

i la marca de clase de los intervalos de X, y Y

j, la marca de clase

para los intervalos de Y varianza de X está dada por la fórmula:

ó

Usando la conjunta:

Tabla N° 4.2.4

Xi yi

1 2 3 4 5 6 hi.

X1 = 2 0.03 0.02 0.01 0.04 0.02 0.00 12

X2 = 3 0.04 0.05 0.02 0.05 0.06 0.03 25

X3 = 4 0.03 0.05 0.02 0.01 0.03 0.01 15

X4 = 5 0.03 0.04 0.03 0.01 0.05 0.04 20

X5 = 6 0.03 0.04 0.02 0.00 0.01 0.03 13

X6 = 7 0.05 0.01 0.03 0.02 0.03 0.01 15h.

j0.21 0.21 0.13 0.13 0.20 0.12 100

Marginal en XX

if

i.h

i.

2 12 0.123 25 0.254 15 0.155 20 0.206 13 0.137 15 0.15

Total 100 1.00

Marginal en YYj

f.j

h.j

1 21 0.212 21 0.213 13 0.134 13 0.135 20 0.206 12 0.12

Total 100 1.00

Tabla N° 4.2.5

Page 102: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES202 203ESTADÍSTICA APLICADA A LA EDUCACIÓN

la Varianza de Yj está dada por la fórmula:

Es igual a lo siguiente:

Ejemplo 06:Con los datos del ejemplo 04, calcular la varianza utilizando lasdistribuciones marginales.De acuerdo a la fórmula debemos calcular X2

i:

Reemplazando en la fórmula anterior tenemos:

la varianza de Y par lo cual tenemos:

4.2.7 Covarianza para Distribuciones Bidimensionales.-

ó

Ejemplo 07:Calcular la covarianza para el ejemplo 04:Para hallar la covarianza tenemos que construir una tabla de distribuciónconjunta, en la cual se considera en la primera columna todos los pares dedatos de la forma (X

i, Y

j), y en la segunda columna las frecuencias absolutas

de cada celda (fij) y la tercera columna con los productos X

i, Y

j, f

ij.

Xi

fi.

Xif

i. X2

iX2

if

i.

2 12 24 4 483 25 75 9 2254 15 60 16 2405 20 100 25 5006 13 78 36 4687 15 105 49 735

Total 100 442 139 2216

Yj

f.i.

Yjf.

jy2

jy2

jf.

j

1 21 21 1 212 21 42 4 843 13 39 9 1174 13 52 16 2085 20 100 25 5006 12 72 36 432

Total 100 326 91 1362

Tabla N° 4.2.5

(Xi, Y

j) f

ijX

i, Y

j, f

ij

(2, 1) 3 6(2, 2) 2 8(2, 3) 1 6(2, 4) 4 32(2, 5) 2 50(2, 6) 0 0(3, 1) 4 12(3, 2) 5 30(3, 3) 2 18(3, 4) 5 60(3, 5) 6 90

Page 103: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES204 205ESTADÍSTICA APLICADA A LA EDUCACIÓN

4.2.8 Correlación Lineal de Pearson.-La correlación expresa el grado de asociación entre las variablesconsideradas, es decir, denota la interdependencia entre datos cuantitativoso cualitativos.Cuando se determina que las variables están íntimamente asociadas esdecir satisfacen exactamente a una ecuación, se dice que hay unacorrelación perfecta entre las variables. Si todos los puntos están alrededorde una recta, la correlación se dice lineal.

4.2.9 Coeficiente de Correlación Lineal.-El coeficiente de correlación, es el estadígrafo que expresa o mide elgrado de asociación o afinidad entre las variables relacionadas.

Denotada por r, se define:

la raíz cuadrada de la razón entre ∑(Yest

- Y)2 y ∑(Y - Y)2 donde Y es lamedia de Y, recibe el nombre de coeficiente de correlación y se representapor r.Es decir:

Esta ecuación se puede expresar también como:

Otra fórmula alternativa para r:

Donde Sx es la desviación estándar de la variable X y Sy es la desviaciónestándar de la variable Y.

El coeficiente de correlación poblacional se denota por ρ

(3, 6) 3 54(4, 1) 3 12(4, 2) 5 40(4, 3) 2 24(4, 4) 1 16(4, 5) 3 60(4, 6) 1 24(5, 1) 3 15(5, 2) 4 40(5, 3) 3 45(5, 4) 1 20(5, 5) 5 125(5, 6) 4 120(6, 1) 3 18(6, 2) 4 48(6, 3) 2 36(6, 4) 0 0(6, 5) 1 30(6, 6) 3 108(7, 1) 5 35(7, 2) 1 14(7, 3) 3 63(7, 4) 2 56(7, 5) 3 105(7, 6) 1 42Total N = 100 ∑ = 1462

Aplicando la fórmula de la covarianza:

Page 104: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES206 207ESTADÍSTICA APLICADA A LA EDUCACIÓN

Cuando r = ± 1 se dice que X, Y están perfectamente y linealmentecorrelacionadas; en este caso, todos los puntos están alineados.Si r = 0 se dice que las variables no están correlacionadas linealmente.Si r ≠ 0, existe cierto grado de correlación entre X , Y.0 < r < 1, correlación positiva (o correlación directa). A un incremento deX se incrementa Y.-1 < r < 0, correlación negativa (o correlación inversa). A un incrementode X, la variable Y decrece.Si r ± 1. Se dice que la correlación es alta.Si r 0 (por la derecha o por la izquierda). Se dice que la correlaciónes pobre. -0.5 < r < 0.5

Ejemplo 08:Tomando los datos del ejemplo 04.a) Calcular e interpretar el coeficiente de correlación Pearson.

Donde :Covarianza S

XY = 2.108

Varianza [X] = S2X = 2.6236

Desviación estándar de X = SX = √ 2.6236 = 1.62

Varianza [Y] = S2y = 2.9924

Desviación estándar de Y = Sy = √ 2.9924 = 1.73

El coeficiente de correlación lineal de Pearson es 0.75 y nos dice queexiste algún grado de correlación lineal positiva o directa entre elnúmero de personas y el número de habitaciones por vivienda, entrelas 100 familias bajo estudio.

EJERCICIOS

1. Se han elegido al azar a 120 alumnos a los que se les ha preguntado laedad en años (X) y su peso en kilogramos (Y), se pide calcular:

a. Las distribuciones marginales de frecuencias absolutas y frecuenciasrelativas.

b. La varianza para ambos casos.c. La covarianza.d. El coeficiente de correlación lineal.

Xi

Yj 60 64 68 72 76 80

17 2 7 0 3 1 118 0 2 5 4 3 120 2 4 5 3 6 122 8 6 7 5 1 223 5 4 3 3 2 125 3 5 6 6 2 1

Page 105: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES208 209ESTADÍSTICA APLICADA A LA EDUCACIÓN

PRUEBA DE AUTOEVALUACIÓN DE LA LECCIÓNPRUEBA DE AUTOEVALUACIÓN DE LA LECCIÓN

1. Dado el siguiente cuadro estadístico que resume una investigación sobremonto de ventas de miles de soles (X) y años de experiencia en el trabajo(Y) de 50 personas.

X: Venta de miles de soles.Y: Años de experiencia.

X Y

[18, 15> [15, 12> [12, 9> [9, 6> [6, 3>

[0, 2> 3 1 2 0 1[2, 4> 1 2 3 3 0[4, 6> 4 6 5 2 1[6, 8> 2 4 2 1 3[8, 10> 1 0 4 2 0

X: Años de experiencia Y: Monto de ventas

a. Encontrar las distribuciones marginales de las frecuencias absolutas.b. Interpretar f

15. f

23, f

45, f

53

c. Interpretar f3., f

4., f

5.

d. Interpretar f.1, f.

2, f.

5

e. Calcular la varianza de X e Y.f. Determinar la covarianza .g. Hallar el coeficiente de correlación lineal e interpretarla.

2. En una clínica se pregunta a sesenta pacientes por el número de días quellevan ingresados (X) y el número de veces que sus familiares les hanvisitado (Y) obteniéndose.

X Y

0 1 2 3 4 5 6f

i.

2 3 2 1 2 5 1 0 143 2 1 3 4 2 1 0 135 4 5 6 0 1 3 1 207 1 4 1 3 2 2 0 13f.j 10 12 11 9 10 7 1 60

(Xi, Y

j), donde i = 1, 2, 3, 4 y j = 1, 2, 3, 4, 5, 6

Se pide:

a) Calcular la varianza de X y la desviación estándar de X.b) Calcular la varianza de Y y la desviación estándar de Y.c) Determinar la covarianza.d) El coeficiente de correlación lineal e interpretarlo.e) Representa gráficamente.

Page 106: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES210 211ESTADÍSTICA APLICADA A LA EDUCACIÓN

LECCIÓN N ° 4.3

REGRESIÓN LINEAL

OBJETIVO ESPECÍFICO N ° 4.3Interpretar y analizar la regresión lineal.

4.3 Diagrama Dispersión.-Representando las observaciones bivariadas en el plano cartesiano

obtendremos la gráfica de un conjunto de puntos que se denomina Diagramade Dispersión o “nube de puntos”.

A continuación presentamos algunos diagramas de dispersión y sus gradosde correlación:

Cuando se encuentran correlaciones bajas se cae en la tentación de concluirque no existe relación entre las dos variables; debe recordarse que la correlaciónr de Pearson refleja únicamente la relación lineal entre las dos variables; puedaque las dos variables estén relacionados en alguna otra forma que no sea lineal;

por ejemplo, exponencialmente; en este último caso la r de Pearson no será unamedida apropiada para establecer el grado de correlación entre las varibles.

Además el hecho de que dos variables tienden a aumentar o disminuirconjuntamente o que una aumente y la otra disminuya no implica queobligatoriamente una tenga algún efecto directo sobre la otra; r mide el gradode correlación lineal entre las variables, pero no necesariamente están provistode implicaciones de causa y efecto.

4.3.1 Regresión.-El problema de regresión surge cuando el estadístico o investigadorselecciona n valores: X

1, X

2 ..., X

n de la variable X, llamada variable

independiente y luego observa o mide los valores y1, y

2 ..., y

n de la

variable Y, llamada variable dependiente, obteniendo una muestradivariada de la forma:

(X1, Y

1), (X

2, Y

2), ..., (X

n, Y

n)

El Diagrama de Dispersión o “nube de puntos”, nos permite visualizarla tendencia que siguen estos puntos; nos puede mostrar si siguen unatendencia lineal, una tendencia exponencial o no se visualiza tendenciaalguna.

En el diagrama de dispersión se visualiza que los puntos siguen unatendencia lineal; entonces diremos que la regresión de Y dado X es lineal.En el segundo diagrama se visualiza que la relación entre X e Y esexponencial; entonces diremos que la regresión de Y dado X esexponencial o curvilínea (regresión no lineal).En el tercer diagrama no se nota tendencia alguna, al menos de tipo lineal.

4.3.2 Regresión Lineal.-

Modelo: Y = a + bX

++

+

++

+

+++

++

Y

X

r = 0.30 ++

++

Y

X

r = -1

++

++

Y

X

r = 1

+ ++ +

+ ++

Y

X

r = 0.95

** *

*

Tendencia Lineal* *

**

***

Tendencia Exponencial Tendencia no Lineal

Page 107: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES212 213ESTADÍSTICA APLICADA A LA EDUCACIÓN

Error residual:

y: son los valores medidos a partir de la Recta de Regresión.y

i: son los valores observados o medidos.

El problema se reduce a calcular o estimar los parámetros a, b de la rectade regresión, por el método de mínimos cuadrados:Si se dispone de una muestra divariada, los valores de X, Y son conocidos;en tanto, los parámetros a, b del modelo lineal son desconocidos y seobtienen a partir de las siguientes relaciones:

b: Se denomina coeficiente de regresión o pendiente de la recta deregresión, en este último caso, generalmente se representa por m.

a: Ordenada en el origen.

4.3.3 Coeficiente de Determinación.-Es el cuadrado del coeficiente de correlación r. Mide la Bondad de Ajuste.r2 = 1 : Ajuste perfecto. Todos los puntos están alineados.r2 1 : Ajuste excelente. (0.8 < r2 < 1)0.5 ≤ r ≤ 0.8 : Ajuste con reservas.r2 0 : Ajuste pobre. (0 < r2 < 0.5). No apta para extrapolaciones

o predicciones.r2 = 0 : La recta no se ajusta a la nube de puntos.

Ejemplo 09:Para los datos de la siguiente tabla donde:X = índice de rendimiento de matemática.Y = índice de rendimiento de historia.N = número de datos (8 alumnos).

Se pide:a) Ajustar la recta de regresión de Y sobre X.b) Ajustar la recta de regresión de X sobre Y.

Donde las constantes a y b se hallan mediante el sistema de ecuaciones:

De este sistema de ecuaciones se deduce los siguientes valores para lasconstantes a y b:

Si deseamos estimar el valor de x a partir de uno dado de Y se utilizará lalínea de regresión X sobre Y y esta definida por la expresión:

X = p + Yq, donde los valores de p y q se hallan mediante las formulas:

Por tanto la recta de regresión de Y sobre X no es la misma que la rectade regresión de X sobre Y.Sobre diagrama de dispersión podemos trazar “a ojo” o “mano alzada”una recta que a nuestro parecer indique la tendencia de la nube de puntos,si pedimos a otra persona que haga lo mismo trazará una rectaposiblemente distinta a la anterior y si ensayamos con más de dos personases probable que las rectas propuestas resulten diferentes; esta diversidadde criterios de carácter visual - subjetivo se supera mediante un métodomatemático que nos proporciona una recta única de regresión quesolamente depende de los datos muestrales. Este método se llama Métodosde Mínimos Cuadrados desarrollado por Gauss, que se formula de lasiguiente manera: De todas las rectas la que mejor se ajusta a la “nube depuntos” es aquella que hace mínima la suma de los cuadrados de loserrores residuales.

^

X Y1.98 2.152.64 2.182.31 2.392.18 1.292.10 1.981.63 1.361.85 1.232.43 2.89

Page 108: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES214 215ESTADÍSTICA APLICADA A LA EDUCACIÓN

Análogamente hallamos los valores de b:

b = 1.3

Entonces la Recta de Regresión de Y sobre X queda definida:

Y = -0.72 + 1.3X

b) Recta de Regresión de X sobre Y está definida por la ecuaciónX = p + Yq donde:

Reemplazando valores en p:

p = 1.19 q = 0.462

Entonces, la recta de regresión X sobre Y queda expresado por laecuación:

X = 1.19 + 0.4624Y

c) Para calcular el índice de rendimiento de historia esperado, si elalumno tiene un índice de rendimiento de matemáticas de 2.70.En la recta definida de la manera siguiente reemplazamos su valorde X.

c) ¿Cuál es el índice de rendimiento de historia de un alumno que tienede índice de rendimiento de matemáticas 2.70?

d) ¿Cuál es el índice de rendimiento de matemática de un alumno quetiene el índice de rendimiento de historia 2.90?

Solución:La recta de regresión de Y sobre X esta dada por la fórmula:Y = a + bX donde:

Por tanto es necesario hallar la siguiente tabla:

Reemplazando valores:

a = - 0.72

X Y X 2 XY Y 2

1.98 2.15 3.92 4.257 4.6232.64 2.18 6.97 5.755 4.7522.31 2.39 5.34 5.521 5.7122.18 2.29 4.75 4.992 5.2442.10 1.98 4.41 4.558 3.9201.63 1.36 2.66 2.217 1.8501.85 1.23 3.42 2.275 1.5132.43 2.89 5.90 7.022 8.352

∑X = 17.12 ∑Y = 16.47 ∑X2 = 37.37 ∑XY = 36.197 ∑Y2 = 35.966

Page 109: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES216 217ESTADÍSTICA APLICADA A LA EDUCACIÓN

4.3.4 Error Típico de la Estima.-Si Y

est representa el valor de la variable Y, estimada por la recta de

regresión de Y sobre X la medida de dispersión alrededor de la recta deregresión estará dada:

Syx

= ± , recibe el nombre de error típico de la estima, donde:

N: número de datos

∑(Y_Yest

)2 = sumatoria de los cuadrados de las diferencias entre el valorY dado y el valor Y estimado para cada X, esta ecuación puede escribirseen función de los valores ya conocidos como:

Y para calcular el error de estima de S2xy se emplea la siguiente fórmula:

Aplicación del ejemplo anterior:a) Hallar el error de estima S

yx

b) Hallar el error de estima Sxy

Solución:a) Para calcular el error de la estima S

yx emplearemos la siguiente

fórmula:

Y = -0.72 + 1.3XY = -0.72 + 1.3(2.70)Y = -0.72 + 3.51Y = 2.79

Entonces podemos estimar que un alumno que tiene índice derendimiento de matemáticas de 2.70 tendrá aproximadamente 2.79en historia.

d) Para calcular el índice de rendimiento de matemáticas esperado, si elalumno tiene un índice de rendimiento de historia de 2.90. En la rectadefinida de la manera siguiente reemplazamos su valos de Y.

X = 1.19 + 0.462YX = 1.19 + 0.462(2.90)X = 1.19 + 1.3398X = 2.53

Entonces podemos estimar que un alumno que tiene índice de rendimientoen historia de 2.90 tendrá aproximadamente 2.53 en matemáticas.

Recta de Regresión Mínimo Cuadrática de Y dado X (por otrafórmula alternativa)

Y = -0.72X + 1.3 Recta de Regresión Mínimo Cuadrática.

Bondad de Ajuste:

^

Page 110: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES218 219ESTADÍSTICA APLICADA A LA EDUCACIÓN

b) Para calcular el error de la estima Sxy emplearemos la siguientefórmula:

4.3.5 Observaciones Multivariadas Mixtas.-Las características de cada observación cuyo estudio simultáneo nosinteresa pueden ser todas de tipo cuantitativo. Tomando el último caso,por ejemplo, podemos estar interesados en estudiar la edad (cuantitativa),sexo (cualitativo), estado civil (cualitativo) y el ingreso familiar(cuantitativo). Entonces diremos que estamos frente a datos uobservaciones Multivariadas Mixtas.El tratamiento estadístico de las observaciones univariantes se extiendede una manera natural a las Multivariantes: Podemos calcular las medidasdescriptivas adecuadas, comparar frecuencias, hallar porcentajes, ilustrarmediante gráficas, etc.La información correspondiente se presenta en tablas que tienen las másvariadas formas que dependen de la cantidad de variables consideradasen el estudio e ingenio del investigador. Este tipo de tablas comúnmentese denominan: “Cuadros Estadísticos”.

AplicaciónDado el siguiente cuadro estadístico sobre ingresantes por especialidades,y modalidad de postulación y sexo, en el examen de admisión a laUniversidad de Huacho.

a) ¿Cuántos estudiantes ingresaron por traslado interno y de sexofemenino? Presentar esta información usando una distribución defrecuencias absolutas.

b) ¿Qué porcentaje de estudiantes ingresaron a la especialidad deEducación Primaria mediante concurso (examen de admisión)?Presentar esta información mediante una distribución de frecuenciasrelativas y procentuales.

c) ¿Qué marginales se pueden obtener? Presente algunas.

Solución:a) Estudiantes que ingresaron por traslado interno y de sexo femenino

son:

(Modalidad, Sexo) vs. Frecuencias Absolutas

Observando el cuadro elaborado afirmamos que por traslado externoingresaron 8 estudiantes de sexo femenino.

b) Qué porcentaje de estudiantes ingresaron a la especialidad deEducación Primaria mediante concurso.

Modalidad Mediante Primeros Traslado Traslado TituladosConcurso Puestos Interno Externo

Carreras H M H M H M H M H MEducación Inicial 02 49 3 5 2 1 0 2 2 3Educación Primaria 21 24 1 2 0 3 1 0 1 1Educación Física 27 31 1 3 2 1 0 1 0 2Lengua - Comunic. 18 21 0 2 2 2 2 1 1 0Matemática - Física 16 17 1 0 0 0 0 2 1 0Ciencia Hist. Social 15 18 1 1 1 1 2 0 0 1Biología - Química 11 14 0 2 1 0 2 2 2 1Total 110 174 7 15 8 8 7 8 7 8

Sexo Hombres MujeresModalidadConcurso 110 174Primeros Puestos 7 15Traslado Interno 8 8Traslado Externo 7 8Titulados 7 8

Page 111: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES220 221ESTADÍSTICA APLICADA A LA EDUCACIÓN

(Especialidades, Modalidades) vs. Frecuencias Absolutas

A la especialidad de Educación Primaria ingresaron 45 estudiantespor concurso.

Modalidad Concurso Primeros Traslado Traslado TituladosPuestos Interno Externo

EspecialidadesEducación Inicial 51 8 3 2 5Educación Primaria 45 3 3 1 2Educación Física 58 4 3 1 2Lengua - Comunic. 39 2 4 3 1Matemática - Física 33 1 0 2 1Ciencia Hist. Social 33 2 2 2 1Biología - Química 25 2 1 4 3

284 22 16 15 15

EJERCICIOS

1. La siguiente tabla es una muestra de 12 profesores de la facultad deeducación de la UNJFSC en la que X es la edad de los profesores, Y eltiempo de servicio.

X = edad 59 51 41 50 57 53 38 47 45 40 39 35Y = tiempo de servicio 26 20 11 18 25 22 8 13 16 12 14 8

a. Hallar el error de estima Syxb. Hallar el error de estima Sxyc. Calcular el coeficiente de correlación entre la edad y el tiempo de

servicio.

Para resolver el problema se empleará las siguientes fórmulas:

PRUEBA DE AUTOEVALUACIÓN DE LA LECCIÓ N

1. Se presentan los siguientes datos correspondientes a 10 alumnos queobtuvieron calificación de Matemáticas (X) y un test del CoeficienteIntelectual (Y) y se tiene los siguientes resultados:

∑X = 1117 ∑Y = 164∑X2 = 126 997 ∑Y2 = 3 184

∑XY = 18 862

a. Se pide encontrar la recta de regresión de Y sobre X.b. Si un alumno tiene un C.I. de 125 ¿Qué calificación alcanzará en

Matemáticas?.c. Calcule el Coeficiente de Correlación Lineal e interprételo.d. Encontrar la Recta de Regresión de X sobre Y.e. ¿Cuál es el calificativo si un alumno en matemáticas obtiene 19,

cuál será su C.I.?.

2. Los siguientes datos contienen las calificaciones de 12 estudiantes aquienes se les aplicó un test de inteligencia (X) y el examen final deEstadística Aplicada a la Educación.

X = test 84 87 68 96 65 75 70 81 90 89 74 80Y = estadística 66 84 56 81 74 94 77 86 79 81 69 71

a. Representar el diagrama de esparcimiento.b. Hallar la recta de regresión Y sobre X.c. Hallar la recta de regresión X sobre Y.d. Calcular Syx

y Sxy

.e. El coeficiente de correlación e interprétalo.f. Si un alumno obtuvo 80 en Estadística Aplicada a la Educación.

¿Cuánto obtendrá de coeficiente intelectual?.

Page 112: Profdosa - Estadistica Aplicada Educacion

223ESTADÍSTICA APLICADA A LA EDUCACIÓN

QUINTA UNIDADPROBABILIDADES

Page 113: Profdosa - Estadistica Aplicada Educacion

225ESTADÍSTICA APLICADA A LA EDUCACIÓN

OBJETIVO GENERALAl finalizar el estudio de los contenidos de la quinta unidad, el

estudiante será capaz de conocer, identificar e interpretar y resolverproblemas aplicados a la teoría elemental de probabilidades.

LECCIONES

5.1 Probabilidades.

5.2 Distribución en elmuestreo.

OBJETIVOSESPECIFICOS

5.1 Identificar y resolverproblemas de la TeoríaElemental de Probabi-lidades.

5.2 Identificar la naturaleza,criterio, elemento, método ytamaño de la Muestra.

CONTENIDOSANALÍTICOS

5.1 Breve Historia.5.1.1 Fenómeno Aleatorio.5.1.2 Espacio Muestral.5.1.3 Evento a suceso.5.1.4 Probabilidades de un

Evento.5.1.5 Probabilidad a

priori.5.1.6 Operaciones.5.1.7 Evento Mutuamente

Excluyente.5.1.8 Probabilidad condi-

cional.5.1.9 Probabilidad de la

Intersección de dosEventos.

5.1.10Independencia esto-cástica.

5.1.11Frecuencia Relativacomo Probabilidad.

5.1.12 Probabilidad Subje-tiva.

5.1.13Partición del espacioMuestral.

5.2 Introducción.5.2.1 Marco de Muestra.5.2.2 Método de Muestreo.5.2.3 Determinación del

Tamaño de laMuestra.

Page 114: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES226 227ESTADÍSTICA APLICADA A LA EDUCACIÓN

LECCIÓN N ° 5.1

PROBABILIDADES

OBJETIVO ESPECÍFICO N ° 5.1Interpretar y resolver problemas de la teoría de Probabilidades.

5.1 Breve Historia.-

“LA PROBABILIDAD NACE EN UNA MESA DE JUEGO”

Desde tiempos remotos los apasionados a los juegos de azar se caracterizaronpor utilizar artificios y estrategias ingeniosas que les permitiese obtenerganancias; con este propósitos le plantearon a Blaise Pascal la siguiente pregunta;¿Cuáles son las posibilidades de obtener dos ases al menos una vez en 4 tiradasde un par de dados? Pascal resolvió el problema satisfactoriamente y fue motivadopara proseguir y profundizar sus estudios, apoyando estrechamente por elmatemático Pierre Fermat;

Luego Jacob Bernoulli, Abraham Moivrre, Tomás Bayes y José Lagrangedesarrollaron la base teórica del Cálculo de Probabilidades. Pierre Simón Laplaceunificó estas primeras ideas y presentó la primera t6eoría de la mes de juegomuy pronto se extiende a las ciencias sociales y a las ciencias económicas espectrode aplicaciones en el campo científico y aspectos de la vida cotidiana.

Las probabilidades constituyen la columna vertebral, la base teórica y elfundamente de la Estadística Moderna.

Estaremos interesados en presentar los aspectos prácticos y aplicativos de lateoría de las probabilidades en la medida que nos sirva en nuestros estudios dela estadística y nos sea útil en la vida cotidiana.

Las probabilidades tienen que ver con los fenómenos que se presentan alazar, fortuitamente o de manera casual en la vida diaria; con ella podemos explicarlos azares de la vida, lo imprevisto, podemos controlar los posibles errores ytomar decisiones adecuadas. El maestro puede acotar y controlar con eficacialos grados de incertidumbre que muchas veces se presentan en el quehacer en elquehacer educativo, sobre todo, en la toma de decisiones.

Una compañía de seguros de vida requiere un conocimiento preciso de losriesgos de pérdida, la esperanza de vida de los asegurados, con el fin de calcularlas “primas “; sin el apoyo de las probabilidades, a través de las ciencias actuarias,ninguna compañía aseguradora garantizaría su permanencia y el éxito financieroesperado.

5.1.1 Fenómeno Aleatorio o Experimento Aleatorio.-Es aquel fenómeno que bajo las mismas condiciones experimentales sepresenta más de una manera. Siempre queda un margen de azar en ladeterminación del resultado del experimento. Aleatorio es sinónimo deazar.

Un fenómeno que bajo las mismas condiciones experimentales se presentade una única manera se denomina fenómeno determínistico y existenfórmulas matemáticas que describen el fenómeno, con las que se puedendeterminar el resultado del experimento.

Los fenómenos determínistico son estudiados por las ciencias naturales,la física, la química, etc.

Los fenómenos aleatorios son estudiados por la Teoría de la Probabilidades.

Ejemplo 1.a. El experimento consistente en dejar caer libremente una piedra

en el aire es un fenómeno determínistico, porque bajo las mismascondiciones experimentales, se presentará de una única manera:“caerá por la acción de la gravedad”

b. Lanzar una moneda al aire sobre una mesa es un experimentoaleatorio; unas veces resultará cara y otras veces sello. Si en esteexperimento “cargásemos” la moneda (revistiendo una cara conun metal pesado) de tal manera que al lanzarla sobre una mesasiempre resulte cara, el experimento dejaría de ser aleatorio ypasaría a ser determínistico.

c. En un partido de fútbol, los posibles resultados son: gane el equipoA, pierda A o empaten; es también un fenómeno aleatorio.

d. Son fenómenos aleatorios todos los juegos de azar: Barajas,loterías, carrera de caballos, la tinka, etc. Aunque en la carrera decaballos pueden existir factores que determinen al ganador (raza,jinete,...) no siempre ganan los “favoritos”, queda un margen deazar por lo que no podemos determinar exactamente al ganador.

Page 115: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES228 229ESTADÍSTICA APLICADA A LA EDUCACIÓN

e. También son fenómenos aleatorios las decisiones tomadas conriesgo en la vida cotidiana: Casarse o no, tomar uno u otro caminoen una bifurcación, etc.

f. Dentro de la ciencia actuarial, una vez que el asegurado paga su“prima” se entabla un verdadero juego de azar entre la compañíay el asegurado; en los seguros de vida, la compañía pierde si elasegurado muere pronto y gana en caso contrario. Si unapersona se asegura con la intención premeditada de quitarse lavida, el fenómeno dejaría de ser aleatorio.

5.1.2 Espacio Muestral o Espacio Demuestra.-Espacio muestral es el conjunto de todos los posibles resultados de unfenómeno aleatorio o el conjunto de todas las maneras posibles como sepresenta un fenómeno aleatorio.

El espacio muestral se denota con la otra griega omega (mayúscula): y asus elementos (resultados individuales del fenómeno aleatorio) se denotapor w o por cualquier otro símbolo.

Una característica de los resultados individuales es que son mutuamenteexcluyentes, la ocurrencia de un resultado individual excluye laposibilidad de ocurrencia simultánea de los demás. Si un fenómenoaleatorio ocurre, ocurre un y sólo un resultado individual.

Ejemplos 2.a. En el ejemplo 1 b), existen dos posibles resultados mutuamente

excluyentes: cara o sello ⇒ Ω = cara, sello.b. Si el fenómeno aleatorio consiste en lanzar una moneda dos veces

(o dos monedas a la vez) sobre una mesa, existen cuatro posiblesresultados, mutuamente excluyentes ⇒ Ω = (c,c), (c,s), (s,c),(s,s).

c. Si el experimento consiste en seleccionar dos estudiantesinmediatamente después de un examen para ver si están aprobadoso desaprobados, existen cuatro posibles resultados: Ω = aa, ad,da, dd; a : aprobado, d : desaprobado.

d. Si el experimento consiste en registrar la estatura de los estudiantes⇒ Ω = w ∈ R / estatura mínima < w < estatura máxima.

Pueden existir diferentes espacios muestrales asociados a un mismoexperimento aleatorio. En el ejemplo 1 c), si solamente deseásemos

estudiar la posibilidad de que el equipo A gane o no gane, el especio demuestra tendría solamente dos elementos; así tendríamos dos espaciosmuestrales diferentes para un mismo fenómeno aleatorio.

Ω2 = Gane, no Gane. Dos elementos.Ω1 = Gane, pierda, empate. Tres elementos.

El espacio muestral puede ser discreto como en los ejemplos 2ª, 2b y 2c;y puede ser continuo como en el 2d (registro de la estatura de losestudiantes)

5.1.3 Evento o Suceso.-Llamaremos evento o suceso a cualquier subconjunto de un espaciomuestral discreto. Simbólicamente: Si W es discreto,

A es un evento o suceso ⇔ A Ω

a. El conjunto nulo o conjunto vacío está contenido en cualquierconjunto, en particular es un subconjunto del espacio muestral, ycomo tal es un evento o suceso imposible

Simbólicamente:Como Ø Ω ⇒ Ø es un evento o sucesoEs un evento que nunca ocurre

b. Como Ω Ω ⇒ Ω es un evento o suceso llamado eventouniversal o suceso seguro. Es un evento que siempre ocurre.

c. A un subconjunto que tiene un único elemento (conjunto unitario)le llamaremos evento sencillo o suceso elemental.

Ejemplo 3.Sea el espacio muestral: Ω = aa, ad, da, dd

Aa : Los dos alumnos seleccionados resultaron aprobados.ad : El primer alumno aprobado y el segundo desaprobado.da : El primer alumno desaprobado y el segundo aprobado.d.d : Los dos alumnos seleccionados resultaron desaprobados.

Definamos los siguientes eventos:A = aa, ad, da : “Al menos un alumno aprobado”.

Page 116: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES230 231ESTADÍSTICA APLICADA A LA EDUCACIÓN

# (A): Cardinalidad de A o el número de elementos que tiene A.# (Ω): Cardinalidad de Ω o el número de elementos que tiene Ω.

Ejemplo 4Calcular las probabilidades de los eventos A, B, C, D, E, del ejemplo 3:

P (A) = 12, P (B) = 12, P (D) = 12, P(E) = 0

5.1.6 Operaciones.-Las operaciones entre eventos son las mismas ue entre conjuntos, es decir:Unión, intersección, diferencia y complemento.

Si A,B son eventos cualesquiera,A ∪ B es un evento y (A ∪ B) ocurre, si y sólo sí, ocurre A o ocurre BA ∩ B es un evento y (A ∩ B) ocurre, sí y sólo sí, ocurre A y ocurre BA - B es un evento y (A - B) ocurre, sí y sólo si, ocurre A y no ocurre BA° es un evento y (A°) ocurre, sí y sólo sí, no ocurre A

Ejemplo 5.Considerando los eventos definidos en el ejemplo 4, efectuar lasoperaciones dadas y encontrar sus probabilidades:

B ∪ C = ad, da, dd, P (B ∪ C) = 12A ∪ C = aa, ad, da, dd = Ω P (A ∪ C) = P (Ω) = 1A Ω D = aa, P (A ∩ D) = P (aa) = 12B ∩ D = = φ, P (B ∩ D) = P (φ) = 0A - D = ad, da = B, P (A-D) = P(B) = 12A° = C, P (A°) = P (C) = 12

5.1.7 Eventos Mutuamente Excluyentes.-Son eventos que no se pueden presentar juntos.

Los eventos A y B son mutuamente excluyentes ⇔ A ∩ B = φ

Dos eventos son mutuamente excluyentes, sí y sólo si, tienen intersección vacía.

Los eventos B y D, del ejemplo 3, son eventos mutuamente excluyentes.

Si la intersección no es vacia, los eventos no son mutuamente excluyentesy se dice que los eventos están traslapados.

B = ad, da : “Un alumno aprobado y el otro desaprobado”.C = dd : “Dos alumnos aprobados o los dos desaprobados”E Conjunto vacío.A,B,C,D,E son subconjuntos de Ω por lo tanto son eventos o sucesos:

- C es un evento sencillo o suceso elemental, contiene unsolo elemento.

- E es un evento vació, no tiene elementos.- El evento A tiene tres elementos; es un evento que tiene un

alumno aprobado.- El suceso B tiene dos elementos; presenta el caso de un

alumno aprobado y el otro desaprobado.- El evento D tiene dos elementos: dos alumnos aprobados

o dos desaprobados.

5.1.4 Probabilidades de un Evento o Suceso.-Es la posibilidad de que un evento suceda o ocurra.Si A es un evento (o suceso), entonces P(A) es la probabilidad deocurrencia del evento (o suceso) A.(P) es un número real, se expresa como fracciones: 12, 12, 7/9 o comodecimales: 0.134, 0.699, 0.05 que están entre cero y uno. Simbólicamente:0 ≤ P (A) ≤ 1

5.1.5 Probabilidad a Priori.-Llamada así debido a que podemos determinar directamente o deantemano (a priori) la probabilidad de un evento o suceso basadoúnicamente en el puro razonamiento lógico, sin necesidad de acudir a laexperimentación; por ejemplo, le asignamos 12 a la probabilidad de queresulte cara al lanzar una moneda sobre una mesa. La probabilidad apriori de un evento A es la oportunidad relativa que tiene el evento deocurrir y es igual al número de elementos que tiene el evento sobre elnúmero total de elementos que tiene el evento sobre el número total deelementos que tiene el espacio muestral (casos favorables sobre el númerode casos posibles).

Si Ω tiene n elementos que tienen la misma posibilidad de ocurrencia ym de estos pertenecen al evento A; entonces,

P (A) = casos favorables = # (A) = m Casos posibles # (Ω) n

Page 117: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES232 233ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ejemplo 7Sea el evento A= aa, ad, da.Muestral Ω = aa, ad, da, ddDeterminar la P (A°)P (A°) = 1- P (A) = 1 – (3/4) =

5.1.10 Probabilidad Condicional.-Probabilidad que ocurra un evento, dado que otro evento ya ha ocurrido.La probabilidad de ocurrencia del evento A bajo la condición de que yaocurrió el evento B, denotado por P(a/B), se define:

P (A/B) = P (A ∩ B ) P (B)

P (A/B): Abreviadamente se lee: Probabilidad de A dado B.

Es la probabilidad de ocurrencia de A, dado que B ha ocurrido o es laprobabilidad de ocurrencia de A en el espacio muestral restringido a B;en este último caso:

P (A/B) = # (A ∩ B) = N° de elementos de A ∩ B N° de elementos de B

EjemploEn el experimento aleatorio que consiste en seleccionar dos estudiantesinmediatamente después de un examen. Calcular la probabilidad queambos resulten desaprobados si se sabe que al menos hay un desaprobado.

Espacio muestral: Ω = aa, ad, da, dd

Sea A el evento que ambos resulten desaprobados: A= ddSea B el evento que haya al menos un desaprobado: B = ad, da,dd

A ∩ B = dd, # (B) , # (A ∩ B) = 1

P (A/B) = P (A ∩ B) = 12 = 1/3 P(B)

P (A/B) = # (A ∩ B) = 1/3 # (B)

Eventos mutuamente excluyentes Eventos traslapados

5.1.8 Probabilidad de la Union de Dos Eventos Mutuamente Excluyentes.-La probabilidad de la unión de dos eventos mutuamente excluyentes esigual a la suma de sus probabilidades; simbólicamente:

P (A ∪ B) = P (A) + P (B) - P (A ∩ B)

Ejemplo 6Dados los conjuntos:

A = aa, ad, da, B = ad, da, D = aa, dd

Calcular: P (A ∪ B), P (B ∪ D)A Y B están traslapados; puesto que: A ∩ B = ad, daP (A ∪ B) = P (A) + P (B) - P (A ∩ B)

= 12 + 2/4 - 2/4 = 12

B Y D son eventos mutuamente excluyentes; puesto que: B ∩ D = φP (B ∪ D) = P (B) + P (D)

= 2/4 + 2/4 = 1

5.1.9 La Probabilidad de un Evento Complementario.-P (A°) = 1 - P (A) 0 ΩP (A) = 1- P (A°) 0P (A) + P (A°) = 1

Page 118: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES234 235ESTADÍSTICA APLICADA A LA EDUCACIÓN

Ejemplo 10:Definamos en el mismo espacio muestral los conjuntos M = ad, daN = ad,dd] ¿M y N son independientes?

M ∩ N = AD, P (M ∩ N) =P (M) P (N) = (2/4) (1/4) =Como P (M ∩ N) = P (M) P (N). Los eventos M y N son independientes.

O bien:P (M) = 2/4, P (M/N) = 1/2. Como P(M/N) = P (M). Los eventos M yN son independientes.

Independencia estocástica difiere del concepto común que tenemos sobre“independencia”. Independencia estocástica se define como una relación(igualdad) entre probabilidades y no como una relación entre eventos:Dos eventos traslapados (o eventos mutuamente excluyentes) pueden serindependientes o no, como se observan en los ejemplos propuestos.

5.13 Frecuencia Relativa como Probabilidad.-Probabilidad es la fracción de veces que ocurre un evento dentro de unnúmero muy grande de intentos o experimentos realizados bajo ciertascondiciones de regularidad.

Ejemplo 11:Nos plantean la siguiente pregunta: ¿Cuál es la probabilidad que unprofesor de escuela viva hasta los 90 años?. No podemos emitir unarespuesta de antemano o a priori, tendremos que acudir a un previo estudioo experimentación, observando la frecuencia con que los profesores dela escuela llegan a vivir 90 años. Si encontramos 2 profesores con 90años de 800 entrevistados, diremos que la estimación de la probabilidadque un profesor viva hasta los 90 años es de 0.025 (representación decimalde la frecuencia relativa: 2/800). Obtendremos una mayor precisión ennuestra respuesta cuanto mayor tiempo le dediquemos al estudio yconsideremos mayor número posible de profesores.

5.1.14 Probabilidad Subjetiva.-Es la probabilidad basada en las creencias personales de quien hace laestimación de la probabilidad.

Casi todas las decisiones sociales se refieren a situaciones específicas yúnicas, más que a una larga serie de situaciones idénticas (regularidad).

5.1.11 Probabilidad De La Interseccion De Dos Eventos Teorema De LaMultiplicacion.-Se obtiene despejando P(A ∩ B) en la fórmula de la probabilidadcondicional anterior. También se denomina probabilidad de que sepresenten simultánea o conjuntamente ambos eventos.Simbólicamente,

P (A B) = P (B) P (A/B)

Traducción: La probabilidad conjunta de los eventos A y B es igual a laprobabilidad de B por la probabilidad condicional de A dado B.

O también:P (A ∩ B) = P (A) P (B/A)

5.1.12 Independencia Estocástica.-Cuando se presentan dos eventos, el resultado del primero puede tenerun efecto en el resultado del segundo o puede no tenerlo. Esto es, loseventos pueden ser dependientes o independientes. Diremos que doseventos son independientes, si la presentación de uno de ellos no tieneefecto sobre la probabilidad de presentación del otro.Simbólicamente,

El evento A es independiente del evento B ⇔ P (A/B) = P (A)

P (A/B) ≠ P (A) ⇔ A no es independiente de B

Los eventos A y B son independientes ⇔ P (A ∩ B) = P (A) P (B)Los eventos A y B no son independientes ⇔ P (A ∩ B) ≠ P (A) P (B)

Ejemplo 9:Los eventos A y B del ejemplo anterior ¿Son independientes?P (A ∩ B) = 12; P (A) P (B) = (1/4)(3/4) = 3/16Como P (A ∩ B) ≠ P (A) P (B). Los eventos A Y B no son independienteso que los eventos A y B son dependientes.

Por otra parte, P (A) = 12, P (A/B) = 1/3. Como P (A) ≠ P (A/B)

Los eventos A y B no son independientes; porque la probabilidad deocurrencia de A es diferente de la probabilidad de ocurrencia de A dado B.

Page 119: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES236 237ESTADÍSTICA APLICADA A LA EDUCACIÓN

La respuesta a la segunda pregunta nos conduce a la regla de Bayes oprobabilidad a posterior.

P (Ak/B) = P (Ak) B = P (Ak) P (B/Ak) P (B) ∑P (A1) P (B/A1)

Es la regla de Bayes.

La regla de Bayes calcula la probabilidad condicional bajo situacionesde dependencia estadística, que también se denomina probabilidad aposteriori porque es la probabilidad que ha sido revisada y cambiadadespués de obtener nueva información o información adicional.

Ejemplo 13En un plantel educativo los alumnos del primer año están distribuidos en3 secciones: La sección A con 30 alumnos, la sección B con 32 alumnosy la sección C, con 35 alumnos. En el informe académico se registra quehay 2 desaprobados en la sección A, 3 desaprobados en la sección B y undesaprobado en la sección C.

Se elige al azar una sección y de ella se selecciona un estudiante, tambiénal azar.

1) ¿Cuál es la probabilidad que el alumno seleccionado resultedesaprobado?.

2) ¿Si el alumno seleccionado resultó desaprobado ¿Cuál es laprobabilidad que pertenezca a la sección A?

Solución:Sea D el conjunto de los alumnos desaprobadosP (D) = P (A) P (D/A) + P (B) P (D/B) + P (C) P (D/C)

= (1/3)(2/30) + (1/3)(3/32) + (1/3)(1/35) = 0,063 389Es la probabilidad que al alumno seleccionado

resulte desaprobado

P (A/D) = P (A ∩ D) = P (A) P (D/A) = 0,022222 = 0.350569 P(D) P(D) 0,063389

Es la probabilidad que pertenezca a la sección A, dado que el alumnoseleccionado resultó siendo desaprobado. Es una probabilidad

Ejemplo 12:Si un director debe decidir la contratación de un docente de entre tresconcursantes finalistas que tienen los mismos méritos, igual gradoacadémico y registran la misma vocación docente (los tres tienen el mismopuntaje).

Antes de tomar la decisión final, el director posiblemente se pregunte¿Cuál es la probabilidad subjetiva al potencial de cada postulante.

5.1.15 Partición del Espacio Muestral.-Sí en un espacio muestral dividido en n partes mutuamente excluyentes,ocurre un evento B, surgen dos preguntas:

1) ¿Cuál es la probabilidad del evento B?2) ¿Cuál es la probabilidad de una de las partes, dado que B ha ocurrido?

La respuesta a la primera pregunta no conduce a la probabilidad totalB = (A1 ∩ B) ∪ (A2 ∩ B) ∪ (A3 ∩ B) ∪ ... ∪ (An ∩ B)P(B) = P (A1 ∩ B) + P (A2 ∩ B) + P(A3 ∩ B) + .... + P (An ∩ B)

P (B) = P (A1) P (B/A1) + P (A2) P (B/A2) + P (A3) P (B/A3) + ... + P (An) P (B/An)

nP (B) = ∑ P (A1) P (B/A1)

i=1

Es la probabilidad total.

Page 120: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES238 239ESTADÍSTICA APLICADA A LA EDUCACIÓN

acondicionada a la ocurrencia del evento D, bajo condiciones dedependencia estadística.

La probabilidad a priori de que el alumno pertenezca a la sección A es1/3. La probabilidad cambiada después de una información adicionalcomo “el alumno seleccionado resultó siendo desaprobado” es 0.350569.Esto es, P (A/D) = 0,350569. Es la probabilidad a posteriori que el alumnopertenezca a la sección A, dado que resultó siendo desaprobado.

LECCIÓN N ° 5.2

DISTRIBUCIÓN EN EL MUESTREO

OBJETIVO ESPECÍFICO N ° 5.2Identificar, explicar, el Método y tamaño de la muestra.

5.2 Introducción.-

¿QUIÉNES VAN HA SER MEDIDOS?

Aquí el interés se centra en quienes, es decir, en los sujetos u objetos deestudio dependiendo del objetivo que se ha planteado en una investigación.

Para seleccionar una muestra lo primero es definir la unidad de análisis, esdecir, personas, organizaciones, centros educativos, direcciones regionales, etc.Esto quiere decir, quienes van ha ser medidos depende de precisar claramente elproblema ha investigar y los objetivos de la investigación. Estas acciones nosllevan al siguiente paso y a los conceptos que vamos a utilizar:

Población: Es el total de elementos (por ejemplo) alumnos de un aula,profesores de un centro educativo, universidades de un país, miembros deuna asociación de padres de familia, etc., sobre la cual queremos hacer unainferencia basándonos en la información relativa a la muestra.

Muestra: Es en esencia un subgrupo de la población, es decir, es unsubconjunto de elementos que pertenecen a una población.

Parámetro: Característica de la población que nos interesa. El valorverdadero del parámetro no se conoce puesto que es lo que tratamos dedescubrir mediante procedimiento muestral.

Estimación: Medición que resulta de la muestra escogida.

Error Muestral: Se debe a que hemos extraído una muestra en vez de un censo.

Error no Muestral: A veces denominado “sesgo” o tendencia a un errorDireccional. Puede presentarse aun cuando no hayamos tomado una muestrasi no hayamos hecho un censo completo.

Page 121: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES240 241ESTADÍSTICA APLICADA A LA EDUCACIÓN

Exactitud: A veces denominada precisión representación mas cercana denuestra muestra al valor verdadero del parámetro de la población.

Confianza: Es el grado de certidumbre que tenemos sobre la exactitud de laEstimación de la Muestra. Existe un nexo estrecho entre nuestro nivel deconfianza y grado de exactitud a que se refiere.

Marco de Muestreo: Es la totalidad de las unidades de Muestreo de dondese extraerá la muestra.

Unidad de Muestreo: Es cada uno de los elementos en la que se subdividela base de la muestra o marco muestral y figuran indidualizados en ellos ypueden estar constituidos por familias, grupos, ciudades, centros educativos,etc.

Unidad de Análisis: Es la unidad para la que deseamos obtener la informaciónestadística. En las encuestas de tipo usual pueden ser personas, hogares,centros educativos, universidades, casas comerciales, podrían ser tambiénproductos surgidos de algún proceso mecánico para algunos otros tipos deanálisis “La unidad de Análisis es denominada como Elemento de Población”.

Probabilidad de Selección: Es la que tiene cada unidad de selección de serincluida en la muestra. La probabilidad es un valor que oscila entre 0 y 1.

Fracción de Muestreo: Es el porcentaje que representa la muestra respectoal universo comprendido en la base de la muestra.

F = Fracción de muestreon = MuestraN = Universo o población

La fórmula es:

Ejemplo:Supongamos que se tiene una población de 1,900 alumnos y el tamaño delas muestras es de 285 alumnos:

Ejemplo:

Es decir, que de cada 100 elementos de la población (1900) 15 estánrepresentados en la muestra.

Coeficiente de Elevación: Es el número inverso a la fracción del muestreoy consiste en la cantidad por la que hay que elevar la muestra para obtener lapoblación. El coeficiente de elevación señala las veces que la muestraesta contenida en el universo.De los datos del ejemplo anteriores obtenemos el coeficiente de elevación

es decir, que la muestra 285 está contenido aproximadamente 7 veces en lapoblación (1900).Procedimiento Muestral.

5.2.1 Marco de Muestreo.-La muestra constituye la elección técnico-estadística de Unidades dentrode una población o conjunto previamente determinado de aquellos.Por ello fundamento básico de la muestra es la existencia materializadade dicho conjunto, en la que aparezcan individualizadas todas sus unidades.

La base de muestreo o marco de muestreo puede consistir en un Censo,un registro, una lista de personas, un fichero, un catálogo, un mapa, unplano, una guía de nombres.

La base de la muestra no siempre existe en realidad. Hay muchosuniversos que no están censados o catalogados y que es prácticamenteimposible catalogarlos. Por ejemplo, no lo están el público que circulapor las calles, ni los asistentes a un cine o a un estadio. La solución quese adopta entonces es practicar al elección de la muestra para algúnprocedimiento aleatorio imperfecto. Así por ejemplo uno de cada ochopersonas que se encuentran por la calle. También se puede dar el casoque se conozca la composición en categorías del Universo, pero que noexista registros de ello. Entonces se puede recurrir al procedimiento,igualmente imperfecto estadísticamente, de asignar a cada agente unaserie de encuestas de cada categoría a realizar, proporcional en su conjuntoa la magnitud de los estratos en el Universo, dejando a su arbitrio laelección de los individuos concretos a encuestar.Recapitulando diremos que el:

Page 122: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES242 243ESTADÍSTICA APLICADA A LA EDUCACIÓN

5.2.2 Métodos De Muestreo.-Los métodos de muestreo en la investigación social son generalmenteMás cuidadosos y sistemáticos que los de la vida diaria. La preocupacióncentral es asegurar que los miembros de la muestra sean los suficientementerepresentativos de la población entera como para permitir hacergeneralizaciones precisas acerca de ello.

Existen dos métodos de muestras: un método aleatorio y otro no aleatorio.

Muestras no aleatoriasa) Muestreo por accidente

El método de muestreo no aleatorio más usual es el muestreo poraccidentes y es que menos difiere con nuestros procedimientos diariosde muestreo ya que se basa exclusivamente en lo que le conviene al

investigador. Es decir, el investigador simplemente incluye los casosmás convenientes en su muestra y excluye los casos inconvenientes.

b) Muestreo por cuotaOtro tipo no aleatorio es el muestreo por cuota, en este procedimientode muestreo las diversas características de una población, tales comoedad, sexo, clase social o raza, son muestreadas de acuerdo con elporcentaje que ocupan dentro de la población. Supongamos por ejemploque nos proponemos sacar una muestra de los estudiantes matriculadosen un Centro Educativo de Educación Primaria donde el 55% son mujeresy el 45% son varones. Utilizando el método de muestreo por cuota, seda a los entrevistadores una cuota de estudiantes para localizar, de maneraque el 55% de la muestra tenga a mujeres y el 45% a los varones, estamosincluyendo en la muestra los mismos porcentajes que están representadosen la población. Si la muestra es de 260 entonces se seleccionan 143estudiantes de sexo femenino y 117 del sexo masculino.

c) Muestreo intencional o de juicioLa idea fundamental que involucra este tipo de muestra es que lológico, el sentido común o el sano juicio, se usen para seleccionaruna muestra que sea representativa de una población. Por ejemplo:Queremos seleccionar una muestra de los niños que no toman lecheen le desayuno, por el sentido común o lógica, podrán ser encuestadoslos niños que viven en las zonas urbanas marginales o pueblos jóvenes.

Muestras aleatoriasEl muestreo aleatorio se caracteriza porque le da a todos y cada uno de los miembrosde una población igual oportunidad de ser seleccionados para la muestra: elloindica que cada miembro de la población debe ser identificado antes de obtenerdicha muestra aleatoria, requisito que generalmente se llena obteniendo una listaque incluya a todos y cada uno de los miembros de la población.Ahora bien, elaborar una lista o padrón de la población es grande ydiversificado. Así por ejemplo si queremos investigar el lugar denacimiento de los alumnos que estudian en la Universidad de Huacho,tendremos que empadronar a todos los alumnos que estudian en laUniversidad de Huacho de acuerdo a su lugar de procedencia.

Entre las muestras aleatorias tenemos:

a) El muestreo aleatorio simple.b) El muestreo aleatorio estratificado.c) El muestreo aleatorio de conglomerado.

EJERCICIOS

Instrucciones.- Escribe en la línea, de cada proposición las palabras quecompletan sus sentido.

1. ………………………………. es cada uno de los elementos en quesubdivide la base de la muestra.

2. ………………………………. es la concreción individualizada de lasUnidades del Universo.

3. ………………………………. es la Unidad para la que deseamos obtenerinformación estadística.

4. ………………………………. es el conjunto completo de todas lasUnidades de análisis cuyas características se van a estimar.

5. ………………………………. es el porcentaje que representa la muestrarespecto al Universo comprendido en la base de la muestra.

6. ………………………………. señala las veces que la muestra estácontenida en el Universo.

Page 123: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES244 245ESTADÍSTICA APLICADA A LA EDUCACIÓN

a) El Muestreo Aleatorio SimpleEl muestreo aleatorio simple puede obtenerse mediante diversosmétodos, entre ellos, a través de un:

- muestreo con reposición,- un muestreo sin reposición,- con el uso de una Tabla de Números Aleatorios.

Utilizaremos un ejemplo hipotético, simple y artificial, paracomprender fácilmente las relaciones necesarias que se dan.Supongamos que tenemos una población hipotética de 10 centroseducativos y que deseamos estimar el promedio de alumnos de cadacentro educativo a través de una muestra.Supongamos que deseamos calcular las estimaciones mediante unamuestra de 3 Centros Educativos. La muestra se puede seleccionar devarias formas. Por ejemplo, podríamos unas 10 fichas de igual tamaño,cada una de las cuales tendrá escrita las letras: A, B, C, D, …hasta J.Luego colocaremos las fichas en un recipiente, las mezclaríamos muybien y extraeríamos 3 fichas al azar considerando que las fichasrepresentan los centros educativos seleccionadas.

La población completa aparece en el Cuadro siguente:

Este tipo de selección puede hacerse de dos formas:Puede sacarse un ficha reemplazada en el recipiente y extraer la

segunda. En este caso la segunda ficha podría ser igual a la primera.Este procedimiento se denomina: Muestreo con reposición.Por otra parte se podría extraer la segunda ficha al mismo tiempo quela primera o se le podría seleccionar sin romper la primera; en uno uotro caso las fichas serían diferentes. Este es el muestreo sinreposición.Cuando se extraen muestras de una población finita, la práctica ususales aplicar el muestreo sin reposición.Existen otras formas de seleccionar dos personas al azar.En el muestreo sin reposición, se consideran todos los pares posiblesde individuos AB, AC, AD,...BC, BD, ... CD, CE, etc. Podríamosescribir un par de letras, por cada uno de los 60 pares, en cada ficha yseleccionar una ficha única. Las muestras de selección posibles soniguales que las del caso anterior.En la práctica no se usan fichas para seleccionar unidadesindividualmente o en pares. El método común es usar una tabla denúmeros al azar y elegir en la misma, dos números comprendidosentre 1 y 10.Los dos números representan a dos individuos. El uso de las tablas denúmeros al azar tiene el mismo efecto que el uso de las fichas.Debemos precisar que cualquiera de estas formas satisface los criteriospara una muestra aceptable.

Uso de una tabla de números aleatoriosCuando el investigador quiere hacer uso de una tabla de númerosaleatorios. Una tabla de números aleatorios se construye en formatal que genere series de números sin ningún patrón u ordendeterminado. Como resultado, el proceso de usar una tabla denúmeros aleatorios produce una muestra imparcial semejante aaquella que se logra poniendo pedazos de papel en un sombrero ysacando nombres con los ojos vendados.Las tablas de números aleatorios se usan en el muestreo para evitarel tener que realizar ciertas operaciones, tales como la selección defichas numeradas de urna, para determinar las unidades que se debenincluir en la muestra.Existen muchas tablas de números al azar, en general esas tablasmuestran conjuntos de dígitos aleatorios ordenados en grupos tantoen sentido horizontal como vertical. Para seleccionar un conjunto denúmeros aleatorios podemos comenzar en cualquier lugar de la tabla.

Número de Alumnos por Centro Educativo

CE AlumnosA 292B 360C 458D 195E 540F 230G 385H 620I 390J 420Total 3 890Promedio de Alumnos 389

Page 124: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES246 247ESTADÍSTICA APLICADA A LA EDUCACIÓN

Además, una vez seleccionado el primer número, se puede continuaruna columna hacia abajo o hacia arriba. Una ficha hacia un lado o elotro, o de acuerdo con cualquier pauta deseada.

b) El Muestreo Aleatorio EstratificadoEl muestreo estratificado es un método del muestreo que consiste enclasificar primero los elementos de la población en grupos el yseleccionar luego, en cada grupo una muestra tomando del muestreoal azar simple, el menos un elemento de cada grupo.El proceso que se sigue para establecer los grupos ya mencionados seconoce como estratificación, el los distintos grupos se denominanestratos.Los estratos pueden reflejar regiones geográficas de un país,densamente o escasamente áreas pobladas, distintos grupos étnicoslos docentes estratificados por tiempo de servicio, áreas por de trabajo,por grupos de edad, por niveles de renumeración, etc.,Para elegir el muestreo estratificado existen criterios que eligen unprocedimiento, ello nos conduce a que exista dos formas de muestreoestratificado:

Muestreo Estratificado:

a. Muestreo Estratificado Proporcional.b. Muestreo Estratificado No Proporcional.

y estos pueden ser:

b.1De asignación igual.b.2De asignación Neyman.

c) El Muestreo Aleatorio de ConglomeradosLos anteriores procedimientos se han referido un método del muestreoen lo que las Unidades del análisis (las personas, colegios, las casas,etc.) se han considerado que estaban ordenados en una lista el o suequivalente y de la que se podía extraer directamente una muestra.Consideramos ahora un procedimiento del muestreo en el que lasUnidades del análisis en la población se consideran agrupadas enconglomerados y se selecciona una muestra del conglomerado.

Los conglomerados muestrales, por lo tanto determinan las Unidadesque se incluyen en la muestra.Para esta determinación existe dos alternativas:

1.- La muestra puede incluir todas las el Unidades en losconglomerados seleccionados. Se les denomina a esteprocedimiento como un muestreo unietápico general delconglomerados.

2.- En los conglomerados seleccionados se pueden seleccionar lamuestra de sub Unidades y enumerar únicamente esa muestrasub de Unidades. Este es el muestreo polietápico de losconglomerados.

Tenemos dos razones principales que sustentan utilizar el muestreodel conglomerado.

5.2.3 Determinación del Tamaño de las Muestras.-Consiste en averiguar cuantos sujetos deben ser seleccionados en la muestra.El tamaño de una muestra ha de alcanzar determinadas proporcionesmínimas, fijadas estadísticamente según las leyes experimentales de laprobabilidad. Pero por otra parte, las necesidades prácticas de ahorro detiempo, costo y esfuerzos aconsejan que el tamaño de la muestra no excedaeste límite mínimo marcado por la estadística. En estas razones es sustentala importancia o más bien la necesidad que tiene el investigador de conocerla forma de calcular los límites mínimos del tamaño de una muestra nosólo para que los resultados se obtengan en la encuesta ofrezcan lasdebidas garantías de poder ser aplicados y extendidos al Universo objetode estudio, sino también para tener la seguridad de que la muestra es lamás reducida posible dentro de los niveles de seguridad y exactitud propuestos.

Tamaño de la Muestra al estimar la Media de la PoblaciónAl prever el intervalo de confianza resultante de una media muestral y ladesviación estándar, es posible aplicar la distribución normal a ladelimitación previa de la extensión del intervalo y el grado de confianzaque nos brindara. La formula con que se calcula el tamaño necesario dela muestra para estimar la media de la población es:

Page 125: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES248 249ESTADÍSTICA APLICADA A LA EDUCACIÓN

Donde:n = Tamaño necesario de la muestra.Z = Número de Unidades de desviación Estándar en la Distribución

normal que producirá el nivel deseado de confianza. (obsérveseque para una confianza del 95%, Z = 1.96, para una confianza del99%, Z = 2.58).

σ = Desviación estándar de la población (conocida o estimada a partirde estudios anteriores).

E = Error, o diferencia máxima entre la media muestra y la media de lapoblación que estamos dispuestos a aceptar en el nivel de confianzaque hemos indicado.

Por ejemplo queremos estudiar la situación socioeconómica de losestudiantes universitarios del departamento de LA LIBERTAD. Hallar eltamaño de la Muestra conociendo lo siguiente.

Desviación estándar: 320 con un nivel de confianza del 95% y con unerror o diferencia máxima entre la Media Muestral y la Media de laPoblación 60.

Z = 1.96 σ = 320 E = 60

n = 109 personas se incluirán en la muestra.

La mayor dificultad al determinar el tamaño de la muestra necesaria paraestimar la media de la población consiste en calcular la desviación estándarde la población.Podemos abordar el mismo tipo del problema desde el punto de vista delerror permisible relativo en vez del error absoluto. En este caso ladesviación estándar (σ) y el error permisible (E) se expresa en funciónde sus porcentaje la Media verdadera de la Población (M) la ecuaciónmas apropiada en este caso será:

Donde M = media de la población, cuyo valor no importa aquí por quedarcancelado al aparecer tanto en el numerador como en denominador de laecuación.

Ejemplo:Queremos saber cuanto gana el estudiante promedio al graduarse en laUniversidad sabiendo que la desviación estándar de la población esde cerca del 38% de la media de la población y queremos estar segurode un 95% de que nuestra media muestral sea halla dentro del 12% dela Media poblacional. Hallar el tamaño de la Muestra.

n = 38.5 ≈ 39 estudiantes serán encuestados.

Por tanto si encuestamos a 39 graduados universitarios tendremos unaseguridad del 95% de que la media muestral se encontrara dentro del12% del sueldo inicial de la media real de la población que se graduaraen dicha Universidad.Tamaño de la Muestra al estimar la proporción de la población.Determinar el tamaño necesario de la muestra en este caso se trata de unaproporción no de una media. La fórmula apropiada es:

Donde:

n = Tamaño necesario de la muestra.Z = Número de Unidades de desviación Estándar en la Distribución

normal que producirá el nivel deseado de confianza. (obsérveseque para una confianza del 95%, Z = 1.96, para una confianza del99%, Z = 2.58).

P = Proporción de la Población que posee la característica de interés.

Page 126: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES250 251ESTADÍSTICA APLICADA A LA EDUCACIÓN

E = Error, o diferencia máxima entre la media muestra y la media dela población que estamos dispuestos a aceptar en el nivel deconfianza que hemos indicado.

Al aplicar esta formula, primero hay que decidir si podemos estimaraproximadamente el valor de la proporción de la población, P en caso deque podamos decir con seguridad que esa proporción difiere mucho de0.5 en una u otra dirección estamos en condiciones de obtener la precisióndeseada con un tamaño mas pequeño de la muestra para lo cual tenemoslos siguientes productos.

Ejemplo:Supongamos que queremos conocer la proporción de la población delPerú que desean viajar a los EEUU y deseamos tener la seguridad del95% de que nuestra proporción Muestras se halla dentro de los 4 puntosporcentuales de la proporción de la población. Como la proporciónverdadera tendera hacer mucho mayor o menor de 5 poco sabremos sobrelas opiniones publicas referente a ese tema por la que adoptamos unaposición conservadora y usamos P = .5 en la fórmula.

Nuestra muestra constatara de 2 305 personas para garantiza la exactitudque pretendemos en un nivel del 95%.

Nuestro ejemplo:En la tabla 5.2.1 observamos que los tamaños requeridos disminuyen demanera impresionante al desviarse de 0.5 la población. Si la proporciónverdadera que deseamos es menos 0.10 estaremos quizás muestreandomas del doble de personas que necesitamos, nótese que de 9 220 (n paraP = 0.4) frente a 3 457 (n para P = 0.1) en el primer renglón de la tabla.

Muestreo cuando la Población es FinitaEn este caso supondremos que la población es finita y aplicaremos lasiguiente formula de Corrección.

Tamaño de la Muestra al estimar la Medida de una población Finita

Donde:N = Tamaño de la población.n = Tamaño necesario de la muestra.Z = Número de Unidades de desviación Estándar en la Distribución

normal que producirá el nivel deseado de confianza. (obsérveseque para una confianza del 95%, Z = 1.96, para una confianza del99%, Z = 2.58).

P (1-P) P(1-P)5 0.5 0.254 0.6 0.243 0.7 0.212 0.8 0.161 0.9 0.09

Tabla N° 5.2.1

Tamaño de la muestra requerida para un nivel de confianza del 95% condeterminado error permisible y un valor del parámetro de la población(P) también determinado.

P = Proporción de la Población

.1 .2 .3 .4 .5 .6 .7 .8 .9

.01 3457 6147 9604 9220 8067 9220 8067 6147 3457

.02 865 1537 2017 2305 2401 2305 2017 1537 865

.03 385 683 897 1025 1068 1025 897 683 385

.04 217 385 505 577 601 577 505 385 217

.05 139 246 323 369 385 369 323 246 139

.10 35 62 81 93 97 93 81 81 35

E = Error máximo Permisible para un nivel de confianza del 95%

Page 127: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES252 253ESTADÍSTICA APLICADA A LA EDUCACIÓN

P = Proporción de la Población que posee la característica de interés.E = Error, o diferencia máxima entre la media muestra y la media de

la población que estamos dispuestos a aceptar en el nivel deconfianza que hemos indicado.

Ejemplo:En la encuesta las personas que decidan viajar a los EEUU, supongamosque la población haya de 2200 personas, aplicando la formula habríatenido una muestra.

n ≈ 472

En resumen para determinar el tamaño de un muestra su cálculo dependede los siguientes factores:

- La amplitud del universo infinito.- El de confianza adoptado.- El error de estimación permitido.- La proporción en que se encuentra en el universo la característica

estudiada.

Según su amplitud.- El universo de la muestra se divide en infinito yfinito.

El nivel de confianza.- El nivel de confianza no es otra cosa que laporción del área de una curva de distribución estadística normal deluniverso que se piensa abarcar.Las pruebas empíricas realizadas muestran en la distribución en eluniverso de cualquier información recogida en una muestra se ajusta porlo general a ley normal de probabilidad con unos valores centrales ymedios avanzados y unos valores reducidos y adoptados por lo tanto laforma de una curva de campana de Gauss.El nivel de confianza que normalmente se estima suficiente en unainvestigación educativa y el más generalmente usado es el de dos sigmas,que abarca el 95.5% a 955 por 1000 del área de la curva normal e indicaque existe una probabilidad de 95.5% de cualquier resultado obtenido,

en la muestra es válido para el Universo en principio. También se emplea,cuando se quiere lograr una mayor seguridad en el nivel de confianza detres sigmas, que abarca una probabilidad de 99.7% del área de dichacurva.

Error de estimación.- Los resultados de las muestras no pueden serrigurosamente exactos en relación al universo que pretenden representary siempre suponen un error de medida mayor a menor. Este errordisminuye como es obvio, con la amplitud de la muestra.A mayor exactitud que se pretenda, por tanto se planteará un error menor,consecuentemente el tamaño de la muestra tendrá que ser mayor.

Proporción en que se encuentra en el universo la característica.- Elcuarto elemento del que depende el tamaño de la muestra es el tanto porciento que expresa la extensión estimada en el universo de la característicasobre la que se desea obtener información. Cuando representa unadificultad grande realizar esta estimación previa, se suele adaptar lasuposición de que dicha proporción es del 50%, que es el caso másdesfavorables, es decir, aquel en que la muestra deberá ser mayor.Existen también tablas elaboradas que dan directamente el tamaño de lamuestra para determinados valores. Son distintas las tablas según setrate de valores universos infinitos y finitos y de un nivel de seguridad dedos sigmas o de tres en cada caso.En el caso de las muestras estratificadas al determinar el tamaño de lasmuestras se plantea un problema especial que es el de su afijación o seano solo la determinación del tamaño general de la muestra que se puedeestablecer según las fórmulas comunes, sino también la especificacióndel volumen de cada estrato de la muestra. Puesto que es condiciónbásica que la muestra sea lo más representativa del universo.La forma más directa y práctica de realizar esta operación consiste enaplicar el porcentaje que representa cada estrato dentro del universo, eltamaño general de la muestra con lo que se obtendrá el número deelementos de la muestra que se debe asignar a cada estrato.

Para universos infinitos que es la siguiente:E = Es el error de estimación admitido.

n = Es el número de elementos de la muestra a determinar.

Page 128: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES254 255ESTADÍSTICA APLICADA A LA EDUCACIÓN

Z2 ó σ = Es el nivel de confianza elegido.p = Es el tanto % estimado de la característica en estudio.q = 100 – p:

EjemploSe ha proyectado realizar una investigación educativa en la ciudad deHuacho según el último censo tiene 380,000 habitantes mayores de 16años.Hallar el tamaño de la muestra teniendo en cuenta que se pretende trabajara un nivel de confianza del 99% y con un margen de error permitido del6%, mediante la aplicación de la fórmula y la utilización de las tablas.

Apliquemos la fórmula:

Identifiquemos los valores:N = 380,000 (universo).n = Muestra no se conoce.Z2 = 99% = 3 Z.E = 6% error admitido.p = En cuanto a p como no se indican las proporciones que guardan

dentro del universo las características a estudiar, es preciso suponerel caso más desfavorable, de p igual a 50, luego q también seráigual a 50.

Reemplazando los valores en la fórmula tenemos:

n = 625

Respuesta: n = 625 o sea el tamaño de la muestra será de 625 habitantes.

Para universos finitos utilizaremos la siguiente fórmula:

Ejemplo: Queremos estudiar las condiciones socio económicas de losestudiantes de la UNJFSC cuyo población alcanzan a 5600 alumnos, hallarel tamaño de la muestra con un nivel de confianza del 95% y con unmargen de error permitido del 5%.

Aplicamos la fórmula

Identifiquemos los valoresn = ?N = 5600 (universo).Z = 95% = 2 nivel de confianza.E = 5% error permitido.p = 0.5 (se asume la máxima heterogeneidad de 50% x 50%).q = 0.5%.

Reemplazamos los valores:

n = 373.4 casos

Respuesta: El tamaño de la muestra de una población de 5600 alumnosserá de 373.4 casos, con un nivel de confianza del 95% y un margen deerror del 5%.

Page 129: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES256 257ESTADÍSTICA APLICADA A LA EDUCACIÓN

PRUEBA DE AUTOEVALUACIÓN DE LA QUINTA UNIDAD

1. Cuando queremos hacer una investigación sobre el consumo de Leche enlos alimentos cotidianos y seleccionamos una muestra de los alumnos queno toman leche en el desayuno por el sentido común o lógico y decidimosque deben ser encuestados los alumnos que viven en los pueblos jóvenes.

Hemos optado por:a. Un muestreo al azar.b. Un muestreo por cuota.c. Un muestreo estratificado.d. Un muestreo intencional.e. Un muestreo por conglomerado.

2. ¿Cuál de los siguientes tipos de muestra no corresponde a una muestraaleatoria?

a. Muestra simple al azar.b. Muestra estratificada.c. Muestra con reposición.d. Muestra por conglomerados.e. Muestreo por accidente.

3. Queremos estudiar las condiciones socio económicas del magisterio de laprovincia de Trujillo cuyo universo alcanza a 3400 profesores; Hallar eltamaño de muestra con un nivel de confianza del 95% = Z = 2, con unmargen permitido del 5%.

La muestra puede ser:a. 480 profesores.b. 420 profesores.c. 350 profesores.d. 411 profesores.e. 380 profesores.

4.- Utilizando los datos de la pregunta anterior, hallar la fracción de muestreoy responde ¿Cuál de las siguientes alternativas es la correcta?

a. 12.09%b. 13.30%

PRUEBA DE AUTOEVALUACIÓN DE LA QUINTA UNIDAD

c. 15.10%d. 11.40%e. 10.80%

5. Con los mismos datos de la pregunta 3 determina: ¿Cuál es el coeficientede elevación de la muestra?

a. 6.4 veces.b. 8.3 veces.c. 10.2 veces.d. 5.2 veces.e. 9.5 veces.

6. Una empresa de investigación desea con $5 determinar la cantidad promediosemanal que los residentes adultos de Huancayo destinan a diversiones.Suponiendo una desviación estándar de $15 y una confianza deseada de95% en el intervalo resultante. ¿Cuántas personas figuraran en la muestra?

7. En la Pregunta 6 ¿Qué tamaño de la muestra se necesita si la población secompone de 900 residentes de el Tambo y Chilca? Suponga que otrosfactores permanecen inalterados.

Page 130: Profdosa - Estadistica Aplicada Educacion

259ESTADÍSTICA APLICADA A LA EDUCACIÓN

SEXTA UNIDADDESARROLLO DE MODELOS Y

TÉCNICAS PARA EL PLANEAMIENTOEDUCATIVO

Page 131: Profdosa - Estadistica Aplicada Educacion

261ESTADÍSTICA APLICADA A LA EDUCACIÓN

OBJETIVO GENERALAl finalizar el estudio de los contenidos de la sexta unidad el

estudiante será capaz de presentar metodologías para ladeterminación de los recursos humanos físicos y financieros.

LECCIONES

6.1 Metodología parala distribución deMetas.

OBJETIVOSESPECIFICOS

6.1 Analizar, describir, conocer,explicar los modelos ymétodos para determinarmetas de atención yocupación físicas.

CONTENIDOSANALÍTICOS

6.1 Metodologías para ladeterminación de Metas.6.1.1 Determinación de

Metas.6.1.2 Cons ide rac iones

Técnicas.6.1.3 Enfoques de

Planificación.6.1.4 Métodos en El

Enfoque de LaDemanda Social.

6.1.5 Meta de Ocupación6.1.6 Metas Físicas

(Aulas y Secciones).

Page 132: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES262 263ESTADÍSTICA APLICADA A LA EDUCACIÓN

LECCIÓN N ° 6.1

METODOLOGÍA PARA LA DETERMINACIÓN DE METAS

OBJETIVO ESPECÍFICO N ° 6.1Desarrollar los diferentes enfoques de la Planificación Eduactiva.

6.1 Metodologías Para la Determinación de Metas.-El desarrollo de modelos y técnicas para el planeamiento educativo nos van

a permitir instrumentalizar los diferentes enfoques de la planificación educativaa fin que nos permita diseñar, elaborar y contar con un instrumento en el desarrollode la Planificación.

6.1.1 Determinación de Metas.-Marco Conceptual: Es conveniente señalar como punto de partida quela meta no es simplemente un calculo puramente estadístico demográfico,sino que es el resultado de análisis de las interrelaciones entre un conjuntode elementos que intervienen para su definición, que puedan ser decarácter no limitante o de carácter restrictivo, pero que ambos se debencompatibilizar para la determinación de ella.En términos generales la Meta es la traducción de los Objetivos y de laPolítica Educativa en Resultados Cuantitativos, lo cual debe definirseteniendo en cuenta la capacidad Operativa del Sector, es decir, de losrecursos (Humanos, Físicos y Financieros), con que cuenta y se vadisponer para el año Meta.Para la determinación de las metas del sistema educativo se debe teneren cuenta el concepto que la Carta Política del Estado señala con respectoa la educación en el sentido de que ella es un derecho inherente a todapersona y que por ende el Estado tiene la obligación de ofrecer a toda lapoblación. Si a este precepto se agrega de que la educación es un procesopermanente que tiene por objeto el pleno desarrollo de la persona, seobserva que ambos apuntan o están encuadrados dentro de la perspectivade la democratización de la educación; que significa ofrecer igualesoportunidades educativas a toda la población en idénticas condicionesde la oferta educativa, en lo que respecta a la calidad del personal docente,equipo, material e infraestructura educativa.Considerando lo anterior y reflexionando sobre la existencia de grandesvolúmenes de poblaciones que no están incorporadas en el sistema educativo,

y los que Están dentro de ella, principalmente de las áreas rurales y zonasmarginales reciben un servicio de menor calidad, generándose desigualdadestanto regionales como sociales; conociendo esta situación, la planificacióneducativa debe responder a la solución de los problemas existentes,atendiendo los requerimientos de la población y otorgando los recursosnecesarios e identificando y priorizando las poblaciones meta a atender.Siendo la educación un derecho de toda persona y que esta debe serpermanente, se cuenta entonces con una demanda total, que estaríaconstituida por toda la población; demanda que está influencia por elcrecimiento permanente demográfico de la población y por lasexpectativas o mejoras en los niveles de vida.Pero en realidad, de acuerdo a los ciclos de vida de toda persona, existe ungrupo de la población que debe encontrarse dentro del sistema educativo;ciclo que comprende principalmente entre la edad de 3 a 24 años donde unapersona trancurre desde el nivel inicial hasta el nivel superior, esta poblaciónvendría a ser la demanda potencial. Pero se sabe que no todos de estapoblación (3-24 años) se encuentra incorporada en el sistema educativo,debido a que egresaron o desertaron del sistema, o se encuentran en elmercado de trabajo o haciendo otras tareas, restando esta población que seencuentra fuera del sistema educativo, nos quedamos con la demanda real oefectiva que se encuentra matriculada en algún nivel educativo del sistema.

6.1.2 Consideraciones Técnicas.-Para la determinación de las metas se debe partir del conocimiento denuestra realidad (nacional, regional, departamental, local) debiendo tenerdefinido la imagen, objetivo para un mediano y largo plazo, la cual estarádeterminado por los objetivos, política, y estrategia del desarrollo denuestra sociedad y el rol que le corresponde a la educación como elementoimportante en el desarrollo económico social del país. En general la ofertaeducativa está en función a las necesidades y requerimientos del desarrollodel país como de las aspiraciones de la población en su conjunto. Laprogramación de las metas debe estar orientada a:

a. Lograr la efectiva democratización de la educación, que garanticeigualdad de oportunidades en cuanto el acceso de la población alservicio educativo en particular a la población menos favorecida;ampliando su cobertura en las áreas rurales, urbano marginales y zonasde frontera; ofreciendo el servicio en similares condiciones; ypermitiendo así mismo, la igualdad de oportunidades en el mercadode trabajo.

Page 133: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES264 265ESTADÍSTICA APLICADA A LA EDUCACIÓN

b. Mejorar el nivel educativo de la población total.c. La eliminación del analfabetismo en forma progresiva.d. Mejorar el nivel de escolarización de la población de 3 a 24 años de

edad, dentro de este grupo de edades priorizando a la población de 6a 11 años que teóricamente debía encontrarse en educación primariaque es obligatoria y garantizar la educación secundaria en todo elpaís, permitiendo disminuir los déficit de atención y tendiendo a unacorrespondencia del grado de estudio y la edad cronológica.

e. Disminuir la brecha en las disparidades o desigualdades regionales,como al interior de ellas.

f. Mejorar la eficiencia interna del sistema educativo.g. Utilización óptima y racional de los recursos tanto humanos, físicos

y financieros asignados al sector.h. Alcanzar en forma progresiva en promedio óptimo de la carga docente

(relación alumnos por profesor) y propiciar la ubicación de personaldocente titulado y/o calificado en las áreas menos atendidas.

En la determinación de las metas para cada nivel y modalidad educativase recomienda seguir los pasos que a continuación se indican:

a. Analizar los datos disponibles para detectar las características ytendencias fundamentales que sirvan de referencia para estimaciónde las metas tanto de atención como de ocupación.

b. Realizar una primera aproximación de matrícula total a fin de obtenerlas magnitudes de la estimación, para después de los ajustescorrespondientes aplicarlos para cada nivel o modalidad educativa.

c. Realizar un análisis de los resultados a través del control de latendencia, en comportamiento de los incrementos y el cumplimientode los criterios definidos para cada nivel, tratando de corregir lasdesviaciones y dando coherencia a los resultados del modelopropuesto.

En base a las consideraciones señaladas se determina el enfoque o modelosde planificación a utilizar, teniendo en cuenta que en el lapso a planificary determinar las metas, debe irse corrigiendo progresivamente losproblemas de carácter estructural, previendo a través de un modelo desimulación, o de la imagen objetivo lo que se podría lograr en los próximosaños tanto corto como a mediano y largo plazo.Existen diversos métodos para la determinación de las metas, las cualesno son excluyentes para su aplicación en los diferentes niveles y

modalidades del sistema educativo, dependiendo solamente de lainformación que se dispone y del tipo de metas a determinar, que vienena ser las siguientes:

a. Metas de atención, que esta referida a prever la futura matrícula enlos diversos niveles y modalidades educativas.

b. Metas de ocupación, es decir, el número de plazas docentes, que serequiere para poder atender el nuevo contingente del alumnado.

c. Metas de aulas, secciones que vienen a ser los requerimientos delambiente físico para recibir los incrementos de alumnos.

Para el tratamiento de las metas se tienen ciertas restricciones olimitaciones principalmente las referidas a la captación de la informaciónque no se cuenta en los niveles de desagregación en la oportunidadrequerida y en la confiabilidad o calidad de ella.A continuación se presenta una descripción de los enfoques de laplanificación más conocidas tales como, el de la demanda social, el delos recursos humanos y el de costo-beneficio donde cada uno de ellosrequiere un información específica en relación de los métodos que losinstrumentaliza. En cada enfoque se escribe su concepción teórica y seexpone el de los métodos que mayormente se utilizan en la planificacióneducativa.

6.1.3 Enfoques de la Planificación.-Enfoque de la Demanda SocialEl enfoque de la demanda social se caracteriza por tener como premisabásica la satisfacción de las necesidades educativas a la población engeneral. Este enfoque considera que la educación es un servicio que debebrindarse a todas las personas que la demanden. Lo que significa que elestado debe realizar grandes esfuerzos que permita ofrecer igualdad deoportunidades educativas; dicho esfuerzo se encuentra limitado por lacapacidad económica del país que impide ofrecer mayores plazas docentesy así poder atender a un mayor volumen de población y en mejorescondiciones.Los métodos usados en el cálculo de las metas, siguiendo este enfoque,se consideran generalmente las tasas o coeficientes de escolarizaciónbasados en tendencias históricas de datos o basadas en correlaciones conel producto bruto interno y la estructura de la población.Las tasas o coeficientes de escolarización generalmente se estimanpor sexo, edad, estructura social, región, atención pública, atención

Page 134: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES266 267ESTADÍSTICA APLICADA A LA EDUCACIÓN

particular, área urbana, rural y otras dimensiones, variando de acuerdoal ámbito temporal y espacial.En base a las orientaciones dadas en el acápite anterior, para el cálculode las metas, especialmente para el mediano y largo plazo, se parte de unanálisis de escolarización global, y profundizando en su exacta dimensión,la evolución de la escolarización en un período de 5 a 10 ó a 15 años deacuerdo a la previsión de las metas a mediano o largo plazo. Así mismose calcula las tasas de crecimiento promedio anual, la evolución de latendencia por grupo de edades, la participación del sector público yprivado, la proporción de la atención mediante programas escolarizados,no escolarizados y otras formas de aprendizaje. Una vez concluida conel análisis de los aspectos anteriores, que vendría a ser la situación daday la existente; el siguiente paso consiste en simular lo que sería en elfuturo a 5, 10 y 20 años.Por ejemplo, en educación inicial en base a los datos que se tienen en1980, 1985, 1990, 2000 se puede formular someramente el siguientemodelo:

a. Escolarización lograda y prevista:

b. Tasa de incremento logrado y previsto:

c. Porcentaje de atención del sector público con respecto al total:

EDAD 1980 1985 1990 1995 2000 2005 20100 – 2 años - 0.1 0.1 2.2 3.5 4.8 6.0

3 – 5 años 5.1 12.0 23.8 33.7 39.9 44.8 50.06 años 1.9 0.7 1.1 1.0 0.6 - -

85/80 90/95 90/80 95/90 00/95 00/90 05/00 10/05

Total 19.5 16.0 17.7 10.6 5.9 8.2 4.5 3.7

Público 19.7 18.3 19.0 10.1 5.6 7.8 4.4 3.6

1980 1985 1990 1995 2000 2005 2010Público escolarizado 72.4 73.2 73.4 73.0 72.5 71.5 70.0

Público no escolarizado - - 99.6 96.0 94.0 93.0 92.0

Público (Escolarizado

más No escolarizado) 72.4 73.3 83.9 82.0 81.0 80.5 80.0

A partir del modelo simulado se inicia con el desarrollo detallado entérminos de matrícula anual, público, privado, programas escolarizados,no escolarizados, etc., así mismo, en base a las metas de atencióncalculadas, se realiza en cálculo de metas de ocupación de acuerdo a lascaracterísticas de los programas escolarizados y no escolarizados.

6.1.4 Métodos en el Enfoque de la Demanda Social.-i. Para las Metas de Atención

Para el cálculo de las metas de atención existe una serie de métodosde los más simples a los más complejos, siendo más conocidos lossiguientes:

- Tasa de crecimiento (r ).- Tasa de escolarización (e).- Progresión bruta por grados de estudio (p).- Métodos de los flujos o cohorte.- Tasa de éxito.- Método de la capacidad operativa instalada.

Cada método como se dijo, tiene sus requisitos, limitaciones yventajas, ningún método es exclusivo para determinado nivel omodalidad educativa, todo depende de la información que se disponey de las características del nivel educativo. Para efectos de estedocumento se desarrolla los 4 primeros métodos, por ser los másconocidos por los investigadores sociales.Pero antes es necesario tener en cuenta para estimación de las metasde atención lo siguiente:

- Que cada nivel o modalidad educativa tiene un comportamientodiferente por lo cual es conveniente darles un tratamientoespecífico en cuanto a definición de criterios y métodos, nosignificando que sea excluyentes del resto.

- Para definir los métodos globales se recomienda utilizar elmétodo de la tasa de escolarización; no es conveniente aplicarningún método tendencial, por que no se está realizandoproyecciones sino definiendo las metas, que significa traducirlos objetivos y políticas educativas en resultados cuantitativosa obtenerse en plazos definidos.

- Para el cálculo de indicadores y análisis de informaciónestadística se debe tomar una serie histórica que varía de

Page 135: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES268 269ESTADÍSTICA APLICADA A LA EDUCACIÓN

acuerdo a la temporalidad de la previsión, es decir, para elmediano o largo plazo que permita tener una mayor visiónsobre el comportamiento de las principales variables eindicadores educativos.

a) Tasa de Crecimiento Promedio Anual: “r”Fórmula general:

Mt+n

= Mt (1 + r)n

Mt = Matrícula del año base.

Mt+n

= Matrícula del año base más los n años a calcular.n = Número de años considerados en el cálculo.r = Tasa de crecimiento promedio anual.

Para determinar “r”.- Usando la tabla de intereses compuesto de la fórmula

general se tiene:

Conociendo en número de años “n” y el coeficiente “K” se buscaen la tabla de intereses compuesto la tasa de crecimiento “r”.

- En base a una serie histórica.

De la fórmula general, cuando n = 1 se tiene:Mt + 1 = (Mt(1 + r)

De donde :

Si se tiene varios “r” la tasa de crecimiento promedio anual será:

- Conociendo el valor de 2 años no consecutivos.

1

1

b) Tasa de Escolarización: “e”La tasa de escolarización es la proporción que se establece alcomparar entre la población matriculada con respecto a lapoblación demográfica.Tasa de escolarización según edad individual.

Definida la tasa de escolarización para el año meta y la poblacióndemográfica respectiva se determina la matrícula para dicho año:

M (x) = MatrículaP (x) = Poblacióne (x) = Tasa de escolarización

c) Progresión Bruta por Grado de Estudios: “p”Proporción de alumnos que pasan de un grado de estudio a otrosuperior, para lo cual se calcula la “tasa bruta de progresión gradoa grado” siendo la fórmula general la siguiente:

P = Tasa bruta de progresión grado a gradoi + 1 = Matrícula del gradot + 1 = Periodo escolar

Para determinar la matrícula se fija previamente “P” y se realizalo siguiente:

d) Métodos de los Flujos o CohortesEste método basado en el análisis de las tendencias de promoción,repitencia, abandono y si la información lo permite de losreentrantes, para lo cual es necesario calcular sus respectivas tasas:

Page 136: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES270 271ESTADÍSTICA APLICADA A LA EDUCACIÓN

i) Tasa de promoción : p

Donde:P i

t = Tasa de promoción.

P it = Alumnos promovidos.

M it = Matrícula del grupo “i” en el año “t”.

ii) Tasa de repitencia: r

rit = Tasa de repitencia.

Rit = Alumnos que repiten el grado de estudio “i” en el año

“t”.

iii) Tasa de Abandono: a

O también:ai

t = 1 - (pi

t + rt

i)

Donde:ai

t = Tasa de abandono.

Ait = Número de alumnos que abandonan el sistema

educativo en el grado de estudios “i”.

iv) Tasa de reingresantes: v

Donde:vi

t = Tasa de reingresantes.

Vit = Número de reingresantes en el grado “i” en el año “t”.

La matrícula para el año meta de un grado o año de estudioserá igual a la suma que resulta de multiplicar la matrículadel grado de estudio del año inmediato anterior por las tasas

(promoción, repitencia y reingresantes) que se han dedefinir previamente.

Ejemplo:

6.1.5 Cálculo de la Metas de Ocupación.-Para el cálculo de las metas de ocupación se considera fundamentalmentela metodología de la carga docente; realizando los siguientes paso: Comoinformación de base se toma las metas de atención y la serie histórica dela carga de alumnos por docente para cada nivel y modalidad educativa;seguidamente se determina para los años meta las futuras cargas docentesen cada nivel y modalidad educativa.Para determinar la carga docente futura se considera un conjunto decriterios generales y específicos que tienen influencia directa en la calidaddel producto educativo. Entre los criterios genéricos válidos para todoslos niveles y modalidades educativas se tienen:

- Contar con una serie histórica de la carga de alumnos por docente,que permiten examinar la situación anterior y actual.

- Conocer el número de alumnos por sección, que en términopromedio visualiza la relación alumno-sección con la relaciónalumno-profesor.

- Contar con el Plan de Estudios y/o Asignaturas a desarrollarse,que permtia determinar la necesidad del desdoblamiento de lassecciones (especialmente en Educación Secundaria y EducaciónSuperior).

- Contar con la carga horaria del profesor, que permita determinarel número de profesores necesarios para cubrir la carga horaria delos alumnos por sección.

- Racionalizar y optimizar los recursos a fin de aproximar una cargade alumnos por docente recomendable para no perjudicar la calidadde la educación.

La valorización de cada uno de estos criterios permite alcanzar un puntode equilibrio; es decir, fijar una determinada carga de alumnos por profesorpara cada nivel y modalidad educativa. En base a la referida valorización,

Page 137: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES272 273ESTADÍSTICA APLICADA A LA EDUCACIÓN

Cuando K2 es mayor que 1, se entiende que un docente atiende a

más de una sección.

Determinando un nuevo valor para K2 se puede obtener el

número de docentes par el año meta.

Nº Doct+1

= K°2 x N° Secc.

t+1

d) En base al stock de docente:

N(t) = I (t) + R (t)N(t) = Requerimiento anual del docente.I(t) = Docentes para atender el incremento de alumnos.R(t) = Docentes para reemplazar a los que se retiran de la actividad.

Este cálculo es necesario para determinar cuántos docentes nuevosse van a incorporar cada año y prever de esa forma el stock quedebe existir para satisfacer las necesidades ocupaciones.

6.1.6 Para las Metas de Aulas y Secciones.-a) Relación alumnos por sección (carga sección)

Es el número promedio de alumnos por sección.

a/s = = K3

Donde:

NºSecct+1

=

b) Relación Sección – AulaSirve para medir el grado de utilización de las aulas por sección.

Secc/aula = = K4

Generalmente hay más secciones que aulas entonces K4 es mayorque 1.

Nº Aulast+1

=

Aulas nuevas = N° Aulast+1

- N° Aulast

se elabora un modelo que permita al interior de cada nivel iraproximándose progresivamente a un t ipo de carga docenterecomendable que permita en el futuro optimizar el trabajo educativo,paralelo a una mejora en la calidad de la educación.

A continuación se presenta cuatro métodos para la determinación de losrequerimiento s de plazas docente:

a) Carga Docente: a/d (Número promedio de alumnos por docente)

a/d = = K1

Teniendo el coeficiente K1 para varios años se determina un nuevo

k°1 para el año meta y se procede a determinar el número de

docentes requeridos.

Nº Doct+1

=

b) Método de la Carga Horaria:

∆ Doc t+1 = ( )

Donde:∆ Doc

t+1 = Incremento de docentes en el año t +1.

∆ Mt+1

= Incremento de alumnos en el año t +1.ha = Horas promedio recibidas por alumno.hd = Horas fijadas para los docentes por semana.cs = Alumnos por sección (carga por sección).

Conociendo el incremento de docente se obtiene el total dedocentes para el año meta.

Nº Doct+1

= Doct + ∆Doc

t+1

c) Relación docente por seccion: d/s

d/s = = K2

Matrícula en el nivel o modalidad

Número de docentes del nivel

Matrícula t +1

K°1

(∆ Mt+1)

cs

ha

hd

N° de Docentes

N° de Secciones

Matrícula

N° de Secciones

Matrt+1

K°3

N° de Secciones

N° de Aulas

N° de Secc.t+1

K°4

Page 138: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES274 275ESTADÍSTICA APLICADA A LA EDUCACIÓN

BIBLIOGRAFÍA

Avila Acosta, Roberto B. “Manual de estadística Básica”. CONCODEPEdiciones. Lima 2000.“Estadística Aplicada a la Educación”. U.Nacional de Huacho.

Cansado, Enrique. “Estadística General” Tomo I y II. CIENES.Santiago de Chile. 1995.

Chao, Lincoln “Estadísticas para las CienciasAdministrativas”. Mc Graw-Hill. 2001.

Crhistentes, Howard B. “Estadística Paso a Paso”. Editorial Trillas.2000. México.

Davis, James A. “Análisis Elemental de Encuestas”.Editorial Trillas. 1998. México.

Freund, Jonh E Frank J. William “Elementos Modernos de la EstadísticaEmpresarial”. Editorial Prentice-HallInternacional.

Glass, Gene V. Julián C Stanley “Métodos Estadísticos Aplicados a lasCiencias Sociales”. Editorial Prentice – mayInternacional.

Kendall, Maurice G, y “Diccionario de Términos Estadísticos”.William R. Bluckland Biblioteca Interamericana de Estadística

teórica y Aplicada. Argentina.

Kenneth D. Hopkins “Estadística Básica” para las cienciassociales y del comportamiento. EditorialPHH. Prentice – Hall hispanoamericanaMéxico 1997.

Kerlinger, Fred N. “Investigación del comportamiento,Técnicas y Metodología”. EditorialInteramericana de México.

PRUEBA DE AUTOEVALUACIÓN DE LA SEXTA UNIDAD

Empleando las tablas 4.1.1 y 4.1.2 resuelva las siguientes interrogantes:

1. ¿Qué parte del área total queda comprendida entre la ordenada a la distanciade 2 y el eje cero?

2. ¿Qué parte del área total se encuentra hasta la distancia de 1.97?

3. ¿Qué parte del área se halla entre +2?

4. ¿Qué parte del área se halla entre – 1.5 y 2?

5. ¿Qué parte del área se halla entre – 1.97 y 1.55?

6. ¿Qué parte del área total se halla entre 1.5 y 2.5?

7. Se sabe que el rendimiento medio de la clase de matemáticas es de 55.15,su desviación estandar 19.7. Se pregunta ¿Cuál es la probabilidad paraque la alumna Kathy Matos, tomada al azar alcance la nota de 78%?

8. Dos alumnos A y B han sido sometidos a dos tipos de pruebas de rendimientoescolar. A logró 132 puntos es un test cuyo rendimiento medio era de 120puntos; su desviación estandar 18 puntos. B obtuvo 110 puntos en otraprueba cuyo promedio de rendimiento era 105 y su desviación estandar 7.Se pregunta ¿Cuál de estos dos alumnos revela mejor estado deaprovechamiento?

Page 139: Profdosa - Estadistica Aplicada Educacion

JULIÁN PEDRO ESPINOZA ROSALES276

Merril, Wiliam y Kart Fox “Introducción a la Estadística Económica”AMORRORTU, Editores. Buenos Aires 1997.

Miranda, Oscar “Planeamiento y Planeación de Encuestas”CIENES. Santiago de Chile . 2000.

Nuñez del Prado, Arturo “Estadística Básica para la Planificación”.Siglo XX. Editores S.A. México. 1997.

Piater, Andre “Estadística y Observación Económica”,Tomo I y II. Ediciones Ariel. Barcelona.

Shao, Stephen P. “Estadística para Economistas yAdministradores de Empresas”. HerrerosHermanos. Sucursal S.A. México.

Sierra Bravo, Restituto “Técnicas de Investigación Social Teoría yEjercicios”. Editorial Paraninfo. Madrid.1995.

Ya-Lun Chou “Análisis Estadísticos”. México.

BIBLIOGRAFÍA