Apuntes Sobre Estadistica

38
Apuntes sobre Estadística Elaborado por H. Medina Disla. Junio 2010. 1 APUNTES SOBRE ESTADISTICA (Borrador para corrección) Héctor Medina Disla Santo domingo, D. N. Junio 2010

description

Apuntes sobre Estadistica primer nivel

Transcript of Apuntes Sobre Estadistica

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 1

    APUNTES SOBRE ESTADISTICA (Borrador para correccin)

    Hctor Medina Disla

    Santo domingo, D. N. Junio 2010

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 2

    I. INTRODUCCION Estadstica: Es una metodologa cientfica que permite recolectar, organizar y procesar datos que proporcionen informacin que sirvan de base para la toma de decisin. Por ejemplo aplicar una encuesta para conocer la preferencia del electorado, aplicar un tratamiento especial a un grupo de personas y observar el resultado, buscar datos sobre la matrcula estudiantil, u otro tema en particular. En cambio, cuando hablamos de Estadsticas nos referimos a un conjunto de medidas o indicadores que describen el comportamiento de un fenmeno de inters en un momento determinado. Por ejemplo, el porcentaje de lectores que prefieren a un candidato en particular, el tiempo necesario para realizar unas tarea, las unidades producidas diariamente por una empresa, las ventas de una empresa, etc. Es decir que las estadsticas representan el fin u objetivo que buscamos y la Estadstica el medio para conseguirlo. 1.1 DIVISION DE LA ESTADISTICA La Estadstica como metodologa cientfica se divide en dos ramas, la Estadstica Descriptiva y la Estadstica Inferencial Estadstica Descriptiva: Es un conjunto de mtodos y tcnicas que permiten describir un conjunto especfico de datos. La Estadstica Descriptiva como su nombre lo indica, describe un grupo particular. Sus principales herramientas son.

    1) Clculo de porcentaje y tasas 2) Presentacin tabular, (cuadros y tablas) 3) Presentacin grfica 4) Clculo de medidas de Medidas de Tendencia Central, (promedios) 5) Clculo de medidas de dispersin o variabilidad 6) Clculo de nmeros ndice. 7) Otras tcnicas descriptivas.

    Estadstica Inferencial: Se refiere a un conjunto de mtodos y tcnicas que permite obtener informacin acerca de una poblacin completa, con solo estudiar una parte de ella (muestra). La Estadstica Inferencial nos permite llevar los resultados obtenidos en una muestra a la poblacin. Sus principales herramientas son: Clculo de probabilidades, muestreo y distribucin muestral, estimacin, prueba de hiptesis, anlisis de varianza, anlisis de regresin y correlacin, otras. 1.2. Conceptos y Definiciones

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 3

    1. Poblacin: Es un conjunto de elementos con caractersticas parecidas o similares y que son de inters para la realizacin de un estudio. En trminos estadsticos una poblacin se define de acuerdo a lo que se desea investigar o estudiar. Por ejemplo si queremos conocer el rendimiento escolar de los/as nios/as de la educacin bsica, entonces nuestra poblacin va a estar definida por la cantidad de nios/as inscrito en los curso de la educacin bsica o si queremos evaluar la calidad de la produccin de una empresa, nuestra poblacin estar formada por todas las unidades producidas por la empresa durante el periodo de inters. Muestra: Es un subconjunto de la poblacin que se toma para fines de desarrollar una investigacin. Cuando un estudio se hace a partir de una muestra, esta debe ser representativa y significativa. Se dice que una muestra es representativa cuando los elementos que componen dicha muestra contienen las mismas caractersticas que los elementos en la poblacin de la cual se tom dicha muestra, el concepto de representatividad se refiere a los aspectos cualitativos de la muestra. Por ejemplo si quisiramos conocer la preferencia poltica de los estudiantes de la UASD una muestra sera representativa si en la misma se incluyen estudiantes de todas las edades, de todas las carreras, de ambos sexo, de todos los centros regionales, etc. de forma tal que al observar la muestra es como si observramos la poblacin en miniatura. Por su parte el concepto de significacin tiene que ver con la cantidad de elementos que conforma la muestra. En este sentido, no existe un nmero de elementos especfico para que una muestra sea significativa, sino, que la cantidad de elementos necesarios para que la muestra sea significativa vara de acuerdo a la caractersticas de la poblacin. Si la poblacin a estudiar es muy variable, se requerir de un mayor nmero de elementos para que la muestra sea significativa que si la poblacin tiende a ser homognea, en cuyo caso un muestra pequea puede ser significativa. 2. Parmetro: Es una medida de referencia la cual se calcula a partir de datos de una poblacin completa. El parmetro se refiere a la medida de una variable en la poblacin. Por ejemplo, cuando se aplican las Pruebas Nacionales y se obtiene el promedio de las calificaciones, esta medida es un parmetro de las calificaciones de los estudiantes.

    3. Estimador o Estadgrafo: Es una medida calculada a partir de los datos obtenidos en una muestra y se utiliza para estimar el valor del parmetro, ya que en la mayora de los casos, se hace difcil y muy costoso conocer el valor real o verdadero de la variable. Por ejemplo cuando se toma una muestra para conocer la preferencia poltica de la poblacin, los porcentajes que se obtienen a partir de la encuesta son estimadores del porcentaje de real de preferencia de todos/as las votantes.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 4

    1.3 FUENTES DE DATOS Ya se ha dicho que la Estadstica es una metodologa cientfica que permite obtener datos que al ser procesados se convierten en estadsticas o indicadores relacionados a una o mltiples variables. Podemos decir entonces que el quehacer de la Estadstica se centra en dar respuestas a una serie de preguntas o interrogantes que surgen en un momento determinado sobre un tema en particular, por ejemplo, Cul es la bebida gaseosa preferida por la poblacin?, por qu las personas prefieren un banco en particular para depositar sus ahorros?, qu porcentaje de la produccin est saliendo defectuoso?, cul ser el nivel de precios para el prximo semestre?, Cmo podemos motivar a los/as estudiantes?, cul mtodo de enseanza es ms efectivo para lograr el aprendizaje en los/as estudiantes? y as sucesivamente. Para dar respuestas a estas preguntas debemos recurrir a la bsqueda de datos y en tal sentido debemos de responder a las siguientes preguntas cules son las fuentes para obtener datos? O de donde obtendremos datos para dar respuesta a nuestra pregunta? En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de los datos y en este sentido las fuentes de datos pueden ser primarias y secundarias. Las fuentes de datos primarias son aquellas en las cuales los datos son generados por quien o quienes realizan la investigacin, es decir que son datos de primera mano, hechos a la medida como lo seala Dillon1, es decir que las fuentes primarias se utilizan para cubrir una necesidad de informacin especfica. 1.3.1 Fuentes primarias de datos Las principales fuentes primarias de datos son el Censo, La Encuesta o Estudios por Muestreo y Los Experimentos. 1. Censo: Es un tipo de investigacin en la cual se estudian todos los elementos de una poblacin determinada. El censo tiene las ventajas de que proporciona informacin sobre una poblacin completa, con un bajo margen de error y adems permite la ubicacin fsica de cada uno de los miembros de la poblacin. Tiene la desventaja de que resulta muy costoso en trminos econmicos, de tiempo y de materiales. 2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una parte de la poblacin, es decir una muestra. Los estudios por muestreo tienen las ventajas de que proporcionan informacin til y confiable sobre una

    1 William Dillon, Thomas J. Madden y Neil H. Firtle: La Investigacin de Mercados. Entornos de Marketing

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 5

    poblacin en corto tiempo y adems resultan menos costosos que un censo. Tienen las desventajas de que no proporcionan informacin sobre la ubicacin fsica de de los elementos de una poblacin y de que si no se disea de manera adecuada puede proporcionar informacin distorsionada sobre el comportamiento del fenmeno que se est estudiando.

    3. Experimentos: Son estudios especializados en los cuales un grupo de elementos de la poblacin es sometido a un tratamiento o condicin especial y los resultados obtenidos con dicho tratamiento se comparan con los resultados de otro grupo que no ha sido sometido al tratamiento o con los del mismo grupo cuando no ha sido sometido al tratamiento o condicin especial. El grupo sometido al tratamiento recibe el nombre de grupo experimental y el grupo con el cual se comparan los resultados recibe el nombre de grupo de control. El objetivo principal de los diseos experimentales es conocer el efecto que tiene en la poblacin estudiada la exposicin de esta a un tratamiento o condicin especial. 1.3.2 Fuentes secundarias de datos Las fuentes secundarias son aquellas en las cuales los datos se encuentran publicados en forma de reportes. Las fuentes de datos secundarias pueden ser externas o internas. Las fuentes secundarias internas son aquellas en las cuales los reportes son el resultado del registro de las actividades de quien lleva a cabo la investigacin, en cambio las fuentes secundarias externas son aquellas en las cuales los datos se encuentran en reportes o publicaciones realizados por entidades ajenas a quien o quienes realizan la investigacin. Las principales fuentes secundarias de datos son los registros internos de la empresa y los reportes de datos de otras organizaciones o externos.

    1. Registros internos de la organizacin: son fuentes secundarias de

    datos y se refieren al conjunto de datos que se origina como resultado del registro continuo y sistemtico de las actividades de una organizacin.

    2. Reportes de datos externos: es un conjunto de datos que pueden ser de inters para dar respuesta a nuestras interrogantes y que han sido generado por organizaciones o entidades externas a quien realiza la investigacin.

    Los registros externos como fuente de informacin tienen las ventajas de que son de fcil acceso, tienen un costo ms bajo que las dems fuentes de datos y adems estn disponibles en el momento requerido. Tienen la desventaja de que quien realiza la investigacin no dispone de los mecanismos de control para garantizar la calidad y la confiabilidad de los

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 6

    datos incluidos en los reportes, as como el formato y la cantidad de datos existentes no siempre se corresponde con los requeridos por el investigador.

    1.4 VARIABLES Y SU CLASIFICACIN Una Variable es una caracterstica que puede variar de un elemento a otro en la poblacin estudiada. Ejemplos: peso corporal de las personas, tamao las aulas universitarias, estatura de las personas, nmero de asignaturas cursadas por los estudiantes por semestre, etc. Las variables se dividen en dos grupos: Cualitativas y Cuantitativas Variables cualitativas: son aquellas variables que describen una cualidad o atributo en el elemento estudiado, estas variables responden la pregunta cul?, ejemplos de estas variables pueden ser: religin que profesan los dominicanos, partido poltico preferido, color de la piel, sexo de los y las estudiantes, raza, carrera estudiada, etc. Variables cuantitativas: son aquellas variables que describen una cantidad en el elemento estudiado. Las variables cuantitativas responden la pregunta cunto?, por ejemplo: nmero de estudiante por aula, venta diaria de una empresa, nmero de hijos por familia, estatura de los estudiantes que cursan estadstica en este semestre, etc. Las variables cuantitativas se dividen en dos categoras: Continuas y discontinuas o discretas. Variables cuantitativas continuas: son aquellas variables cuantitativas cuyos resultados pueden expresarse en nmeros fraccionarios o decimales. Estas variables provienen de un proceso de medicin, por ejemplo el nivel de ingreso de las personas, consumo familiar, estatura de las personas, gasto diario de los estudiantes, etc. Variables cuantitativas discontinuas o discretas: son aquellas variables cuantitativas cuyos resultados se expresan en nmeros enteros, es decir que no admiten valores decimales. Las variables cuantitativas discontinuas o discretas provienen de un proceso de conteo, por ejemplo nmero de asignaturas por estudiante, nmero de estudiantes por aula, nmero de personas que llega a un restaurante de comida rpida, etc. Obsrvese que las variables cuantitativas continuas pueden expresarse en nmero fraccionarios y las discretas o discontinuas se expresan en nmeros enteros, por lo que, aunque en muchas ocasiones expresamos una variable en nmero enteros, no significa que sea discreta, por ejemplo, el gasto en transporte, mayormente lo expresamos en nmero entero, sin embargo, es una

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 7

    variable continua, pues el resultado admite valores fraccionarios, pero el nmero de asignaturas cursada por ejemplo solo se expresa en nmero enteros pues no admite valores fraccionarios. 1.5 MEDICION Y ESCALA DE MEDICIN Daniel2 seala cuando la mayora de las personas escuchan o leen la palabra medicin piensan en actividades tales como usar cintas mtricas para determinar la longitud, anchura o circunferencia de algn objeto, pesar un objeto o persona, y determinar el volumen de alguna sustancia como cuando un cocinero mezcla las cantidades de ingredientes especficas de una receta. A la palabra medicin, sin embargo, puede drsele una definicin ms cientfica que la acostumbrada En efecto la medicin va ms all de determinar cantidad, longitud, volumen o cualquier otra medida de inters. En el mbito de la Estadstica cuando nos referimos a medicin llegamos un poco ms profundo, as por ejemplo hablamos de la medicin de la personalidad, de la medicin de los niveles de tolerancia, los niveles de preferencia por un servicio o un producto, etctera. Para el desarrollo de este curso enteremos por Medicin al proceso mediante el cual se le asigna un numeral (nmero, letra o smbolo) a una variable. Por ejemplo si estamos realizando una investigacin sobre las caractersticas de la poblacin estudiantil podremos incluir variables como la edad, el sexo, el nmero de asignaturas cursadas el gasto diario, percepcin sobre los servicios de la biblioteca, las asignaturas ms preferidas y muchas otras variables. En cada una de estas variables tendremos una medicin en cada uno de los elementos estudiados, as por ejemplo, para la edad nos referiremos a los aos cumplidos y por lo tanto tendremos medidas numricas, (23, 21, 19, 35,..), para la variable sexo podramos asignarle un nmero por ejemplo uno para masculino y dos para femenino o viceversa, pero de igual forma podramos asignarle una letra, M para los masculinos y F para las femeninas o un smbolo para diferenciar cada sexo, de la siguiente manera para los masculinos y para las femeninas De igual forma para la variable nmero de asignaturas de registrara el nmero que representa la cantidad de asignaturas inscrita, por ejemplo, 3, 6, 5, 4, y par la variable gasto tambin se registrara el nmero que representa el monto del gasto diario, 100, 150, 60, 180, . y la variable relacionada con la percepcin sobre los servicios de la biblioteca podemos asignarle una calificacin desde cero a cinco, tomando el cero como una percepcin de los

    2 Wayne W., Daniel & James C. Terrell: Estadstica para Administracin y Economa Tomo I. Editora McGraw-Hill. 7. Edicin. Junio 2000.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 8

    servicios como muy malos y cinco una percepcin de que los servicios son excelentes. Para la variable relacionada con las asignaturas ms preferidas, podramos establecer un registro en orden de importancia, para que la persona estudiada nos diga en orden de preferencia cuales son las asignaturas preferidas, en tal sentido podramos establecer el primer lugar para la ms preferida, el segundo para la segunda ms preferida y as, sucesivamente. Lo que se quiere sealar es que hay diferente forma en como podemos establecer la medicin para una variable, es decir que hay diferente tipo de escala para medir una o mltiples variables, pudiendo entonces establecer una definicin para la escala de medicin. Escala de Medicin: Es la forma en como se mide una variable, es decir que la escala de medicin es el proceso mediante el cual se le asigna un numeral a cada variable. Existen cuatro tipos de escala de medicin: nominal, ordinal, de intervalo y de razn o proporcin. Escala Nominal: Es aquella escala de medicin en la cual los numerales asignados a cada valor o atributo no representa ningn orden de jerarqua, de importancia o preferencia. En este tipo de escala los numerales solo se utilizan para identificar los valores o atributos de cada variable. Ej.: los numerales o cdigos asignados a las variables cualitativas, los nmeros asignados a los integrantes de un equipo bisbol, la matrcula estudiantil, etc. Escala Ordinal: Es aquella escala en la cual los numerales se asignan a cada variable de acuerdo a un orden de jerarqua, importancia o de preferencia. En este tipo de escala, cada numeral representa un tramo jerrquico, de preferencia o de importancia. Ej.: los cdigos asignados a los cargos en una empresa, preferencia de un producto segn su orden de importancia, el nmero asignado a las placas de los vehculos oficiales, etc. Tanto la escala ordinal como la nominal se usan en la medicin de variables cualitativas. Escala de Intervalo: Es una escala cuantitativa cuya caracterstica principal, es que no parte de un cero absoluto, es decir que el punto a partir del cual se empieza a medir es arbitrario. En este tipo de escala la presencia del cero como de medida de la variable no representa ausencia de la variable. Ej.: Las escalas usadas para medir la temperatura, la intensidad de un temblor de tierra, coeficiente inteligente, etc.

    Escala de Razn o Proporcin: Es una escala cuantitativa cuya caracterstica principal es que el proceso de medicin de inicia a partir de un cero absoluto, es decir, que la presencia del cero como medida de la variable significa la

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 9

    ausencia de esta. A este tipo de escala corresponden la mayora de las variables con que trabajamos a diario, ejemplo, peso corporal, tamao de las personas, consumo familiar, ventas de una empresa, distancia recorrida, unidades producidas, distancia recorrida diariamente, etc.

    1.6 PASOS DE UNA INVESTIGACIN ESTADSTICA Cuando nos planteamos una interrogante sobre un tema en particular, nos vemos en la necesidad de buscar datos que nos proporcionen las informaciones necesarias para dar respuesta a dicha interrogante, este proceso de bsqueda de datos conlleva la realizacin de una investigacin la cual requiere de cinco pasos fundamentales3: planeacin, diseo de la investigacin, recoleccin de datos, procesamiento y anlisis y presentacin de resultados. Figura no. 1: Pasos de una investigacin

    Aunque estos pasos pueden y varan atendiendo a los criterios del investigador en trminos generales estos pasos representan el proceso lgico de una investigacin aunque reciban diferentes nombres. A continuacin se hace una descripcin breve de cada uno de estos. 1. Planeacin: Es la fase en la cual se definen los aspectos administrativo y operativos de la investigacin. Esta fase comprende entre otras actividades, el establecimiento de los objetivos: general y especficos, alcance de la investigacin, poblacin de estudio, presupuesto necesario, cronograma de actividades y plan de anlisis o resultados esperados.

    2. Diseo del estudio: En esta fase se define y se disea el instrumento de recoleccin de datos (cuestionario, entrevistas, observacin, entre otros) y se

    3 Ver a Lincoln L. Chao: Estadstica para las Ciencias Administrativas. Tercera Edicin. Editora McGraw-Hill

    Diseo del Estudio

    Anlisis y presentacin

    Planeacin

    Recoleccin de datos

    Procesa- miento

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 10

    define adems, la metodologa a seguir para la aplicacin del instrumento de recoleccin de datos. 3. Recoleccin de datos: Es la fase que requiere de ms tiempo y consiste en la aplicacin del instrumento de recoleccin de datos definido en el diseo del estudio de acuerdo a la metodologa establecida. En esta fase la persona a cargo de la investigacin y su equipo de trabajo se lanzan al terreno para recolectar los datos que una vez procesados darn respuestas a los objetivos de la investigacin.

    4. Procesamiento de datos: Es la fase en la cual se obtienen los cuadros y tablas, as como las medidas o indicadores estadsticas que permiten describir el comportamiento de la poblacin estudiada, as como dar respuestas a los objetivos planteados en la fase de planeacin. La fase de procesamiento de los datos conlleva cuatro actividades esenciales previas: Limpieza y organizacin de los datos, codificacin, digitacin y edicin. La limpieza y organizacin de los datos se refiera al proceso mediante el cual se verifican la calidad de los datos obtenidos, se enumeran los instrumentos de recoleccin de datos utilizados, verificacin del cumplimiento de las metas en cuanto a la cantidad y calidad. La codificacin por su parte es la actividad que permite asignar un cdigo numrico a cada respuesta del instrumento de recoleccin de datos. Esto se hace con la finalidad de facilitar el proceso de digitacin. La digitacin es el proceso mediante el cual los datos son introducidos al computador con el fin de que el procesamiento sea ms eficiente. La edicin por su parte es un proceso de verificacin, es decir, con la edicin de los datos verificamos que se haya digitado lo que realmente se ha respondido en el instrumento de recoleccin de datos.

    5. Anlisis y presentacin de resultados: Es la fase es la cual se analizan los resultados obtenidos, estableciendo descripcin de la poblacin estudiada, comparaciones y asociaciones entre variables, inferencias muestrales, entre otras. En la fase de procesamiento y adems se dan a conocer los resultados obtenidos en la investigacin. Veamos un ejemplo relacionado con el proceso de investigacin. En el semestre 2006-1 de la UASD, el trabajo final de un grupo de estudiantes fue medir el rendimiento, (tomando para ello el promedio de las calificaciones) de un grupo de estudiantes tanto en las escuelas pblicas como en las escuelas privadas. De esta forma la poblacin estaba definida, as como los objetivos del trabajo de investigacin.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 11

    Como se podrn imaginar, el presupuesto era pequeo y no predeterminado, pero tengan por seguro que aquellas personas que no pasaron de curso se lo encontraron ms costoso, pero bueno, ese no es el caso ahora. El instrumento de recoleccin de datos fue un cuestionario, el cual se muestra en la figura nmero dos y la metodologa consisti en tomar una muestra de estudiantes de las escuelas pblicas y otra muestra en colegios privados. El cuestionario utilizado como instrumento de recoleccin de datos se muestra en la figura nmero dos de la pgina siguiente. Figura no. 2. Instrumento de recoleccin de datos utilizado en el estudio

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante __________________________ 2. Edad ______ 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante _____________________________ 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas ______ 8. Calificacin en Espaol ______ 9. Calificacin en Sociales ______ 10. Calificacin en Naturales _____ La metodologa consisti en tomar una muestra de treinta estudiantes de la escuela pblica y treinta de la escuela privada. La fuente de datos utilizada fue el registro de cada estudiante en la escuela, procediendo a completar el instrumento de recoleccin de datos diseado A continuacin se presenta una muestra del instrumento de recoleccin de datos completado durante la tercera fase del estudio. Por conveniencia las respuestas se han subrayado de forma que se puedan identificar fcilmente. Ntese que los cuestionarios no estn numerados y si lo estuvieran no representan una jerarqua o importancia, sino que el numeral asignado es una escala nominal.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 12

    Figura no. 3: Instrumentos de recoleccin de datos completados

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Rodolfo Pea 2. Edad 15 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante: Con padre y madre 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 69 8. Calificacin en Espaol 75 9. Calificacin en Sociales 72 10. Calificacin en Naturales 71

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Ral Arias 2. Edad 12 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante: con ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 67 8. Calificacin en Espaol 69 9. Calificacin en Sociales 64 10. Calificacin en Naturales 69

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Paola Mocin 2. Edad 10 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante Ta 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 80 8. Calificacin en Espaol 78 9. Calificacin en Sociales 76 10. Calificacin en Naturales 80

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante: Yordi Gonzlez 2. Edad 11 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante: con la madre 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 70 8. Calificacin en Espaol 68 9. Calificacin en Sociales 65 10. Calificacin en Naturales 65

    Universidad Autnoma de Santo Domingo

    Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Ashley Ciprin 2. Edad 9 aos 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 85 8. Calificacin en Espaol 80 9. Calificacin en Sociales 82 10. Calificacin en Naturales 78

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Vicente Meja 2. Edad 13 aos 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante con la madre 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 65 8. Calificacin en Espaol 70 9. Calificacin en Sociales 78 10. Calificacin en Naturales 70

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 13

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Cndida Beatriz 2. Edad 11 aos 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 83 8. Calificacin en Espaol 90 9. Calificacin en Sociales 89 10. Calificacin en Naturales 91

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Manuel Fontana 2. Edad 10 aos 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante con una ta 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 88 8. Calificacin en Espaol 90 9. Calificacin en Sociales 89 10. Calificacin en Naturales 85

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Charly Cepeda 2. Edad 13 aos 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 77 8. Calificacin en Espaol 78 9. Calificacin en Sociales 83 10. Calificacin en Naturales 78

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    1. Nombre y apellidos del estudiante Helena Parache 2. Edad 11 aos 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante con ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 77 8. Calificacin en Espaol 72 9. Calificacin en Sociales 81 10. Calificacin en Naturales 65

    Una vez agotada la tercera fase, la recoleccin de datos, nos dedicamos a cuarta fase, el procesamiento de los datos, recordando que esta fase incluye la organizacin, codificacin, digitacin y edicin, para luego obtener los cuadros y tablas, as como las medidas estadsticas que nos permitan dar respuestas a los objetivos planteados. En el caso que nos ocupa para la organizacin podemos por ejemplo asignar un nmero a cada instrumento completado. Para la codificacin, el trabajo se reduce significativamente, ya que el instrumento diseado tiene cada pregunta pre-codificada, por ejemplo, para el sexo se le asigna el nmero uno a los de sexo masculino y el dos a las de sexo femenino, de igual forma a los y las estudiantes de escuelas pblicas se le asigna el nmero uno y los y las de colegios privados el nmero dos. Sin embargo, en el caso de la pregunta relacionada a con quien vive el o la estudiante, es recomendable establecer un cdigo numrico para las posibles respuestas, ya que en el instrumento esta es una pregunta abierta. Los cdigos

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 14

    asignados son: el nmero uno para los y as que viven con ambos padres, (padre y madre), el dos para los y las que viven solo con la madre, el tres para los y las que viven solo con el padre y el cuatro para los y las que viven con otro familiar. La importancia de asignar un cdigo numrico es que el proceso de digitacin se hace ms eficiente y se cometen menos errores. Un ejemplo se muestra a continuacin con los dos primeros instrumentos Figura no. 4: instrumentos de datos completados y codificados

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    No. 1 1. Nombre y apellidos del estudiante Rodolfo Pea 2. Edad 15 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante: 1 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 69 8. Calificacin en Espaol 75 9. Calificacin en Sociales 72 10. Calificacin en Naturales 71

    Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos

    No. 2 1. Nombre y apellidos del estudiante Ral Arias 2. Edad 12 3. Sexo: 1. Masculino 2. Femenino 4. Con quien vive el estudiante: 1 5. Tipo de escuela: 1. Pblica 2. Privada 6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 67 8. Calificacin en Espaol 69 9. Calificacin en Sociales 64 10. Calificacin en Naturales 69

    Como se muestra en la figura anterior, a la derecha aparece el nmero asignado al instrumento y en la pregunta de con quien vive el o la estudiante se ha asignado como respuesta el nmero uno ya que en ambos casos los estudiantes viven con ambos padres. Para la digitacin se podra colocar los datos en una matriz, colocando cada variable en las columnas y cada fila para los elementos estudiados. En este caso vamos a utilizar la hoja de clculo de Excel para la digitacin como se muestra en la figura nmero cinco. (Es preciso aclarar que existen numerosos programas en los que se puede hace la digitacin, se ha elegido el Excel por la disponibilidad y facilidad del mismo)

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 15

    Figura no. 5: Ilustracin de la digitacin en Excel

    El proceso de edicin de los datos sera imprimir los datos digitados y luego verificar si el proceso de digitacin se ha hecho correctamente. Una vez que se ha realizado el proceso de digitacin y edicin de los datos, se procede a obtener los cuadros y tablas, as como las medidas estadsticas que nos permitan dar respuesta a los objetivos del trabajo de investigacin, pero sobre este particular volveremos a tratarlo en los captulos siguientes. 1.7 PRESENTACIN DE RESULTADOS Una vez que se ha completado el proceso de investigacin con el anlisis de los resultados, el paso siguiente consiste en presentar dichos resultados a la entidad interesada. Para hacerlo existen cinco formas que describiremos brevemente a continuacin:

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 16

    1. Presentacin oral: Cuando los resultados de la investigacin se presentan en forma de discurso. Por ejemplo, muchas organizaciones, (empresas, partidos polticos, ONG`s, entre otras) convocan a una rueda de prensa o a un encuentro con el objetivo de dar a conocer los resultados de una investigacin determinada. La presentacin oral tiene la ventaja de que es fcil de preparar y su costo es bajo, sin embargo, presenta la desventaja de que quien recibe la informacin va olvidando los primeros datos en la medida en que se avanza con el suministro de informacin. 2. Presentacin escrita: Es aquella en la cual los resultados de una investigacin se presentan en un informe en forma de texto. La presentacin de los resultados de una investigacin presentados en un informe, requieren de una mayor formalidad y de un esfuerzo mayor. Un informe con los resultados de una investigacin consta de seis partes esenciales.

    2.1 Hoja y/o carta de presentacin: en esta parte se presenta de manera

    formal los resultados de la investigacin.

    2.2 ndice de contenido: en esta parte del informe se establece o describe la ubicacin fsica de cada una de las partes contenidas en el informe.

    2.3 Resumen ejecutivo: como lo indica su nombre, es un resumen que contiene los principales resultados de la investigacin. Su objetivo fundamental es describir el comportamiento de la poblacin estudiada de manera rpida y precisa sin adentrarse en detalles.

    2.4 Cuerpo del trabajo: En esta parte se describen de manera detallada

    todos los resultados de la investigacin, incluye la presentacin de cuadros, tablas, grfico, descripcin textual, as como el clculo de medidas estadsticas.

    2.5 Conclusiones: las conclusiones representan el juicio extrado de los

    resultados de la investigacin. Se refieren a los puntos a los cuales llega quien o quienes realizan el estudio despus de analizar de manera detallada los resultados obtenidos. Las conclusiones dan respuestas a las interrogantes establecidas y a los objetivos planteados en la fase de planeacin.

    2.6 Recomendaciones: se refiere al conjunto de sugerencias o curso de

    accin que se sugieren seguir a partir de los resultados de la investigacin.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 17

    2.7 Anexos: en esta parte del informe se incluye toda informacin que sea relevante para el estudio que se realiza y que por alguna razn no se incluy en el cuerpo del trabajo, por ejemplo cuadros, copia del o los instrumentos de recoleccin de datos utilizados, cronograma de actividades, fotografas, copias de artculos, de leyes, entre otros. 3) Presentacin tabular: es aquella es la que los resultados de una investigacin se presentan en forma de cuadros o tablas. Un cuadro o tabla estadstica se compone de tres partes esenciales y una opcional. 3.1 Ttulo: en este se detalla de manera clara, precisa y lo ms corto

    posible los datos incluidos en el cuadro. El ttulo es de vital importancia a fin de edificar a la persona interesada sobre la informacin que se presenta en el cuadro o la tabla de que se trate.

    3.2 Cuerpo o armazn: es un arreglo matricial, (arreglo de filas y

    columnas) en el cual se detallan los datos especificados en el ttulo. El cuerpo o armazn est compuesto de dos partes:

    3.2.1 La columna principal, en la cual se describe la variable o las variables a presentar en el cuadro. 3.2.2 Las columnas secundarias, es las cuales se describen los valores relacionados a cada valor o atributo de la variable.

    3.3 Fuente: es la parte del cuadro en la cual se especfica el origen de los

    datos presentados en dicho cuadro. La importancia de la fuente es que al informar sobre el origen de los datos descrito en la tabla, permite, de alguna manera, evaluar la calidad y confiabilidad de los mismos.

    Nota aclaratoria: se utiliza para especificar cualquier detalle o aclaracin referente a los datos incluidos en el cuadro. Por ejemplo, en el cuadro que se muestra a continuacin se podra incluir una nota aclaratoria para indicar que solo se incluyen a los estudiantes que asistieron ese da a la clase o que incluye a otros colados de otra seccin de la que se trate.

    4) Presentacin grfica: es aquella en la cual los resultados de una investigacin se presentan en forma de grfico. La importancia de la presentacin grfica es que permite observar el comportamiento de una variable sin entrar en detalles, solo con observar el cuadro.

    Cuadro No: Sexo de los estudiantes de Est-XXX, seccin XX

    SEXO No. % MASCULINO FEMENINO

    9 25

    26.5 73.5

    TOTAL 34 100.0 Fuente: Clase 17/01/2004

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 18

    Sex o de lo s e s tu d ia n tes de Es t-x x x , s e cc in 0 0

    26.5%

    73.5%MASCULINO FEMENINO

    Comparacin mensual de su consumo

    0

    100

    200

    300

    400

    500

    600

    700

    Abr May Jun Jul Ago Sep Oct Nov Dic Ene Feb Mar Abr

    Por ejemplo, al observar un recibo de la facturacin de la electricidad, se muestra un grfico como el que vemos a nuestra derecha, observamos como ha variado el consumo, si se ha consumido ms o se ha consumido menos. Una presentacin grfica contiene los mismos elementos que un cuadro o tabla, es decir: ttulo, cuerpo, fuente y nota aclaratoria. 5) Presentacin Mixta: es aquella en la cual quien o quienes realizan la investigacin utilizan para la presentacin de los resultados del estudio dos o ms formas de presentacin de datos.

    Fuente: clase del 7/01/2004

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 19

    II. ORGANIZACIN Y PRESENTACIN DE LOS DATOS 2.1 ORGANIZACIN SIMPLE El objetivo fundamental de la organizacin de los datos es conocer el comportamiento y las caractersticas de las variables estudiadas, sin una organizacin de los datos se hace un tanto difcil el anlisis de los mismos. Supongamos que tenemos los datos relacionados con el rendimiento acadmico de 133 estudiantes y los mismos se muestran en el recuadro siguiente:

    82.5 73.8 73.0 76.8 81.5 79.5 67.8 88.5 68.3 60.5 71.0 77.5 63.0 70.5 70.8 85.5 60.0 81.3 82.0 81.0 61.0 80.3 70.8 69.5 61.3 78.8 62.8 61.8 81.0 81.8 64.8 71.5 71.0 75.0 68.8 86.3 77.0 67.5 82.0 84.5 82.3 71.8 77.8 79.5 72.3 71.5 69.5 84.8 67.3 85.0 87.8 67.0 81.3 72.8 69.8 71.0 79.0 78.8 67.0 76.0 72.8 67.0 69.0 91.3 87.3 62.0 83.5 78.5 68.8 91.8 88.8 73.8 66.5 84.0 69.3 65.3 67.8 88.5 84.5 69.0 68.5 72.0 58.0 61.5 88.5 83.3 66.0 84.3 67.8 66.8 63.0 93.0 71.8 71.3 82.8 70.3 56.5 83.5 85.0 81.3 65.8 92.5 70.3 63.8 81.8 95.3 80.8 69.8 72.5 89.8 70.0 66.8 88.0 90.8 72.8 70.5 70.5 72.0 77.8 82.0 71.0 61.3 78.5 77.8 56.8 64.5 85.0 70.5 64.8 67.0 90.8 84.3 63.5

    Como se puede observar, tenemos datos suficientes como para dar un diagnstico sobre el rendimiento de los y las estudiantes, sin embargo, sin una organizacin esto se hace poco aplicable. Una forma sencilla de iniciar una exploracin de los datos, para conocer sus caractersticas es organizando los mismos en orden ascendente como se ilustra a continuacin. Este procedimiento no nos proporcionar mucha informacin sobre las caractersticas relevantes de la variable, nos permite conocer por ejemplo cual es el rendimiento mayor y el menor y permite adems observar si existe un valor que se repita con una frecuencia mayor que los dems, etc.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 20

    56.5 65.3 69.0 71.0 76.8 81.3 84.8 56.8 65.8 69.0 71.3 77.0 81.3 85.0 58.0 66.0 69.3 71.5 77.5 81.5 85.0 60.0 66.5 69.5 71.5 77.8 81.8 85.0 60.5 66.8 69.5 71.8 77.8 81.8 85.5 61.0 66.8 69.8 71.8 77.8 82.0 86.3 61.3 67.0 69.8 72.0 78.0 82.0 87.3 61.3 67.0 70.0 72.0 78.5 82.0 87.8 61.5 67.0 70.3 72.3 78.5 82.3 88.0 61.8 67.0 70.3 72.5 78.8 82.5 88.5 62.0 67.3 70.5 72.8 78.8 82.8 88.5 62.8 67.5 70.5 72.8 79.0 83.3 88.5 63.0 67.8 70.5 72.8 79.5 83.5 88.8 63.0 67.8 70.5 73.0 79.5 83.5 89.8 63.5 67.8 70.8 73.8 80.3 84.0 90.8 63.8 68.3 70.8 73.8 80.8 84.3 90.8 64.5 68.5 71.0 75.0 81.0 84.3 91.3 64.8 68.8 71.0 75.0 81.0 84.5 91.8 64.8 68.8 71.0 76.0 81.3 84.5 92.5

    Ahora podemos fijarnos una idea ms acabada sobre el rendimiento de los y las estudiantes de las escuelas pblicas y privadas, por ejemplo, observamos que ms de un tercio tiene un rendimiento promedio inferior a los 70.0 puntos, que solo cinco de los 133 estudiantes estudiados tienen un rendimiento superior a 90.0 puntos y as sucesivamente. 2.2 DISTRIBUCIONES DE FRECUENCIA Los datos que provienen de un censo, una encuesta por muestreo, diseo experimental y aquellos que provienen de fuente secundarias que no han sido agrupados o condensados, como por ejemplo la revisin de un expediente clnico, se presentan en la mayora de los casos en una Distribucin de frecuencia, ya sea para una o para mltiples variables. Una distribucin de frecuencia es un arreglo matricial, (arreglo de filas y columnas) donde se presenta los valores o atributos de una variable y su respectivas frecuencias. Antes de entrar en detalles sobre los diferentes tipos de distribuciones de frecuencias, vamos a definir el concepto de frecuencia y los diferentes tipos de frecuencias. La Frecuencia, en trminos estadsticos, se define como el nmero de veces que se repite un dato u observacin. Por ejemplo, al observar el sexo de 50 estudiantes de un curso de Estadstica, se observaron los datos que se presentan en la tabla siguiente

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 21

    Tabla 1: Sexo de 50 estudiantes de un curso de Estadstica

    M F F F M F F M F F F F F M F F F F F M M F F F M M F M F F F F F F F F F F F F F F M F F F F F F M

    Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia. 2.3 TIPOS DE FRECUENCIA Existen cuatro tipos de frecuencias: la absoluta simple, la relativa simple, la absoluta acumulada y la absoluta relativa acumulada.

    2.3.1 Frecuencia absoluta simple, (fi): se define como el nmero de veces que se repite un dato u observacin. Comnmente se le denomina con el nombre de frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una frecuencia absoluta simple de 11, mientras que el dato femenino presenta una frecuencia absoluta simple de 39.

    2.3.2 Frecuencia absoluta acumulada, (FA): consiste en la suma continua y subsecuente de la frecuencia absoluta simple. La frecuencia absoluta acumulada expresa la cantidad de elementos que se encuentra por debajo de un valor especfico. 2.3.3 Frecuencia relativa simple, (fr o %): consiste en expresar la frecuencia absoluta simple, (fi) como una proporcin con aspecto al total de frecuencia. 2.3.4 Frecuencia relativa acumulada, (FRA o % acumulado): Expresa la frecuencia absoluta acumulada, (FA) como un porcentaje con respecto al total de frecuencia y representa la proporcin de elementos que se encuentran por debajo de un valor determinado. La FRA se puede obtener de dos formas: a) Sumando de manera continua y subsecuente la frecuencia relativa simple. b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia. 2.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que para fines de anlisis se consideras homogneos. Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que conforma una distribucin de frecuencia. Para la ilustracin vamos a tomar la calificacin obtenida por 50 estudiantes en una prueba parcial de Estadstica, los datos se ilustran en la tabla nmero dos a continuacin.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 22

    Tabla 2: Calificacin obtenida por 50 estudiantes de Estadstica en una prueba parcial

    14 14 19 15 10 12 13 14 9 12 13 14 8 16 14 16 16 12 18 15 17 18 10 14 16 10 19 19 13 15 16 16 13 17 16 9 13 17 11 11 12 12 19 10 8 17 6 18 14 16

    Para ordenar estos datos, lo primero que vamos a hacer es colocar en la primera columna la variable, en este caso la calificacin obtenida, pero como puede tomar mltiple valores, se clasifica en cinco categoras, la primer, los/as que obtuvieron menos de 12 puntos, la segunda los/as estudiantes que obtuvieron entre 12 y menos de 14 puntos, la tercera los/as estudiantes que obtuvieron entre 14 y menos de 16 puntos, la cuarta clase est compuesta por los/as estudiantes que obtuvieron entre 16 y menos de 18 puntos y la quinta clase, est formada por aquellos/as estudiantes que obtuvieron entre 18 y 20 puntos. De esta forma, la primera columna queda como se ilustra a continuacin:

    Calificacin 12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    TOTAL El segundo paso es determinar la cantidad de estudiantes que cae dentro de cada una de estas categoras o clases. Para esto, sencillamente se cuenta en la tabla dos, la cantidad de calificaciones que est dentro de cada uno de los lmites de cada categora o clase. Para determinar la cantidad de datos en cada categora o clase se puede hacer contando de manera directa cada valor o a partir de un proceso de conteo detallado, colocando una raya, un punto o un smbolo en cada categora cada vez que aparece un valor que se corresponda con esta. Al observar los datos sueltos de la tabla dos, en la primera categora, las calificaciones menores de 12 puntos, hay 11 estudiantes, con calificacin

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 23

    menor a 12 puntos. De igual forma se observa que hay 10 estudiantes con calificacin entre 12 y menos de 14 puntos, igual cantidad, 10 estudiantes con calificacin entre 14 y menos de 16 puntos. De igual forma se observa que hay 12 estudiantes con calificacin entre 16 y menos de 18 puntos y finalmente, siete estudiantes con calificacin entre 18 y 20 puntos. En la segunda columna de la distribucin se coloca la frecuencia de cada clase o categora, por lo que la tabla quedara como se ilustra a continuacin:

    Calificacin fi

    12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    11

    10

    10

    12

    7

    TOTAL 50 A partir de esta frecuencia absoluta simple, se obtienen las dems frecuencias. La frecuencia relativa, por ejemplo se obtiene al dividir cada frecuencia absoluta entre el total de frecuencia. Si esta frecuencia se desea expresar como un porcentaje, entonces se multiplica por 100. La primera frecuencia relativa es [(11/50) x 100]= 22.0%, la segunda frecuencia relativa es [(10/50) x 100]= 20.0% y as sucesivamente, la tercera frecuencia relativa es [(10/50) x 100]= 20.0%, la cuarta frecuencia relativa es [(12/50) x 100]= 24.0% y la quinta y ltima frecuencia relativa de esta distribucin es [(17/50) x 100]= 14.0% El resultado de calcular cada una de la frecuencia relativa se muestra en la tabla siguiente:

    Calificacin fi %

    12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    11

    10

    10

    12

    7

    22.0

    20.0

    20.0

    24.0

    14.0

    TOTAL 50 100.0

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 24

    De igual forma, a partir de la frecuencia absoluta simple se obtiene la frecuencia absoluta acumulada. Esta frecuencia es el resultado de sumar las frecuencias absoluta simple de cada clase. En trminos generales, la frecuencia absoluta acumulada de una clase o categora en particular es igual a la frecuencia acumulada hasta la clase anterior ms la frecuencia absoluta simple de la clase o categora de que se trate. As, la frecuencia absoluta acumulada de la primera clase o categora es igual a frecuencia absoluta simple, para nuestro ejemplo, la frecuencia absoluta acumulada de la primera clase es igual a 12. La frecuencia absoluta acumulada en la segunda clase o categora es la suma de la frecuencia acumulada en la primera clase ms la frecuencia absoluta simple de la segunda clase, es decir (11 + 10)= 21. El procedimiento se sigue de manera similar hasta determinar la frecuencia acumulada para cada clase o categora. De esta forma la frecuencia acumulada de la tercera clase es igual a la frecuencia acumulada de la segunda clase ms la frecuencia absoluta simple de la tercera clase, en este caso (21 + 10)= 31, la frecuencia acumulada de la cuarta clase es igual a la frecuencia acumulada hasta la tercera clase ms la frecuencia absoluta simple de la cuarta, esto es (31 + 12)= 43 y la frecuencia acumulada de la quinta clase o es igual a la frecuencia acumulada hasta la cuarta clase ms la frecuencia simple de la quinta clase, es decir (43 + 7)= 50. El resultado de las sumas se muestra en la tabla siguiente:

    Calificacin fi % FA 12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    11

    10

    10

    12

    7

    22.0

    20.0

    20.0

    24.0

    14.0

    11

    21

    31

    43

    50

    TOTAL 50 100.0 Una vez que se ha determinado la frecuencia absoluta acumulada el siguiente paso es calcular la frecuencia relativa acumulada o porcentaje acumulado. Este porcentaje puede obtenerse de dos formas, o se acumula la el porcentaje simple o se divide cada frecuencia absoluta acumulada entre el total. El procedimiento de acumular el porcentaje simple, simplifica los clculos. El porcentaje acumulado de la primera clase es igual porcentaje simple de la misma. Para nuestro ejemplo, el porcentaje acumulado de la primera clase o

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 25

    categora es igual a 22.0%. El porcentaje acumulado en la segunda clase o categora es la suma del porcentaje acumulado en la primera clase ms el porcentaje simple de la segunda clase, es decir (22.0 + 20.0)= 42.0%. Al igual que en la frecuencia absoluta acumula, procedimiento se sigue de manera similar hasta determinar la porcentaje acumulado para cada clase o categora. De esta forma la porcentaje acumulado de la tercera clase es igual al porcentaje acumulado de la segunda clase ms el porcentaje simple de la tercera clase, en este caso es (42.0 + 20.0)= 62.0%, el porcentaje acumulado de la cuarta clase es igual al porcentaje acumulado hasta la tercera clase ms el porcentaje simple de la cuarta, esto es (62.0 + 24.0)= 86.0% y el porcentaje acumulado de la quinta clase o es igual al porcentaje acumulado hasta la cuarta clase ms el porcentaje simple de la quinta clase, es decir (86.0 + 14.0)= 100.0%. El resultado de las sumas se muestra en la tabla siguiente:

    Calificacin fi % FA FRA 12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    11

    10

    10

    12

    7

    22.0

    20.0

    20.0

    24.0

    14.0

    11

    21

    31

    43

    50

    22.0

    42.0

    62.0

    86.0

    100.0

    TOTAL 50 100.0 Una vez que han calculado las frecuencias se procede a completar el cuadro de manera adecuada, es decir, poner el ttulo, se elimina la columna del conteo, (si se ha incluido), y se coloca la fuente de los datos.

    Cuadro No : Calificacin de 50 estudiantes de un curso de estadstica en una prueba parcial Calificacin fi % FA FRA

    12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    11

    10

    10

    12

    7

    22.0

    20.0

    20.0

    24.0

    14.0

    11

    21

    31

    43

    50

    22.0

    42.0

    62.0

    86.0

    100.0

    TOTAL 50 100.0 Fuente: Tabla 2

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 26

    2.5 TIPOS DE DISTRIBUCIN DE FRECUENCIA Para agrupar los datos existen tres tipos de distribucin de frecuencia, la cuales se utilizarn de acuerdo al tipo de datos que estemos tratando. 2.5.1 Distribucin de frecuencia para datos cualitativos: cuando se tienen datos cualitativos, el procedimiento se simplifica, pues solo se requiere colocar las diferentes categoras de la variable y la frecuencia asociada con dada una de ellas, como se muestra en el ejemplo siguiente:

    Cuadro No.: Personas con quienes viven los/as estudiantes de las escuelas pblicas y de la privadas

    Con quien vive fi % Ambos padres 106 79.7 Con la madre 15 11.3 Con el padre 5 3.8 Otro familiar 7 5.3 Total 133 100.0 Fuente: Estudio de mayo del 2006

    2.5.2 Distribucin Frecuencia Simple o Tipo I: es un tipo de distribucin de frecuencia que se utiliza para presentar una variable cuantitativa discreta, cuyo rango de valor sea menor o igual de diez. Es decir se utiliza para variables cuantitativas discretas que toman pocos valores diferentes. Ejemplos de estas variables son nmero de hijos/as por familia, nmero de asignaturas cursadas por los estudiantes de la UASD, nmero de cursos realizados por los empleados y empleadas de una empresa, entre otros. Ejemplo: Se les pregunt a cincuenta profesores sobre el nmero de estudiantes reprobados que tena en su curso, los datos son: Tabla 3: Nmero de estudiantes reprobados/as por curso

    3 1 4 5 3 2 2 4 2 2 5 4 2 4 5 3 2 3 3 1 3 5 3 1 2 2 4 2 1 0 2 4 4 5 4 3 1 2 3 1

    El dato menor que aparece en los datos es el valor cero y el mayor es el cinco de forma tal que esta variable en esta muestra toma seis valores diferentes: cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una distribucin de frecuencia simple o tipo I colocamos los diferentes valores de

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 27

    la variable en la primera columna y luego se cuenta el nmero de veces que se repite cada dato, como se muestra en la distribucin de frecuencia siguiente:

    Cuadro No.: Cantidad de estudiantes reprobados/as por curso # de estudiantes fi. % FA % Acum.

    0 1 2.5 1 2.5 1 6 15.0 7 17.5 2 11 27.5 18 45.0 3 9 22.5 27 67.5 4 8 20.0 35 87.5 5 5 12.5 40 100.0

    Total 40 100.0 Fuente: Encuesta a 40 profesores noviembre 2006

    2.5.3 Distribucin Frecuencia con Clase o Tipo II: Este tipo de distribucin se utiliza para variables cuantitativas continuas y para aquellas variables cuantitativas discretas, cuyo rango de valor sea mayor de diez. Siempre que se trate de datos cuantitativos continuos se hace necesario el uso de este tipo de distribucin. La razn para ello es que los datos cuantitativos continuos pueden diferir uno del otro por milsima de datos, lo que, de tener los diferentes valores con sus respectivas frecuencias se podra tener tantas clases como valores individuales se tenga, perdindose de esta manera la esencia de la agrupacin de los datos, proporcionar informacin sobre las caractersticas de las variables estudiadas Un ejemplo de este tipo de distribucin de frecuencia se muestra a continuacin

    Cuadro No : Calificacin de 50 estudiantes de un curso de estadstica en una prueba parcial Calificacin fi % FA FRA

    12.0

    12.0 13.9

    14.0 15.9

    16.0 17.9

    18.0 20.0

    11

    10

    10

    12

    7

    22.0

    20.0

    20.0

    24.0

    14.0

    11

    21

    31

    43

    50

    22.0

    42.0

    62.0

    86.0

    100.0

    TOTAL 50 100.0 Fuente: Tabla 2

    2.6 Pasos para construir una distribucin de frecuencia con clase.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 28

    Los pasos que se presentan a continuacin son solo una gua de cmo organizar los datos en una distribucin de frecuencia con clase, puesto que la forma de presentar los datos muchas veces depende de lo que se quiera mostrar en la distribucin. Pero cuando no se tiene una idea de cmo agrupar los datos, los siguientes pasos son una buena gua y estos pasos son: 1. Calcular el rango de la variable: El rango de una variable se define como la

    diferencia entre dato mayor y el dato menor y el mismo indica los diferentes valores posibles que puede tomar la variable

    RV = Xmayor - Xmenor

    2. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase es la diferencia que existe entre el lmite inferior y el lmite superior de cada clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo a los objetivos de quien est presentado la informacin. Una forma de obtener el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual establece que el ancho o intervalos de clases en una distribucin de frecuencia puede aproximarse a partir de la siguiente frmula:

    )log322.3(1 nxRV

    , n representa el total de datos o tamao de la muestra

    A partir de esta frmula se obtiene un intervalo de igual dimensin para todas las clases lo que facilita el anlisis. 3. Establecer los lmites de cada clase: para establecer los lmites de cada clase o intervalo, se inicia con el dato menor y se le suma el intervalo y as se contina hasta llegar al dato mayor observado. Es importante tener en consideracin que los lmites se deben establecer de forma excluyentes, esto es, que los valores en los lmites no deben ser iguales, por ejemplo, si una clase va de 30 a 40, como el 40 no va incluido en esa clase lo aconsejable es establecer como limite superior el resultado de la suma disminuido en una unidad, lo que nos dara una clase con los siguientes lmites; 30 a 39, as, la siguiente clase iniciara con 40 y de esta forma los valores del lmite superior de una clase y el inferior de la siguiente no van a ser iguales. Este procedimiento ayuda a que quien lea u organice la informacin no tenga dudas sobre donde colocar por ejemplo el 40, adems de que este procedimiento facilita un mayor entendimiento del comportamiento de los datos.

    4 Herbert A. Sturges: The Choice of a Class Interval, Journal of the American Statistical Association. Marzo 1926

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 29

    4. Realizar el conteo y establecer las frecuencias: El conteo consiste es determinar cuantos valores de la variable pertenecen a cada clase o intervalo

    Ejemplo: 1. Los datos que se muestran a continuacin representan las edades de un grupo de 40 personas que asistieron al estreno de una pelcula

    21 24 33 29 35 26 26 25 44 32

    40 21 31 28 20 26 21 33 32 41

    22 20 22 23 43 50 47 45 26 38

    26 22 24 39 38 35 20 46 20 25

    A partir de los datos desarrolle las siguientes preguntas:

    a) Construir una distribucin de frecuencia b) Determinar el porcentaje de personas que tiene menos de 30 aos c) Interprete el resultado de la frecuencia relativa simple de la tercera clase d) Interprete el resultado de la frecuencia relativa acumulada de la quinta

    clase. e) Qu porcentaje de las personas que asistieron al curso de estadstica

    tiene menos de 38 aos? Iniciamos con los cinco pasos para construir una distribucin de frecuencia con clase: 1. Rango de la variable:

    RV = Xmayor - Xmenor RV = 50 20 RV = 30

    2. )log322.3(1 n

    RV

    575.43221.630

    3221.5130

    )6021.1322.3(130

    )40log322.3(130

    3. Establecer los lmites de cada clase: recordemos que para la primera

    clase se suma el intervalo al dato menor y as sucesivamente, como se muestra a continuacin:

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 30

    EDAD 20-24 25-29 30-34 35-39 40-44 45-50

    Obsrvese que la primera clase inicia con el 20 que es el dato menor y termina en 24 ya que el intervalo de la distribucin es de cinco. El lector podr preguntarse porque la primera la clase no termina en 25 que es resultado de sumar el intervalo al dato menor y la respuesta es que el 20 como dato menor va incluido en el intervalo de la clase y si contamos teneos 20, 21, 22, 23 y 24 que son los cinco valores del intervalo. 4. Por ltimo establecemos la frecuencia de cada de una de las clases. Un procedimiento recomendado es hacer un conteo, tomando en consideracin los lmites de cada clase. As por ejemplo, si tomamos los valores de la primera columna observamos que estos son: 21, 40, 22 y 26 por lo que el primer valor corresponde a la primera clase porque es un valor que esta entre 20 y 24, el segundo valor corresponde es el 40 y corresponde la quinta clase que va de 40 a 44, el tercer valor es 22 y corresponde a la primera clase porque este valor est entre 20 y 24 y el cuarto valor es el 26 y pertenece a la segunda claro porque este valor esta entre 25 y 29 que son los lmites de esta clase. Este procedimiento se sigue hasta incluir todos los valores de la variable en la clase o intervalo correspondiente. El resultado de dicho proceso se muestra a continuacin: Cuadro No.: Edad de las personas que asistieron al estreno de la pelcula.

    EDAD fi % FA % Acum. 20-24 13 32.5 13 32.5

    25-29 9 22.5 22 55.0

    30-34 5 12.5 27 67.5

    35-39 5 12.5 32 80.0

    40-44 4 10.0 36 90.0

    45-50 4 10.0 40 100.0

    Total 40 100.0 Fuente: Encuesta hecha a los/as asistentes al cine

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 31

    b) Determinar el porcentaje de personas que tiene menos de 30 aos: Como se muestra en la tabla anterior menor a 30 aos hay un 55.0% que son las personas que tienen entre 20 y 24 aos y las que tienen entre 25 y 29 aos. c) Interprete el resultado de la frecuencia relativa simple de la tercera clase: La tercera clase es la que va de 30 a 34 y el resultado indica que el 12.5% de las personas que asistieron al estreno de la pelcula tienen entre 30 y 34 aos. d) Interprete el resultado de la frecuencia relativa acumulada de la quinta clase. El resultado de la frecuencia relativa acumulada de la quinta clase es 90.0% y el mismo indica que el 90.0% de las personas que asistieron al estreno de la pelcula tienen 44 aos o menos. Tambin se puede decir, que el 90.0% de las personas que asistieron al estreno de la pelcula tienen menos de 45 aos. e) Qu porcentaje de las personas que asistieron al estreno de la pelcula tiene menos de 38 aos? Como el 38 no aparece en ninguno de los lmites, se hace necesario determinar en los datos sueltos cuantas personas tienen menos de 38 aos y esta cantidad la dividimos entre el total y se multiplica por 100 para determinar el porcentaje. Para este caso tenemos un total de 29 personas con menos de 38 aos, luego el porcentaje de persona con menos de 38 aos es de (29/40)*100, es decir 72.5% Ejercicios para el aula 1. El tamao de un grupo de viviendas, expresado en ciento de m2, se muestra en la tabla siguiente. 26 36 33 19 28 26 20 22 8 30 30 20 5 34 20 25 29 40 17 32 20 6 18 31 19 4 19 32 20 17 6 28 a) Construir una distribucin de frecuencia. b) Qu por ciento de las viviendas tienes un tamao inferior a los 25 m2? c) Qu por ciento de las viviendas tiene un espacio mayor a 30 m2? d) Interpretar el resultado de la cuarta clase de la frecuencia relativa

    acumulada. e) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 32

    2. Los datos que se presentan a continuacin representan el ndice de calificacin de un grupo de estudiantes de preparatoria. 2.75 3.53 2.42 3.00 3.85 3.71 2.25 2.96 3.00 3.00 3.50 3.06 3.09 2.22 2.47 3.20 3.02 2.00 2.05 3.60 a) Construir una distribucin de frecuencia con cinco clases. b) Interpretar el resultado de la frecuencia relativa simple de la tercera clase. c) Interpretar el resultado de la frecuencia absoluta acumulada de la cuarta

    clase. d) Qu porcentaje de estudiantes tiene un ndice de calificacin menor a 3.00

    puntos? 3. La escolaridad de 35 padres de familia (expresado en aos de educacin) se presenta como sigue. 14 16 13 14 16 12 12 13 12 15 16 14 16 17 16 16 13 12 15 12 16 14 12 12 15 14 13 17 13 14 16 12 15 16 18 a) Organice los datos en una distribucin de frecuencia. b) Qu porcentaje de padres de familia, tiene menos de 15 aos de

    educacin? c) Qu porcentaje de padres de familia tiene 12 aos de educacin? 4. El ingreso quincenal, en cientos de RD$ de un grupo de empleados de la empresa K.G. se muestra en los datos siguientes. 24 44 38 22 29 27 48 31 30 27 21 37 42 39 38 16 32 28 60 10 23 12 17 24 18

    a) Organice los datos en una distribucin de frecuencia con un intervalo de

    RD$10. b) Qu porcentaje de los empleados ganan menos de $20? c) Qu porcentaje gana entre 30 y 40? d) Interpretar el resultado de la frecuencia relativa simple de la segunda clase. 5) El rea de estudio de un grupo de 30 estudiantes se presenta a continuacin. 1. Administracin 11. Indeciso 21. Administracin 2. Economa 12. Indeciso 22. Computacin 3. Contabilidad 13. Economa 23. Mercadeo 4. Contabilidad 14. Mercadeo 24. Economa 5. Mercadeo 15. Indeciso 25. Indeciso 6. Economa 16. Administracin 26. Administracin 7. Mercadeo 17. Economa 27. Computacin

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 33

    8. Administracin 18. Mercadeo 28. Mercadeo 9. Mercadeo 19. Indeciso 29. Economa 10. Economa 20. Computacin 30. Mercadeo

    a. Construir una distribucin de frecuencia. b. Calcular el porcentaje de estudiante por rea de estudio.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 34

    2.7 TABULACIN CRUZADA Tambin se le llama tabla de doble entrada y se utiliza para presentar dos o ms variables en un solo cuadro. La Tabulacin Cruzada proporciona una descripcin bsica de la interrelacin que hay entre las variables que se tabulan en el cuadro, de igual forma ayuda a buscar patrones de interaccin siempre que la frecuencia de cada celda represente un nmero significativo con respecto al total. Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que para construir una distribucin de frecuencia con una variable. Es decir que se debe tomar en consideracin las variables a incluir en el cuadro de doble entrada, (cualitativa o cuantitativa y en el caso de las variables cuantitativas, se debe tomar en cuenta si estas son continuas o discontinuas). 2.7.1 TABULACIN CRUZADA PARA DOS VARIABLES Para la construccin de un cuadro de doble entrada con dos variable, se coloca una de las variables en la primera columna o columna principal y la otra variable en la primera fila, de forma tal que se forme una celda comn para cada una de las categoras de las variables incluidas. La variable que se coloca en la primera fila generalmente es aquella que tienen un mayor nmero de categoras. Para ilustrar lo que se ha dicho, suponga que estamos interesados en conocer la relacin que existe entre dos variables, digamos X e Y. Suponga adems que la variable X tiene cinco categoras, X1, X2, X3, X4 y X5 y que la variable Y tiene tres categoras, Y1, Y2, Y3, si queremos presentar estas dos variables en un solo cuadro, el cuadro tendra la forma siguiente:

    Yi Xi Y1 Y2 Y3

    TOTAL

    X1 C11 C12 C13 Total X1 X2 C21 C22 C23 Total X2 X3 . . . . X4 . . . . X5 C51 C52 C53 Total X5

    TOTAL Total Y1 Total Y2 Total Y3 Total

    general El cuadro indica dos renglones para el total, esto es debido a que estamos presentando solo dos variables, as, en el total de la ltima fila representa el

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 35

    total de cada columna, mientras que el total de la ltima columna representa el total de cada fila del cuadro. En las celdas que se forman, se colocarn los datos que tienen las dos caractersticas del cuadro. Por ejemplo, en la celda C11, se colocan los elementos que son comunes a X1 y a Y1, en la columna C12 se colocan los elementos que son comunes a X1 y a Y2 y as sucesivamente. Ejemplo: Se evalu el sexo y la calificacin final de treinta estudiantes de una escuela primaria para conocer la relacin entre la calificacin en matemticas y el sexo de los/as estudiantes. Los datos se muestran en la tabla siguiente.

    No. Sexo Calif. No. Sexo Calif. No. Sexo Calif. 1 Masc. 68 11 Masc. 70 21 Fem 87 2 Fem 86 12 Fem 91 22 Masc. 76 3 Masc. 74 13 Masc. 72 23 Masc. 81 4 Masc. 72 14 Fem 70 24 Masc. 77 5 Masc. 72 15 Masc. 65 25 Fem 77 6 Fem 85 16 Fem 82 26 Masc. 73 7 Fem 66 17 Fem 68 27 Fem 60 8 Fem 79 18 Masc. 86 28 Masc. 60 9 Masc. 70 19 Masc. 71 29 Masc. 71

    10 Masc. 72 20 Fem 82 30 Masc. 73 Para este caso tenemos dos variables, una variable cuantitativa, (calificacin matemtica) y una cualitativa, (sexo de los/as estudiantes). La variable sexo tiene dos categoras, masculino y femenino, y la calificacin en matemtica es continua y su rango es mayor de 10 por lo tanto hay que hacer una distribucin con clases. Para ello vamos a dividir esta variable en cuatro categoras, los estudiantes con menos de 70 puntos, los que tienen entre 70 y 80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o ms puntos. Luego de esta clasificacin el cuadro queda como se ilustra a continuacin: Como se muestra en el cuadro siguiente, el primer alumno es de sexo masculino y tiene una calificacin de 68 puntos, por lo tanto se coloca en la columna de masculino y en la primera fila, ya que aqu de colocan los que tienen calificacin entre 60 y 69 puntos. El segundo estudiante es una estudiante y tiene una calificacin de 86 puntos, por lo tanto se coloca en la columna de sexo femenino y en la tercera fila, ya que aqu se deben colocar los estudiantes que tienen entre 80 y 89 puntos. El tercer estudiante es sexo masculino y tiene una calificacin de 72 puntos, por lo que se coloca en la columna de masculino y en la segunda fila, ya que en

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 36

    esta se colocan los estudiantes con calificacin entre 70 y 79 puntos. El procedimiento se contina hasta tabular los datos de la tabla como se ilustra a continuacin

    Sexo Calificacin Masculino Femenino

    Total

    60 - 69 /// /// 70 - 79 ///////////// /// 80 - 89 // /////

    90 - 100 / Total

    Luego del conteo de las frecuencias, los datos son

    Cuadro No. Calificacin en matemticas y sexo de los estudiantes

    Sexo Calificacin

    Masculino Femenino Total

    60 - 69 3 3 6 70 - 79 13 3 16 80 - 89 2 5 7

    90 - 100 0 1 1 Total 18 12 30

    Fuente: Registro de la escuela

    Preguntas

    1. Determinar el porcentaje de estudiante por sexo 2. Calcular el porcentaje de estudiantes con menos de 80 puntos 3. De los que tienen menos de 90 puntos, qu porcentaje es femenino? 4. Del grupo femenino qu porcentaje tiene menos de 90 puntos? 5. Que porcentaje de estudiantes tiene entre 80 y 89 puntos

    Ejercicio: Con los datos que se presentan en la tabla siguiente crear un pequeo reporte indicando la relacin entre el rendimiento acadmico y el sexo de los estudiantes, entre el nmero de asignatura por sexo, as como el gasto en transporte por sexo y nmero de asignaturas cursadas. Finalmente incluya un pequeo anlisis de la relacin entre la edad de los estudiantes y el nmero de asignaturas cursadas.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 37

    Para el ndice acadmico divida esta variable en tres categoras, los que tienen menos de 75 puntos, los que tienen entre 75 y 80 puntos y los que tienen ms de 80 puntos. En el caso del nmero de asignaturas, divdala en tres categoras, los que cursan menos de cuatro asignaturas, los que estn cursando cuatro asignaturas y los que cursan ms de cuatro. Para la edad divida esta variable en tres categoras, los que tienen entre 20 y 23 aos, los que estn entre 24 y 27 aos y los que tienen de 28 y ms aos. En el caso del gasto en transporte haga una divisin en categoras, si lo considera necesario y ser as, divida la variable a su conveniencia.

    Datos personales de 30 estudiantes de Informtica

    No. EDAD SEXO # DE ASIG.

    INDICE ACAD.

    GASTO EN TRANSP.

    1 22 M 3 80.0 20 2 24 F 3 77.8 50 3 23 M 4 75.6 60 4 25 M 5 74.6 30 5 21 M 3 82.1 30 6 25 F 3 74.3 50 7 22 M 3 77.7 40 8 21 F 6 80.1 40 9 28 F 3 70.3 40

    10 28 F 4 70.3 40 11 29 M 5 73.5 40 12 25 F 3 74.3 20 13 20 M 4 79.8 40 14 30 F 2 73.3 20 15 28 F 3 81.5 40 16 24 F 4 74.4 40 17 28 F 3 78.6 40 18 24 F 6 76.7 40 19 21 F 4 77.7 20 20 24 M 3 79.4 20 21 35 M 2 75.7 40 22 21 F 4 83.0 40 23 24 M 3 81.2 50 24 22 F 3 76.8 60 25 21 F 4 80.7 30 26 26 F 3 70.8 50 27 25 F 4 71.3 20 28 24 M 5 74.9 80 29 29 M 3 82.6 30 30 25 F 5 80.6 20

    FUENTE: ENCUESTA EN EL AULA EST-211 SEC-01. 24/02/2007.

  • Apuntes sobre Estadstica

    Elaborado por H. Medina Disla. Junio 2010. 38