REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y...

144
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DE EDUCACIÓN SUPERIOR UNIVERSIDAD BOLIVARIANA DE VENEZUELA DIRECCIÓN GENERAL ACADEMICA DIRECCIÓN DE PLANIFICACIÓN Y DISEÑO CURRICULAR PROGRAMA DE FORMACIÓN DE GRADO “GESTIÓN SOCIAL DEL DESARROLLO LOCAL” ANÁLISIS DEL DATO ESTADÍSTICO GUIA DIDÁCTICA Por los profesores Deivis Cardoza Emilio Silva José Silva Julio César Falcón Melsi Goitte Ramón Roberto Herrera C. 1

Transcript of REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y...

Page 1: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

REPÚBLICA BOLIVARIANA DE VENEZUELAMINISTERIO DE EDUCACIÓN SUPERIORUNIVERSIDAD BOLIVARIANA DE VENEZUELADIRECCIÓN GENERAL ACADEMICADIRECCIÓN DE PLANIFICACIÓN Y DISEÑO CURRICULARPROGRAMA DE FORMACIÓN DE GRADO “GESTIÓN SOCIAL DEL DESARROLLO LOCAL”

ANÁLISIS DEL DATO ESTADÍSTICOGUIA DIDÁCTICA

Por los profesoresDeivis Cardoza

Emilio SilvaJosé Silva

Julio César FalcónMelsi Goitte

Ramón Roberto Herrera C.

TERCERA EDICIÓNAGOSTO 2.006

CARACAS-VENEZUELA

1

Page 2: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

ÍNDICE

Presentación 3

Unidad I La Estadística: Herramienta fundamental en diversos escenarios de aplicación 7

Unidad II Organización de los Datos 23

Unidad III Representación de los Datos 40

Unidad IV Medidas de Posición, de Tendencia Central y de Dispersión 57

Unidad V Introducción a la Probabilidad, Muestreo y Estimación 93

Bibliografía 102

2

Page 3: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

ANÁLISIS DEL DATO ESTADÍSTICOGUÍA DIDÁCTICA

PRESENTACIÓN

La Guía Didáctica de "Análisis del Dato Estadístico” está diseñada para que los profesores-facilitadores de la UBV contribuyan al logro, por parte de los estudiantes, de la competencia en el uso de las herramientas estadísticas, integradas en todos los Programas de Formación en la UBV.

La Estadística es una herramienta fundamental para la formulación, ejecución y seguimiento de cualquier proyecto socio-comunitario y de investigación. El egresado de la UBV tiene que manejar con soltura un leguaje estadístico revestido con una gran sencillez y comprensibilidad, que permita una fluida comunicación dentro de un grupo de trabajo interdisciplinario, y que al mismo tiempo pueda apoyar la resolución de una gran cantidad de situaciones que requieran el estudio de un conjunto de datos para su mejor compresión y aporte de soluciones. Por tanto, no se está buscando de que el egresado de la UBV se convierta en un experto especialista en Estadística, sino más buen que desde su disciplina profesional pueda hacer un adecuado uso de aquella especialidad matemática para su propia área de trabajo individual y colectivo.

Esta Guía Didáctica expone de manera sencilla, sustancial y consistente los principales métodos de la Estadística y sus relaciones.

La sencillez de esta Guía no disminuye su validez didáctica, apta para todo aquel que se inicia en el estudio de la Estadística Descriptiva e Inferencial. Esta herramienta es indispensable para los proyectos socio-comunitarios y de investigación que aspiren a tener base cuantitativa, pues un proyecto sin datos estadísticos presenta una gran debilidad.

Esta unidad curricular básica ha sido diseñada de maneja de suministrar una herramienta de gran utilidad, la cual, apoyada en la antropogogía como estrategia didáctica, impulsará el trabajo autónomo, creativo, responsable y participativo de los alumnos en la ejecución eficaz de las tareas propias de Proyecto I y Proyecto II.

La estructura de la Guía consta de cinco Unidades divididas en Temas.

Unidad I La Estadística: Herramienta fundamental en diversos escenarios de aplicación

Unidad II Organización de los Datos

Unidad III Representación de los Datos

3

Page 4: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Unidad IV Medidas de Posición, de Tendencia Central y de Dispersión

Unidad V Introducción a la Probabilidad, Muestreo y Estimación

En estas Unidades se presentan los contenidos y las correspondientes actividades didácticas que se realizan en el lapso académico estimado para esta Unidad Curricular.

Estructura del Unidad

Cada Unidad está compuesta de cuatro partes:

1) Objetivo.2) Competencia a lograr.3) Contenido.4) Actividades.

Se presentan como estrategias de aprendizaje/evaluación para ser realizadas por los estudiantes bajo la guía y supervisión del profesor-facilitador. Son de varios tipos:

4.1) Individuales: Incluyen resúmenes, ensayos, informes y exposiciones que deberán ser realizados en forma individual por el alumno.

4.2) Grupales o Cooperativos: Incluyen investigaciones, debates y otros trabajos y experiencias realizadas en equipo por los estudiantes.

4.3) Comunitarias: Actividades centradas en la interacción socio comunitario y el trabajo participativo.

Sugerencias para uso de la Guía

Para los profesores:

La Guía constituye una orientación para apoyar la actividad, debe ser utilizada en forma secuencial y flexible. El profesor–facilitador debe orientar y adaptar esta propuesta al grupo de estudiantes que tiene a su cargo, de manera que podrá cambiar, agregar, combinar o eliminar contenidos.

El profesor actuará como compañero facilitador del aprendizaje (es un estudiante más de la sección pero con Título Universitario), aclarando conceptos y explicando los ejercicios (actividades) que se les propongan y no entiendan. En todo momento el profesor debe hacer uso constante, en forma amena y sencilla, de ejemplos propios de la vida cotidiana individual y colectiva del estudiante en su ámbito académico y social, pues de esa manera se podrá facilitar el proceso educativo y dialógico de enseñanza-aprendizaje de las ideas y planteamientos matemáticos de la Estadística, y así se podrá percibir y valorar objetivamente la utilidad práctica de esta disciplina, y a su vez se contrarrestará la tendencia equivocada, negativa y prejuiciada de considerarla como algo muy difícil y aburrido y de escaso provecho y nula importancia.

4

Page 5: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

El profesor–facilitador llevará el registro de la evolución del proceso de aprendizaje, así como la metodología de evaluación de cada uno de los estudiantes, con quienes se reunirá para validar el desarrollo de sus actividades y aprendizaje.

La actividad a ejecutar por el profesor–facilitador en cada sección de facilitación del proceso de aprendizaje constará de dos partes.

1) Validar la ejecución de las actividades por parte de cada grupo y al mismo tiempo evaluar la evolución del proceso de aprendizaje individual, para lo cual llevará un registro.

2) Presentar la nueva propuesta de actividad, respondiendo las preguntas que se presenten u ofreciendo algunas ideas del material mediante el uso de diversas metodologías pedagógicas, como por ejemplo mapas conceptuales, Aprendizaje por Proyecto, Tablas de resumen acerca de la teoría presentada a consideración, entre otros. Se sugiere usar metodologías pertinentes con respecto a los lineamientos institucionales de la UBV en materia de evaluación.

Para los estudiantes

El estudiante debe comprometerse con su proceso de aprendizaje, leyendo cuidadosamente la guía consultando los textos de estadística a su alcance y cumpliendo con las actividades asignadas.

Debe acudir a los encuentros programados con el profesor para comentar, indagar, ampliar lo conocimientos que ha adquirido por si mismo; y para encontrar orientación acerca de temas relacionados, problemas estadísticos y otros relacionados que puedan surgir.

Los alumnos se agruparan en equipos de trabajo para realizar las actividades asignadas. De esa manera, cada alumno podrá elaborar con mayor facilidad su portafolio de aprendizaje, en el se reunirán todos los aportes y resultados de las actividades grupales e individuales.

El desarrollo del portafolio de aprendizaje queda a libre decisión de los integrantes del curso, y tiene varias finalidades:

Sirve como insumo para la evaluación. Sirve como registro de la actividad creadora de los estudiantes para ser

recopilado como testimonio de producción de saber en la UBV. Podrá presentado en eventos científicos y exposiciones de interés.

Al final de cada Unidad se propone realizar una prueba diagnóstica a fin de validar el avance del proceso de aprendizaje o logro de las competencias esperadas. Independientemente de los mecanismos de evaluación a

5

Page 6: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

implementarse, estos deben tener carácter formativo para que, más allá de obtener cualquier nota o resultado cuantitativo, el verdadero objetivo sea alcanzar resultados cualitativos que reflejen el aprendizaje de los conocimientos de la Unidad Curricular.

Como propuesta organizativa para las actividades asignadas, los equipos de trabajo contarán como máximo con el 20% del total de alumnos de la sección. Dentro del equipo de trabajo se nombrará un coordinador quien ejercerá dicha función (asignándole a cada uno su aporte en la ejecución de la actividad) y apoyará positivamente la discusión y ejecución de las actividades a realizar en cada Unidad.

Con el fin de que el lector pueda aportar ideas y sugerencias para enriquecer y mejorar la Guía Didáctica, ponemos a su disposición los siguientes correos electrónicos: [email protected], y [email protected].

Esperamos que esta Guía sea realmente útil para todos ustedes, que disfruten de la aventura de aprender haciendo, y que sirva de apoyo y estímulo para el desarrollo profesional y la creación de su propio conocimiento individual y colectivo.

6

Page 7: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

UNIDAD I: LA ESTADÍSTICA: Herramienta fundamental en diversos escenarios de aplicación.

OBJETIVO: El estudiante comprende la importancia de la Estadística, sus conceptos básicos y aplicaciones.

COMPETENCIAS A LOGRAR:

1) Definir y analizar la Estadística.2) Citar algunas aplicaciones de la Estadística en la vida real.3) Definir y diferenciar población y muestra.4) Mencionar y definir las diferentes ramas de la Estadística.5) Explicar el objetivo, las ventajas y la necesidad de las muestras.6) Definir los conceptos de dato y variable, y reconocer la diferencia entre

una variable discreta y una continua y la escala o nivel de medición de un grupo de datos.

7) Comprender la importancia de obtener buenos datos y los métodos para su obtención.

8) Comprender cada uno de los procesos que involucra una investigación estadística.

9) Definir la fuente y la técnica de muestreo a emplear en la recolección de datos.

10)Diseñar el instrumento para la recolección de datos.

CONTENIDO:

TEMA 1

1.1 ¿Qué es la Estadística?

Es un conjunto de métodos y técnicas a usarse para recolectar, clasificar, organizar, presentar, analizar, explicar, simular, controlar y evaluar hechos sujetos a un estudio numérico como base para la descripción, explicación y comparación de un fenómeno (al cual están asociado tales hechos) que afecta a grupos de naturaleza diversa, teniendo ese estudio el fin de generar conocimientos de los mismos, y ayudar a tomar mejores decisiones sobre dicho fenómeno además de predecirlo a futuro. O sea, la Estadística es el estudio de la incertidumbre y capacita para enfrentar el azar.

1.1.1 ¿Qué significa Estadística?

En nuestro lenguaje cotidiano, Estadística se refiere a información numérica que puede presentarse tanto en forma grafica como en tablas, haciendo más fácil y práctica la transmisión de esa información.

Ejemplos:

7

Page 8: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

El número de niños que viven en una determinada parroquia de Caracas. El porcentaje de graduados de las universidades públicas del país. La cantidad de estudiantes de la UBV por cada Programa de Formación de

Grado y por cada sede a nivel nacional. El salario promedio de los habitantes de la parroquia La Vega. El número de decesos anuales debidos al alcoholismo. El número de goles anotados por la vino tinto.

1.1.2 ¿Por qué y para qué se estudia la Estadística?

Hay tres razones para estudiar Estadística:

1) Hay datos en todas partes.2) Las técnicas estadísticas se usan para tomar decisiones que afectan

nuestro bienestar.3) No importa cual sea la línea de trabajo, se tomarán decisiones que

involucren datos.

La Estadística se ocupa de la caracterización y aplicación de técnicas para:

1) Diseñar una investigación, bien sea un experimento comparativo, una encuesta por muestreo, un estudio observacional, o de construcción de un modelo.

2) Resumir los datos de la investigación.3) Inferir sobre grupos numerosos en estudio, a partir de los datos de la

investigación.

1.1.3 ¿Cuál es la utilidad de la Estadística?

El verdadero alcance de la Estadística no puede circunscribirse a las formulaciones abstractas numérico-algebraicas propias de su concepción técnico-metodológica. La Estadística es algo más que números, cuentas y fórmulas de apariencia complicada, extraña o poco común. Esos tres elementos tienen su origen en situaciones cotidianas de la vida real que el ser humano debe resolver de diversas maneras, y las soluciones y decisiones a tomar pueden ser o no ser de orden cuantitativo. Si son de ese orden, quien estudie y use la Estadística debe contextualizarla en su justa dimensión, y asimilarla e interpretarla en función de revelar el carácter teórico-práctico y abstracto-concreto de la vinculación entre conocimiento y realidad. Luego, la Estadística:

Es una herramienta que ayuda a interpretar los datos generando información y conocimiento de la realidad.

Ayuda a obtener la información indispensable en la planificación de las soluciones necesarias que las comunidades requieren en diversos otros escenarios.

8

Page 9: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Permite procesar información que sirve de base a la ejecución de cualquier proyecto.

Partiendo de las anteriores consideraciones, dejaría de tener sentido cualquier tendencia a descontextualizar la Estadística en particular, y la Matemáticas en general, como un compendio de conocimientos misteriosos y de escasa o nula utilidad real.

1.1.4 Ciencias y fenómenos que requieren del uso de la Estadística

En vista de la utilidad de la Estadística en diversas áreas, las ciencias que la necesitan se clasifican en:

Las que obligatoriamente la requieren, lo cual implica que muchas veces se confundan con esta, como es el caso de la Demografía.

Las que la usan para estudiar fenómenos cualitativos y cuantitativos, como la Biología, la Economía, la Educación, la Sociología, etc.

Las que deben obtener sus resultados con la máxima exactitud posible, como la Astronomía, la Física y la Meteorología.

Cada una de estas ciencias se aboca a estudiar fenómenos que por sus características particulares requieren de diferentes tratamientos al aplicarles los métodos estadísticos. Partiendo de este criterio, tales fenómenos podemos clasificarlos en:

Los que no pueden estudiarse por simple observación porque es muy grande la cantidad de objetos o casos a considerar en esos fenómenos, el tiempo en que estos ocurren es muy distante, o se presentan con diferentes intensidades o frecuencias.

Los que deben estudiarse desde el punto de vista cualitativo y cuantitativo, como las investigaciones socio-económicas.

Los que al estudiarse cuantitativamente reproducen errores que necesitan de la Estadística para corregirlos o eliminarlos.

1.2 Población y Parámetro

Población es el conjunto total de elementos, cantidades, individuos u objetos a los que se le consideran en estudio una o varias características comunes.

Ejemplo: Los pacientes de los hospitales públicos del país.

Parámetro es una medida numérica obtenida por el manejo y procesamiento de los datos de la población descrita por dicha medida, representándose esta con letras griegas minúsculas.

9

Page 10: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Medida Símbolo del Parámetro

Media μDesviación Estándar σVarianza σ2

1.3 Muestra y Estadístico, Estadígrafo o Estimador

Muestra es un subconjunto o parte de la población.

Ejemplo: De la población anterior, los pacientes del hospital de los Magallanes de Catia.

Estadístico, Estadígrafo o Estimador es una medida numérica obtenida por el manejo y procesamiento de los datos de la muestra descrita por dicha medida, representándose esta con letras latinas, generalmente minúsculas.

Medida Símbolo del Estadístico

MediaDesviación Estándar SVarianza S2

1.4 Tipos de Estadística

1.4.1 Estadística Descriptiva o Deductiva (o Análisis Estadístico)

Consiste en procedimientos usados para tratar y organizar los datos de una muestra en estudio con el fin de sistematizarlos, reducirlos, condensarlos y presentarlos mediante cuadros, gráficas y tablas, procedimientos que permiten describir y analizar, por medio de ciertas medidas, las características esenciales de la muestra en cuestión sin que sobrepasen los conocimientos que proporcionan los datos.

Ejemplo: De acuerdo a los datos suministrados por el Instituto Nacional de Estadística (I.N.E.)

Cuadro 1: Hogares y personas en situación de pobrezaPrimer Semestre 2.004

Categoría Cantidad PorcentajeNo Pobres 9.610.104 39,85%Pobres 7.727.355 32,05%Pobres Extremos 6.776.393 28,10%Población Total 24.113.852 100%

10

Page 11: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

1.4.2 Estadística Inferencial o Inductiva (o Inferencia Estadística)

Es un conjunto de técnicas que se utilizan para una población con el propósito de seleccionar una muestra representativa de esta y obtenerle estimaciones, generalizaciones e inducciones válidas mediante el procesamiento de los datos de esa muestra, siendo que el alcance de los conocimientos aportados por esos datos es sobrepasado por las estimaciones antes referidas.

Ejemplo: La cooperativa de enlatados de Río Caribe pidió a una muestra de 1.960 consumidores probar una variedad de atún enlatado con orégano llamado Delicias de Sucre. De los 1.960 encuestado 1.176 dijeron que comprarían el atún si lo ponían en venta.

¿Que información obtuvo la cooperativa de enlatados de Río Caribe acerca de la aceptación del atún con orégano por parte de la población?

¿Es éste un ejemplo de Estadística Descriptiva o Estadística Inferencial? Tome este ejemplo, responda las preguntas y agréguelo a su portafolio.

1.5 Consideraciones acerca de la Población y la Muestra

Para estudiar las características de los elementos que integran una población o de algún fenómeno que la afecte, se puede ejecutar un censo o escoger una muestra. En el caso del censo, tenemos que investigar todos y cada uno de los elementos de la población. En el caso de una muestra, investigamos solo un conjunto parcial de los elementos que integran una población, analizamos sus características particulares, y en base a los resultados deducimos las leyes que rigen a la muestra o al fenómeno (a través de las Probabilidades) e inferimos sobre las características de la población total para hacer previsiones sobre los mismos, tomamos decisiones u obtenemos conclusiones. Una muestra debe ser representativa de la población de la que ha sido extraída, y todos sus elementos deben contener características en la misma proporción en que se hallan para la población total.

Para realizar un censo se requiere de gran cantidad de personas entrenadas, planificación, presupuesto y suficiente tiempo antes y después del levantamiento. De allí que gran número de veces, en lugar de realizarse un censo, se investiga una población en base a muestras, y mediante la Inferencia Estadística se determinan las características de la población total.

Es importante diferenciar en el estudio estadístico que se realiza si los datos provienen de una población o de una muestra. Si disponemos de los datos de las características de todos los individuos que componen una población, podemos analizarlos mediante los métodos que provee la Estadística Descriptiva, reduciendo los datos a tablas o distribuciones, y simplificar éstas obteniendo algunas medidas que las representan (estadísticos).

11

Page 12: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Si los datos provienen de un conjunto parcial de la población (muestra), también usaremos la Estadística Descriptiva para analizarlos y obtener algunas medidas (estadísticos) que nos describan las características de los datos de la muestra, pero para conocer de manera muy aproximada las características de la población (parámetros) es necesario recurrir a la Estadística Inferencial.

En conclusión, un objetivo típico en Estadística es describir la población con base en información obtenida mediante la observación de relativamente pocos elementos individuales. Para dar así una solución estadística a un problema, se desarrolla una secuencia de pasos:

1) La situación bajo investigación se define cuidadosa y completamente.2) Se recolecta una muestra de la población siguiendo un procedimiento

establecido e idóneo.3) Los datos de la muestra se convierten en información útil (la cual, dada en

forma numérica o gráfica, se denomina Estadísticas de la Muestra).4) Se aplican las teorías de inferencia estadística a la información de la

muestra para obtener conclusiones sobre la población muestreada (estas conclusiones o respuestas se denominan inferencias).

Estos pasos se indican en la siguiente figura.

1.6 Datos y Variables

1.6.1 Definiciones

Dato Estadístico es una cantidad o categoría susceptible de ser observable y medible en una población o muestra. En general se le denomina simplemente como Dato. Por otra parte, Variable Estadística es una característica o propiedad

12

Page 13: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

que varía de acuerdo con alguna escala o dimensión al asumir diferentes valores (cantidades o categorías) por parte de los componentes de una población o muestra. Generalmente se le denomina solamente como Variable.

Las variables asumen los datos como valores. Una variable está asociada a una colección de datos, y recíprocamente ocurre lo mismo. Si un valor no aparece en algún componente o elementos de la población o muestra, entonces ese valor no es un dato y sí lo es en caso contrario.

1.6.2 ¿Para qué necesitamos recolectar datos?

Mide el desempeño de un servicio o proceso de producción en curso que realizan las distintas comunidades.

Ayuda en el proceso de toma de decisiones cuando se estudia un determinado evento.

Facilita la administración de recursos de diversa índole a ser empleados en la concreción y/o ejecución de las decisiones.

1.7 Tipos de variables

Ejemplos: Ejemplos:-.Numero de hijos por familia -.Peso de los alumnos-.Número de empleado por empresa

-.Kilómetros recorridos

-.Número de televisores vendidos en el año

-.Estatura.

13

Variables

Discretas: son respuestas numéricas surgidas del proceso de conteo. Asume cantidades específicas e interrumpidas en su extensión, es decir, números enteros o exactos.

Cualitativas o Categóricas: son aquellas características o variables que no son numéricas, es decir, denotan modalidad, cualidad, categoría o atributo.

Cuantitativa o Numérica: son aquellas características o variables que son cantidades, es decir, producen respuestas numéricas.

Ejemplos:-.Estado civil-.Género

Continuas: son respuestas numéricas surgidas del proceso de medición. Asume cantidades decimales e ininterrumpidas en su extensión, es decir, cualquier número entre dos dados.

Page 14: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Explicando de otra forma la clasificación de las variables cuantitativas, decimos que para una variable discreta se dan de modo inherente separaciones entre valores observables sucesivos, o sea, una variable discreta es aquella tal que entre 2 valores cualesquiera observables (potencialmente), hay por lo menos un valor no observable (potencialmente). En cambio, una variable continua tiene la propiedad de que entre 2 valores cualesquiera observables (potencialmente), hay otro valor observable (potencialmente), es decir, una variable continua puede tomar todos los valores a lo largo de un intervalo.

Una variable continua siempre se registra en forma discreta, y entre valores registrables adyacentes la magnitud de la distancia queda determinada por la precisión de la medición, pero a diferencia de una variable discreta, nunca se puede medir exactamente a la variable continua, con la cual debe haber inevitablemente un error de medida.

Las variables se representan con letras mayúsculas del alfabeto latino, y los datos se representan con el mismo tipo de letra de las correspondientes variables con las que están vinculadas, pero colocándoseles subíndices para diferenciarlas. Por otra parte, los datos se pueden clasificar con las mismas denominaciones que tengan las respectivas variables a la que están asociadas. Por tanto, podemos hablar de datos cualitativos y cuantitativos, y entre estos, existen datos discretos y continuos. Si la variable es cualitativa, cada categoría asumida por está se halla asociada a un grupo de datos.

TEMA 2

1.8 Escalas o Niveles de Medición de los Datos

La medición es la asignación de valores numéricos a atributos, categorías, elementos, sucesos u otros valores según ciertas escalas o reglas. La medición corresponde a las características o propiedades propias de los objetos en estudio y no de los objetos en sí mismos.

Si se mide cierta propiedad de dos objetos, los resultados pueden ser diferentes. No importan lo próximas que sean dos mediciones de un mismo objeto en dos instantes distintos, aquellas pueden dar resultados diferentes. Tal variación, que ocurre de modo natural, ha dado motivo para que las características o propiedades que se miden sean denominadas como variables. El problema de la variación se complica al reconocer que esta también ocurre en quienes miden y en los instrumentos que se usan para medir.

Un proceso de medición que sea confiable proporciona datos con poca variación y mayor exactitud respecto al objeto a medirse. Si el proceso es válido entonces mide lo que se desea medir, por lo que sería deseable disponer de un

14

Page 15: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

proceso de medición válido y confiable. Se requiere prestar atención a la variación y a como esta puede afectar la calidad de los datos. Por tal motivo se han propuesto criterios de validez y confiabilidad referentes a aspectos que conviene tener en cuenta para evaluar la calidad de los datos.

Uno de esos criterios a considerar es la Escala o Nivel de Medición de Datos, que se define como un sistema de valores y condiciones relacionales que asigna un grado o valor a una variable en base a los sujetos u objetos sometidos a medición. La técnica estadística a emplearse en el análisis de los datos obtenidos depende del uso de una de las cuatro escalas de medición que se dan a continuación.

1.8.1 Escala de Medición Nominal o Clasificatoria

Es una escala adoptada por variables cualitativas, la cual consiste en la clasificación en dos o más categorías, que no tienen vinculación entre sí y se les asignan nombres o símbolos. Si el símbolo es numérico, este sustituye a las palabras. Cualquiera que sea el símbolo, no se le aplican operaciones matemáticas (suma, resta, multiplicación y división), y sólo se cuantifica la frecuencia o el número de casos asociados a una categoría.

Ejemplos: Género (hombre, mujer), número de estudiantes con credencial que entran a juego de fútbol y que sean mujeres, número de revistas deportivas.

1.8.2 Escala de Medición Ordinal o de Rango

Escala en la que se establece un orden jerárquico entre datos o categorías de variables cualitativas. En esta escala no se indica la magnitud de la diferencia entre categorías, ni se aplican operaciones matemáticas básicas a los nombres o símbolos que las representan. Al igual que en el nivel ordinal, únicamente se cuantifican frecuencias en cada categoría.

Ejemplo: El escalafón militar, o la siguiente lista de las calificaciones que los alumnos dieron a un profesor de la UBV en el curso de PIUNI.

1.8.3 Escala de Medición de Intervalo

Escala en la que se establece distancias o intervalos iguales entre valores numéricos. Esta escala se utiliza para variables cuantitativas, y en la misma no existe un cero absoluto o verdadero, es decir, este se fija arbitrariamente en forma

Calificación FrecuenciaSuperior 6Bueno 28

Aceptable 25Pobre 12Inferior 3

15

Page 16: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

relativa, y no representa la ausencia de la característica en estudio. Tiene la propiedad de orden de la Escala de Medición Ordinal, y además la distancia entre las medidas tiene significado. En esta escala sí es posible realizar diferentes operaciones matemáticas.

Ejemplos: El tiempo calendario, como el Calendario Gregoriano o el Musulmán. Por otra parte, la temperatura en Grados Centígrados no posee un cero absoluto, ya que 0º no implica ausencia de temperatura, y esa medición representa otro valor de la temperatura cuando se mide en Grados Fahrenheit, Kelvin o Réaumur.

1.8.4 Escala de Medición de Razón o de Proporción

Es la escala más alta. Tiene todas las características de la escala de intervalo, y además el valor cero tiene significado y representa la ausencia de la característica estudiada, y la distancia y relación proporcional entre dos números tiene sentido.

Ejemplos: El peso de las personas, la densidad de un objeto, el salario diario de los miembros de la comunidad, la altura de las personas.

El siguiente cuadro resume las escalas aquí referidas.

Tipo de Escala Modo de Medir Usos admisibles

Nominal o Clasificatoria

Asignación de nombres y símbolos (pudiendo ser numéricos)

Clasificar

Ordinal o de Rango

Asignación de nombres y símbolos (pudiendo ser numéricos)

Clasificar y ordenar

De IntervaloAsignación de símbolos

numéricos comparándolos con una unidad de medición, y se fija el cero relativo inicial

Clasificar, ordenar y obtener diferencias de mediciones

De Razón o de Proporción

Asignación de símbolos numéricos comparándolos con una unidad de medición, y se fija el cero absoluto inicial

Clasificar, ordenar y obtener diferencias y proporciones de mediciones

1.9 Fuentes de los datos

Son los sujetos u objetos que generan o contiene la información a usarse en una investigación estadística. Por ejemplo, los datos publicados por fuente gubernamentales, o los dados en la aplicación de una encuesta o un experimento, o los obtenidos por la realización de un estudio u observación directa.

16

Page 17: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Los datos necesarios para la investigación estadística pueden hallarse a través de diferentes fuentes, que son primarias si los datos suministrados por una persona o una institución fueron obtenidos directamente por estos, y si no lo obtuvieron tenemos fuentes secundarias.

La fuente primaria más notable es la que publica la información de los Censos Nacionales. En la práctica es aconsejable utilizar fuentes primarias. Sin embargo, si por la naturaleza del fenómeno y de los recursos disponibles no es posible usar esas fuentes, es aconsejable emplear las secundarias siempre y cuando los datos facilitados se hayan obtenido de manera técnicamente rigurosa.

Las dependencias gubernamentales que suministran los datos son fuentes oficiales, y si se obtienen por personas, agencias u organizaciones no gubernamentales, estos se denominan fuentes privadas.

1.10 Técnicas e Instrumentos de Recolección de Datos1.10.1 Relación entre Técnica e Instrumento

Técnica: Se entiende como Técnica el procedimiento o forma particular de obtener datos o información.

La aplicación de una técnica conduce a la obtención de información, la cual debe ser resguardada mediante un instrumento de recolección de datos.

Instrumento de Recolección de Datos: Es un dispositivo o formato (en papel o digital), que se utiliza para contener, registrar o almacenar información. Son ejemplos de instrumentos:

Un cuestionario en cuya estructura queda registradas las respuestas suministradas por el encuestado (formulario para rellenar).

Una libreta en la que el investigador anota lo observado. Computadora portátil con sus respectivos medios de almacenaje. Dispositivos como cámara fotográfica, video-filmadora, grabador de audio,

entre otros.

17

Page 18: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Diagrama de Técnicas e Instrumentos para la Recolección de Datos

En esta Guía desarrollaremos la técnica de la Encuesta.

Encuesta: Se define como una técnica que pretende obtener información que suministra un grupo, muestra o población de sujetos acerca de si mismo, o en relación a un tema en particular. La encuesta puede ser oral o escrita.

Encuesta Oral: Se fundamenta en un interrogatorio cara a cara o vía telefónica en el cual el encuestador pregunta y el encuestado responde. Su duración es bastante corta por lo cual se realizan pocas preguntas. Esta modalidad utiliza como instrumento la guía de encuesta.

Encuesta escrita: Se realiza a través de un cuestionario auto-administrado, el cual como su nombre lo indica, siempre es respondido de forma escrita por el encuestado.

Cuestionario: Se realiza de forma escrita mediante un instrumento o formato en papel, medios magnéticos o electrónicos contentivo de una serie de preguntas. Se le denomina cuestionario auto-administrado porque debe ser llenado por el encuestado sin intervención del encuestador.

1.10.2 Tipos de cuestionarios

Preguntas Cerradas: Son aquellas que establecen previamente las opciones de respuesta.

18

INSTRUMENTOS

DISEÑO DE

INVESTIGACION DOCUMENTAL

Análisis Documental

Análisis del contenido

Fichas.

Computadoras.

Lista de Cotejo.

Escala de Estimación.

DISEÑO DE INVESTIGACION DE CAMPO

Estructurada

No Estructurada

Observación

Encuestas

Entrevistas

Oral

Escrita

Estructurada

No Estructurada

Cuadro de Registro y clasificación de categorías

Diario de Campo.

Cámaras fotográfica y de video.

Guía de encuesta.

Grabador, Cámara de video.

Cuestionario

Guía de entrevista.

Grabador, Cámara de video.

Libreta de Notas.

Grabador, Cámara de video.

TECNICAS

Page 19: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Ejemplo: ¿Posee usted un televisor?

Preguntas Abiertas o de desarrollo: Son las que no ofrecen opciones de respuesta, sino que se da la libertad de responder al encuestado, quien construye su respuesta de manera independiente.

Ejemplo: ¿Que actividades deportivas realiza durante el último mes?

Preguntas Mixtas: Es aquel cuestionario que combina preguntas abierta y cerradas.

1.10.3 Recomendaciones para la elaboración del cuestionario

1) Las preguntas del cuestionario no se inventan a capricho, es decir estas deben tener una correspondencia con los objetivos específicos de la investigación.

2) Ordena las preguntas de lo general a lo particular.3) Evitar preguntas que abusen de la memoria del encuestado.4) Obviar preguntas sobre temas o conocimientos especializados.5) No incluir preguntas que induzcan a la respuesta (preguntas guías).6) Omitir preguntas que originen múltiples interpretaciones.7) Separar las preguntas de “doble cañón”, es decir, aquellas que se

interroga sobre dos puntos en una misma pregunta.8) Incluir preguntas que permitan verificar respuestas anteriores o preguntas

de control.9) Emplear frases de enlace cuando sea necesario.10)Utilizar escalas de rangos para preguntas sobre tópicos muy personales,

tales como, la edad y el salario.11)Una vez construido el cuestionario se recomienda aplicar una prueba piloto

o sondeo preliminar a un pequeño grupo que no forme parte de la muestra, pero que sea equivalente en cuanto a su característica. Esto con la finalidad de establecer la validez del cuestionario, y corregir cualquier falla y elaborar una versión definitiva del instrumento.

Para mayores detalles al respecto, se puede consultar el libro “Estadística General”, de Ernesto Rivas.

1.10.4 Planeamiento y ejecución de un estudio estadístico comunitario

La descripción de los datos producidos por experimentos comparativos, encuestas, estudios convencionales o construcción de modelos es un paso para lograr inferir resultados obtenidos de los estudios particulares hacia las poblaciones de interés. En otras situaciones, la descripción se apoya en el

Si No

19

Page 20: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

análisis estadístico de los datos, y a aquella la podemos clasificar en los siguientes estilos o maneras:

1) Descripción rígida (sin exploración): dispone el uso de técnicas de análisis prescritas sin el examen previo de los datos.

2) Exploratorio: se emplea cuando no tenemos preguntas específicas que guíen la recolección de datos.

3) Confirmatorio: se usa cuando formulamos preguntas precisas en una investigación y recolectamos datos con el fin de darles respuesta.

Estos estilos deben tomarse en cuenta para el planeamiento y ejecución de la investigación estadística, abarcándose los siguientes pasos:

1) Formulación de problema especifico de la investigación2) Desarrollo del instrumento para la obtención de los datos3) Recolección de los datos4) Organización y presentación de los datos5) Análisis estadístico6) Interpretación de los resultados

1) Formulación de problema especifico de la investigación

Este paso consiste en la definición del evento, fenómeno u objeto y finalidad de la investigación. Para poder lograr su exacta definición es necesario detener conocimiento sobre el objeto a investigar.

2) Desarrollo del instrumento para la obtención de los datos

Este paso tiene un carácter subjetivo, ya que en él se necesita del esfuerzo creativo y constructivo del investigador. Es necesario el estudio de antecedentes y experiencias similares, recursos disponibles y necesarios, alcance y limitaciones.

3) Recolección de los datos

Este es el paso mas importe dentro de la investigación estadística desde el punto de vista operativo. La recolección de datos es el fin del planeamiento y ejecución de la investigación estadística. Previamente se ha de definir el universo estadístico, es decir, definir los tipos de casos que han de ser estudiados, así como el alcance de la investigación en el espacio y el tiempo, y luego hay que diseñar el instrumento para la recolección de la información. La necesidad de hacerlo ya la expusimos previamente en la sección 1.6.2.

4) Organización y presentación de los datos

Este se realiza mediante:

20

Page 21: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

4.1)La Revisión: Consiste en la inspección de los registros donde se han reunido los datos para corregir los errores, las respuestas ilógicas y las omisiones.

4.2)El agrupamiento: Significa volcar en una hoja todos los datos contenidos en los cuestionarios (instrumentos).

4.3)La Clasificación: Se determina cada variable evaluada en los instrumentos, y de todas las hojas antes usadas para registrar los datos se escogen, de entre estos últimos, los que están asociados a la variable en cuestión.

4.4)La Presentación (tablas y gráficos): Luego de la agrupación de los datos estos se pueden presentar ordenados en tablas ó cuadros y mediante la representación de graficas.

5) Análisis estadístico

En este paso se calcula todas las medidas o características numéricas (parámetros o estadísticos según sea el caso).

6) Interpretación de los resultados

Consiste en traducir las medidas o características numéricas obtenidas en el lenguaje relativo al objeto o evento estudiado. Se interpreta los resultados emitiendo en este momento opinión sobre lo estudiado.

1.11 ACTIVIDADES

Individual

Lea la guía con cuidado antes de realizar las siguientes actividades.

Recolecte dentro de su grupo familiar las observaciones y datos referentes a las variables edad, sexo, altura y color de ojos. ¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición.

Escribe un ensayo sobre la utilidad de la Estadística en la formulación, ejecución y seguimiento de proyectos y trabajos de investigación, e inclúyalo en su portafolio de aprendizaje.

Grupal Cooperativo

Busque información estadística en la prensa. Comente su utilidad y aplicación e inclúyalo en su portafolio.

Resuelve los siguientes ejercicios e incorpórelos a su portafolio de aprendizaje:

1. Explique la diferencia entre variables cualitativas y cuantitativas. De ejemplos.

21

Page 22: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

2. Explique la diferencia entre una población y una muestra, y de ejemplos.3. Busque en la página Web del INE la información poblacional que allí se

suministra sobre la fuerza de trabajo (población ocupada). Tome los cuadros correspondientes al primer semestre del año 2.004.

4. Considere las variables Población y Fuerza de Trabajo. ¿Cuál es la variable cualitativa y cuál la cuantitativa?

Determine si los siguientes datos son cualitativos y cuantitativos, además de su correspondiente nivel de medición.1. Numero de vivienda.2. Tipo de teléfono.3. Duración de llamadas a larga distancia.4. Color de la vegetación.5. Altura de los árboles de Caracas.6. Tipos de vivienda en la comunidad.7. Número de camas en el hospital.

Investigue y elabore tres tipos diferentes de encuestas (instrumentos), INE, FUNDACREDESA, Internet.

Comunitario

Trasládese en compañía de su profesor de Proyecto I (II) a la comunidad o lugar donde se ejecutará el Proyecto I (II). Inclúyalo en su portafolio.1. Formule el problema e identifique las variables presentes que serán

consideradas dentro de su diagnóstico.2. Todos y cada uno de los grupos escogerán un conjunto de estas

variables, las cuales clasificará según sus características.3. Diga la utilidad de esta investigación y de las variables escogidas.4. Diseñe el instrumento para la recolección de los datos, siguiendo las

recomendaciones presentada en la guía.5. Aplique el instrumento y recolecte los datos en campo.6. Recuerda trabajar en campo usando sólo lápices de grafito, nunca con

bolígrafo. Recuerde sistematizar todas y cada una de las actividades y generar un

reporte para tu portafolio.

22

Page 23: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

UNIDAD II: ORGANIZACIÓN DE LOS DATOS

OBJETIVO: Organizar datos estadísticos en una distribución de frecuencias.

COMPETENCIAS A LOGRAR:

1) Explicar la necesidad de organizar los datos.2) Manejar la clasificación de distribuciones de datos y frecuencias 3) Construir distribuciones de frecuencias para datos simples y agrupados.4) Elaborar una presentación organizada para distribuciones de

frecuencias.5) Usar paquetes computacionales (Excel, Stargrafic, SPSS, otros) para la

elaboración de tablas de datos simples y agrupados.

CONTENIDO:

TEMA 1

2.1 Necesidad de organizar los datos

Para poder realizar un análisis lógico de los datos obtenidos en una investigación y contenidos en una serie de instrumentos, es necesario ordenarlos en forma lógica, es decir, clasificarlos en base a determinados criterios. En ese sentido, y recordando el paso 4 de la Sección 1.10.4 del Unidad I, es necesario efectuar:

1) La Revisión: Consiste en constatar y hacer recuento todos los instrumentos contentivos de los datos con el objeto de detectar los espacios en blanco u omisiones, y observar aquellas respuestas absurdas, erróneas o ilógicas, corrigiéndolas cuando sea posible.

2) El Agrupamiento: Luego de ejecutarse el paso anterior, corresponde seleccionar, expresar (resumidamente) y agrupar en una hoja los datos tal como aparecen descritos en el respectivo instrumento a ser asociado a dicha hoja.

3) La Clasificación: Se determina cada variable evaluada en los instrumentos, y de todas las hojas antes usadas para registrar los datos se escogen, de entre estos últimos, los que están asociados a la variable en cuestión.

Así obtenemos una mejor percepción visual, conceptual y sectorizada del volumen de información a ser expuesta en forma manejable para su procesamiento estadístico con las técnicas a ser estudiadas en la presente Guía Didáctica.

2.2 ¿Qué se entiende por Observación, Clase y Frecuencia?

23

Page 24: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Una Observación (o Unidad Estadística) es un dato asumido por una variable cuando esta es cualitativa, o es una repetición de un dato propio de una población o muestra cuando la variable es cuantitativa.

En el primer caso, la cantidad N de observaciones es igual a la cantidad n de datos (N = n) pues cada observación es un dato en sí misma. En el segundo caso, cada dato está asociado a una serie de observaciones que lo repiten; el número N de observaciones de todos los datos es mayor o igual al número n de datos obtenidos (N ≥ n). Si cada observación aparece repetida una sola vez, entonces la cantidad de datos resulta igual a la cantidad de observaciones (N = n), es decir, cada dato está asociado a una sola observación.

Necesariamente deben aplicarse técnicas de conteo con el fin de identificar y cuantificar las observaciones de manera cuidadosa para evitar errores. La más sencilla es escoger una observación de una serie dada y en una hoja se le colocan al lado tantas rayitas como repeticiones se encuentren en la serie, en la cual se van tachando a medida que se van encontrando. Este procedimiento se ejecuta para todas las observaciones previa aplicación de algún criterio que permita ordenarlas.

Una Clase es un grupo determinado de datos u observaciones estudiados, los cuales se pueden ubicar en k grupos, pudiéndose colocar estos en orden de magnitud de ser así posible (de acuerdo a la escala o nivel de medición a usarse), y se distribuyen de forma que un mismo dato u observación no tenga ubicación simultánea en clases diferentes. Es decir, cada dato u observación se asocia a una y sólo una de las k clases dadas.

Se entiende por Frecuencia a la cantidad o porcentaje de observaciones asociadas a un dato o a una clase. Si la variable es cualitativa, cada observación es un dato y cada categoría asumida por la variable viene siendo una clase, cuya frecuencia en todo caso viene dada por la cantidad o porcentaje de datos que caen en esa categoría. Si la variable es cuantitativa, un dato es un valor numérico repetido por las observaciones, y la cantidad de estas es la frecuencia del dato, y la frecuencia de una clase es la suma de las frecuencias de los datos que la conforman.

2.3 Distribuciones de Datos y Frecuencias

Una Distribución de Datos en un conjunto de datos obtenidos de una serie de observaciones, y dispuestos de manera separada y consecutiva, ya sea en forma unitaria o grupal conforme a las categorías o valores de una variable, y ordenados según la escala o nivel de medición empleada al efecto.

Una Distribución de Frecuencias es un agrupamiento de datos en grupos mutuamente excluyentes, dando el número o porcentaje de observaciones a cada grupo. O sea, no hay Distribución de Frecuencias sin Distribución de Datos, y aquella tendrá su respectiva denominación de acuerdo al tipo de frecuencia a

24

Page 25: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

definirse en la Sección 2.5. Por ejemplo, se puede hablar de una Distribución de Frecuencias Relativas.

2.4 Tipos de Distribuciones de Datos y Frecuencias

2.4.1 Distribución de Datos Simples o no Agrupados

Así se le denomina cuando a los datos no se les han aplicado algún tratamiento de agrupación, es decir, cada uno de los n datos es tomado de manera unitaria y por separado. Cuando a estos datos les asociamos sus respectivas frecuencias, estamos ante una Distribución de Frecuencias para Datos Simples o no Agrupados. Por otra parte, toda serie de N observaciones se puede representar como una distribución de n datos simples y viceversa, por lo que uno es equivalente al otro, y de uno se construye el otro.

2.4.2 Distribución de Datos Agrupados

A partir de una Distribución de Datos Simples o no Agrupados previamente elaborada, los datos se agrupan en k clases o grupos con el fin de sintetizar, condensar, resumir o hacer más fácilmente manejable la información. Cuando a estas clases les asociamos sus respectivas frecuencias, estamos ante una Distribución de Frecuencias para Datos Agrupados.

2.5 Tipos de Frecuencia

2.5.1 Frecuencia Absoluta (f o F)

Es la cantidad f de veces que se repite cada uno de los n datos dentro de una colección de estos, o el número de observaciones F asociadas a cada una de las k clases. A veces a la Frecuencia Absoluta se le denomina Frecuencia Absoluta Simple.

La suma de n o k frecuencias (para datos simples o agrupados, respectivamente) da el número N de todas las observaciones. Luego tenemos las correspondientes expresiones que simbolizan lo antes dicho:

Datos Simples Datos Agrupados

2.5.2 Frecuencia Absoluta Acumulada (fa o Fa)

Es la suma de las frecuencias absolutas comprendidas hasta un determinado dato (fa) o hasta cierta clase (Fa).

25

Page 26: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Datos Simples Datos Agrupadosfaj = f1 + f2+…+fj, j = 1,…, n Faj = F1 + F2+…+Fj, j = 1,…, k

2.5.3 Frecuencia Relativa (h o H)

Se define como el porcentaje que resulta de dividir cada frecuencia absoluta sobre la sumatoria de todas las frecuencias absolutas de n datos o k clases, y luego multiplicar ese cociente por 100%, obteniéndose h o H respectivamente. A veces a la Frecuencia Relativa se le denomina Frecuencia Relativa Simple.

Datos Simples Datos Agrupados

2.5.4 Frecuencia Relativa Acumulada (ha o Ha)

Es la suma de las frecuencias relativas comprendidas hasta un determinado dato (ha) o una cierta clase (Ha).

Datos Simples Datos Agrupadoshaj = h1 + h2+…+hj, j = 1,…, n Haj = H1 + H2+…+Hj, j = 1,…, k

TEMA 2

2.6 Construcción de Distribuciones de Frecuencias para Datos Simples y Agrupados

Si la variable X es cualitativa, hallaremos las frecuencias absolutas y relativas de cada una de las k modalidades de la variable. Aquí cada clase se expresa como una modalidad representada de acuerdo a la Escala de Medición Nominal u Ordinal de la variable. Si la escala no es ordinal, no tiene sentido calcular las frecuencias absolutas acumuladas y las frecuencias relativas acumuladas.

Modalidad de Clase F H Fa Ha

c1

c2

c3

.

.

.ck

F1

F2

F3

.

.

.Fk

H1

H2

H3

.

.

.Hk = 100%

Fa1

Fa2

Fa3

.

.

.Fak

Ha1

Ha2

Ha3

.

.

.Hak = 100%

N N

26

Page 27: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Ejemplo: Un estudio hecho en un conjunto de 25 varones con objeto de determinar su grupo sanguíneo ha conducido a los siguientes resultados:

A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B

La variable que indica el tipo sanguíneo es cualitativa, y no hay jerarquía entre los atributos o modalidades. Luego obtenemos la siguiente Distribución de Frecuencias.

Tipo de sangre F H

ABO

AB

11761

44%28%24%

4%N = 25 100%

Si la variable X es cuantitativa (discreta o continua), hallaremos las frecuencias de cada uno de los valores o datos de la variable si son pocos, y se hará de manera similar a como se expuso anteriormente.

Ejemplo: Observemos la siguiente tabla en la que se expresan las calificaciones obtenidas en un ejercicio evaluado en escala de 1 a 10 puntos. Tenemos una distribución de frecuencias asociadas a una variable cuantitativa.

Calificaciones f h fa ha123456789

10

1212343121

5%10%

5%10%15%20%15%

5%10%

5%

13469

1316171920

5%15%20%30%45%65%80%85%95%

100% N = 20 100%

2.7) Pasos necesarios en la construcción de una Distribución de Frecuencias para Datos Agrupados

En caso de asumir la variable cuantitativa X una cantidad relativamente numerosa de valores, los agrupamos en clases y hallamos sus frecuencias. Aquí la clase se representa por un número, y a esta se halla asociado un intervalo de la recta real llamado Intervalo de Clase, y una Marca de Clase Xm o valor que representa ese intervalo, tal como veremos a continuación.

27

Page 28: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Nº de Clase

Intervalo de Clase Xm F Fa H Ha

123...k

[Li1, Ls1][Li2, Ls2][Li3, Ls3]

.

.

.[Lik, Lsk]

Xm1

Xm2

Xm3

.

.

.Xmk

F1

F2

F3

.

.

.FK

Fa1

Fa2

Fa3

.

.

.FaK = N

H1

H2

H3

.

.

.HK

Ha1

Ha2

Ha3

.

.

.HaK = 100%

N 100%

Ejemplo: Una cooperativa de producción fundada hace algunos años se dedicó a vender productos agrícolas que producía. Como consecuencia del paro petrolero y de escasez de alimentos enlatados en las comunidades a las que servía la cooperativa, se propuso negociar productos enlatados a fin de aumentar la oferta de productos y de esta manera ampliar sus servicios a la comunidad. Dada la gran variedad de productos así como de sus precios, la cooperativa necesita desarrollar una investigación estadística de productos y precios que ofrecían a fin de encontrar las variaciones en los precios y las tendencias de preferencia de la comunidad.

A continuación presentamos una serie de datos de los precios de los nuevos productos ofrecidos por la cooperativa.

1.560 1.870 1.890 2.330 3.030 1.9901.630 3.240 2.330 2.550 2.010 3.0301.220 1.630 2.010 1.150 3.020 1.8933.550 3.030 2.750 2.330 2.110 1.6301.630 3.240 1.893 2.111 1.630 2.0102.735 2.330 3.240 2.567 2.789 1.234

1) Definimos la variable X, determinamos el número N de observaciones, y se ordena la serie de datos de menor a mayor (por filas o columnas)

Sea X la variable que indica el precio de cada producto enlatado vendido por la cooperativa. Vemos que X es cuantitativa y discreta. Hay N = 36 observaciones que ordenaremos por columnas en forma creciente. Para hacer esto, de cada una de las m columnas (filas) de la agrupación anterior se selecciona la menor de las observaciones, y de allí se escoge la menor de las m cantidades así obtenidas por columna. Luego, en una nueva columna (fila) a escribirse en otra agrupación posterior, se expresan las repeticiones de ese valor a la vez que se tachan en la agrupación anterior, y en ésta se aplica el procedimiento de nuevo sin tomar en cuenta los valores ya tachados.

28

Page 29: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

1.150 1.630 1.893 2.111 2.567 3.0301.220 1.630 1.990 2.330 2.735 3.0301.234 1.630 2.010 2.330 2.750 3.2401.560 1.870 2.010 2.330 2.789 3.2401.630 1.890 2.010 2.330 3.020 3.2401.630 1.893 2.110 2.550 3.030 3.550

Interpretación: Al observar los precios ordenados podemos decir que hay 18 productos con precios por debajo de Bs. 2.111 y el resto un precio mayor.

La cantidad de observaciones realizadas es de 36 precios correspondientes a 36 productos enlatados diferentes.

2) Determinamos la cantidad de datos n y la correspondiente Distribución de Frecuencias para Datos Simples.

Dada la variable X, las observaciones se denotan con el símbolo xi, donde j asumirá el valor de la posición de cada observación, j = 1, 2, 3,..., N.

x1 = 1.150 x7 = 1.630 x13 = 1.893 x19 = 2.111 x25 = 2.567 x31 = 3.030x2 = 1.220 x8 = 1.630 x14 = 1.990 x20 = 2.330 x26 = 2.735 x32 = 3.030x3 = 1.234 x9 = 1.630 x15 = 2.010 x21 = 2.330 x27 = 2.750 x33 = 3.240x4 = 1.560 x10 = 1.870 x16 = 2.010 x22 = 2.330 x28 = 2.789 x34 = 3.240x5 = 1.630 x11 = 1.890 x17 = 2.010 x23 = 2.330 x29 = 3.020 x35 = 3.240x6 = 1.630 x12 = 1.893 x18 = 2.110 x24 = 2.550 x30 = 3.030 x36 = 3.550

De aquí obtenemos la siguiente tabla, donde el número de datos es n = 22. Esa tabla es un ejemplo de una Distribución de Frecuencias Absolutas para Datos Simples, donde a cada dato Xj se le asocia su correspondiente frecuencia absoluta fj, j = 1,…, n. No sería posible obtener la tabla que veremos a continuación sin la tabla anterior donde las observaciones están ordenadas en forma creciente. Ambas tablas son equivalentes, pues de una se puede extraer la otra.

X f X f X f X fX1 = 1.150 1 X7 = 1.890 1 X13 = 2.330 4 X19 = 3.020 1X2 = 1.220 1 X8 = 1.893 2 X14 = 2.550 1 X20 = 3.030 3X3 = 1.234 1 X9 = 1.990 1 X15 = 2.567 1 X21 = 3.240 3X4 = 1.560 1 X10 = 2.010 3 X16 = 2.735 1 X22 = 3.550 1X5 = 1.630 5 X11 = 2.110 1 X17 = 2.750 1X6 = 1.870 1 X12 = 2.111 1 X18 = 2.789 1

Dada la variable X, en la Distribución de Frecuencias Absolutas para Datos Simples cada uno de estos es tomado aisladamente del resto al representarlo con el símbolo Xj, donde j asumirá el valor de la posición de cada dato y X = Xj (j = 1, 2,..., n).

29

Page 30: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

En el presente caso, el dato X5 = 1.630 está asociado a las observaciones x5, x6, x7, x8 y x9, las cuales asumen cada una el valor 1.630, que se repite con una frecuencia f5 = 5.

Interpretación: Hay 5 productos enlatados que tienen un precio de Bs. 1.630.

3) Calculamos la Amplitud, Rango o Recorrido de la distribución de datos considerada

Para esto primero determinamos el valor mayor Xmás grande y el valor menor Xmás pequeño de la Distribución de Datos Simples. Como en esta distribución los datos están ordenados del menor al mayor valor, tenemos que Xmás grande = Xn y Xmás pequeño = X1. Luego calculamos la Amplitud, Rango o Recorrido mediante la siguiente formula: A = Xmás grande – Xmás pequeño = Xn – X1.

Xmás pequeño = Bs. 1.150, Xmás grande = Bs. 3.350

A = 3.350 – 1.150; A = 2.200

Interpretación: La variación de precios entre el mayor y el menor es de Bs.2.200.

4) Calculo el número k de clases

Necesitamos determinar la cantidad de clases o grupos en que debemos separar a los distintos datos de la distribución. La idea es hacer más fácil el manejo de la información vinculada a numerosas observaciones o datos.

Existen muchas maneras de definir la cantidad de clases a considerar. Un procedimiento útil para este fin es la Regla de 2 a la k. Tomamos el menor valor entero para k de tal manera que 2k sea mayor o igual a N (numero de observaciones consideradas).

El valor encontrado para k será el número de clases para la agrupación. Se recomienda que el número de clases este entre 5 y 25 (5 ≤ k ≤ 25).

Ahora usamos esta regla para hallar el número de clases del ejercicio considerado.

Asumimos (por tanteo) un valor de k = 5. Entonces 25 = 32, y como 32 es menor que N = 36, el valor de k = 5 no es útil. Ahora asumimos el valor de k = 6, calculamos 26 = 64, y como ahora 64 es mayor que N = 36, entonces en este caso se usarán 6 clases. Siempre el valor de 2k tiene que ser mayor o igual que N (o sea, N ≤ 2k).

30

Page 31: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Interpretación: Los datos los agruparemos en 6 clases o grupos para poder obtener la mayor información posible de la distribución considerada. Tratar esa cantidad de clases es un trabajo más práctico que usar 22 datos o 36 observaciones.

5) Cálculo de la distancia entre los límites consecutivos de los Intervalos de Clase (DC) y su correspondiente longitud (Ic)

Un Intervalo de Clase se define como aquel sector de la recta real que contiene una clase o conjunto de datos que se encuentra ubicado entre dos extremos o límites establecidos. El tamaño de cada intervalo debe ser el mismo para todas las clases, y el valor de esa distancia debe ser un número entero, no decimal. La sucesión de estos intervalos deben abarcar por lo menos la distancia desde el menor valor Xmás pequeño hasta el valor mayor Xmás grande, aunque pueden abarcar una distancia mayor.

Con respecto a la clase j = 1,…, k, el intervalo de clase que la contiene posee como extremos un límite inferior Lij y un límite superior Lsj. Aquí cada intervalo se tomará cerrado en sus extremos, y estará separado de los intervalos adyacentes a una distancia de una unidad de longitud para cada uno. Por ejemplo, para las clases 1 y 2 los respectivos intervalos [Li1, Ls1] y [Li2, Ls2] estarán separados de esa manera pues se debe cumplir que Li2 – Ls1 = 1.

Por razones de orden práctico, a veces cada intervalo [Lij, Lsj] se representa como Lij – Lsj tal como aparece en algunos libros de Estadística. En tal caso no se está representando una resta ni un intervalo que no sea cerrado en sus extremos.

Hay casos en que los intervalos de clase se pueden tomar abiertos o semiabiertos en sus límites. En la presente Guía Didáctica no estudiaremos los procedimientos para obtenerlos, pudiéndose consultar en otros textos de Estadística.

Sea DC la distancia existen entre los límites inferiores o superiores consecutivos para dos intervalos de clases. Siguiendo el ejemplo dado, DC = Li2 – Li1 = Ls2 – Ls1. Para hallar esa distancia podemos utilizar la siguiente formula:

Si el resultado dado por esta fórmula da un número decimal, este se redondea por exceso y se escoge como el valor buscado para DC. Se selecciona así para garantizar que los intervalos de clase puedan contener a todos los datos.

31

Page 32: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Sea Ic la longitud que tiene cualquier intervalo de clase [Lij, Lsj], por lo que Ic = Lsj – Lij, j = 1,…, k, pues todos los intervalos tienen igual tamaño. Es fácil deducir que Ic = Dc – 1.

En base a los cálculos anteriores, tenemos que

Xmás pequeño = 1.150, Xmás grande = 3.350, A = 2.200, k = 6

Aplicamos la formula:

A este resultado lo aproximamos al entero inmediatamente superior, por lo cual tenemos que Dc = 367 e Ic = 366.

Interpretación: Determinamos que el precio menor de la distribución es Bs. 1.150 y el mayor Bs. 3.350. La diferencia entre los valores extremos consecutivos de cada clase es Bs. 367.

6) Determinamos los Intervalos de Clases

6.1)Cálculo de los límites inferiores Li

Tomamos Li1 = Xmás pequeño = 1.150 como límite inferior de la clase j = 1. Para calcular el límite inferior Li2 de la clase j = 2, sumamos al Li1 el valor DC y tendremos Li2 = Li1 + DC = 1.150 + 367 = 1.517. Entonces Li2 = 1.517, y así sucesivamente hasta completar los 6 límites inferiores de los correspondientes intervalos de clases.

6.2)Cálculo de los límites superiores Ls

Para calcular el limite superior Ls1 de la clase 1, a Li2 le restamos la unidad, y así Ls1 = Li2 – 1 = 1.517 – 1 = 1.516, Ls1 = 1.516. Luego, para calcular Ls2 le sumamos DC a Ls1 y tendremos Ls2 = Ls1 + DC = 1.516 + 367 = 1.883. Entonces Ls2 = 1.883, y así sucesivamente hasta completar los 6 límites superiores de los correspondientes intervalos de clases.

6.3)Tabulación de los Intervalos de Clase

Ahora determinamos los intervalos de clases que usaremos. A la clase j le corresponde el intervalo [Lij, Lsj], j = 1,…, k. Expondremos esta información por medio de una tabla. Recordemos que su tamaño o longitud es Ic = Lsj – Lij = Dc – 1, el cual es igual para todos los intervalos de clase.

Nº de Intervalo

32

Page 33: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Clase de Clase1 [1.150, 1.516]2 [1.517, 1.883]3 [1.884, 2.250]4 [2.251, 2.617]5 [2.618, 2.984]6 [2.985, 3.353]

Interpretación: La clase o grupo 2 consta de todos los precios registrados de enlatados mayores o iguales a Bs. 1.517 y menores o iguales a Bs. 1.883, y la variación entre estos dos límites o extremos es de Bs. 366.

7) Calculamos la Marca de Clase

La Marca de Clase es el punto medio del respectivo intervalo de clase al cual pertenece. Se calcula a partir de la semisuma de sus límites.

, j = 1,…, k

Calculamos el valor medio Xm1 de la clase j = 1.

; Xm1 = 1.333

De igual manera determinamos el resto de las marcas de clase. Luego, a la tabla anterior le anexamos una columna contentiva de dichas cantidades, asociándolas a sus correspondientes clases.

Nº de Clase

Intervalo de Clase Xm

1 [1.150, 1.516] 1.3332 [1.517, 1.883] 1.7703 [1.884, 2.250] 2.0654 [2.251, 2.617] 2.4345 [2.618, 2.984] 2.8016 [2.985, 3.353] 3.164

Interpretación: El primer grupo de precios está definido entre Bs. 1.150 y Bs. 1.516, y el precio promedio de estos valores extremos es de Bs. 1.333.

8) Calculamos la Frecuencia Absoluta de cada clase

33

Page 34: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

De la distribución de frecuencias para datos simples, la frecuencia absoluta Fj de la clase j = 1,…, k es la suma de las frecuencias de los datos pertenecientes a esa clase.

Para el caso de la clase j = 2, el respectivo intervalo de clase es [1.517, 1.883], y los datos X4 = 1.560, X5 = 1.630 y X6 = 1.870 conforman la clase 2. Luego tenemos que F2 = f4 + f5 + f6 = 7. Es decir, en el intervalo [1.517, 1.883] hay 7 observaciones.

Las frecuencias así obtenidas las anexamos a la tabla en una columna adjunta a la de las marcas de clase.

Nº de Clase

Intervalo de Clase Xm F

1 [1.150, 1.516] 1.333 32 [1.517, 1.883] 1.770 73 [1.884, 2.250] 2.065 94 [2.251, 2.617] 2.434 65 [2.618, 2.984] 2.801 36 [2.985, 3.353] 3.164 8

N = 36

Interpretación: Los precios de 7 productos enlatados son mayores o iguales a Bs. 1.517 y menores o iguales a 1.883.

9) Calcularemos la Frecuencia Absoluta Acumulada (Fa)

Para la clase j = 1,…, k, tenemos que Faj es la cantidad de observaciones contenidas entre el correspondiente intervalo de clase más las de los anteriores siguiendo el orden, es decir, Faj = F1 + F2 +…+ Fj.

Las frecuencias absolutas acumuladas aquí obtenidas se ubican en la tabla anterior por orden de clase en una columna anexa a la de la frecuencia absoluta.

Para la clase j = 3 tenemos que Fa3 = F1 + F2 + F3 = 3 + 7 + 9 =19.

Nº de Clase

Intervalo de Clase Xm F Fa

1 [1.150, 1.516] 1.333 3 32 [1.517, 1.883] 1.770 7 103 [1.884, 2.250] 2.065 9 194 [2.251, 2.617] 2.434 6 255 [2.618, 2.984] 2.801 3 286 [2.985, 3.353] 3.164 8 36

N = 36

34

Page 35: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Interpretación: Los precios de 19 productos enlatados son menores o iguales a Bs. 2.250.

En algunos textos la Frecuencia Absoluta Acumulada Faj aquí referida para la clase j viene siendo la Frecuencia Absoluta Acumulada hacia Arriba ,

mientras que la Frecuencia Absoluta Acumulada hacia Abajo es = Fj + Fj+1 +…+ Fk-1 + Fk.

Nº de Clase

Intervalo de Clase Xm F

1 [1.150, 1.516] 1.333 3 3 362 [1.517, 1.883] 1.770 7 10 333 [1.884, 2.250] 2.065 9 19 264 [2.251, 2.617] 2.434 6 25 175 [2.618, 2.984] 2.801 3 28 116 [2.985, 3.353] 3.164 8 36 8

N = 36

Para la clase j = 3 tenemos que = F3 + F4 + F5 + F6 = 9 + 6 + 3 + 8 = 26.

Interpretación: Los precios de 26 productos enlatados son mayores o iguales a Bs. 1.884.

10)Calculamos la Frecuencia Relativa (H)

Aplicando la fórmula respectiva para la clase j = 2, tenemos que

100% = 100% = 19,44% De igual manera se calcula la

frecuencia relativa de cada una de las clases restantes.

Nº de Clase

Intervalo de Clase Xm F Fa H

1 [1.150, 1.516] 1.333 3 3 8,33%2 [1.517, 1.883] 1.770 7 10 19,44%3 [1.884, 2.250] 2.065 9 19 25,00%4 [2.251, 2.617] 2.434 6 25 16,67%5 [2.618, 2.984] 2.801 3 28 8,33%6 [2.985, 3.353] 3.164 8 36 22,22%

N = 36 99,99%

Interpretación: El 19,44% de los productos enlatados tienen precios mayores o iguales a Bs. 1.517 y menores o iguales a Bs. 1.883.

35

Page 36: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

11)Calculamos la Frecuencia Relativa Acumulada (Ha)

Para la clase j = 1,…, k, tenemos que Haj es el porcentaje de observaciones contenidas en el correspondiente intervalo de clase más los porcentajes de observaciones de las anteriores clases siguiéndolas en orden creciente, es decir, Haj = H1 + H2+…+Hj. De aquí se deduce que necesariamente la frecuencia relativa acumulada de la clase j = k tiene que ser Hak = 100%, aunque a veces por errores de cálculo a nivel de centésimas, o incluso de milésimas, puede que ese valor de la última clase se ubique en el entorno de 99,99 %.

Para la clase j = 3 tenemos que Ha3 = H1 + H2 + H3 = 8,33% + 19,44% + 25,0 % = 52,78%. De igual manera calculamos las restantes frecuencias y las anexamos.

Nº de Clase

Intervalo de Clase Xm F Fa H Ha

1 [1.150, 1.516] 1.333 3 3 8,33% 8,33%2 [1.517, 1.883] 1.770 7 10 19,44% 27,78%3 [1.884, 2.250] 2.065 9 19 25,00% 52,78%4 [2.251, 2.617] 2.434 6 25 16,67% 69,44%5 [2.618, 2.984] 2.801 3 28 8,33% 77,78%6 [2.985, 3.353] 3.164 8 36 22,22% 99,99%

N = 36 99,99%

La última tabla así obtenida es la Distribución de Frecuencias para Datos Agrupados del problema tratado hasta ahora.

Así como nos hemos referido a la Frecuencia Absoluta Acumulada hacia Arriba ( ) y hacia Abajo ( ), en forma análoga se puede definir Frecuencia Relativa Acumulada hacia Arriba ( ) y hacia Abajo ( ).

Interpretación:La frecuencia absoluta F4 = 6 de la cuarta clase, significa que 6 productos

enlatados tienen precios que oscilan entre Bs. 2.252 y Bs. 2.619.La frecuencia relativa H3 = 25,00% de la tercera clase, significa que el 25%

de los productos referidos tienen precios que oscilan entre Bs. 1.884 y Bs. 2.251.La frecuencia acumulada Ha4 = 25 de la cuarta clase, significa que 25

productos tienen precios que oscilan entre Bs. 1.150 y Bs. 2.619.La frecuencia relativa acumulada Ha5 = 77,78% de la quinta clase, significa

que el 77,78% de los productos tienen precios que oscilan entre Bs. 1.150 y Bs. 2.987.

Del ejemplo anterior contesten las siguientes preguntas:

36

Page 37: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

¿Cuántos productos enlatados tienen precios entre Bs.2.252 y Bs. 2.986?¿Cuántos productos enlatados tienen precios entre Bs.1.150 y Bs. 2.251?¿Cuál es el precio promedio del 25% de los productos enlatados?¿En qué precios oscilan por lo menos 28 productos enlatados?

Nota 1: Al tener una Distribución de Frecuencias para Datos Simples o no Agrupados, para cada uno de estos se calcula la frecuencia absoluta, relativa, acumulada (hacia arriba y hacia abajo), y relativa acumulada (hacia arriba y hacia abajo. Como los datos se toman unitariamente y no agrupados en clases, no hay intervalos de clase.

Ejemplo: Las edades de los 20 integrantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta.

34 40 30 37 26 18 37 18 26 2623 37 26 23 34 37 21 37 37 23

A esta serie de observaciones se le aplica los pasos 1 y 2 de la Sección 2.7 para construir una tabla donde aparezcan ordenados en forma creciente los datos con sus respectivas frecuencias absolutas.

X 18 21 23 26 30 34 37 40f 2 1 3 4 1 2 6 1

Posteriormente, se ejecutan los pasos 8, 9, 10 y 11 de la sección antes mencionada.

X f h18 2 2 20 10% 10% 100%21 1 3 18 5% 15% 90%23 3 6 17 15% 30% 85%26 4 10 14 20% 50% 70%30 1 11 10 5% 55% 50%34 2 13 9 10% 65% 45%37 6 19 7 30% 95% 35%40 1 20 1 5% 100% 5%

N = 20 100%

Nota 2: La Distribución de Frecuencias para Datos Simples expresa información muy detallada y abundante acerca de los datos. La Distribución de Frecuencias para Datos Agrupados expresa información muy resumida y austera acerca de estos, por lo que se pierde información y la segunda distribución mencionada es una aproximación de la primera. Manejarlos de cualquiera de las dos maneras es más práctico y explícito en su contenido que tenerlos desordenados y dispersos.

37

Page 38: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Nota 3: Todos los pasos de la Sección 2.7 se han aplicado para una variable cuantitativa, pero algunos se pueden usar y adaptar para cualquier variable cualitativa. En ese caso no se podrían calcular el rango ni nada referido propiamente a intervalos de clase, y si tal variable hace uso de una Escala de Medición Ordinal tiene sentido determinar las frecuencias absolutas acumuladas y frecuencias relativas acumuladas para cada categoría que asuma la variable en cuestión.

Nota 4: Dependiendo de las particularidades del problema a estudiar y de la variable usada para una distribución de frecuencias para datos agrupados, los intervalos asociados a las clases j = 1 y j = k (o sea, el primer y el último intervalo) pueden no tener definidos el límite inferior Li1 y el límite superior Lsk, respectivamente. En este caso hablamos de una Distribución Abierta.

Ejemplo: En una Unidad de Barrio Adentro fueron atendidas 200 personas en un día de consulta, y se distribuyeron en 6 grupos por edades.

Edades (años)

Número de asistentes

Menos de 29 1630-39 2540-49 5150-59 8060-69 20

Más de 70 8

2.8 ACTIVIDADES

Individual

Lea con cuidado los contenidos presentados en esta unidad y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.

Grupal Cooperativo

Del análisis de las evolución de enfermedades endémicas de una región del país se encontró que los casos de dengue hemorrágico en los últimos quince años varió de la siguiente forma: 1.650, 1.475, 1.510, 1.670, 1.540, 1.495, 1.590, 1.629, 1.510, 1.930, 2.300, 1.890, 2.345, 3.500, 1.250.1. ¿Cómo se llaman los datos 1.250 y 3.500 en esta serie de datos?2. Agrupe la serie de datos en clases, calcule el valor medio de cada clase,

F, Fa, H y Ha. Resuelve y agrégalos a tu portafolio.

38

Page 39: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Durante un diagnóstico realizado en una comunidad de los paramos del Estado Mérida, se aplicó una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos:

77 18 63 84 38 54 52 59 54 56 3626 50 34 44 41 58 58 53 51 62 6362 62 65 61 60 60 45 66 83 71 6358 51 71

Agrupe la serie de datos en clases, calcule el valor medio de la clase, F, Fa, H y Ha. Interprete los resultados, resuelve y agrégalos a tu portafolio.

La Junta Comunal de una comunidad de los Valles del Tuy esta compuesta por quince miembros o representantes, ellos se reúnen una vez a la semana para realizar el seguimiento de los principales problemas de la comunidad y adelantar acciones a favor de su resolución. En cada reunión se levanta un acta donde se deja constancia de la asistencia. De análisis de las 51 reuniones convocadas el año pasado se encontraron los siguientes datos.

5 8 14 5 6 9 3 1 7 10 83 11 12 15 8 5 3 2 4 9 21 12 13 5 9 8 3 1 2 1 105 4 9 3 1 9 1 11 12 14 67 2 6 4 8 2 10

Organice y agrupe los datos en clases, y calcule el valor medio de cada clase, F, Fa, H y Ha. Interprete los resultados, resuelve y agrégalos a tu portafolio de aprendizaje.

Comunitario

Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II) siga el siguiente tratamiento:1. Revíselos.2. Determine si son datos discretos o continuos.3. Agrúpelos ordenados de mayor a menor.4. Calcule los elementos de los datos agrupados.5. Número de N observaciones, numero de n datos, número de k clases,

Intervalo de Clase, Punto Medio de cada clase, F, Fa, H y Ha. Interprete los resultados.

39

Page 40: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

UNIDAD III: REPRESENTACIÓN DE LOS DATOS

OBJETIVO: Cuando el estudiante culmine este Unidad, podrá presentar los datos usando técnicas de tabulación y graficación para extraer conclusiones descriptivas.

COMPETENCIAS A LOGRAR:

1) Comprende la función de las tablas, cuadros y gráficos para presentar los datos procesados.

2) Representa e interpreta datos en tablas.3) Grafica los datos, con el propósito de representarlos.4) Interpreta las representaciones gráficas.5) Uso de herramientas computacionales (Excel, SPSS, entre otras).

CONTENIDO:

En la práctica se realiza la representación de los datos, dentro de la investigación estadística, luego de haberse agrupado y calculado los valores de frecuencia requerida. En gran parte el carácter de este proceso es publicitario por la forma de informar al interesado los resultados y datos obtenidos en una investigación. En cualquier caso, las formas de presentación de los datos son la textual, la tabular y la gráfica.

TEMA 1

3.1 Forma Textual

Es la que se realiza a través de palabras ó símbolos algebraicos. Esta forma es quizás la menos aconsejable, y solo debe utilizarse en los casos en que se requiera exponer resultados brevemente, pues en el caso de que el texto sea muy largo cansaría al lector y no le permitiría comprender totalmente lo expuesto. En la práctica se utiliza como un complemento de la forma tabular o de la forma grafica.

Ejemplo: Los enlatados que vende una cooperativa de producción presentan precios que están agrupados en varias clases; los precios que están en el intervalo entre Bs. 1.558 y Bs. 2.253 presentan una frecuencia de 9, o sea, el 25% de los productos enlatados, de los cuales Bs. 2.253 representa el precio más alto del 69,45% de los productos enlatados que vende la cooperativa.

3.2 Forma Tabular

Es aquella que se realiza a través de las tablas o cuadros estadísticos, entendiéndoseles como una ordenación de datos numéricos en filas y columnas

40

Page 41: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

con las especificaciones correspondientes acerca de la naturaleza de los datos (simples o agrupados), y así poder apreciar de la mejor forma las características y la cuantía del fenómeno estudiado y establecer comparaciones entre dichos datos. Al respecto, la forma tabular contiene en sí misma todas las cantidades que conforman una Distribución de Frecuencias para Datos Simples o Agrupados.

3.2.1 Componentes del Cuadro Estadístico

Las partes que componen un Cuadro Estadístico son:

1) Título: Comprende el número del cuadro (cuando el mismo forma parte de un grupo), el tema del cuadro y a veces una nota complementaria; contesta el titulo las preguntas: ¿Qué? (tema de los datos), ¿Cuándo? (referencia cronológica), ¿Dónde? (referencia geográfica).

2) Encabezamiento: Comprende los títulos de cada columna de datos.

3) Columna Matriz: Abarca las designaciones de cada fila de datos y se encuentra en la parte izquierda del cuadro.

4) Cuerpo: Consiste en las cifras o símbolos que se encuentran colocados en las filas y columnas del cuadro debajo del encabezamiento y a la derecha de la columna matriz.

5) Notas: Aparecen en cual parte del cuadro, y explican algunas aclaratorias sobre los datos y casi siembre la fuente de los datos, cuando las notas se encuentra al final del cuadro se denominan notas al pie.

Ejemplo:

Consideremos el ejemplo estudiado en la Sección 2.7 del Unidad II.

41

Page 42: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Cuadro 3

ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOSCOOPERATIVA DE PRODUCCION DE RÍO CARIBE

2.003

(Bolívares)

Nº de Clase

Intervalo de Clase Xm F Fa H (%) Ha (%)

1

[1.150 – 1.516] 1.333 3 3 8,33

8,33

2 [1.517 – 1.883] 1.770 7 10 19,44%27,78

3 [1.884 – 2.250] 2.065 9 19 25,00% 52,784 [2.251 – 2.617] 2.434 6 25 16,67% 69,445 [2.618 – 2.984] 2.801 3 28 8,33% 77,786 [2.985 – 3.353] 3.164 8 36 22,22% 99,99

Nota: Representan los productos enlatados ofrecidos por la Cooperativa en Marzo de 2.003.Fuente: Gerencia de Ventas de la Cooperativa de Producción de Río Caribe.

3.2.2 Pasos recomendados para elaborar un Cuadro Estadístico

1) Numeración del Cuadro. Los cuadros, gráficos, fotos y figuras de un informe deben esta numerados según su tipo de presentación y en orden correlativo. Por ejemplo: Cuadro 1, Cuadro 2,..., Grafico 1, Grafico 2,..., Foto 1, Foto 2, Foto 3,…, Figura 1, Figura 2,...

2) Título propiamente dicho. Deberá colocarse sin subrayar, centrado en la parte superior del cuadro, y usando letras mayúsculas para todo el

42

Col

umna

Mat

riz

Cue

rpo

Título

Enc

abez

amie

nto

Page 43: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

enunciado. Es preciso redactar con claridad y expresar concisamente los datos que se presentan en el cuadro.

En general, el orden del enunciado será el siguiente:

Referencia Geográfica. Naturaleza de los datos. Referencia Cronológica. Detalles de clasificación o unidades. Estas deberán colocarse entre

paréntesis y utilizando mayúsculas únicamente al iniciar la palabra.

Ejemplo:

Cuadro 3

ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOSCOOPERATIVA DE PRODUCCION DE RIO CARIBE

2.003

(Bolívares)

3) Encabezamiento. Debe disponerse en la parte superior del cuadro, y las designaciones que comprenden deberán escribirse en lo posible horizontalmente, debiendo ser claras y concisas. Así mismo se dispondrán en un orden lógico de izquierda a derecha.

4) Columna matriz o principal. El arreglo puede hacerse de la siguiente manera:

Cuando se trate de datos cualitativos, éstos deberán ordenarse alfabéticamente.

Cuando su función sea analizar una tendencia de un fenómeno se ordenarán en forma ascendente ejemplo: 1.954, 1.955, 1.956, pero si se trata de la importancia de los últimos años se ordenarán los años de manera descendente ejemplo: 1.959, 1.958, 1.957, 1.956.

En lo que refiere a meses del año o los días de semana se comenzarán con enero y lunes respectivamente.

5) Tamaño del cuadro. Todo cuadro deberá en lo posible hacerse en tamaño carta, y debe planearse de tal manera que no sea ni muy largo y angosto, ni muy ancho ni corto.

6) Presentación de notas y fuentes. Las notas preferiblemente se colocarán al pie del cuadro. Cuando se trate de la fuente de los datos, esta deberá presentarse citando al autor y el año de la publicación.

43

Page 44: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

3.2.3 Ventajas de la presentación tabular

1) Se sigue un orden o plan de acuerdo a la finalidad de la investigación.2) Facilita la observación de la relación existente entre los diversos datos

presentados en un mismo cuadro o entre cuadros diferentes.3) Favorece el descubrimiento de irregularidades en los datos por omisiones o

errores de indagación o clasificación.4) Facilita el resumen de los principales resultados obtenidos.

TEMA 2

3.3 Forma Gráfica

Una vez que la información estadística está expuesta en forma tabular, quien haga uso de esta necesita a menudo una visión rápida del comportamiento de las variables (ventas, enfermedades, tipología de las viviendas, edad y genero de los habitantes de una comunidad, altura de los brotes, notas finales de los alumnos del primer año, etc.). Por tanto, es preciso presentar dicha información mediante algún tipo de gráfico estadístico que facilita la visualización y descripción del comportamiento de las variables y sus particularidades más notables.

En base a los planteamientos anteriores, se definen los gráficos como representaciones visuales de la información procesada estadísticamente y que permiten generar apreciaciones que también son visuales y estadísticas.

La utilidad de los gráficos estriba en la ideal global que dan sobre la situación investigada. El volumen de información que aportan no es tan extenso como la que se entrega en una tabla de varias columnas a leerse por separado, pero los gráficos también le dan coherencia a grandes conjuntos de datos, presentándolos en un espacio más reducido y revelando diversos detalles comparables de los mismos a nivel general y específico. La excelencia del gráfico consiste en la comunicación de ideas complejas con claridad, eficiencia y precisión, evitando la distorsión en el mensaje de los datos.

Suministrar información de manera gráfica es un verdadero arte funcional que no sólo sirve para presentar los datos sino también para expresar ideas que se desean destacar. Por esta razón, quien presente un gráfico aporta su imaginación y temperamento para comunicar un mensaje a ser asimilado para quien vaya destinado. La forma de presentar cualquier idea a través de gráficos dependerá del nivel del destinatario, del lugar de exposición y de otros factores a analizar para escoger el diseño que facilite la mejor y más adecuada comunicación posible.

44

Page 45: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Los gráficos se clasifican en dos grupos.

Gráficos Cartesianos: Son los que se basan en un sistema de coordenada cartesianas conformados por el Eje X (horizontal) y el Eje Y (vertical). Tenemos los Histogramas (de Frecuencia y de Frecuencia relativa), los Gráficos de Línea o Diagramas Lineales, los Polígonos (de Frecuencia, Acumulativos u Ojivas, de Frecuencia Relativa, y de Frecuencia Relativa Acumulada u Ojivas Porcentuales), los Diagramas de Barra y los Diagramas a Doble Columna.

Gráficos Simbólicos: Son los que hacen uso de mapas geográficos, dibujos y figuras geométricas. Los más usados vienen siendo los Cartogramas, los Pictogramas, Pictógrafos o Diagramas Pictóricos, y los Diagramas o Gráficos Circulares (o Sectoriales o de Pastel).

Los elementos componentes de todo gráfico son:

1) Título Principal.2) Título Secundario o Subtítulo.3) Descripción del gráfico.4) Región de datos y símbolos.5) Región a ser ocupada por el gráfico.6) Descriptores o indicadores de señales y marcas.7) Notas.

Para ambos tipos de gráficos antes definidos son válidos los siguientes principios generales:

Los gráficos se han de explicar enteramente por sí mismos. El contenido de un gráfico deberá ser tan completo como sea posible. Deben evitarse elementos superfluos que lo recarguen exageradamente.

Los elementos del gráfico deben ser claramente distinguibles y visualmente prominentes, además de representar eficientemente las distribuciones de datos y de frecuencias.

No se debe tratar de abarcar demasiada información en un solo gráfico. Es mejor hacer varios gráficos en distintos espacios que comprimir toda la información en uno solo. Una regla práctica segura es evitar más de 3 gráficos en un mismo espacio, y en ese caso deben ser visualmente discernibles. Los elementos de estos gráficos deben ser consistentes con los de otros gráficos anteriormente usados.

Los gráficos tienen que dar una visión general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se deben reservar para las tablas.

En caso de agregarse notas, estas deben estar fuera del área del gráfico.

3.3.1 Gráficos Cartesianos

45

Page 46: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Para cada uno de los gráficos que describiremos a continuación, es preciso aplicar las siguientes reglas:

En el eje donde se ubiquen las frecuencias, el cero siempre debe colocarse explícitamente. Cuando las variables se inician con valores muy altos, el eje donde se coloquen estos se puede comenzar el mismo valor por donde inicia la variable o por un valor cercano. Si en cualquiera de los ejes se hace necesario interrumpir la escala de los números, esto debe hacerse en forma clara con una línea en zigzag.

La curva debe trazarse más gruesa que las coordenadas para que resalte. Los ejes, títulos, letreros y notas deben ser claros, y colocarse horizontal o

verticalmente de acuerdo al eje, y de ser necesario se dibujan líneas de fondo para facilitar la lectura de los valores.

Las unidades de medición de las variables deben destacarse claramente, y los números que indican valores de la misma característica se han de dar con el mismo número de decimales.

La longitud de los ejes y la equivalencia entre las unidades de medición deben seleccionarse de modo que la gráfica resulte balanceada a lo largo y ancho.

Si es necesario mencionar puntos particulares de la curva, estos deben indicarse con notas al pie, y en general debe evitarse el recargamiento del gráfico.

Debe mencionarse la fuente de información.

Si estas reglas no se aplican adecuadamente, se incurre en un mal uso de los gráficos. Una de las maneras más fáciles de engañar al lector es hacer, en el eje donde se ubiquen las frecuencias, el rango muy pequeño en términos de las proporciones de las unidades de medición que se usan para estos ejes coordenados. Otra manera de crear percepciones gráficas equivocadas es empezar sin indicación previa y explícita en cualquier otro valor distinto de cero en el eje donde aparezcan las frecuencias.

1) Histograma: Es la reproducción gráfica de una Distribución de Frecuencias para Datos Agrupados en un sistema de coordenadas cartesianas, componiéndose aquel gráfico por una sucesión de rectángulos o barras, teniendo cada uno en el Eje X como base un intervalo de clase y en el Eje Y como altura la respectiva Frecuencia Absoluta (Histograma de Frecuencia o Histograma propiamente dicho) o la Frecuencia Relativa (Histograma de Frecuencia Relativa).

Todos los puntos de un intervalo de clase tienen una misma altura dada por la respectiva frecuencia en el Eje Y. Los intervalos de clase se dibujan consecutivamente de igual tamaño y sin separación (juntos), por lo que los rectángulos son adyacentes, y el área de cada uno es proporcional a la frecuencia a la cual está asociada.

46

Page 47: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

El Histograma proporciona una presentación visual fácil de interpretar de la Distribución de Frecuencias ya mencionada.

Ejemplo: El siguiente Histograma de Frecuencia proviene de la Distribución de Datos Agrupados del problema tratado en el problema de la Sección 2.7 del Unidad II.

Interpretación: Entre Bs. 1.885 y Bs. 2.252 están localizados los precios del grupo más numeroso de enlatados, siendo Bs. 2.068 el precio promedio de los límites de precios de ese grupo. Además, existe otro grupo importante de productos cuyos precios están ubicados entre Bs. 2.988 y Bs. 3.353.

2) Gráfico de Línea o Diagrama Lineal: Partiendo de una Distribución de Frecuencias para Datos Agrupados de una variable cuantitativa discreta, en un sistema de coordenadas cartesianas se ubican los datos en el Eje X y se colocan las Frecuencias Absolutas en el Eje Y. Luego se definen pares ordenados donde la abscisa (componente horizontal) es un dato y la ordenada (componente vertical) del par en cuestión es la respectiva frecuencia absoluta de ese dato discreto. Después de dibujarse los pares ordenados, con segmentos de línea recta estos se unen en forma consecutiva siguiendo las abscisas en orden creciente.

Ejemplo: Veamos este gráfico sobre la vacunación de niños.

47

Page 48: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

3) Polígono: Es una sucesión de diferentes segmentos consecutivos que comparten de a dos un mismo extremo común. En un sistema de coordenadas cartesianas, nos interesan los polígonos abiertos, es decir, aquellos en los que la secuencia de sus segmentos no encierra área alguna por sí misma a menos que la pueda encerrar con el Eje X.

3.1)Polígono de Frecuencia: Es semejante a un histograma y a un gráfico de líneas, pues cada par ordenado que conecta a dos segmentos lineales tiene como abscisa a una marca de clase de un intervalo de clase sobre el cual están los segmentos referidos. La escala en el Eje X corresponde a las marcas de clase y la escala en el Eje Y corresponde a la Frecuencia Absoluta. Generalmente, el par ubicado sobre el primer intervalo de clase se une con un segmento al límite inferior Li1 en el Eje X, y lo mismo se hace entre el par que se encuentra sobre el último intervalo de clase y su límite superior Lik en dicho eje. Así obtenemos un área cerrada por el polígono y el eje nombrado. Por otra parte, el Polígono de Frecuencia se puede dibujar en el mismo sistema de coordenadas donde aparece el correspondiente Histograma de Frecuencia, teniéndose dos gráficos a la vez.

3.2)Polígono de Frecuencia Absoluta Acumulada o Polígono Acumulativo: Es semejante a los anteriores, pero en el Eje Y usaremos los valores de la Frecuencia Absoluta Acumulada. La curva obtenida se denomina Ojiva. Es pertinente referirnos a la Ojiva hacia Arriba (u ojiva propiamente dicha) y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la Frecuencia Absoluta Acumulada hacia Arriba ( ) y hacia Abajo ( ), y ambas se pueden dibujar simultáneamente. La primera ojiva es creciente y la otra es decreciente.

3.3)Polígono de Frecuencia Relativa: Es semejante a los polígonos anteriores, pero en el Eje Y usaremos los valores de la Frecuencia Relativa.

Ejemplo: Consideremos el problema de la Sección 2.7.

48

Page 49: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

PORCENTAJE DE ENLATADOS POR PRECIOS PROMEDIOS

8,33

19,45

25

16,67

8,33

22,22

0

5

10

15

20

25

30

1150 – 1516 1517 – 1883 1884 – 2251 2252 – 2619 2620 – 2986 2987 – 3353

PRECIOS PROMEDIOS

PO

RC

EN

TA

JE D

E E

NLA

TO

DS

3.4)Polígono de Frecuencia Relativa Acumulada: Es semejante a los polígonos anteriores, pero en el Eje Y usaremos los valores de la Frecuencia Relativa Acumulada. Este gráfico también es conocido como Ojiva Porcentual.

Aquí es válido referirnos a la Ojiva Porcentual hacia Arriba y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la Frecuencia Relativa Acumulada hacia Arriba ( ) y hacia Abajo ( ), y ambas se pueden dibujar en un mismo sistema de coordenadas cartesianas. La primera ojiva es creciente y la otra es decreciente. Si ambas ojivas se grafican a la vez en un mismo sistema de coordenadas, estas se interceptan en un par ordenado tal que su abscisa se denomina Mediana, concepto que estudiaremos en el siguiente Unidad.

Ejemplo: De nuevo consideremos el problema de la Sección 2.7.

4) Gráfico de Barra: En uno de los ejes de un sistema de coordenadas cartesianas cada intervalo representa una categoría asumida por una variable cualitativa, un valor numérico de una variable discreta, o un intervalo de clase de una Distribución de Frecuencias para Datos

49

Page 50: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Agrupados de cualquier variable cuantitativa. En el otro eje se ubican las respectivas frecuencias asociadas a las categorías, los valores o los intervalos de clase. Luego se dibuja una serie de rectángulos o barras, teniendo cada una a un intervalo como uno de sus lados y a la frecuencia como la longitud del otro lado. Muchas veces estos se ubican separados a igual distancia para mejor efecto visual en caso de tenerse numerosas barras.

Los intervalos deben ser de igual tamaño. Las barras son horizontales si los intervalos están en el Eje Y, y verticales si están en el Eje X, siendo el Histograma de Frecuencia un caso particular al respecto. Las barras pueden ser simples cuando representan una sola variable, y compuestas cuando en cada intervalo hay tantas columnas como variables a considerar.

Ejemplo: Tomemos el diagrama de barras del problema de la Sección 2.7.

Interpretación: Se puede observar que la mayor concentración de precios de enlatados se encuentra entre Bs. 1.885 y Bs. 2.252, además que entre Bs. 2.988 y Bs. 3.355 se concentran un segundo grupo de precios de enlatados.

Tal como dijimos anteriormente, podemos representar una distribución de frecuencias asociada a una variable cualitativa dibujando cada cualidad como un intervalo.

Ejemplo: La siguiente gráfica es tomada de un estudio hecho a un grupo de 25 varones para determinar su grupo sanguíneo

50

Page 51: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Igualmente, cada intervalo del Gráfico de Barras puede representar cada uno de los valores asumidos por una variable discreta.

Ejemplo: Tomemos el siguiente gráfico de barras donde se expresan las calificaciones de un ejercicio evaluado en la escala de 1 a 10 puntos.

4) Gráfico a Doble Columna: Lo tenemos cuando a ambos lados de uno de los ejes se ubican columnas que parten de intervalos definidos en ese eje, dirigidas cada una en sentido inverso o contrario con respecto a la otra con la que comparte el mismo intervalo (arriba y abajo en dirección vertical, o izquierda y derecha en dirección horizontal), siguiéndose las mismas indicaciones dadas para los Diagramas de Barras. A cada intervalo parten dos barras en sentido contrario, compartiendo el mismo intervalo aunque ambas barras aparezcan dibujadas en forma separada.

En pocas palabras, un Diagrama a Doble Columna está formado por dos diagramas de barras que están asociados a un mismo eje.

Ejemplo: Tomamos una Pirámide Poblacional por años y sexo de una determinada región geográfica.

51

Page 52: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Del Gráfico a Doble Columna se puede hacer un Diagrama de Barras Compuestas para dos variables.

52

Page 53: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

TEMA 3

3.3.2 Diagramas Simbólicos

Tal como se puede deducir sobre los diagramas que veremos a continuación, y comparándolos con los anteriormente expuestos, estos últimos proporcionan más información y permiten una apreciación estadística más rigurosa. Sin embargo, el uso de Diagramas Simbólicos una manera fácil de transmitir una visión general de la información para el entendimiento del público cualquiera sea su nivel. Al respecto, la información numérica debe aparecer en el gráfico y guardar la correspondiente proporción con el dato numérico.

1) Cartograma: Es un mapa de una región geográfica a ser usado para presentar información estadística sobre características consideradas acerca de dicha región. Tiene la ventaja de exponer ciertos aspectos geográficos y relaciones espaciales que no se pueden revelar por cualquier otra forma de presentación. Este tipo de gráfico es propio de la ciencia de la Cartografía.

Las diferentes maneras de presentar un cartograma son las siguientes:

Cada punto o mancha colocada sobre el mapa representa un valor. El mapa se divide por sectores, y cada sector se identifica a través de un

color o sombreado. Sobre el mapa se superpone determinada figura que representa los

valores relacionados con el fenómeno a presentar.

Ejemplo: En el siguiente cartograma observamos la urbanización en el mundo atendiendo a la industrialización.

53

Page 54: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

2) Pictograma, Pictógrafo o Diagrama Pictórico: Es un gráfico consistente en un dibujo o símbolo que por su forma es alegórico, sugerente o representativo de la naturaleza del dato del fenómeno que se quiere representar.

La frecuencia absoluta de cada modalidad se representa por unidades y/o fracciones de un mismo pictograma, siendo este equivalente a una determinada cantidad de observaciones que se debe indicar con claridad en su encabezamiento. La repetición de un mismo pictograma debe hacerse de igual forma y proporción, puesto que un observador siempre muestra indecisión en la comparación de alturas, áreas y volúmenes si el pictograma se presenta de dos o más maneras diferentes. El inconveniente que se puede dar es cuando se busca de dibujar una fracción del pictograma, lo que requiere cierto cuidado.

Ejemplo: Consideremos las exportaciones de frutas que ha efectuado El Salvador desde 1.985 hasta 1.988, siendo medidas en colones (¢).

A veces no se usa la regla anterior, sino otra distinta: el tamaño del pictograma suele ser proporcional a la frecuencia que representa, por lo que se requiere asociar la frecuencia a reflejar con las medidas de la figura.

Ejemplo: Representamos el número de partidos ganados, perdidos o empatados de un equipo.

3) Diagrama o Gráfico Circular (o Diagrama Sectorial o de Pastel): Consiste en considerar el área completa del círculo como equivalente al 100% o frecuencia relativa total de la población o muestra a representar,

54

Page 55: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

determinado luego el área cubierta por el sector circular correspondiente a cada frecuencia relativa parcial H de esa misma población o muestra, siendo que la proporción entre 100% y H es igual a la existente entre los 360º del círculo y el ángulo g limitado por los radios del sector circular mencionado. Por tanto, a g lo podemos hallar, y después dibujar en el círculo, partiendo de la siguiente interpolación proporcional o regla de tres:

100% 360º

H g

Aplicamos este procedimiento tantas veces como cantidades de frecuencias relativas existan en una Distribución de Frecuencias consideradas para una variable cualitativa o para Datos Agrupados de una variable cuantitativa.

Ejemplo: Usando las frecuencias relativas calculadas para el problema de la Sección 2.7, obtenemos el siguiente diagrama circular.

Trace una circunferencia, y mediante el uso de un transportador, y construye una distribución de frecuencia relativa con los siguientes datos: 15, 20, 35, 10, 8, 12. Resuelve e interprete.

3.4 ACTIVIDADES

Individual

Lea con cuidado los contenidos presentados en este Unidad y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.

Grupal Cooperativa

55

Page 56: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

A los problemas resueltos propuestos en el unidad anterior así como a los datos tomados en campo, constrúyale los histogramas de frecuencia y los polígonos aquí estudiados.

Usa los gráficos de torta para presentar la distribución de frecuencia relativa de los ejercicios anteriores.

Comunitaria

Con los datos recolectados en campo (durante las actividades de Proyecto I o II) y ya ordenados, represéntelos utilizando tantos cuadros como los respectivos gráficos.

56

Page 57: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

UNIDAD IV: MEDIDAS DE POSICIÓN, DE TENDENCIA CENTRAL Y DE DISPERSIÓN

OBJETIVO: Analizar e interpretar las características o propiedades de los datos numéricos (posición, tendencia central y variación) y sus mediciones descriptivas de resumen.

COMPETENCIAS A LOGRAR:

1. Comprender las propiedades de la posición y la tendencia central.2. Calcular diversas Medidas de Posición y de Tendencia Central para un

conjunto de datos simples o agrupados.3. Interpretar las diferencias entre las diversas Medidas de Tendencia Central

para un conjunto de datos simples o agrupados.4. Entender la importancia de analizar la dispersión de un grupo de datos.5. Calcular diversas Medidas de Dispersión para un conjunto de datos simples

o agrupados.6. Interpretar las diferencias entre las diversas Medidas de Dispersión para un

conjunto de datos agrupados o no agrupados.7. Usar paquetes computacionales (Excel, SPSS, entre otros) para calcular las

medidas de tendencia central y de dispersión.

CONTENIDO:

TEMA 1

4.1 Necesidad del uso de medidas numéricas descriptivas

Los métodos gráficos son útiles para obtener una descripción general rápida de las observaciones y datos recolectados para su presentación. Hay limitaciones en el uso de esos métodos pues en caso de no poderse presentar los gráficos, harán falta otras técnicas descriptivas para transmitir una idea de la información contenida en aquellos, y por otro lado es difícil usarlos para hacer inferencia estadística pues en particular el histograma de una muestra no necesariamente va a ser idéntico al de la población, y si lo fuesen sería necesario medir el grado de similitud o diferencia entre ambos histogramas.

Estas dificultades descriptivas de los métodos gráficos pueden superarse mediante medidas descriptivas numéricas. Por eso se desea usar los datos de una muestra para calcular un grupo de esas medidas (estadísticos) con el fin de transmitir una adecuada imagen mental de la distribución de frecuencias en cuanto a su ubicación, concentración y variabilidad, y que sean útiles para hacer inferencia estadística respecto a la población. Los respectivos estadísticos a estudiarse aquí son las Medidas de Posición, de Tendencia Central y de Dispersión.

57

Page 58: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Obviamente, en base a los planteamientos expuestos al comienzo, aquí los estadísticos están solamente referidos para cualquier variable cuantitativa X. Además, para una distribución de datos simples los procedimientos para el cálculo de estas medidas no son los mismos a emplearse en el caso de una distribución de datos agrupados.

Todas las medidas a estudiarse estarán referidas al estudio de muestras, pero se pueden generalizar para poblaciones.

4.2 Medidas de Posición

Consideraremos un tipo especial de medida que determina cualquier posición intermedia o lejana dentro de una distribución de datos. Se denominan Cuantiles o Fractiles, y se utilizan sobre todo para resumir o describir las propiedades de conjuntos grandes de observaciones ordenadas de menor a mayor. Tenemos los Centiles o Percentiles, Deciles y Cuartiles.

Los Centiles o Percentiles son 99 valores que dividen al conjunto de datos en 100 partes cada una con igual cantidad de observaciones ordenadas ascendentemente, y se denotan en forma respectiva como P1, P2,…, P99. Por debajo de un valor Pi se encuentra el i % de las observaciones, y el (100 – i) % son mayores que Pi, i = 1,…, 99.

Los Deciles son 9 valores que dividen al conjunto de datos en 10 partes cada una con igual cantidad de observaciones ordenadas ascendentemente, y se denotan en forma respectiva como D1, D2,…, D9. Por debajo de Di se encuentra el (i 10) % de las observaciones, y el (100 – i 10) % son mayores que Di, i = 1,…, 9. Por ejemplo, el 30% de las observaciones son menores que D3 y el 70% de estos son mayores que D30.

Los Cuartiles son 3 valores que dividen al conjunto de datos en 4 partes cada una con igual cantidad de observaciones ordenadas ascendentemente, y se denotan en forma respectiva como Q1, Q2 y Q3. Por debajo de Qi se encuentra el (i 25) % de las observaciones, y el (100 – i 25) % de estas son mayores que Qi, i = 1, 2 ,3.

El Primer Cuartil Q1 o Cuartil Inferior es un valor tal que el 25% o la cuarta parte de las observaciones son menores que ese valor, o lo que es lo mismo, el 75% o las tres cuartas partes de las observaciones son mayores que ese valor.

El Segundo Cuartil Q2 o Cuartil Medio es un valor tal que el 50% o las dos cuartas partes) de las observaciones son menores que ese valor, o lo que es lo mismo, el 50% o las dos cuartas partes de las observaciones son mayores que ese valor.

58

Page 59: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

El Tercer Cuartil Q3 o Cuartil Superior es un valor tal que el 75% o las tres cuartas partes de las observaciones son menores que ese valor, o lo que es lo mismo, el 25% o la cuarta parte de las observaciones son mayores que ese valor.

1) Cuartiles para una Distribución de Datos Simples

De una distribución de n datos simples, obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie y un cuartil Qi dado, sea xj la observación que le es más cercana de entre las que son menores a Qi, i = 1, 2, 3. La posición j de esa observación varía de acuerdo al tipo de cuartil, habiendo aproximadamente j observaciones con valores menores a Qi de acuerdo a esta expresión:

i-ésimo Cuartil Qi: , i = 1, 2, 3

El valor resultante de esa formulación para j no necesariamente va a dar un valor entero, por lo que se hace necesario el uso de ciertas reglas al respecto.

Regla 1: Si el valor obtenido para j es un número entero, se elige como cuartil al valor de la observación específica en esa posición. Entonces Qi = xj.

Regla 2: Si el valor obtenido para j se encuentra en el justo medio de dos números enteros (es decir, si ese valor es un número fraccionario cuya parte decimal sólo consta del dígito 5), se redondea a j por defecto y el cuartil es el promedio de los valores correspondientes a las observaciones

xj y xj+1. Entonces .

Regla 3: Si el valor obtenido para j no es un número entero o el valor medio entre dos números enteros (es decir, si ese valor es un número fraccionario cuya parte decimal no consta solamente con el dígito 5), se redondea a j por defecto o exceso al número entero más cercano, y el cuartel asume el valor numérico de la observación que ocupa esa posición. Entonces Qi = xj.

Vemos que el valor de un cuartil no necesariamente va a coincidir con el de alguna observación, lo cual depende de la cantidad N de observaciones ordenadas.

Ejemplo: Suponga un conjunto de observaciones que corresponden a las tasas anuales de interés, establecidas por el BCV, para el rendimiento que reciben los trabajadores por el fideicomiso de sus prestaciones sociales.

59

Page 60: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17Tasa de

Interés (%) 10 20,6 28,6 28,6 29,4 29,5 29,9 30 30,5 30,5 32,1 32,2 32,4 33 35,2 37.1 38

Vamos a ejecutar los siguientes pasos para hallar Q1 y Q3.

1) Se ordenan las observaciones de menor a mayor, definiendo la cantidad de estas, siendo N = 17 en este caso.

Orden x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17

Tasa de Interés (%) 10 20,6 28,6 28,6 29,4 29,5 29,9 30 30,5 30,5 32,1 32,2 32,4 33 35,2 37.1 38

b) Se establece el valor de la posición j que está asociada al Primer Cuartil Q1 (i = 1).

= 4,5

Por la Regla 2 tenemos j = 4, y en consecuencia:

= 29

Interpretación: El 25% de las personas reciben una tasa de interés menor de 29% por el fideicomiso de sus prestaciones sociales, o el 75% de las personas reciben una tasa de interés mayor a 29%.

c) Se establece el valor de la posición j que está asociada al Tercer Cuartil Q3 (i = 3).

= 13,5

Por la Regla 2 tenemos j = 13, y en consecuencia:

= 32,7

Interpretación: El 75% de las personas reciben una tasa de interés menor de 32,7% por el fideicomiso de sus prestaciones sociales, o lo que es igual, el 25% de las personas reciben una tasa de interés mayor a 32,7%.

60

Page 61: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

2) Cuartiles para una Distribución de Datos Agrupados

Dada una distribución de frecuencias para datos agrupados, a través del correspondiente polígono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar gráficamente cualquiera de los cuartiles. El valor porcentual del cuartil (25%, 50% o 75%) se ubica en el Eje Y, y desde allí se traza una línea paralela al Eje X hasta tocar la ojiva en un punto de esta, y desde allí trazamos una línea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser el cuartil buscado (Q1, Q2 o Q3, respectivamente).

En el próximo ejemplo se realizará el cálculo solamente para el caso de Q1, y los demás serán resueltos por el estudiante de manera análoga al procedimiento que aplicaremos aquí.

Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueñas se distribuyeron en 6 grupos.

Tabla 1

Edades (años) Nº de asistentes

20-29 1630-39 2540-49 5150-59 8060-69 2070-79 8

Para hallar el Primer Cuartil Q1 ejecutaremos los siguientes pasos.

a) Partiendo de la Tabla 1, construimos una distribución de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones.

61

Page 62: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Tabla 2I II III

Nº de clases

Edades(años)

Número de asistentes

Número de asistentes

acumulados1 20-29 16 162 30-39 25 413 40-49 51 924 50-59 80 1725 60-69 20 1926 70-79 8 200

Totales N = 200

b) Determinamos la cantidad aproximada de observaciones menores

a Q1, y si su valor no resulta entero, se redondea con las mismas reglas aplicadas a la posición j es el cálculo de los cuarteles para observaciones ordenadas.

= 50

En la Tabla 2, a medida que avanzamos en la Columna III (frecuencias acumuladas) siguiendo el número de clase, vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el número j de clase tal

que , por lo que el Primer Cuartil Q1 está ubicado en

el intervalo de clase Lij – Lsj de la Columna I, siendo menores a Q1

las observaciones de este y de los otros intervalos anteriores, estando contabilizadas tales observaciones en la Columna II (frecuencias absolutas). El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase.

Las condiciones anteriores se cumplen para la clase j = 3 pues Faj-1 = Fa2 = 41, Faj = Fa3 = 92, y 41 ≤ 50 ≤ 92. Entonces Q1 se encuentra en el intervalo Li3 – Ls3 = 40 – 49.

c) Recordemos que Q1 siempre va a estar dentro del intervalo Lij – Lsj.

Si Faj-1 = o Faj = , entonces Q1 = Lij o Q1 = Lsj,

respectivamente. Si , entonces parte de las

observaciones menores a Q1 se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij – Lsj, por lo

62

Page 63: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

que en este último hay observaciones mayores que Lij y

menores que Q1, y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij – Lsj.

Por otra parte, en el intervalo Lij – Lsj de tamaño Ic = Lsj – Lij

tenemos que cada una de las Fj observaciones contenidas en ese

intervalo ocupa allí un espacio de tamaño unidades de longitud.

Luego, la distancia que separa a Lij y Q1 es el espacio que ocupan

las observaciones ubicadas entre ambos valores, o sea

. Por lo tanto, la formulación para Q1 es:

En general, existen aproximadamente observaciones

menores que el cuartil Qi, cuya expresión correspondiente es:

, i = 1, 2, 3

Para nuestro ejemplo, vemos que pues se

cumple que 41 < 50 < 92. Entonces hay = 50 – 41 = 9

observaciones entre Li3 y Q1, las cuales se encuentran en el intervalo Li3 – Ls3 = 40 – 49 de tamaño Ic = Ls3 – Li3 = 49 – 40 = 9. El espacio ocupado en ese intervalo por cada una de las F3 = 51

observaciones es = 0,17. Entonces la distancia entre Li3 y

Q1 es = 1,53, y así:

63

Page 64: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

= 40 + 1,53 = 41,53 ≈ 42

Interpretación: El 25% de las personas asistentes al ambulatorio de Barrio Adentro tienen una edad promedio menor de 42 años aproximadamente.

¿Cuándo debe usarse los Cuantiles o Fractiles en cualquiera de los casos anteriores?

Estas medidas brindan información acerca de la concentración y variación de una serie de observaciones y datos, pero se necesitan varias mediciones de esa especie para tener una descripción adecuada de la serie. En función de tener la menor cantidad de mediciones posibles, generalmente se usan los Cuartiles para tal propósito descriptivo.

TEMA 2

4.3 Medidas de Tendencia Central

Al estudiarse la información estadística mediante los gráficos cartesianos, en el comportamiento de los datos con respecto a sus respectivas frecuencias se observan valores más comunes que otros, y en general se aprecia una tendencia de agrupación en el vecindario de los valores más repetidos, habiendo así mayor densidad de frecuencia en la parte central de los gráficos.

El problema es hallar el valor más representativo de una serie de valores, es decir, si tenemos una cantidad que varía en el espacio o en el tiempo, se necesita obtener su grado o nivel generalmente predominante. Ese valor lleva implícita la idea de variación, pero esta se desprecia pues sólo interesa obtener el que más se impone, representándose así una gran cantidad de valores unitarios por uno sólo.

Las Medidas de Tendencia Central son los valores más representativos de una distribución de datos y frecuencias, ubicándoseles en su zona central. Cada medida es un valor típico descriptivo en la que un conjunto de datos muestra una tendencia bien determinada a agruparse o aglomerarse alrededor de cierto punto central.

Estas medidas son la Media Aritmética (y en particular la Media Ponderada), la Mediana, la Moda, el Eje Medio y el Rango Medio. A veces cada una de estas medidas es denominada promedio, nombre que en general se reserva para la Media Aritmética.

1) MEDIA ARITMÉTICA (MEDIA O PROMEDIO)

64

Page 65: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

1.1) Media para una Distribución de Datos Simples

Partiendo de una serie de observaciones asociada a esa distribución, definimos la Media como la suma de todas las observaciones dividida entre la cantidad N de estas. En virtud de las propiedades de la suma, el orden de las observaciones no altera el resultado para la Media.

La formulación de la Media es:

La Media es un valor que equilibra los valores de las observaciones que le son mayores y menores, y es sensible a mediciones extremas que no estén equilibradas a su alrededor.

Ejemplo: El gerente de un local de Mercal desea estudiar la concurrencia a la tienda, y encuentra que 295, 1.002, 941, 768, y 1.283 personas entraron a la tienda durante los pasados cinco días.

El total de personas que entró al Mercal durante los cinco días anteriores es de 295 + 1.002 + 941 + 768 + 1.283 = 4.289. La Media o promedio de personas que diariamente entraron en la tienda es de 4.289 ÷ 5 = 857,8, que es aproximadamente 858 personas.

Identificaremos los valores a emplear en la formulación.

x1 = 295 personas x4 = 1.002 personasx2 = 768 personas x5 = 1.283 personas

x3 = 941personas N = 5 observaciones o datos

Luego:

= 857,8 ≈ 858

Interpretación: Esto significa que en promedio entraron aproximadamente 858 personas diariamente en esos cinco días.

65

Page 66: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Diga si en el ejemplo de Mercal la media está afectada por los valores extremos.

Media Ponderada: Es la suma de los productos obtenidos de cada valor ponderado por su respectiva ponderación de acuerdo al fenómeno estudiado, dividido entre la suma de todas las ponderaciones.

Las ponderaciones pueden ser las k frecuencias relativas asociadas a las frecuencias absolutas de las clases de una variable cualitativa. La formulación es:

pues = 100% = 1

Ejemplo: En una clase de un colegio público hay 20 alumnos de primer grado, 18 de segundo y 12 de tercero. Si los estudiantes de primero representan el 40%, los de segundo el 36% y los de tercero el 24% del total existente, ¿cuántos estudiantes hay en promedio en los tres salones de clase?

Cursos Alumnos PorcentajesPrimer Grado 20 40%=0,40Segundo Grado 18 36%=0,36Tercer Grado 12 24%=0,24

Total 50 100%=1,00

Para k = 3 categorías, identificamos los valores señalados.

F1 = 20 alumnos, p1 = 40% = 0,40F2 = 18 alumnos, p2 = 36% = 0,36F3 = 12 alumnos, p3 = 24% = 0,24

La Media Ponderada es:

= 17,36 ≈ 17

Interpretación: Aproximadamente un promedio de 17 alumnos estudian en cada uno de los tres primeros grados.

66

Page 67: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

En una distribución de frecuencias para n datos simples obtenidos de N observaciones asociadas a una variable cuantitativa, las ponderaciones vienen siendo sus respectivas frecuencias absolutas. La formulación es:

pues

La Media Aritmética de una serie de N observaciones es la misma Media Ponderada de la distribución de frecuencias para n datos simples obtenidos de la serie mencionada. Esta última es ventajosa utilizarla cuando abundan numerosas observaciones reflejadas en datos con frecuencias elevadas.

Ejemplo: Las edades de los integrantes de una sección de 20 estudiantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta. Estos son las N = 20 observaciones ordenadas crecientemente por fila.

x1 = 18 x2 = 18 x3 = 21 x4 = 23 x5 = 23x6 = 23 x7 = 26 x8 = 26 x9 = 26 x10 = 26x11 = 30 x12 = 34 x13 = 34 x14 = 37 x15 = 37x16 = 37 x17 = 37 x18 = 37 x19 = 37 x20 = 40

La Media Aritmética es:

= 29,5 ≈ 30

De esta serie de observaciones obtenemos la siguiente distribución de frecuencias absolutas para n = 8 datos simples.

X1 X2 X3 X4 X5 X6 X7 X8

X 18 21 23 26 30 34 37 40f 2 1 3 4 1 2 6 1

f1 f2 f3 f4 f5 f6 f7 f8

La Media Ponderada es:

67

Page 68: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

= 29,5 ≈ 30

Interpretación: La edad promedio de cada estudiante de la sección es de aproximadamente 30 años.

Nota: En el ejemplo de la concurrencia de personas a Mercal, si aplicamos la fórmula de la Media Ponderada resulta que fj = 1, j = 1,…, 5.

1.2) Media para datos agrupados en k clases

Se calcula de manera similar a la Media Ponderada, estando las N observaciones distribuidas en k intervalos de clase, para los cuales las correspondientes marcas de clase son los valores a ser ponderados con las respectivas frecuencias absolutas. La formulación es:

pues

Ejemplo: A partir de la Tabla 1 (las edades de los asistentes a un centro ambulatorio de Barrio Adentro) construimos la Tabla 3 de la siguiente manera:

a) Calculamos la edad promedio (marca de clase) de los límites de edades de cada grupo (Columna II).

b) Calculamos el número de asistentes acumulados (frecuencias acumuladas) en cada clase de edades (Columna IV).

c) Calculamos el producto de la edad promedio de cada clase (Columna II) por el número de asistentes de dichas clases (Columna III), se suman esos valores obtenidos para cada clase (Columna V), y tal resultado se divide entre el total de asistentes, obteniéndose el resultado de la Media.

Tabla 3I II III IV V

Nº de Edades Edad Número Número Edad

68

Page 69: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

clases (años) Promedio de asistentes

de asistentes

acumulados

Promedio Número

de asistentes1 20-29 24,5 16 16 3922 30-39 34,5 25 41 862,53 40-49 44,5 51 92 2.269,54 50-59 54,5 80 172 4.3605 60-69 64,5 20 192 1.2906 70-79 74,5 8 200 596

Totales N = 200 9.770

La Media es:

= 48,85 ≈ 49

Interpretación: Cada uno de los 200 pacientes que asistieron al ambulatorio de Barrio Adentro tiene una edad promedio aproximada de 49 años.

Nota: No se puede calcular la Media Aritmética donde existen clases abiertas (ejemplo: 70 años y más). Lo recomendable es usar la Mediana. En cualquier caso, la Media Aritmética para datos agrupados puede asumir un valor igual o muy cercano al de la Media Aritmética para la serie de observaciones de donde se extrajeron los datos agrupados. Por otra parte, se redondean esos valores para tal medida de tendencia central según la variable empleada, como en los anteriores ejemplos sobre edades.

¿Cuándo debe usarse la Media Aritmética en cualquiera de los casos anteriores?

Debido a que su cálculo se basa en todas las observaciones, cualquier valor extremo afecta mucho la media aritmética. Se debe usar cuando no este afectada por los valores extremos.

2) MEDIANA

69

Page 70: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Es un valor MD que divide en dos grupos a una distribución de datos, de tal manera que uno de los grupos tiene 50% de las observaciones menores a MD y el otro grupo posee 50% de las que son mayores a dicho valor. Es decir, ambos grupos tienen igual cantidad de observaciones. Esta Medida de Tendencia Central es también una Medida de Posición pues por su definición coincide con el Segundo Cuartil Q2, o sea, MD = Q2.

2.1)Mediana para una Distribución de Datos Simples

De una distribución de n datos simples obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie, sea xj la observación más cercana a la Mediana MD de entre las que son menores a dicho valor. Dependiendo de N, el valor de MD puede o no puede coincidir con el de xj, existiendo reglas que permiten clarificar este hecho.

Regla 1: Si la cantidad N de observaciones es impar, entonces la Mediana está representada por el valor numérico de la observación

correspondiente a la posición . Entonces MD = xj.

Ejemplo: En un hospital público de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 120. ¿Cuál es la Mediana de los tiempos?

Procederemos a ejecutar los siguientes pasos:

a. Se ordenan e identifican las observaciones de menor a mayor.

x1 x2 x3 x4 x5 x6 x7 x8 x9

50 50 50 52 57 78 120 135 212

b. Se establece la posición de la Mediana de acuerdo a la cantidad de observaciones. En nuestro caso, N = 9, y por la Regla 1 tenemos que

= 5

MD = xj = x5 = 57

Interpretación: El 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio menor a 57 minutos, o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio mayor a 57 minutos.

70

Page 71: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Regla 2: Si la cantidad N de observaciones es par, entonces consideramos que la Mediana está entre las dos observaciones xj y xj+1 que están en las posiciones centrales las observaciones ordenadas, siendo

. La Mediana es la semisuma de los valores numéricos de estas dos

observaciones. Entonces .

Ejemplo: En un hospital público de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 60, 120. ¿Cuál es la Mediana de los tiempos? Interprete.

Procederemos a ejecutar los siguientes pasos:

a) Se ordenan e identifican las observaciones de menor a mayor.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

50 50 50 52 57 60 78 120 135 212

b) Se establece la posición de la Mediana de acuerdo a la cantidad de observaciones. En nuestro caso, N = 10, y por la Regla 2 tenemos que

= 5

= 58,5

Interpretación: Esto significa que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo menor a 58,5 minutos en promedio, o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo mayor a 58,5 minutos en promedio.

2.2)Mediana para una Distribución de Datos Agrupados

Dada una distribución de frecuencias para datos agrupados en k clases, a través del correspondiente polígono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar gráficamente la Mediana, cuyo valor porcentual (que es 50%) se ubica en el Eje Y, desde allí se traza una línea paralela al Eje X hasta tocar la ojiva en un punto de esta, y luego partiendo de ese punto trazamos una línea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser la Mediana. Ese valor viene siendo la abscisa del punto de intersección de la ojiva porcentual hacia

71

Page 72: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

arriba con la ojiva porcentual hacia abajo, asociadas respectivamente a las frecuencias relativas acumuladas hacia arriba ( ) y hacia abajo ( ).

La manera como calcularemos a MD es similar al procedimiento efectuado para el Primer Cuartil Q1, pues ya dijimos que la Mediana es igual al Segundo Cuartil Q2.

Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueñas se distribuyeron en 6 grupos.

Tabla 1

Edades (años) Nº de asistentes

20-29 1630-39 2540-49 5150-59 8060-69 2070-79 8

Para hallar la Mediana ejecutaremos los siguientes pasos.

a) Partiendo de la Tabla 1, construimos una distribución de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones.

Tabla 2I II III

Nº de clases

Edades(años)

Número de asistentes

Número de asistentes

acumulados1 20-29 16 162 30-39 25 413 40-49 51 924 50-59 80 1725 60-69 20 1926 70-79 8 200

Totales N = 200

b) Determinamos la cantidad aproximada o de observaciones

menores a MD si N es par o impar, respectivamente.

72

Page 73: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

= 100

En la Tabla 2, a medida que avanzamos en la Columna III siguiendo el número de clase, vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta

hallar el número j de clase tal que , por lo que la

Mediana MD está ubicada en el intervalo de clase Lij – Lsj de la Columna I, siendo menores a MD las observaciones de este y de los otros intervalos anteriores, estando contabilizadas tales observaciones en la Columna II. El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase.

Las condiciones anteriores se cumplen para la clase j = 4 pues Faj-1 = Fa3 = 92, Faj = Fa4 = 172, y 92 ≤100 ≤ 172. Entonces MD se encuentra en el intervalo Li4 – Ls4 = 40 – 49.

c) Recordemos que MD siempre va a estar dentro del intervalo Lij – Lsj.

Si Faj-1 = o Faj = , entonces MD = Lij o MD = Lsj,

respectivamente. Si , como parte de las

observaciones menores a MD se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij – Lsj, por lo

que en este último hay observaciones mayores que Lij y

menores que MD, y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij – Lsj.

Por otra parte, en el intervalo Lij – Lsj de tamaño Ic = Lsj – Lij

tenemos que cada una de las Fj observaciones contenidas en ese

intervalo ocupa allí un espacio de tamaño unidades de longitud.

Luego, la distancia que separa a Lij y MD es el espacio que ocupan

las observaciones ubicadas entre ambos valores, o sea

MD – Lij = . Por lo tanto, la formulación para MD es:

Md =

73

Page 74: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Para nuestro ejemplo, vemos que pues se

cumple que 92 <100 < 172. Entonces hay = 100 – 92 = 8

observaciones entre Li4 y MD, las cuales se encuentran en el intervalo Li4 – Ls4 = 50 – 59 de tamaño Ic = Ls4 – Li4 = 59 – 50 = 9. El espacio ocupado en ese intervalo por cada una de las F4 = 80

observaciones es = 0,11. Entonces la distancia entre Li4 y

MD es = 0,9, y así:

= 50 + 0,9 = 50,9 ≈ 51

Interpretación de la Mediana: El 50% de las personas que asistieron al ambulatorio de Barrio Adentro tienen una edad promedio aproximadamente menor a 51 años.

¿Cuándo debe usarse la Mediana en cualquiera de los casos anteriores?

Siempre que una observación extrema esté presente, es adecuado usar la mediana en lugar de la media para describir el conjunto de observaciones o de datos agrupados. Se requiere tener ordenadas las observaciones al tratar de hallar la Mediana, la cual no se ve influenciada por los valores extremos existentes en aquellas, y se puede calcular en distribuciones abiertas, donde no se puede encontrar la Media, la cual no depende del orden de las observaciones.

3) MODA

3.1)Moda para una Distribución de Datos Simples

De una distribución de n datos simples, obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie, la Moda Mo es el valor de aquella observación que aparece con mayor frecuencia (el que más se repite o el más típico). Si son varios valores distintos los que se repiten a la vez con una misma frecuencia mayor que las de otras observaciones, entonces la serie aquí dada es pluri-modal.

74

Page 75: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Ejemplo: En un hospital público de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 60, 120. Para hallar la Moda, procederemos a ejecutar los siguientes pasos:

a) Se ordenan e identifican las observaciones de menor a mayor.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

50 50 50 52 57 60 78 120 135 212

b) Se observa la observación que más se repite y ese valor es la Moda. Para nuestro ejemplo, la Moda es Mo = 50 pues ese valor es repetido tres veces por las observaciones x1, x2 y x3.

Interpretación: El mayor tiempo de espera de los pacientes es un promedio de aproximadamente 50 minutos.

Si en la serie de N observaciones estas son numerosas y se repiten muchos valores, construimos la respectiva distribución de frecuencias absolutas para n datos simples, y la moda será el valor del dato que tenga la mayor frecuencia.

Ejemplo: Las edades de los 20 integrantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta.

34 40 30 37 26 18 37 18 26 2623 37 26 23 34 37 21 37 37 23

Estos son las N = 20 observaciones ordenadas crecientemente por fila.

x1 = 18 x2 = 18 x3 = 21 x4 = 23 x5 = 23x6 = 23 x7 = 26 x8 = 26 x9 = 26 x10 = 26x11 = 30 x12 = 34 x13 = 34 x14 = 37 x15 = 37x16 = 37 x17 = 37 x18 = 37 x19 = 37 x20 = 40

De esta serie de observaciones obtenemos la siguiente distribución de frecuencias absolutas para n = 8 datos simples.

X1 X2 X3 X4 X5 X6 X7 X8

X 18 21 23 26 30 34 37 40f 2 1 3 4 1 2 6 1

f1 f2 f3 f4 f5 f6 f7 f8

Vemos que Mo = X7 = 37 pues ese es el dato cuya frecuencia f7 = 6 es la mayor de todas.

75

Page 76: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Interpretación: El grupo de 6 estudiantes de 37 años cada uno es por edad el más numeroso de la sección.

3.2)Moda para una Distribución de Datos Agrupados

La Moda Mo es el valor alrededor del cual los datos tienden a concentrarse más densamente. Está localizada en el intervalo de clase de mayor frecuencia, y se le denomina Intervalo Modal. Aunque ahora veremos una formulación para la Moda, en algunos textos se le toma como la marca de clase con mayor ordenada en un polígono de frecuencia (absoluta). Sin embargo, para la Moda no siempre se tiene un valor exacto sino aproximado, el cual será más exacto a medida que disminuya el tamaño del intervalo de clase y aumente la cantidad de observaciones O datos. Es posible que la distribución que los agrupe sea pluri-modal.

Ejemplo: Construimos la Tabla 4 de la Tabla 1 donde aparecen contabilizados los pacientes por edades atendidos en un Unidad de Barrio Adentro.

Tabla 4I II

Nº de clases

Edades(años)

Número de asistentes

1 20-29 162 30-39 253 40-49 514 50-59 805 60-69 206 70-79 8

Totales N = 200

Procederemos a ejecutar los siguientes pasos.

a) Primero hay que encontrar EL Intervalo Modal en el cual esta situada la Moda, siendo aquel que tiene la máxima frecuencia absoluta. En nuestro ejemplo representado por la Tabla 4, la Clase Modal es j = 4 pues la mayor frecuencia viene dada por Fj = F4 = 80 (Columna II), y el Intervalo Modal (Columna I) es Lij – Lsj = Li4 – Ls4 = 50 – 59.

b) A partir de la Columna II calculamos el valor d1 como la diferencia entre la frecuencia absoluta Fj del Intervalo Modal y la frecuencia absoluta Fj-1 que le antecede (o sea, d1 = Fj – Fj-1), y también determinamos el valor d2 que se obtiene como la diferencia entre la frecuencia absoluta del Intervalo Modal y la frecuencia absoluta Fj+1

76

Page 77: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

que le sucede (o sea, d2 = Fj – Fj+1). En particular, tenemos Fj-1 = F3

= 51, Fj+1 = F5 = 20, y por tanto d1 = 80 – 51= 31 y d2 = 80 – 20 = 60.

c) A Intervalo Modal Lij – Lsj le calculamos su longitud Ic = Lsj – Lij, y con el resto de los valores mencionados anteriormente hallamos la Moda Mo con la siguiente formulación:

Como Ic = Ls4 – Li4 = 59 – 50 = 9, resulta:

= 50 + 0,34 9 = 50 + 3,06 = 53,06≈ 53

Interpretación de la Moda: Gran parte de los asistentes al centro ambulatorio tienen una edad promedio de aproximadamente 53 años.

¿Cuándo debe usarse la Moda en cualquiera de los casos anteriores?

Cuando queremos conformarnos con tener una idea superficial de la concentración de la distribución, la Moda se usa sólo para fines descriptivos porque varía más entre distintas muestras que otras medidas de tendencia central. La ocurrencia de algún valor extremo no afecta a la Moda al igual que la Mediana.

4) EJE MEDIO

Es una medida de resumen que se usa para superar posibles problemas que introducen los valores extremos de las observaciones o datos. El Eje Medio EM se obtiene con la semisuma del Primer y Tercer Cuartil, procedimiento idéntico tanto para datos simples o agrupados. La formulación es:

Ejemplo: Calcularemos el Eje Medio para las tasas de interés del BCV estudiadas cuando se calcularon el Primer y Tercer Cuartil cuando tenemos una serie ordenada de observaciones. Como Q1 = 29% y Q3= 32,7%, entonces:

77

Page 78: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

= 30,85

Interpretación: Todas las personas reciben por el fideicomiso de sus prestaciones sociales una tasa promedio aproximada de 30,85%.

5) RANGO MEDIO

El Rango Medio RM se obtiene con la semisuma del valor más pequeño y el valor más grande de un conjunto de N observaciones ordenadas ascendentemente, o como la semisuma del límite inferior y el límite superior del primer y último intervalo de clase, respectivamente, cuando tenemos datos agrupados en k clases. En el primer caso, al comparar la serie de N observaciones con los n datos simples, tenemos que X1 = x1 y Xn = xN. Las correspondientes formulaciones son:

Para N observaciones ordenadas o n datos simples:

Para datos agrupados en k clases:

Ejemplo: Los números de visitantes durante los últimos 10 años a la cueva del Guácharo fueron los que se presentan a continuación. Determine el Rango Medio del número de visitantes:

690, 610, 540, 690, 560,630, 690, 670, 690, 670.

a) Se ordenan e identifican las observaciones de menor a mayor.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

540 560 610 630 670 670 690 690 690 690

b) Se busca el menor y el mayor valor del conjunto observaciones. Para las N = 10 observaciones ya ordenadas, tenemos que x1 = 540 y xN = x10 = 690.

c) Se obtiene el Rango Medio.

= 615

¿Cuándo debe usarse el Rango Medio en cualquiera de los casos anteriores?

78

Page 79: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Cuando se procesan datos donde no se presente un valor extremo, lo que hace que se utilice poco este promedio

4.4 ACTIVIDADES (PARA OBSERVACIONES O DATOS SIMPLES)

Individual

Lea con cuidado los contenidos presentados en relación a medidas de tendencia central para observaciones o datos no agrupados, y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.

Grupal Cooperativo

Del análisis de las evolución de enfermedades endémicas de una región del país se encontró que los casos de dengue hemorrágico en los últimos quince años varió: 1.650, 1.475, 1.510, 1.670, 1.540, 1.495, 1.590, 1.629, 1.510, 1.930, 2.300, 1.890, 2.345, 3.500, 1.250

Calcule la Mediana, el Rango Medio y El Eje Medio. Interprete cada una de las medidas.

El siguiente cuadro muestra a las personas en pobreza extrema por entidad federal correspondientes al primer semestre del año 2.004.

Entidades Federales

Personas en pobreza extrema

Zulia 905.332Carabobo 504.884Miranda 479.470Lara 641.034Aragua 350.651Bolívar 423.549Distrito Capital 252.287Sucre 440.327Táchira 315.286Portuguesa 299.222Anzoátegui 198.597Mérida 212.517Falcón 242.757Barinas 282.831Guárico 211.126Trujillo 196.845Monagas 199.024Apure 179.149Yaracuy 166.633Cojedes 82.257Vargas 75.408

79

Page 80: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Nueva Esparta 49.713Delta Amacuro 27.201Amazonas 40.293

Nota: Ordenada por el total de pobresFuente: INE / Unidad de Medición de Condiciones de Vida

1. ¿Cuál es la cantidad media de personas pobres por entidad federal: la Mediana, el Rango Medio, el Eje Medio?

2. Diga cuál de las promedios refleja la realidad de las personas pobres extremos.

3. De acuerdo a los valores descritos en el cuadro, ¿la Media de las personas en pobreza extrema está afectada por algunas entidades federales? ¿Es la mejor medida?

4. ¿Qué medidas tomaría para ir disminuyendo el número de personas en pobreza extrema que se encuentran en las grandes entidades federales?

Durante un diagnóstico realizado en una comunidad de los paramos del Estado Mérida, se aplicó una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos

77 18 63 84 38 54 52 59 54 56 36 2634 44 41 58 58 53 51 62 63 62 62 50

Calcule el Primer Cuartil e interprete.

Comunitaria

Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II), siga el siguiente tratamiento:1. Revíselos. Agrúpelos ordenados de mayor a menor.2. Calcule Media, Mediana, Rango Medio, Primer Cuartil, Tercer Cuartil y

Eje Medio. Interprete los resultados y agréguelo a su portafolio.

4.5 ACTIVIDADES (PARA DATOS AGRUPADOS)

Individual

Lea con cuidado los contenidos presentados en relación a las medidas de posición y de tendencia central para datos agrupados, y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.

Grupal Cooperativo

80

Page 81: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Los sueldos de una muestra de la población de Caracas revelaron los siguientes datos, organizados en una distribución de frecuencias.

Sueldo (Miles de Bs.)

Número de personas

100-199 616200-299 125300-399 151400-499 80500-599 20600-699 48700-799 25800-899 7900-999 2

Determine Media Aritmética, Mediana, Moda, Primer Cuartil, Tercer Cuartil.

Interprete las medidas anteriores. ¿Qué sueldo menor en promedio gana el 50% de la población? Compare Media Aritmética, Mediana y Moda, y diga algunas

conclusiones.

Se tiene de una muestra de los tiempos que necesitaron 42 personas de una cooperativa para ensamblar un armario.

Tiempo (en minutos)

Número de personas

1-3 44-6 87-9 16

10-12 913-15 516-18 2

Determine e interprete la Media Aritmética, la Mediana, la Moda y el Primer Cuartil.

TEMA 3

4.6 Medidas de Dispersión

Las Medidas de Tendencia Central carecen de significación por sí solas pues de nada vale conocer únicamente el comportamiento central de una serie de valores si se desconoce la manera como se alejan o se acercan esos valores con

81

Page 82: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

respecto a un valor representativo de estos y obtenido calculando la apropiada medida de tendencia central.

Lo anterior implica la necesidad de caracterizar numéricamente la dispersión, la cual se entiende como la manera en que los valores de una serie difieren unos de otros. La dispersión será mayor o menor de acuerdo a la magnitud de esas diferencias. Por lo tanto, los resultados que obtenemos por las Medidas de Tendencia Central tienen mayor significado con la ayuda de las Medidas de Dispersión o Variabilidad, las cuales son complemento de aquellas y determinan la homogeneidad o heterogeneidad de los conjuntos de datos referidos a un valor de tendencia central tomado como referencia.

La variabilidad no se puede eliminar pero sí reducir. Controlándola domesticamos al azar y aprendemos a vivir bajo incertidumbre.

Las Medidas de Dispersión se dividen en dos grupos.

Medidas de Dispersión Absoluta: sus valores vienen expresados en las mismas unidades de medición del conjunto de observaciones o datos a ser estudiado, y sólo hacen referencia al conjunto en cuestión. Las medidas más importantes son el Rango, la Varianza y la Desviación Estándar.

Medidas de Dispersión Relativa: sus valores se obtienen de los cocientes fraccionales entre medidas de dispersión absoluta y de tendencia central, y como ambas vienen expresadas en las mismas unidades de medición, las medidas de dispersión relativa asumen valores abstractos o porcentuales. Este hecho nos permite comparar la dispersión en dos o más conjuntos de datos para determinar el que tiene mayor o menor dispersión. Sin estas medidas de dispersión relativa, la comparación sería imposible en caso de haber dos conjuntos con distintas unidades de medición, o que tengan un mismo valor para una medida de dispersión absoluta pero habiendo a la vez distinta variabilidad de sus respectivas observaciones o datos con respecto a una medida de tendencia central. La más importante entre las medidas de dispersión relativa es la del Coeficiente de Variación.

1) RANGO, AMPLITUD TOTAL, RECORRIDO U OSCILACIÓN TOTAL

Se obtiene restando el valor más bajo del valor más alto de un conjunto de N observaciones, o restando el límite inferior de la ultima clase menos el límite superior de la primera clase cuando tenemos datos agrupados en k clases. En el primer caso, al comparar la serie de N observaciones con los n datos simples, tenemos que X1 = x1 y Xn = xN. Las respectivas formulaciones son:

Para N observaciones ordenadas o n datos simples: R = xN – x1 = Xn – X1

Para datos agrupados R = Lsk – Li1

82

Page 83: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

en k clases:

Vemos que el Rango representa la medida del mayor espacio en que se encuentran todos los valores de una distribución. No da una idea verdadera de la concentración de los valores, habiendo casos en los que se obtienen intervalos exagerados cuando la distribución tiene una concentración en un espacio reducido, y por tanto estos difieren mucho de los valores extremos.

Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa, listas para embarcarse a Francia son: 102, 97, 101, 106, y 103. Determine el Rango.

a) Se ordenan e identifican las observaciones de menor a mayor.

x1 x2 x3 x4 x5

97 101 102 103 106

b) Se busca el menor y el mayor valor del conjunto observaciones. Para las N = 5 observaciones ya ordenadas, tenemos que x1 = 97 y xN = x5 = 106.

c) Se obtiene el Rango.

R = xN – x1 = x5 – x1 = 106 – 97 = 9

Interpretación: La variación de los pesos con respecto a todos los pesos de la caja es de 9 Kg.

¿Cuándo debe usarse el Rango en cualquiera de los casos anteriores?

El Rango se usa cuando las observaciones o datos son muy escasos o demasiado dispersos, además que esa medida es útil para conocer los valores extremos o la dispersión total. Con el Rango la variabilidad se puede expresar en un sólo número. Las desventajas de esta medida están en que no utiliza todas las observaciones sino dos de estas, se puede ver muy afectada por alguna observación extrema hasta el punto de perder importancia como medida de dispersión cuando los valores extremos son muy lejanos, y por otra parte para un mismo problema el Rango aumenta o queda igual con el número de observaciones pero no disminuye en ningún caso.

2) VARIANZA Y DESVIACIÓN ESTÁNDAR O TÍPICA

Para medir mejor la dispersión de los datos en términos de su totalidad, es necesaria pero no suficiente la concepción del rango como una

83

Page 84: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

sola diferencia o distancia de dos valores, siendo pertinente ampliar el alcance de esta idea a los valores restantes para que todos (y no dos) se vean reflejados o influyan en una medida de dispersión. Como no tendría sentido tomar en cuenta todas las diferencias posibles (aunque sean tomadas positivamente como distancias, obviando sus verdaderos signos) para las observaciones o datos, es más práctico y razonable considerar las diferencias o desvíos entre cada uno de estos valores y una medida de tendencia central que sirva de referencia. Se escoge la Media Aritmética pues es aquella medida de tendencia central que equilibra a todas las observaciones y no solamente a dos.

Todas esas diferencias o desvíos se promedian en su totalidad mediante expresiones cuadráticas cuya justificación matemática escapa al alcance de los objetivos de este Unidad. Sin embargo, esas expresiones son numéricamente muy precisas y útiles para representar la dispersión y para su posterior uso en Estadística Inferencial. Además, son más exactas que el simple promedio de esas diferencias, el cual es un valor que se denomina Desviación Media, y que aparece en cualquier libro de Estadística pero no lo estudiaremos en la presente Guía Didáctica.

Tal como veremos ahora, la Varianza viene dada en unidades cuadráticas, y por eso se le aplica la operación matemática de la raíz cuadrada para obtener la Desviación Estándar, siendo este un valor medido en las mismas unidades simples en que los datos vienen dados.

2.1) Varianza y Desviación Estándar para una Distribución de Datos Simples

Para una serie de N observaciones ordenadas tenemos las respectivas formulaciones para la Varianza S2 y la Desviación Estándar S que daremos a continuación.

Así como coinciden la Media de una serie de N observaciones y la Media de una distribución de frecuencias para n datos simples asociados a dichas observaciones, también ocurre lo mismo entre las formulaciones anteriores y las siguientes para tales datos, teniendo en cuenta que

.

84

Page 85: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa, listas para embarcarse a Francia son: 102, 97, 101, 106, y 103. Determinemos la Varianza y la Desviación Estándar.

Para el cálculo de esas medidas, realizaremos los siguientes pasos con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarán la obtención de estas medidas.

a) La Columna I representa los N = 5 pesos en Kg. de las cajas de frutas.

b) La Columna II contiene las desviaciones respecto a la Media, que se obtienen restando de la columna I el valor de la Media o promedio para cada valor de la columna I. La Media es:

= 101,8 ≈ 102 Kg.

c) La Columna III se obtiene elevando al cuadrado cada valor de la columna II.

Ix

II III

x1 = 97 = -5 = 23

x2 = 101 = -1 = 1

x3 = 102 = 0 = 0

x4 = 103 = 1 = 1

x5 = 106 = 4 = 18Total: 509 Total: 43

d) La Varianza S2 es el resultado de dividir el total de la Columna III entre el número N de observaciones.

85

Page 86: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

= 8,6 ≈ 9 Kg2.

e) Ahora hallaremos la Desviación Estándar S.

= 2,93 Kg. ≈ 3 Kg.

Interpretación: La diferencia con respecto al peso promedio de 102 Kg. correspondientes a las 5 cajas es de aproximadamente 3 Kg.

2.2) Varianza y Desviación Estándar para una Distribución de Datos Agrupados

Si tenemos una distribución de frecuencias para datos agrupados en

k clases, recordemos que , y la Varianza S2 y la Desviación

Estándar S tienen las respectivas formulaciones:

Ejemplo: El administrador del un hospital público hizo una investigación acerca del número de días que 200 pacientes, escogidos al azar, se quedaron en el hospital después de una operación.

Estancia en el hospital (en días)

Número de pacientes

1-3 184-6 90

86

Page 87: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

7-9 4410-12 2113-15 916-18 919-21 422-24 5

Para el cálculo de la Varianza y la Desviación Estándar realizaremos los siguientes pasos, con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarán la obtención de estas medidas.

a) La Columna I representa el número promedio de días de estancia en el hospital por cada una de las k = 8 clases.

b) La Columna II contiene la cantidad de pacientes atendidos según la cantidad de días que permanecieron en el hospital.

c) La Columna III se obtiene restando el valor de la Media o promedio con cada valor de la Columna I.

= 7,71 ≈ 8 días

d) La Columna IV se obtiene elevando al cuadrado cada valor de la Columna III.

e) La Columna V se obtiene multiplicando la Columna IV por la Columna II.Intervalos de Clases

IXm

IIF

III IV V

1 – 3 Xm1 = 2 F1 = 18 = -6 36 6484 – 6 Xm2 = 5 F2 = 90 = -3 9 8107 – 9 Xm3 = 8 F3 = 44 = 0 0 0

10 – 12 Xm4 = 11 F4 = 21 = 3 9 18913 – 15 Xm5 = 14 F5 = 9 = 6 36 32416 – 18 Xm6 = 17 F6 = 9 = 9 81 72919 – 21 Xm7 = 20 F7 = 4 = 12 144 57622 – 24 Xm8 = 23 F8 = 5 = 15 225 1.125Total 200 4.401

f) La Varianza S2 es el resultado de dividir el total de la Columna V entre el número total de pacientes.

87

Page 88: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

= 22 días2.

g) Ahora hallaremos la Desviación Estándar S.

= 4,69 ≈ 5 días

Interpretación: La diferencia respecto al número promedio de 8 días, correspondientes a las 200 estadías de los pacientes, es de aproximadamente 5 días.

Nota: La Varianza S2 sirve para hallar la Desviación Estándar S, y ambas se basan en los desvíos de los datos con respecto a la Media. Si no existe variabilidad, entonces todos los datos coinciden con la Media y S2 = S = 0, y en otro caso S2 > 0 y S > 0. Si algunos datos están muy alejados de la Media, entonces S2 y S tomarán valores muy elevados, o sea, son muy sensibles ante la presencia de datos extremos pues en esencia son medias o promedios de otra especie. En consecuencia, el valor de la Desviación Estándar está en relación directa con la dispersión de los datos, pues a mayor o menor dispersión de estos hay mayor o menor Desviación Estándar, respectivamente.

2.3) Regla de Tchebishev

Esta regla dice que para m = 2, 3, y para un conjunto de n datos X1,

…, Xn, por lo menos t = 100% de los datos se encuentran en el

intervalo ( – mS, + mS), es decir, dentro de m desviaciones de la Desviación Estándar S con respecto de la Media .

La utilidad de esta regla radica en que permite determinar unos límites para acotar o enmarcar una parte de los datos en su dispersión con respecto a la Media. Además, también válida para distribuciones de datos agrupados pues sólo se requiere conocer la Media y la Desviación Estándar para su aplicación.

Ejemplo:

88

Page 89: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Para el problema de los pesos de las cajas de frutas, tenemos que los datos son: 102, 97, 101, 106, y 103. Su Media es = 101,8 y su Desviación Estándar es S = 2,93. Para m = 2 tenemos que por lo menos t

= 100% = 75% de los datos deben estar en el

intervalo (95,94 , 106,58), es decir, ser mayores que 95,94 y menores que 106,58. Siendo que n = 5, entonces tenemos que por lo menos nt = 3,75 4 datos están en ese intervalo, lo cual se cumple con creces pues en realidad allí están todos los datos.

Interpretación: Hay por lo menos 4 cajas de frutas cuyos respectivos pesos son mayores a 95,94 96 Kg., y a su vez son menores que 106,58 107 Kg.

3) COEFICIENTE DE VARIACIÓN

Tanto para datos simples como agrupados, el Coeficiente de Variación CV es igual al cociente entre la Desviación Estándar y la Media, y multiplicando ese cociente por cien para ser expresado en porcentaje.

La formulación es CV = 100%.

Esta medida se emplea fundamentalmente con el objeto de:

1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medición, como por ejemplo Kilogramos y Centímetros.

Ejemplo: En una fábrica venezolana X la Media y Desviación Estándar de los salarios es de Bs 102 y Bs 11, respectivamente. En una fábrica colombiana Y la Media y Desviación Estándar de los salarios es de $ 230 y $ 54, respectivamente. Entonces:

Fábrica venezolana X Fábrica colombiana Y = 102, SX = 11 = 230, SY = 54

CVX = = 10,78% CVY = = 23,47%

Interpretación: La fábrica colombiana Y tiene mayor variación en los salarios que la fábrica venezolana X.

2. Comparar dos grupos de datos con iguales unidades de medición, y en los que la Media y Desviación Estándar de uno de los grupos son diferentes para el otro, pero ambos grupos pueden tener igual o

89

Page 90: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

similar grado de dispersión. Igualmente, pueden haber valores similares para el par de Medias y el par de Desviaciones, pero los grupos tienen muy alejados grados de dispersión.

Ejemplo: En una empresa X la Media de los salarios es de Bs. 3.800 y la Desviación Estándar es de Bs. 42. En una empresa Y la Media de los salarios es de Bs. 14.500 con una Desviación Estándar de Bs. 130. Entonces:

Empresa X Empresa Y = 3.800, SX = 42 = 14.500, SY = 130

CVX = = 1,10% CVY = = 0,89%

Interpretación: La empresa Y tiene menor variación en los salarios que la empresa X, aunque tienen similar dispersión.

3. Determinar si cierta Media es consistente u homogénea con cierta Desviación Estándar, lo cual expresaremos en la siguiente escala.

CV Interpretación0% a 10% Muy homogéneo

11% a 15% Homogéneo16% a 25% Heterogéneo26% o más Muy heterogéneo

Ejemplo: En una sección de educación básica, sea X la variable que indica las notas del curso de Matemáticas, cuya Media y Desviación Estándar son = 12 Pts y SX = 2 Pts., respectivamente. Por otra parte, sea Y la variable que indica las notas del curso de Física, cuya Media y Desviación Estándar son = 14 Pts. y SY = 2,5 Pts., respectivamente. Dada la similitud entre y , y entre SX y SY, y puesto que en un mismo curso hay dos puntuaciones de distinta especie, ¿cuál de los dos cursos es más consistente y cuál tiene la Media más representativa?

Tenemos que:

Curso de Matemáticas Curso de Física = 12, SX = 2 = 14, SY = 2,5

CVX = = 16,67% CVY = = 17,85%

90

Page 91: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Interpretación: El curso de Matemáticas es más homogéneo que el curso de Física. Se observa que CVX = CVY, por lo que la Media más representativa es la del curso de Matemáticas. Como es mayor la dispersión relativa CVY de los datos en el curso de Física, esto quiere decir que las calificaciones en Matemáticas se haya más concentrada alrededor de la Media en comparación a las de la otra materia.

4.7 ACTIVIDADES

Individual

Lea con cuidado los contenidos presentados en relación a las medidas de dispersión para datos simples (no agrupados) y agrupados. Consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.

Grupal Cooperativo

Para cada uno de los ejercicios siguientes, determine e interprete el Rango, la Varianza, la Desviación Estándar y el Coeficiente de Variación. Así mismo, establezca una conclusión al menos acerca de la dispersión. Resuelve los siguientes ejercicios:

1. Una muestra de archivos personales de ocho empleados de una alcaldía indicó que durante un período de seis meses tuvieron el siguiente número de inasistencias: 2, 0, 6, 3, 10, 4, 1 y 2.

2. El Departamento de Control de Calidad de una afamada marca de atún mide con un índice la calidad de su producto. Los datos se organizaron en la tabla siguiente.

Índice Número de productos

100-119 5120-139 7140-159 9160-179 16180-199 10200-219 3

3. A continuación tenemos las ganancias semanales de un grupo de 20 taxistas (expresadas en miles de bolívares).

147 185 95 92 93 115 127 126 143 157101 93 123 133 83 51 135 125 129 132

91

Page 92: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

UNIDAD V: INTRODUCCIÒN A LA PROBABILIDAD, MUESTREO Y ESTIMACIÓN

OBJETIVO: Calcular e interpretar probabilidades asociadas a un evento aleatorio dado y seleccionar una muestra de una población dada como medio para estimar ciertos parámetros poblacionales.

COMPETENCIAS:

1) Definir el concepto de probabilidad.2) Calcular el tamaño de un espacio muestral dado.3) Mencionar y explicar cómo se calculan probabilidades de acuerdo a

cada uno de los tres planteamientos de probabilidad.4) Definir población y muestra.5) Mencionar y explicar los métodos de muestreo probabilística.6) Construir intervalos de confianza para estimar la media y la proporción

de una población.7) Seleccionar el tamaño de la muestra requerido para la estimación de

la media y de la proporción de una población.8) Uso del paquete computacional SPSS (entre otros) para el cálculo de

estimadores.

CONTENIDO:

TEMA 1

5.1 ¿Qué es Probabilidad?

La Probabilidad es la posibilidad numérica de que ocurra un evento. La probabilidad de un evento es medida por valores comprendidos entre 0 y 1. Mientras mayor sea la probabilidad de que ocurra un evento, su valor asignado estará más próximo a 1. La probabilidad de una imposibilidad es 0.

Ejemplo:

La probabilidad de que el sol salga mañana es muy alta, es decir, muy cercana a 1; la probabilidad de que apruebes este curso sin estudiar está al otro extremo, está cercana a 0.

En todas las situaciones un elemento común a estas es la presencia de la incertidumbre. La noción de azar se presenta cuando no se puede predecir con certeza el resultado de un determinado Fenómeno Aleatorio, siendo aquel hecho que bajo ciertas condiciones puede ocurrir o dejar de suceder, lo que conduce al estudio profundo de las ideas anteriores a través de un área de las Matemáticas denominada Teoría de la Probabilidad.

92

Page 93: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Esta rama del conocimiento es el vehículo que le permite al investigador en Estadística usar la información contenida en una muestra para hacer inferencia o para describir la población de la cual se ha obtenido la muestra.

Supongamos que la población es conocida y nos interesa calcular la probabilidad de observar una muestra particular. Exactamente lo opuesto es cierto en los problemas estadísticos cuando asumimos que la población es desconocida y la muestra es conocida, y lo que deseamos es hacer inferencias acerca de la población. Así, la Teoría de la Probabilidad actúa desde la población hacia la muestra, mientras que la Estadística actúa opuestamente, moviéndose de la muestra hacia la población.

5.2 Experimento Aleatorio

Un Experimento es un proceso por medio del cual se obtiene una observación, dato o medición. Un Experimento Aleatorio es aquel que se caracteriza por dar resultados inciertos porque al repetirlo bajo análogas condiciones, jamás se podrá predecir el resultado que se va a obtener ya que puede ocurrir más de uno que sea posible. Supone un mayor o menor grado de incertidumbre.

En el caso contrario al antes descrito estamos en presencia de un Experimento Determinista.

Ejemplo:

Si lanzamos una moneda al aire, el resultado puede ser cara o sello, pero no sabemos de antemano cual de ello va a salir. El proceso de lanzamiento de la moneda es un experimento aleatorio.

5.3 Espacio Muestral (de un experimento aleatorio)

Es el conjunto de todos los resultados posibles del experimento, y lo podemos denotar con la letra griega “Ω” (omega) o con la letra mayúscula E. Cada resultado del experimento (o elemento del Espacio Muestral) se denomina Punto Muestral.

Ejemplo:

En un proceso de fabricación extraemos un artículo elegido entre los artículos fabricados y observamos si es o no es defectuoso.

Si denotamos por B cuando es artículo es bueno y por D cuando es defectuoso, ambos serían los puntos maestrales y podríamos tomar = B, D.

93

Page 94: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Otro ejemplo:

El espacio muestral S del experimento de lanzar un dado está dado por las seis caras de este.

S = 1, 2, 3,4, 5, 6

Cada uno de los seis posibles resultados del lanzamiento viene siendo un punto muestral.

Así cómo existen espacios maestrales finitos, también existen los que son infinitos. Por ejemplo, lanzamos un dardo hacia un tablero y hay una extensión continua de puntos donde puede caer.

5.4 Suceso o Evento de un Experimento Aleatorio

Es un subconjunto del espacio muestral que se caracteriza por ser resultado de un experimento aleatorio. Se representa por una letra mayúscula.

Como un suceso es una colección específica de puntos maestrales, un suceso particular ocurrirá si ocurre cualquier punto muestral de dicho suceso.

5.5 Los Modelos de Probabilidad

En la antigüedad se denominaba probable a lo que según las apariencias puede ser declarado verdadero o cierto, por lo que la probabilidad posee grados según su acercamiento o alejamiento de la certidumbre (certeza). Luego, la Probabilidad puede ser Subjetiva (un juicio probable) u Objetiva (un acontecimiento probable).

Estas ideas de probabilidad y azar dieron origen a la Teoría de la Probabilidad como disciplina de carácter matemático. Esto permitió dar un valor numérico a la probabilidad de ocurrencia o no ocurrencia de un acontecimiento o resultado, tal como veremos luego.

En el campo de la Estadística, debido al carácter amplio y general de la Probabilidad, esta es igualmente válida para poblaciones y muestras. Recordando las consideraciones hechas sobre ambos conceptos en el Módulo I de la Unidad I, el cálculo de Probabilidades es útil para la Estadística Inferencial. Por lo tanto, el resto de los planteamientos a estudiarse en la Unidad III estarán referidos a poblaciones.

La Probabilidad ocupa un lugar importante en la toma de decisiones puesto que permite proyectar (inferir) resultados de un evento determinado. Debido a las múltiples aplicaciones que tiene la Teoría de la Probabilidad en la vida cotidiana, existen cuatro modelos para su cálculo:

94

Page 95: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Modelo Clásico (a priori) Modelo Empírico o de Frecuencia Relativa (a posteriori) Modelo Subjetivo

5.5.1 El Modelo Clásico

Fija la probabilidad sin depender de ninguna experiencia y por lo tanto no está apoyada en ninguna inferencia inductiva. Se relaciona con los juegos de azar y las apuestas. Aquí se supone que los sucesos elementales son equiprobables.

La probabilidad clásica de un evento A se determina mediante la Regla de Laplace, expresada así:

P(A) =

El numerador de esa expresión es la cantidad de elementos o puntos maestrales que conforman al suceso A, y el denominador es la cantidad total de elementos pertenecientes al espacio muestral .

Ejemplo:

Sea el experimento aleatorio de lanzar un dado una vez, el cual tiene éxito si el resultado del experimento es la cara 3 y 4.

Tomando el espacio muestral = 1, 2, 3, 4, 5, 6 y el evento A = 3, 4, tenemos P(A) = =0,3333… = 33,33%.

5.5.2 El Modelo Empírico o de Frecuencia Relativa

Utiliza datos que se han observado empíricamente en una investigación estadística, registra la frecuencia con que ha ocurrido un evento en el pasado, y estima la probabilidad de que el evento ocurra nuevamente con base a su comportamiento histórico ya investigado.

Para calcular la probabilidad de un evento A aplicando este modelo, se utiliza la siguiente fórmula:

P(A) =

Ejemplo:

95

Page 96: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Alicia faltó 5 veces a clases el mes pasado. ¿Cuál es la probabilidad de que falte este mes que tiene 30 días?

P (Falta) = = = 0,1666… = 16,66%

Este modelo se usa esencialmente en distribuciones de frecuencias para datos estudiados en Estadística, por lo que es útil el siguiente resumen comparativo de conceptos estadísticos y probabilísticas, siendo que algunos de estos últimos serán estudiados más adelante en los próximos módulos.

Conceptos Empíricos(Estadísticos)

Conceptos Teóricos(Probabilísticos)

Población Espacio MuestralMuestra SucesoFrecuencia relativa ProbabilidadVariable Estadística Variable AleatoriaHistograma de Frecuencia Relativa Curva de Probabilidad

Histograma de Frecuencia Relativa Acumulada Curva de Distribución

Características Estadísticas(Estadísticos)

Características Probabilísticas (Parámetros)

5.5.3 El Modelo Subjetivo

Se utiliza cuando no hay datos históricos disponibles y sólo se cuenta con opiniones o criterios subjetivos. Aquí la probabilidad representa una relación entre una proposición y un cuerpo de evidencia, pero no es una relación puramente lógica. Es una relación cuasilógica y el valor numérico asociado a ella representa un grado de creencia subjetiva expresada en un juicio probable. Por ejemplo, ¿Cuál es la probabilidad de que una mujer sea elegida a la Presidencia de la República Bolivariana de Venezuela?

En cierto modo se puede considerar el enfoque de este modelo como una generalización de la probabilidad obtenida a partir de una frecuencia en una serie larga de pruebas, y también a partir de situaciones en que la información que dispone un individuo es más incompleta y precaria. Por otra parte, en un gran número de aplicaciones usuales de las probabilidades, más que pensar en la repetición de un experimento y en su frecuencia, el individuo hace comparaciones entre la situación en que se encuentra (que no necesariamente se va a repetir) y las situaciones típicas caracterizadas por el azar.

En esa interpretación personal de la probabilidad, en base a ciertas reglas el individuo asigna probabilidades a los sucesos elementales, y aquellas servirán para hallar las probabilidades de otros sucesos en base a las mismas reglas, y su

96

Page 97: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

interpretación se hace planteando la analogía o comparación entre ambos tipos de sucesos.

TEMA 2

5.6 Población y Muestra

Los conceptos de Población y Muestra fueron estudiados en las Secciones 1.2 y 1.3 del Unidad I de la Unidad I, al igual que las razones que justifican el uso de las muestras se analizaron en la Sección 1.5.

Una población es finita si consta de un número finito o fijo de elementos, medidas u observaciones. Por ejemplo, tenemos el conjunto de calificaciones obtenidas en una sección de estudiantes de la UBV que cursan Análisis del Dato Estadístico.

A diferencia de las poblaciones finitas, una población infinita contiene una infinidad de elementos, al menos hipotéticamente. Por ejemplo, cuando medimos el peso de los habitantes de una comunidad.

A menos que se indique lo contrario, las poblaciones a ser estudiadas aquí son finitas.

5.6 Muestreo

El Muestreo es el conjunto de procedimientos que nos permite diseñar la muestra más apropiada para un experimento o investigación, garantizándose que la muestra seleccionada sea representativa de la población de origen para no tener que trabajar con la totalidad de esta y controlar los errores cometidos en su estudio.

Para que una muestra sea aceptable, esta debe ser representativa de la población de la cual se obtuvo, y también debe existir la posibilidad de medir la confiabilidad de las estimaciones obtenidas de la muestra (totales, promedios, porcentajes, etc.). La muestra es representativa si posee todas las características de la población en la misma proporción en que se encuentran manifiestan en el seno de esta. Todo esto es objeto de estudio de la Teoría de Muestreo.

Los objetivos del muestreo son:

Realizar estimaciones de valores de una población a partir de las medidas obtenidas de la muestra.

Calcular medidas de confiabilidad de esas estimaciones. Interpretar las estimaciones de manera precisa.

Se aconseja el muestreo en los siguientes casos:

97

Page 98: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Cuando la población es infinita o muy grande de tal forma que resulte muy difícil su enumeración total.

En poblaciones muy homogéneas tales que la muestra represente con fidelidad a la población.

Cuando el proceso de investigación de las características de una población sea destructivo.

Las ventajas del muestreo son:

Economía y rapidez en su realización. Ahorro de dinero si la muestra es representativa pues en tal caso no hay

necesidad de trabajar con todos los elementos de la población. Más alcance en la investigación. Más entrenamiento, formación y control de personal. Mayor rapidez de procesamiento y presentación de resultados. Menos personal y recursos. Fácil verificación posterior en base al diseño utilizado. Más confiabilidad de los datos obtenidos en base a la posibilidad de

controlar más fácilmente las informaciones recopiladas.

Las limitaciones del muestreo son:

No permite hacer cálculos, tabulaciones o proyecciones con respecto a áreas o pequeños grupos.

Presenta el error de muestreo y otros ajenos a ese proceso. Dificultad de la tabulación cruzada de algunas características. Se requiere una alta preparación estadístico-matemática de muestrista. Existe la creencia de que las investigaciones sobre la población ofrecen un

margen más sólido y eficiente de exactitud que los resultados obtenidos de una muestra.

5.6 Clasificación del Muestreo

En Estadística, un Diseño de una Muestra es un plan definitivo determinado por completo, antes de recopilar cualquier dato, con el fin de tomar posteriormente una muestra de una población de referencia. Enmarcado dentro del proceso del diseño, el tipo de muestreo a desarrollar se clasifica en función de las características de la población y del criterio de selección previamente determinado en una investigación. Algunas veces se hace uso de la Teoría Combinatoria para obtener determinado tipo de muestras.

1) Muestreo Probabilístico y no Probabilístico

El Muestreo no Probabilístico es aquel donde la selección no se hace al azar sino el criterio del investigador. A menudo suele presentar grandes sesgos y por esa razón es poco fiable.

98

Page 99: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

En cambio, si la selección de los elementos de la muestra se realiza aleatoriamente, es decir, independientemente de la opinión del investigador, entonces se está haciendo un Muestreo Probabilístico o Aleatorio, el cual es mucho más confiable. En este caso, si la población tiene N elementos y la muestra es de M elementos, la probabilidad que tiene cada elemento de

la población de integrar esa muestra es .

Un muestro probabilística o aleatorio puede ser sin Reemplazo, Aleatorio Simple y Sistemático.

2) Muestreo con y sin Reemplazo

Tenemos un Muestreo con Reemplazo cuando cada elemento de la población puede elegirse más de una vez. Esto ocurre cuando cada elemento seleccionado se vuelve a regresar a la población de la cual se extrajo después de anotar sus características en un instrumento al aplicarle alguna técnica de recolección de información. Este tipo de muestreo no es probabilístico, y se aplica para poblaciones que en la práctica se consideran infinitas o inagotables. Aquí cambia la probabilidad de selección de cada elemento que formará la muestra.

Al contrario, en una Muestra sin Reemplazo el elemento seleccionado para integrar la muestra deja de ser seleccionable al no poder elegirse más de una vez. Es decir, una vez extraído no se regresa a la población. Por lo tanto la población es agotable y por supuesto finita. A este tipo de muestreo se le suele llamar Irrestrictamente Aleatorio. Para

este caso, hay maneras de obtener una muestra de tamaño M de una

población de tamaño N, y la probabilidad de elegir así una muestra es

.

3) Muestreo Aleatorio Simple

Es un procedimiento de muestreo probabilístico mediante el cual extraemos de una población una muestra representativa de la misma, y donde cada elemento de la población tiene la misma posibilidad de ser incluido en la muestra. En términos de probabilidad, de ser N el tamaño de la población, será 1/N la probabilidad de ser escogido cada elemento para formar parte de la muestra sin importar el tamaño de esta. Este tipo de muestreo es el más sencillo y usado.

4) Muestreo Sistemático

99

Page 100: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

Es cuando los elementos de la población están ordenados por listas. Se elige un individuo al azar y a continuación se eligen todos los demás a intervalos constantes hasta completar la muestra. Si el orden de los elementos es tal que los individuos próximos tienden a ser más semejantes que los alejados, el muestreo sistemático tiende a ser más preciso que el aleatorio simple al cubrir más homogéneamente toda la población. A veces este tipo de muestreo no es necesariamente aleatorio.

El verdadero riesgo del muestreo sistemático yace en la posible presencia de periodicidades ocultas y la obtención de resultados sesgados o parcializados.

5) Muestreo Estratificado

Es cuando nos interesa que la muestra tenga la misma composición a la de la población cuando esta se divide en clases o estratos. Esto último se hace a fin de disminuir la variabilidad de la población y de buscar mayor homogeneidad dentro de cada estrato.

Si tenemos información acerca de la constitución o composición de una población, y siendo esa información importante para nuestra investigación, podemos mejorar el muestreo aleatorio por medio de la estratificación, procedimiento que consiste en dividir a la población en una cantidad de sub-poblaciones o estratos que no se mezclen y en la que en cada uno sus elementos sean los más parecidos entre sí, y luego de hacer esa distribución se toma una muestra de cada estrato. Si para cada estrato se obtiene una muestra aleatoria simple, el procedimiento completo (primero la estratificación y luego el muestreo aleatorio) se conoce como Muestreo Aleatorio Simple Estratificado.

Esencialmente, el objetivo de la estratificación es formar estratos de tal forma que haya una relación entre un estrato particular y la respuesta que se busca en el estudio estadístico, y que en cada uno de los estrato separados haya tanta homogeneidad como sea posible.

Ejemplo:

Si en una población el 20% son mujeres y el 80% hombres, se mantendrá la misma proporción en la muestra.

6) Muestreo por Conglomerados

Se divide la población total en un número determinado de subdivisiones relativamente pequeñas y se seleccionar al azar algunos elementos de esas subdivisiones o conglomerados para incluirlos en la muestra general. Si los conglomerados son subdivisiones geográficas, este también se llama Muestreo por Áreas.

100

Page 101: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

BIBLIOGRAFÍA

BÁSICA

1. ANDERSON, D. Estadística para Administración y Economía. Volumen I y II. International Thomson. México, 2.001.

2. ARIAS, F. El proyecto de Investigación. Caracas, 2.004.

3. BAUCE, G. Estadística Aplicada: Problemario. Ediciones del Vicerrectorado Académico de la Universidad Central de Venezuela. Caracas, 2.004.

4. FREUND, J. Y SIMON, G. A. Estadística Elemental. Editorial Prentice-Hall Hispanoamericana. México, 1.994.

5. FUENLABRADA DE LA VEGA, S. Probabilidad y Estadística. McGraw-Hill Interamericana. México, 2.000.

6. HAMDAM, N. Métodos Estadísticos en Educación. Ediciones de la Biblioteca de la Universidad Central de Venezuela. Caracas, 1.994.

7. LIND, D., MASON, R., Y MARSHALL, W. Estadística. Irwin MacGraw Hill. México, 2.001.

8. ORTEGA, J. Elementos de Probabilidad. Sociedad Fondo Editorial CENAMEC. Caracas, 1.998.

9. SENIGNI, S. Apuntes de Estadística para Biólogos. Dirección de Publicaciones ULA. Mérida, 2.003.

10.SOTO, A. Iniciación a la Estadística. Editorial José Martí. Caracas, 1.982.

11.SPIEGEL, J. SCHILLER Y SRINIVASAN, R. Probabilidad y Estadística. McGraw-Hill Interamericana. Bogotá, 2.001.

12.TAPINOS, G. Elementos de Demografía. Editorial Espasa-Calpe SA. Madrid, 1.998.

COMPLEMENTARIA

1. ALSON, P. Métodos de Graficación. Editorial Erro. Caracas, 1.999.

101

Page 102: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

2. BLALOCK, H. Estadística Social. Fondo de Cultura Económica. México, 1.966.

3. CRÁMER, H. Elementos de la Teoría de Probabilidades. Aguilar Ediciones. Madrid, 1.968.

4. GLASS, G. Y STANLEY, J. Métodos Estadísticos Aplicados a las Ciencias Sociales. Editorial Prentice-Hall Internacional. Madrid, 1.974.

5. GONZÁLEZ, R. Introducción a la Geoestadística. Ediciones de la Biblioteca de la Universidad Central de Venezuela. Caracas, 1.996.

6. HABER, A Y RICHARD, R. Estadística General. Fondo Educativo Interamericano, S.A. México, 1.973.

7. LINCOYÁN, O. Introducción a la Estadística. McGraw-Hill Interamericana. Bogotá, 1.998.

8. MCCOLLOUGH, C. Análisis Estadístico para la Educación y las Ciencias Sociales. McGraw Interamericana. México, 1.982.

9. MENDENHALL, W. Introducción a la Probabilidad y la Estadística. Wadsworth Internacional Iberoamericana. California, 1.972.

10.RIVAS, E. Estadística General. Ediciones de la Biblioteca de la Universidad Central de Venezuela. Caracas, 1.968.

11.SALAMA, D. Estadística: Metodología y aplicaciones. Editora Principios. Caracas, 1.987.

12.WALPOLE, R. y RAYMOND, M. Probabilidad y Estadística. McGraw Hill Interamericana. México, 1.992.

13.WAYNE, D. Estadística con aplicaciones a las Ciencias Sociales y la Educación. McGraw Hill Interamericana. México, 1.981.

VIRTUAL

Adicionalmente a los libros antes mencionados, se recomiendan las siguientes páginas web de Internet (año 2.005).

http://www.bcv.org.vehttp://www.eclac.cl/celadehttp://www.euler.ciens.ucv.ve/gl-autor.htmlhttp://www.eumed.net/cursecon/2/dem.htmhttp://www.faces.ucv.vehttp://www.ine.gov.ve/ine/indexine.asp

102

Page 103: REPÚBLICA BOLIVARIANA DE VENEZUELA - … · Web view¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. Escribe un ensayo sobre la utilidad

http://www.platino.gov.vehttp://www.uned.es/111044/p104a.htm

103