Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de...

77
8 UNIDAD 1 Estadística descriptiva.

Transcript of Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de...

Page 1: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

8

UNIDAD 1 Estadística descriptiva.

Page 2: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

9

Desde hace muchos años, la estadística ha tenido presencia en todos los ámbitos de estudio: economía, administración, ingeniería, etc.

La estadística descriptiva es una rama de las matemáticas que se encarga de la recolección, organización, análisis e interpretación de una serie de datos, con el fin de estudiar el comportamiento de las poblaciones o predecir el comportamiento de un fenómeno a fin de facilitar la toma de decisiones. Para ello en esta unidad trataremos en detalle los conceptos básicos de muestra, población y tipos de datos.

Los gráficos estadísticos cumplen con el propósito de presentar de manera visual el comportamiento de una serie de datos e inferir sobre su distribución. Los más usados son gráficas circulares, histogramas, polígonos de frecuencias y ojiva.

Los parámetros y estadísticos más importantes y utilizados para la inferencia de datos son: media, mediana, moda y cuartiles. Con ello se consigue predecir el comportamiento de los datos que describen una población a través del estudio de las tendencias.

Page 3: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

10

1. Describirás el comportamiento de una serie de datos cuantitativos, por medio de la construcción de tablas de distribución de frecuencias y gráficas de diversos tipos, para realizar el análisis de la información.

1.1Estadística Descriptiva. 1.1.1 Definición. 1.1.2 Población. 1.1.3 Tipos de poblaciones. 1.1.4 Muestra. 1.1.5 Tipos de muestreo. 1.1.6 Tipos de muestra. 1.1.7 Tipos de experimentos. 1.1.8 Tipos de datos.

1.2Representación gráfica de datos. 1.2.1 Gráficas de tallo y hojas. 1.2.2 Distribuciones de frecuencia. 1.2.3 Tipos de tablas. 1.2.4 Frecuencias para datos agrupados. 1.2.5 Distribución acumulativa.

Page 4: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

11

1.1Estadística descriptiva.

1.1.1 Definición.

Es el conjunto de métodos matemáticos que nos permiten agrupar, organizar y tratar la información, de tal manera que podamos hacer inferencias con respecto a las características o comportamiento de la población.

1.1.2 Población.

El conjunto de todos los elementos ( i x ) que podríamos encontrar en la realización de un experimento, se denomina población. En sentido estadístico, un elemento puede ser algo con existencia real (población tangible), como un automóvil o una casa; o algo más abstracto (población conceptual) como la temperatura, un voto, o un intervalo de tiempo. Cabe señalar que un experimento es el instrumento a través del cual se obtienen los datos o elementos que constituyen la población, como pueden ser una encuesta, un juego de azar, etc.

A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres:

Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo.

De cada elemento de la población, podremos estudiar uno o más aspectos, cualidades o caracteres.

Page 5: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

12

1.1.3 Tipos de poblaciones.

1.1.3.1 Según su tamaño.

Población finita: Cuando el número (n) de elementos que la forman es finito.

El número de alumnos de un centro de enseñanza, o grupo clase.

Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos.

Si se realizase un estudio sobre los productos que hay en el mercado; Habrían tantos y de tantas calidades que esta población

podría considerarse infinita.

1.1.3.2 Según su elegibilidad.

Población base: Grupo de personas designadas por características personales, geográficas o temporales, elegibles para participar en el estudio.

Población muestreada: Población base con criterios de viabilidad o posibilidad para realizar el muestreo. La muestra es una porción de la población.

Población diana: Grupo de personas a las que va proyectado dicho estudio. La clasificación característica de los mismos, la hace modelo de estudio para el proyecto establecido.

Page 6: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

13

1.1.3.3 Características de las poblaciones.

Cuando se lleva a cabo alguna investigación, deben tenerse en cuenta las características esenciales al seleccionar la población bajo estudio. Dentro de dichas características tenemos las siguientes:

Homogeneidad: Todos los miembros de la población deben tener las mismas características según las variables que se vayan a considerar en el estudio o investigación. Por ejemplo, si se fuera a investigar la incidencia de la drogadicción entre mujeres adolescentes, entonces hay que definir claramente las edades que comprenden la adolescencia y cuando se seleccione la población, asegurarse de que todas las personas entrevistadas sean de la edad determinada y del sexo femenino.

Tiempo: Período de tiempo donde se ubica la población de interés. Hay que determinar si el estudio es del momento presente o si se va a estudiar una población de cinco años atrás o entrevistar personas de diferentes generaciones.

Espacio: Lugar donde se ubica la población de interés. Un estudio no puede ser muy amplio y por falta de tiempo y recursos hay que limitarlo a un área o comunidad en específico.

Cantidad: Tamaño de la población. Es sumamente importante porque ello determina o afecta al tamaño de la muestra a seleccionar; la falta de recursos y tiempo también limita la extensión de la población a investigar.

Page 7: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

14

1.1.4 Muestra.

La Muestra es el segmento de la población que será estudiada. Corresponde al grupo de elementos de los que se recopilan datos y realizan observaciones; siendo realmente un subconjunto de la población muestreada.

Al elegir una muestra, se espera que sus propiedades sean extrapoladas a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos a los que se obtendrían si se realizase un estudio de toda la población.

Se define la muestra como un subconjunto fielmente representativo de la población.

Cabe mencionar que para que el muestreo sea válido y pueda realizarse un estudio fiable, debe cumplir ciertos requisitos. Dependiendo de las características, condiciones y tamaño de la muestra, se puede hablar de grados o niveles de confiabilidad.

Page 8: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

15

1.1.5 Tipos de muestreo.

Un muestreo es la técnica para la selección de una muestra a partir de una población. Hay diferentes tipos de muestreo y el que se utilice para recopilar la información, dependerá de la representatividad de la población a analizar.

Aleatorio: Cuando se selecciona al azar la muestra y cada miembro tiene igual oportunidad de ser elegido.

Estratificado: Cuando se subdivide en estratos o subconjuntos, según las variables o características que se pretenden investigar. Cada estrato debe corresponder proporcionalmente a la población.

Sistemático: Cuando se establece un patrón o criterio al seleccionar la muestra.

Se quiere conocer el número de miembros que tienen las familias, por cada diez que se detecten, se entrevistará una al azar.

1.1.6 Tipos de muestra.

1.1.6.1 Muestra Aleatoria simple.

Una muestra aleatoria simple se selecciona de tal manera, que cada muestra posible del mismo tamaño y características, tenga igual oportunidad de ser elegida de la población.

Una muestra es aleatoria simple si:

1) Cada elemento de la población tiene la misma oportunidad de ser seleccionado.

2) Los resultados u observaciones se obtienen cuando se realizan experimentos; en los cuales, todos los elementos tienen la misma oportunidad de aparecer.

En una población finita se enumeran los elementos de la población de 1 a N y se asignan números aleatorios de tantas cifras según el valor de N. El valor del número aleatorio indicaría el elemento a seleccionar.

Page 9: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

16

Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemáticos, estratificados y de conglomerados.

Si la población consiste en toda la gente de un país, se puede primero seleccionar al azar algunas subdivisiones del país y después seleccionar la

muestra final entre la gente de estas subdivisiones.

1.1.6.2 Muestra de conveniencia.

Se seleccionan aquellos miembros de la población de fácil acceso. Se usa cuando se quieren obtener resultados rápidamente.

Ventajas: 1) Bajo costo de selección. 2) Se producen resultados rápidamente. 3) Puede usarse para conocer posiciones generales, usualmente extremas

de la población.

Desventajas: 1) Es muy poco probable que la muestra sea representativa de la población. 2) No se puede establecer su confiabilidad ni margen de error. 3) No se puede inferir la población en base a los resultados obtenidos.

1.1.6.3 Muestra aleatoria ponderada.

Cuando la población incluye un grupo muy pequeño pero esencial, hay el riesgo de que ningún miembro de ese grupo quede dentro de una muestra aleatoria. Tales grupos clave de usuarios de productos son, entre otros, gente con problemas visuales, auditivos o con la capacidad reducida del movimiento. Otras minorías a menudo significativas se originan de religiones, nacionalidades y lenguas.

Page 10: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

17

1.1.6.4 Muestra aleatoria estratificada.

Primero dividimos la población en subpoblaciones o estratos, luego tomamos una muestra aleatoria simple de cada uno de estos estratos. La colección de todas las muestras de los estratos nos da como resultado una muestra estratificada. Los estratos se seleccionan de acuerdo con los valores conocidos de alguna variable de manera que hay poca variabilidad entre los miembros de un estrato particular, sin embargo hay grandes diferencias entre los distintos estratos.

1.1.6.5 Muestra agrupada.

Cuando la población se encuentra dividida, de manera natural, en grupos que se supone contienen toda la variabilidad de la población, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio. Dentro de los grupos seleccionados se ubicarán las unidades elementales, podrían ser: Personas a encuestar, aplicándoseles el mismo instrumento de medición a todas las unidades, o sólo a algunas seleccionadas al azar. Este método tiene la ventaja de simplificar la recopilación de datos muestrales.

Page 11: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

18

1.1.7 Tipos de experimentos. Pueden ser encuestas, entrevistas, juegos de

azar, información climática, conteos.

1.1.8 Tipos de datos. Los datos estadísticos son concisos,

específicos y capaces de ser analizados objetivamente por diferentes procedimientos. En función de sus características los datos se clasifican en cuantitativos y cualitativos; siendo los

cuantitativos la base fundamental del estudio de la estadística. El uso de la computadora ha hecho posible el almacenamiento y procesamiento de datos de una manera más eficiente. Se obtienen mediante un proceso que incluye el registro de resultados de las observaciones o variables, que adquieren una serie de valores en las mediciones sucesivas.

1.1.8.1 Los datos de características cuantitativas o numéricas.

Son aquellos que se pueden expresar numéricamente y se obtienen a través de mediciones y conteos. Un dato cuantitativo se puede encontrar en cualquier disciplina; psicología, contabilidad, economía, publicidad. Los datos de características cuantitativas y cualitativas se clasifican en:

1. Variables continuas: Son aquellas cuyos valores son sucesivos. Se obtienen en cualquier momento de un proceso.

1.5, 3.4, 2.8, …r, donde r es un elemento de los reales. 2. Variables discretas: Son aquellas que no aceptan valores fraccionarios

dentro de un determinado intervalo. Se generan a través de un proceso de conteo.

1, 2, 3, 4, …n, donde n es un elemento de los enteros.

Page 12: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

19

1.1.8.2 Datos de características cualitativas o categóricas.

Los datos de características cualitativas son aquellos que no se pueden expresar numéricamente. Estos datos se deben convertir a valores numéricos antes de que se trabaje con ellos.

Si hacemos una base de datos de pacientes, las variables categóricas serían: sexo, estado civil, hábito de fumar.

Los datos de características cualitativas se clasifican en:

1. Datos nominales: Comprenden categorías, como el sexo, carrera en estudio, calificaciones. Las características mencionadas no son numéricas por su naturaleza, pero cuando se aplican, ya sea en una población o una muestra, es posible asignarle a cada elemento una categoría y contar el número que corresponde a cada elemento. De esta manera estas características se convierten en numéricas.

2. Datos jerarquizados: Es un tipo de datos de características cualitativas que se refiere a las evaluaciones subjetivas cuando los conceptos se jerarquizan según la preferencia o logro. Las posiciones de una competencia de atletismo se jerarquizan en: Primer lugar, segundo lugar, tercer lugar.

Tanto los datos nominales como los jerarquizados, que por su naturaleza no son numéricos, se convierten en datos discretos.

En el proceso de medición de estas variables, se pueden utilizar dos escalas:

Escalas nominales: Son una forma de observar o medir en la que los datos se ajustan por categorías

que no mantienen una relación de orden entre sí (color de los ojos, sexo, profesión, presencia o ausencia de un factor de riesgo o enfermedad).

Escalas ordinales: Cuando existe un cierto orden o jerarquía entre las categorías de las escalas utilizadas (grados de disnea, estadía de un tumor).

Page 13: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

20

1.2 Representación gráfica de datos.

En muchas ocasiones la información proporcionada en una tabla es tan singular o importante que se decide presentar esos resultados de forma gráfica. Muchas veces, la representación gráfica nos permite obtener de una forma más rápida y clara la información que nos es útil, e inclusive nos permite hacer comparativos entre las diferentes clases.

Veamos primeramente algunos principios comunes en la construcción de gráficos:

En su gran mayoría los gráficos se inscriben en un sistema de ejes coordenados, siendo el circular o de sectores, una excepción. En uno de los ejes se representan las frecuencias observadas o los valores calculados a partir de los datos, mientras que en el otro se representa el criterio principal de clasificación. La escala relativa al eje donde se representan frecuencias debe comenzar en cero. De ser necesario, se puede interrumpir “adecuadamente” la escala dependiendo del tipo de gráfico. La longitud de un eje debe ser, aproximadamente, entre una medida y una medida y media, la del otro. Esta proporcionalidad es importante, pues garantiza la equivalencia entre gráficos. Cada eje debe ser rotulado indicando qué representa, y en caso de que corresponda, la unidad de medida usada. Un gráfico depende de la información que se quiera expresar y su construcción precisa del ordenamiento de los datos a través de un método tabular.

Componentes de un gráfico.

Un gráfico, está compuesto de las siguientes partes:

a. Identificación. b. Título. c. Cuerpo. d. Pie del gráfico.

Page 14: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

21

1.2.1 Gráficas de tallo y hojas.

Es una técnica de recuento y ordenación de datos que permite de una manera rápida, obtener una representación visual del conjunto de datos. Para construirlo, se eligen uno o más dígitos iniciales para los valores de tallo, el dígito o dígitos finales corresponderán a las hojas, posteriormente, se enlistan los valores del tallo verticalmente en orden creciente, colocando a continuación cada dato observado junto al valor correspondiente de tallo. Se utiliza con grandes cantidades de información y constituye un método resumido de mostrar los datos. La desventaja de este método, es que no muestra información sobre frecuencias, sólo muestra los datos.

Page 15: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

22

1. La siguiente distribución de frecuencias, corresponde a las edades de los 20 profesores de una escuela secundaria. Represéntala mediante una tabla de Tallos y Hojas.

34 25 33 41 28 27 42 38 37 23 29 36 35 44 32 28 26 30 42 36

En este caso, los tallos son los números 3, 2 y 4 que corresponden a las decenas y que de manera ordenada quedan como: 2, 3 y 4.

En la siguiente tabla, se colocan las hojas, que corresponden a las unidades y se van agregando según el orden en el que van apareciendo:

Tallos Hojas 2 5 8 7 3 9 8 6 3 4 3 8 7 6 5 2 0 6 4 1 2 4 2

Finalmente simplemente reordenamos las hojas también en orden creciente:

Tallos Hojas 2 3 5 6 7 8 8 9 3 0 2 3 4 5 6 6 7 8 4 1 2 2 4

Esta representación, proporciona más información que un histograma.

Page 16: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

23

2. Con los siguientes datos, construye un diagrama de tallos y hojas. 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40

Solución:

Ordenamos los datos quedando:

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Tomamos como tallo las decenas y como “hojas” las unidades, quedando

TALLO HOJAS 2 0 3 4 4 4 5 9 3 1 1 3 4 6 6 7 9 9 4 0 0 1 5

3. Construye un diagrama de tallos y hojas con los datos que se tomaron de 35 alumnos, en relación con su estatura.

1.68 1.71 1.75 1.91 1.69 1.89 1.77 1.69 1.82 1.78 1.51 1.82 1.71 1.87 1.76 1.49 1.75 1.72 1.77 1.76 1.72 1.92 1.70 1.77 1.69 1.57 1.77 1.84 1.63 1.79 1.68 1.74 1.78 1.80 1.73

Solución: Ordenando los datos:

1.49 1.51 1.57 1.63 1.68 1.68 1.69 1.69 1.69 1.70 1.71 1.71 1.72 1.72 1.73 1.74 1.75 1.75 1.76 1.76 1.77 1.77 1.77 1.77 1.78 1.78 1.79 1.80 1.82 1.82 1.84 1.87 1.89 1.91 1.92

Page 17: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

24

Recorriendo un lugar el punto decimal y tomando los enteros como “tallo” y las décimas como “hojas” queda:

TALLO HOJAS 14 9 15 1 7 16 3 8 8 9 17 1 1 2 2 3 4 5 5 6 6 7 7 7 7 8 8 9 18 0 2 2 4 7 9 19 1 2

4. De un radar para medir las velocidades en 45 automóviles, se obtuvieron los siguientes datos para realizar un diagrama de tallos y hojas.

96 93 88 117 127 95 113 96 108 94 148 156 139 142 94 107 125 155 155 103 112 127 117 120 112 135 132 111 125 104 106 139 134 119 97 89 118 136 125 143 120 103 113 124 138

Solución:

Ordenando los datos

88 89 93 94 94 95 96 96 97 103 103 104 106 107 108 111 112 112 113 113 117 117 118 119 120 120 124 125 125 125 127 127 132 134 135 136 138 139 139 142 143 148 155 155 156

Elegimos los 2 primeros dígitos como “tallos” y el número restante será la hoja

TALLO HOJAS 8 8 9 9 3 4 4 5 6 6 7 10 3 3 4 6 7 8 11 1 2 2 3 3 7 7 8 9 12 0 0 4 5 5 5 7 7 13 2 4 5 6 8 9 9 14 2 3 8 15 5 5 6

Page 18: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

25

1.2.2 Distribuciones de frecuencia.

Una tabla de distribución de frecuencia es un cuadro que consiste en la disposición conjunta, ordenada y normalmente totalizada, de las sumas o frecuencias totales obtenidas en la recopilación de los datos, referentes a las categorías o dimensiones de una o varias variables, relacionadas entre sí. Las tablas sistematizan los resultados cuantitativos ofreciendo una visión numérica, sintética y global del fenómeno observado. En ella, se culmina y concreta la fase clasificatoria de la investigación cuantitativa.

1.2.2.1 Tabla de entrada de datos.

Es una tabla en la cual sólo aparecen los datos que se obtuvieron de la investigación científica o del experimento. Es la más sencilla, utilizada cuando no se requiere mayor información acerca de los resultados de una serie de n repeticiones de algún experimento u observación aleatoria, suponiendo que las repeticiones son mutuamente independientes y se realizan en condiciones uniformes. El resultado de cada observación, puede expresarse de forma numérica.

El material estadístico consiste en n valores observados de la variable Xi.

Los valores observados se suelen registrar, en primer lugar en una lista. Si el número de observaciones no excede de veinte, los datos se registran en orden creciente de magnitud o por variable cualitativa.

Con los datos de esta tabla pueden hacerse diversas representaciones gráficas y calcular características numéricas como la media y la mediana.

Page 19: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

26

1.2.3 Tipos de tablas.

1.2.3.1 Tablas de frecuencia.

Una tabla de frecuencia está formada por las categorías o valores de una variable y sus frecuencias correspondientes. Esta tabla es lo mismo que una distribución de frecuencias y se crea por medio de la tabulación y agrupación. Se realiza el mismo procedimiento de tabulación anteriormente descrito si el número de valores observados para la variable, se trabaja con una sola variable, descontando los repetidos. Si existen repetidos la frecuencia f es el número de repeticiones de un valor de x dado. Sin embargo, cuando el conjunto de datos es mayor, resulta laborioso trabajar directamente con los valores individuales observados y entonces se lleva a cabo, por lo general, algún tipo de agrupación como paso preliminar, antes de iniciar cualquier otro tratamiento de los datos. Las reglas para proceder a la agrupación son diferentes según sea la variable, discreta o continua; para una variable discreta suele resultar conveniente hacer una tabla en cuya primera columna figuren todos los valores de la variable x representados en el material, y en la segunda, la frecuencia f con que ha aparecido cada valor de x en las observaciones.

Estas clases de tablas son las más usadas y brindan mayor información sobre los datos que las tablas de entradas de datos, efectivamente. Una tabla de este tipo dará en forma abreviada, una información completa acerca de la distribución de los valores observados. Con estas se pueden utilizar más a fondo los métodos gráficos al igual que los métodos aritméticos.

Ejemplo:

1. La siguiente tabla muestra el número de artículos defectuosos que se detectaron en una línea de producción durante 30 días del mes de abril del 2006. Elabora la tabla de distribución de frecuencias respectiva.

4 5 4 5 6 7 6 5 4 7 8 7 8 6 7 5 6 8 7 9 8 7 4 6 7 8 9 4 6 7

Page 20: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

27

Núm. artículos defectuosos

i x FRECUENCIAS

i f 4 5 5 4 6 6 7 8 8 5 9 2

TOTAL 30 FUENTE: Departamento de Producción, Cía. X, S.A.

1.2.3.2 Tablas de Frecuencias Relativas.

Resume la información contenida en un conjunto de datos, organizándolos según su clase y su frecuencia relativa, la cual se refiere al grado de representación porcentual de una clase con respecto al total.

Núm. artículos

i x Frecuencias

i f Frecuencias Relativas

i fr Frecuencias Relativas

porcentuales

% 4 5 0.17 17% 5 4 0.13 13% 6 6 0.20 20% 7 8 0.27 27% 8 5 0.17 17% 9 2 0.06 6%

Total 30 1.00 100% FUENTE: Departamento de Producción, Cía. X, S.A.

Page 21: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

28

1.2.3.3 Tablas de Frecuencias Relativas Acumuladas.

Resume la información contenida en un conjunto de datos, organizándolos según su clase y frecuencia relativa, se refiere al grado de representación porcentual acumulado de cada una de las clases.

Núm. artículos

i x Frecuencias

i f

Frecuencias Relativas

i i

f fr n

=

Frecuencias Relativas

porcentuales

%

Frecuencias Relativas

Acumuladas

i fra 4 5 0.17 17% 17% 5 4 0.13 13% 30% 6 6 0.20 20% 50% 7 8 0.27 27% 77% 8 5 0.17 17% 94% 9 2 0.06 6% 100%

TOTAL 30 1.00 100% FUENTE: Departamento de Producción, Cía. X, S.A.

1.2.4 Frecuencias para datos agrupados.

Para una variable continua, o para aquellas variables cuyo rango sea exagerado, el procedimiento de ordenación es algo más complicado. Se debe establecer la elaboración de una tabla de datos agrupados, ya que si el número de la variable xi es muy extenso, sería poco práctico la elaboración de un tabular como el anterior.

1.2.4.1 Clases.

El primer paso consiste en establecer el número de clases que deberá tener la tabla, utilizando la ley de Sturges, que no es otra cosa más que una forma de seleccionar el número de clases que se utilizarán para la construcción de un histograma (es una metodología empleada con una frecuencia en los paquetes computacionales de estadística). Se establecen los límites de cada clase y se hace el cálculo de los n valores observados que pertenecen a dicha clase y que representa la frecuencia de clase correspondiente a dicho intervalo.

1.2.4.2 Límites de Clase.

Los límites de clase corresponden a los valores máximo y mínimo correspondientes a cada clase y que se denominan como el límite superior y el límite inferior respectivamente, estos valores delimitan los alcances de cada clase. Al agrupar los datos, se registrarán como un elemento más de la clase correspondiente, y la clase correspondiente, será aquella en la que el valor del dato esté dentro de los límites de alguna clase.

Page 22: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

29

1.2.4.3 Intervalos de Clase.

Se refiere al tamaño de la clase, se determina como la diferencia entre el límite superior y el límite inferior de cada clase, de manera convencional, los intervalos de clase para cada clase, son del mismo tamaño.

Page 23: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

30

1. A fin de estudiar la posibilidad de la aplicación de instrumentos de medición, para un lote de fabricación, el departamento de ensamblado desarrolló un estudio para una muestra tomada de forma aleatoria, en donde se registran los diámetros de algunas piezas. Los resultados se presentan a continuación:

60 116 82 80 116 76 77 83 92 85 116 104 87 95 81 102 94 74 95 66 93 100 113 82 91 114 67 78 95 82 99 84 113 95 85 106 99 98 89 90 111 93 75 87 94 112 98 97 98 109

Solución:

Calcula primeramente el número de clases utilizando la regla de Sturges 2 y después obtén el tamaño de clase dividiendo el rango entre el número de clases.

Aplica la ley de Sturges

C = 3.3 (log n)+ 1 C = 3.3 (log 50) + 1 = 6.60 ≈ 7

NOTA: n representa el total de datos.

Calcula el rango de los datos.

Rango = Máx. – Mín. Rango = 116 – 60 = 56

Nota: Cuando el rango sea mayor a 20 elabora la tabla de datos agrupados, sino realiza una tabla considerando a la variable de forma independiente.

2 Metodología empleada en la determinación del número de intervalos de clase en una distribución de frecuencias ideal.

Page 24: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

31

Calcula la amplitud de clases:

Se divide el rango entre el número de clases calculado a través de la ley de Sturges:

= − − − − − − − −− > 56 8 amplitud declase. 7

Se establecen los límites de cada clase.

Se inicia la primera clase con el número menor de los datos y se le va asignando la amplitud calculada, estableciéndose así la clase; la siguiente, inicia con el número inmediatamente posterior.

Nota: Cuando la variable tratada no sea continua, aunque la amplitud sea fraccionaria, se deberá redondear a fin de no complicar su elaboración.

Posteriormente se registran las frecuencias y se les da aplicación específica. A continuación se presenta la tabla de frecuencias relativas, de acuerdo a los diámetros de los instrumentos de medición.

Intervalo i f Frecuencia relativa.

i i

f fr n

=

60 ­ 68 3 0.06 69 ­ 77 4 0.08 78 ­ 86 10 0.20 87 ­ 95 14 0.28 96 ­ 104 9 0.18 105 ­ 113 6 0.12 114 ­ 122 4 0.08

∑ 50 1.00

Page 25: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

32

Algunas especificaciones del procedimiento son:

El número de clases depende de la cantidad de datos u observaciones y de la amplitud general.

Muchas observaciones ⇒ permiten un mayor número de clases.

Pocos datos ⇒ no conviene hacer muchas clases. Buscar un balance entre la necesidad de resumir la información y mantener suficientes detalles para apreciar las características de los datos.

Partir de la amplitud general y probar con diferente número de clases hasta alcanzar un número de clases y un intervalo adecuado (rango / # clases). Decidir si usar clases iguales o desiguales. El número de clases recomendable está asociado con la cantidad de datos.

Un intervalo o clase está determinado por dos números a y b de manera que todos los mayores o iguales que a y menores que b pertenecen a dicho intervalo. Se simboliza por (a, b), donde a y b son los límites del intervalo o clase.

La frecuencia absoluta (f) de un intervalo o clase es el número de datos que pertenecen al mismo.

Una característica de este tipo de tablas es:

La marca de clase de un intervalo, i Mc , es el punto medio del intervalo. Su cálculo nos lo da la expresión:

+ =

2 i a b Mc

Page 26: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

33

Límites reales de clase: Se obtienen sumando al límite superior de la clase el límite inferior de la clase contigua superior y dividiendo entre dos.

Retomando el ejemplo anterior

Intervalo Frecuencias

i f

Marca de

clase i Mc

Límite real de clase

i Li 60 ­ 68 3 64 68.5 69 ­ 77 4 73 77.5 78 ­ 86 10 82 86.5 87 ­ 95 14 91 95.5 96 ­ 104 9 100 104.5 105 ­ 113 6 109 113.5 114 ­ 122 4 118 122.5

∑ 50

Recomendaciones: Las clases deben ser exhaustivas y mutuamente excluyentes. Procurar que el número de clases oscile entre 5 y 10.

1.2.5 Distribución Acumulativa.

Como se había hecho mención con anterioridad un método gráfico, representa como ventaja el presentar de manera visual y de forma más clara la distribución de los datos. Existen varios tipos de gráficos, los cuales se encuentran clasificados, de acuerdo al tipo de variable y al fenómeno que pretenda explicar, esta clasificación se puede apreciar en el siguiente esquema:

Page 27: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

34

1.2.5.1 Métodos gráficos para variables de tipo cualitativo.

Este tipo de variables no son susceptibles de ser medidas en valores numéricos, indican calidad o cualidades: sexo, país de origen, religión, etc. Para este tipo de variables los métodos gráficos a utilizar son: Barras y Diagrama circular.

1.2.5.1.1 Gráfica de Barras.

La siguiente tabla muestra el país de procedencia de las importaciones de tecnología aplicada a la industria textil durante el año 2006.

PAÍS DE PROCEDENCIA

IMPORTACIONES (MILLONES DE DÓLARES.)

JAPÓN 123 450 CHINA 96 500 TAIWAN 63 450 COREA 32 600 INDIA 16 350

0 20000 40000 60000 80000

100000 120000 140000

Millon

es de Dólares

JAPÓN CHINA TAIWAN COREA INDIA

País

IMPORTACIONES

Page 28: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

35

1.2.5.1.2 Gráfica Circular.

La gráfica mostrada arriba con barras, se puede realizar en forma de una gráfica circular que también se conoce como de pay o de pastel:

IMPORTACIONES (MILLONES DE DÓLARES)

JAPÓN

CHINA

TAIWAN

COREA

INDIA

Page 29: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

36

1. La secretaría de salud realizó el registro de las vacunas aplicadas a menores de diez años durante el año 2006. Los datos se muestran a continuación y se requiere expresar de manera porcentual, cuál fue la vacuna más aplicada.

Solución:

Nótese que la variable sujeta a estudio es cualitativa, es decir, expresa una condición de calidad o característica específica. Para la elaboración de un diagrama circular o de pastel se llevan a cabo los siguientes pasos:

a) Se forma al dividir un círculo en sectores circulares de manera que: Cada sector circular equivale al porcentaje correspondiente al dato o grupo que representa.

b) La unión de los sectores circulares forma el círculo y la suma de sus porcentajes es 100. Se Calcula el número de grados que corresponde a cada sector, esto se logra aplicando una regla de tres simple:

Page 30: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

37

% → Grados 100% 360º

BCG 17% 61º

La unión de los sectores circulares forma el círculo y la suma de sus porcentajes es 100.

Page 31: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

38

1.2.5.2 Métodos gráficos para variables de tipo cuantitativo.

Para este tipo de variables los gráficos a utilizar son los histogramas y los polígonos de frecuencias.

1.2.5.2.1 Histogramas. La secretaría de salud realizó el registro de las vacunas

aplicadas a

Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de la variable, cuando la tabla sea de datos no agrupados. Cuando sean datos agrupados se representa el intervalo de clase.

Se emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los límites de los intervalos y el centro de cada intervalo es la marca de clase, que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.

El histograma se usa para representar variables cuantitativas continuas que han sido agrupadas en intervalos de clase, la desventaja que presenta es que no funciona para variables discretas, de lo contrario es una forma útil y práctica de mostrar los datos estadísticos.

Page 32: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

39

Para hacer un histograma seguimos los siguientes pasos:

Dividimos el rango de los datos n en intervalos o clases, que no se superpongan. Las clases deben ser excluyentes y exhaustivas. Tal y como se hizo en la tabla de datos. Contamos la cantidad de datos en cada intervalo o clase, es decir, la frecuencia. También podemos usar para cada intervalo la frecuencia relativa. Graficamos el histograma en un par de ejes coordenados representando en las abscisas los intervalos y sobre cada uno de ellos un rectángulo, cuya área es proporcional a la frecuencia relativa de dicho intervalo.

Page 33: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

40

1. Se tiene la siguiente tabla de datos agrupados.

Variable i x i f Marca de clase i Mc

Límite real de clase

i Li i fr i fra

60 ­ 68 3 64 68.5 0.06 0.06 69 ­ 77 4 73 77.5 0.08 0.14 78 ­ 86 10 82 86.5 0.20 0.34 87 ­ 95 14 91 95.5 0.28 0.62 96 ­ 104 9 100 104.5 0.18 0.80 105 ­ 113 6 109 113.5 0.12 0.92 114 ­ 122 4 118 122.5 0.08 1.00

Como resultado de la distribución de frecuencias y su grado de representatividad, se derivan los siguientes histogramas.

HISTOGRAMA DE FRECUENCIAS

0 2 4 6 8 10 12 14 16

1

CLASES O INTERVALOS

FRECUENCIAS

60 ­ 68 69 ­ 77 78 ­ 86 87 ­ 95 96 ­ 104 105 ­ 113 114 ­ 122

Page 34: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

41

HISTOGRAMA DE FRECUENCIAS RELATIVAS

0

0.1

0.2

0.3

60­68 69­77 78­86 87­95 96­104 105­113 114­122

Clases

Freecu

encias

Como resultado del histograma de frecuencias, la unión de marcas de clase (polígono de frecuencias), presentamos a continuación la distribución suavizada de los datos.

POLÍGONO DE FRECUENCIAS

0 0.05 0.1 0.15 0.2 0.25 0.3

60­68 69­77 78­86 87­95 96­104 105­113 114­122

Clase

Frecue

ncia

Page 35: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

42

2. Teniendo los datos de los minutos que llegan tarde 30 autobuses, calcula: a) Rango. b) Número de intervalos. c) Amplitud. d) Tabla de frecuencia. e) Marcas de clase. f) Histograma. g) Polígono de Frecuencias. h) Ojiva.

Datos en minutos: 10 15 3 5 15 19 15 19 7 8 13 5 5 5 15 7 5 6 9 8 5 5 12 2 19 6 7 12 5 12

a) Rango:

19 2 17 Max Min R V V = − = − =

b) Número de intervalos:

1 3.3log( ) k n = +

1 3.3log(30) 1 3.3(1.47) 1 4.85 5.85 k = + = + = + =

Como k, se encuentra entre 5 y 6 se toma 6

K = 6

c) Amplitud:

17 2.8 6

R A k

= = =

subiéndolo a 3

A= 3

Page 36: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

43

d)

Intervalos 2­5 5­8 8­11 11­14 14­17 17­20

Recorriendo media unidad anterior y los límites de los intervalos.

Intervalo Frecuencia

i f Frecuencia acumulada

i fa Frecuencia relative

i fr

Frecuencia relativa

acumulada

i fra

Marca de clase

i Mc

1.5­4.5 2 2 0.066 0.066 3

4.5­7.5 13 15 0.43 0.5 6

7.5­10.5 4 19 0.133 0.633 9

10.5­13.5 4 23 0.133 0.766 12

13.5­16.5 4 27 0.133 0.9 15

16.5­19.5 3 30 0.1 1 18

e)

Retardos de Autobuses

0

5

10

15

1.5­4.5 4.5­7.5 7.5­10.5 10.5­ 13.5

13.5­ 16.5

16.5­ 19.5

Marcas de clase

Tiem

po en minutos

Page 37: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

44

f)

Retardo de Autobuses

0 5 10 15

1.5­4.5 4.5­7.5 7.5­10.5 10.5­ 13.5

13.5­ 16.5

16.5­ 19.5

Marcas de clases

Tiem

po en min.

h)

Retardos de Autobuses

0 5 10 15 20 25 30 35

0 1.5­4.5 4.5­7.5 7.5­10.5 10.5­ 13.5

13.5­ 16.5

16.5­ 19.5

Marcas de Clase

Tiem

po en min.

Observaciones:

No existen criterios óptimos para elegir la cantidad de intervalos. En general, entre 8 y 15 intervalos deberían ser suficientes. Muchos o muy pocos intervalos puede ser poco informativo. Se busca un equilibrio entre un histograma muy irregular y uno demasiado suavizado.

No es necesario que todos los intervalos tengan la misma longitud, pero es recomendable que así sea. Esto facilita la lectura.

El histograma representa la frecuencia o la frecuencia relativa a través del área y no a través de la altura.

Page 38: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

45

1.2.5.2.2 Simetría o Sesgamiento.

Se manifiesta al trazar una vertical, en el diagrama de barras o histograma, de una variable. Cuando se transforma en eje de simetría. Decimos que la distribución es simétrica cuando la vertical divide el histograma de manera equivalente. En caso contrario, dicha distribución será asimétrica o diremos que presenta asimetría. Analizaremos las medidas de forma del histograma o

representación de datos, es decir, qué información nos aporta según la forma que tenga la disposición de datos. Las medidas de forma de una distribución se pueden clasificar en medidas de asimetría. Las cuales se presentan a continuación:

Page 39: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

46

El coeficiente de asimetría más preciso es el de Fisher, que se define por:

3

1

3 3

( ) n

i i i

x x f

n S

α

=

=

Según sea el valor de α3, diremos que la distribución es asimétrica a derechas o positiva; a izquierdas o negativa; o simétrica, o sea:

Si α 3 > 0 la distribución será asimétrica positiva o a derechas (desplazada hacia la derecha).

Si α 3 < 0 la distribución será asimétrica negativa o a izquierdas (desplazada hacia la izquierda).

Si α 3 = 0 la distribución puede ser simétrica; si la distribución es simétrica, entonces podremos afirmar que α3 = 0.

1.2.5.2.3 Ojivas de Frecuencia.

Las distribuciones de frecuencia acumulada y frecuencia relativa acumulada se presentan gráficamente con las ojivas de frecuencia acumulada y frecuencia relativa acumulada, que es una gráfica de segmentos de línea que une los puntos donde se cruzan los límites reales con las frecuencias acumuladas y relativas acumuladas de cada intervalo de clase.

Page 40: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

47

Page 41: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

48

2. Calcularás medidas de dispersión de un conjunto de datos, con base en el análisis de la información, para la solución de problemas.

1.3 Medidas de Tendencia Central. 1.3.1 Tendencia Central. 1.3.2 Medidas de Posición Central. 1.3.3 Tendencia Central para Datos Agrupados. 1.3.4 Medidas de Posición No Central. 1.3.5 Medidas de Variabilidad. 1.3.6 Coeficiente de variación.

Page 42: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

49

1.3 Medidas de tendencia central. 1.3.1 Tendencia central.

Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos.

Las medidas de posición son de dos tipos:

a) Medidas de posición central: informan sobre los valores medios de la serie de datos.

b) Medidas de posición no centrales: informan de cómo se distribuye el resto de los valores de la serie.

1.3.2 Medidas de posición central.

Las principales medidas de posición central son las siguientes:

1.3.2.1 Media.

Media: Es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas:

a. Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:

1 1 2 2 3 3 ( ) ( ) ( ) ... ( ) n n x f x f x f x f x n

+ + + + =

Propiedades:

1) Si sometemos a una variable estadística x, a un cambio de origen y escala y = a + bx, la media aritmética de dicha variable x, varía en la misma proporción.

y a bx = +

2) La suma de las desviaciones de los valores o datos de una variable x, respecto a su media aritmética es cero.

1

( ) 0 n

i i i

x x f =

− = ∑

Page 43: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

50

Ventajas e inconvenientes:

­ La media aritmética viene expresada en las mismas unidades que la variable. ­ En su cálculo intervienen todos los valores de la distribución. ­ Es el centro de gravedad de toda la distribución, representando a todos los valores observados.

­ Es única. ­ Su principal inconveniente es que se ve afectada por los valores extremadamente grandes o pequeños de la distribución.

b) Media geométrica: se eleva cada valor al número de veces que se ha repetido. Se multiplican estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra y “m” el número de resultados diferentes).

1 1 2

1 2 ( ... ) f f fm n n x x x x =

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica.

La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.

Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información.

Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

c) Media ponderada de un conjunto de números: es el resultado de multiplicar cada uno de los números por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuación la suma de estos productos, y dividiendo el resultado de esta suma de productos entre la suma de los pesos más la masa según la característica de cada número inicial. Este "peso" depende de la importancia o significancia de cada uno de los valores.

Page 44: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

51

Para una serie de datos

x = x1, x2, ..., xn

A la que corresponden los pesos

w = w1, w2,..., wn

La media ponderada se calcula como:

1

1

n

i i i n

i i

xw x

w

=

=

= ∑

La media es la medida de tendencia central más utilizada y se calcula de forma diferente para cada uno de los datos, es decir, si los datos sujetos a estudio son datos no agrupados su cálculo se resume a un promedio.

Page 45: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

52

1. La siguiente tabla muestra el número de artículos defectuosos que se detectaron en una línea de producción durante 30 días del mes de abril del 2006. Elabora la tabla de distribución de frecuencias respectiva.

4 5 4 5 6 7 6 5 4 7 8 7 8 6 7 5 6 8 7 9 8 7 4 6 7 8 9 4 6 7

190 6.33 30

i x x n

= = = ∑

O bien, puede calcularse a través de la ponderación, utilizando la misma tabla de datos:

FUENTE: Departamento de Producción, Cía. X, S.A.

6.3333 i i x f x

n = = ∑

Núm. artículos defectuosos

i x

Frecuencias

i f

Media

i i x f x

n = ∑

4 5 20 5 4 20 6 6 36 7 8 56 8 5 40 9 2 18

Total 30 ∑ 190

Page 46: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

53

2. Tres alumnos de estadística realizaron un estudio y obtuvieron los siguientes datos:

Alumno Entrevistas realizadas

i f Medias obtenidas

x

A 100 34 B 50 37 C 200 35

Obtén la media ponderada

Media Ponderada = i i

i

x f x

f = ∑

Media ponderada= ( ) ( ) ( ) 34 100 37 50 35 200 3400 1850 7000 12,250 35

100 50 200 350 350 + + + +

= = = + +

3. Un periódico contrata a 5 agencias para obtener los datos de las velocidades de los automóviles que pasan por la autopista México–Querétaro, obteniendo los siguientes datos:

Agencia i f i x

1 300 110 2 200 105 3 250 112 4 200 108 5 150 110

Obtén la Media Ponderada

( )( ) ( )( ) ( )( ) ( )( ) ( )( ) 110 300 105 200 112 250 108 200 110 150 300 200 250 200 150

33000 21000 28000 21600 16500 120,100 1100 1100

109.1818

x

x

x

+ + + + =

+ + + +

+ + + + = =

=

Page 47: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

54

4. En una escuela con 4 grupos de 5° semestre se obtuvieron los siguientes datos para calcular la media ponderada del plantel:

Grupo i f i x

A 35 7.7 B 29 8.3 C 41 7.9 D 36 8.6

( )( ) ( )( ) ( )( ) ( )( ) 7.7 35 8.3 29 7.9 41 8.6 36 35 29 41 36

269.5 240.7 323.9 309.6 1143.7 141 141

8.11

x

x

x

+ + + =

+ + +

+ + + = =

=

1.3.2.2 Mediana.

Mediana: Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).

No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

En el caso de datos no agrupados, su cálculo requiere de los siguientes pasos:

1) Ordena los datos de forma ascendente. 2) Identifica si la serie de datos es par o impar.

3) Si es par utiliza las siguientes fórmulas: 2

2 2

2

n n x x Md

+ + =

Si la serie fuera impar: 12 n Md x + =

4) El resultado de la fórmula será el valor de posición del o los datos que representen la mediana.

Page 48: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

55

4 5 4 5 6 7 6 5 4 7 8 7 8 6 7 5 6 8 7 9 8 7 4 6 7 8 9 4 6 7

Ordenando los datos:

4 4 4 4 4 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 9 9

Siendo la serie par: 30 32 2 2

Md y =

Md = 15 y 16

Se ubican los datos cuya posición sea: 6 y 7

Nota: Cuando los datos tienen un valor diferente, se promedian:

6 7 6.5 2

Md +

= =

Page 49: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

56

1.3.2.3 Moda.

Es el valor que más se repite en la muestra, y en consecuencia, en una distribución de frecuencias, es el valor de la variable que viene afectada por la máxima frecuencia de la distribución. En distribuciones no agrupadas por intervalos se observa la columna de las frecuencias absolutas, y el valor de la distribución al que corresponde la mayor frecuencia, será la moda. A veces aparecen distribuciones de variables con más de una moda (bimodales, trimodales, etc.), e incluso una distribución de frecuencias que presente una moda absoluta y una relativa.

En el caso del ejercicio anterior: Mo = 7

1.3.3 Tendencia central para datos agrupados.

Su cálculo requiere el uso de fórmulas que ubiquen perfectamente el valor de los datos:

Media: i i Mc f x

n = ∑ , siendo i Mc = marca de clase o punto medio.

Clases o intervalos

I

Frecuencia i f

Marca de clase i Mc

Media x

60­68 3 64 192 69­77 4 73 292 78­86 10 82 820 87­95 14 91 1274 96­104 9 100 900 105­113 6 109 654 114­122 4 118 472

50 ∑ 4,604 50 ∑ 92.08 x =

Page 50: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

57

Mediana: 2 i

i M d

n fa Md L I

f

− = +

Siendo:

i L = Límite inferior de clase.

i fa = Frecuencia acumulada anterior a la clase.

I = Intervalo de clase.

Md f = Frecuencia de la clase donde se encuentra la mediana.

Page 51: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

58

1. Determina la mediana y la moda para la siguiente distribución de datos:

Ubica la clase donde se encuentre la mediana: 50 25

2 2 n

= =

Elige la clase donde se encuentra la mediana, buscando en i fa que es la acumulación de frecuencias en tabla.

50 17 2 86.5 9 14

Md

− = +

91 .6 Md =

Intervalos Frecuencia

i f Frecuencia acumulada anterior a la clase

i fa

Límite inferior de clase

i L 60 ­ 68 3 3 59.5 69 ­ 77 4 7 68.5 78 ­ 86 10 17 77.5 87 ­ 95 14 31 86.5 96 ­ 104 9 40 95.5 105 ­ 113 6 46 104.5 114 ­ 122 4 50 113.5

Page 52: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

59

MODA: 1

1 2 o M Li I ∆ = + ∆ + ∆

Siendo: r1 Diferencia entre el dato más repetido y el anterior.

r2 Diferencia entre el dato más repetido y el siguiente.

Se ubica la clase con el dato más repetido

Aplica la fórmula:

MODA: 4 86.5 9

4 5 o M = + +

0 90.5 M =

Page 53: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

60

1.3.4 Medidas de posición no central.

1.3.4.1 Fractiles: cuartiles, deciles y percentiles.

Los fractiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de frecuencias. Los fractiles más conocidos son:

a) Cuartiles (Qi)

Son valores de la variable que dividen a la distribución en 4 partes, cada una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su izquierda el 50% de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75% de los datos. (Q2 =50%)

b) Deciles (Di)

Son los valores de la variable que dividen a la distribución en las partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 =50%)

c) Centiles o Percentiles (Pi)

Son los valores que dividen a la distribución en 100 partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles. (Q2 = D5 = P50 =50%)

Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición. El percentil es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra. Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de las puntuaciones.

El percentil α% de la distribución de los datos es el valor por debajo del cual se encuentran el α % de los datos en la muestra ordenada.

Page 54: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

61

Para calcularlo:

Ordenamos la muestra de menor a mayor.

Buscamos el dato que ocupa la posición ( ) 1 n fractil

α + (si este número no

es entero se promedian los dos adyacentes o se interpolan los dos adyacentes).

1. Tenemos 30 datos ordenados:

4 4 4 4 4 5 5 5 5 6 6 6 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 9 9

Se requiere el cálculo del tercer cuartil:

Datos: n=30 α=3 Fractil=cuartil=4

• Buscamos el dato de posición, utilizando: ( 1) 4 n α + = 3(30 1) 7.75

4 +

=

• Se ubica el dato 7ª y 8ª = cuyos valores son 5 y 5. • Se promedian = 5 • El valor cuartil es 5. • Se expresa: el 25 % de los datos van desde el valor 4, hasta el 5.

Busquemos ahora el percentil 80.

Datos: n=30 α=80 Fractil=percentil=100

• Buscamos el dato de posición, utilizando: ( 1) 100 n α + = 80(30 1) 24.8

100 +

=

• Se ubica el dato 24 y 25 = cuyos valores son 8 y 8. • Se promedian = 8 • El valor percentil es 8.

Se expresa: el 80 % de los datos van desde el valor 4, hasta el 8.

Page 55: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

62

En el caso de datos agrupados, es necesaria la utilización de fórmulas, para obtenerlos de manera precisa, ya que estos se encuentran ubicados mediante intervalos.

Retomando el ejemplo de datos agrupados:

Calculemos: Tercer Cuartil

Datos: n=50 α=3 Fractil=cuartil=4

• Se ubica el dato que representa el tercer cuartil ( 1) 4 n α + =

3(50 1) 38.25 4

+ =

• Se aplica la fórmula:

No fa Q Li I fq

− = +

3 38.25 31 95.5 9

9 Q

− = +

lo cual infiere o expresa el resultado:

3 102.74 Q =

Con el fin de estudiar la posibilidad de la utilización de instrumentos de medición, para un lote de fabricación, el departamento de ensamblado desarrolló un estudio a una muestra tomada de forma aleatoria, en donde se registran los

Intervalos Frecuencia

i f Frecuencia acumulada anterior a la clase

i fa

Límite inferior de clase

i Li 60­68 3 3 59.5 69­77 4 7 68.5 78­86 10 17 77.5 87­95 14 31 86.5 96­104 9 40 95.5 105­113 6 46 104.5 114­122 4 50 113.5

Page 56: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

63

diámetros de algunas piezas, donde el 75% de los instrumentos tienen diámetros que van desde el 60 y hasta el 102.74.

1.3.5 Medidas de variabilidad. Cálculo de varianza, desviación estándar y coeficiente de variación.

1.3.5.1 Medidas de dispersión: Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.

1.3.5.2 Varianza ( 2 s ): Mide la distancia existente entre los valores de la serie y la media al cuadrado. Se calcula como la suma de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor (frecuencia). La suma obtenida se divide por el tamaño de la muestra menos uno.

2

2 1

( )

1

n

i i i

f x x s

n =

− =

donde i f =frecuencia / i x =dato / x =media / n = número total de datos.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

1.3.5.3 Desviación estándar ( s ): Se calcula como raíz cuadrada de la varianza y es una medida de la distribución de los datos.

2

1

( )

1

n

i i i

f x x s

n =

− =

Page 57: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

64

1.3.6 Coeficiente de Variación.

Coeficiente de variación de Pearson (CV ): Se calcula como cociente entre la desviación típica y la media de la muestra.

100 s CV x

=

Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos.

Como medidas de variabilidad más importantes, conviene destacar algunas características de la varianza y de la desviación estándar: • Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy alejados de la media, el numerador de sus fórmulas será grande y la varianza y la desviación típica lo serán también.

• Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para reducir a la mitad la desviación típica, la muestra se tiene que multiplicar por 4.

• Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son iguales a 0.

• Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de valor será detectado.

Page 58: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

65

1. Para los datos mostrados en la siguiente tabla de distribución de frecuencias, determina: a) La desviación estándar.

b) El coeficiente de variación.

Intervalos Frecuencia

i f Marca de clase

i Mc i i Mc f 2 ( ) i i Mc x f −

60 ­ 68 3 64 192 2365.45 69 ­ 77 4 73 292 1456.18 78 ­ 86 10 82 820 1016.06 87 ­ 95 14 91 1274 16.32 96 ­ 104 9 100 900 564.53 105 ­ 113 6 109 654 1,717.71 114 ­ 122 4 118 472 2,687.38

∑= 50 ∑= 4,604 ∑= 9,823.68

a) Determinamos la media:

4,604 50

i i Mc f x

n = = ∑

92.08 x =

Calculamos ahora la varianza: 2

2 ( ) 9,823.68 50

i i Mc x f s

n

− = = ∑

2 196.47 s =

Una vez obtenida la varianza, la desviación estándar se calcula con la raíz cuadrada de la misma:

196.47 s =

14.01 s =

Page 59: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

66

b) Entonces el coeficiente de variación es:

100 s CV x

=

14.01 100 92.08

CV =

15.21% CV =

2. En una empresa se han producido 50, 55, 70, 65, 62, 75, 60, 55, 60, y 65 toneladas de producto, durante los últimos 10 meses. Calcula:

a) Media. b) Mediana. c) Moda. d) Decil 7.

Solución:

a) Media:

1 50 55 70 65 62 75 60 55 60 55 617 10 10

n

i i x

x n

= + + + + + + + + + = = =

61.7 x =

b) Mediana:

Como n es par y ordenando los datos de menor a mayor

10 10 1 1 2 2 2 2

2 2

n n X X X X Md

+ + + + = =

5 6 60 62 122 61 2 2 2

X X Md + +

= = = =

1 50 2 55 3 55 4 60 5 60 6 62 7 65 8 65 9 70 10 75

Page 60: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

67

c) Moda:

Los datos que más se repiten son:

55 = 2 ocasiones 60 = 2 ocasiones 65 = 2 ocasiones

Por lo que:

Mo= 55, 60, 65 siendo multimodal

d) Siendo par:

7 7(10) 7 10

D = =

El dato 7 es 65.

D7 = 65

3. Al medir el tiempo que tarda un balín en caer de cierta altura se registraron las siguientes mediciones en segundos:

3.8 3.6 4.2 3.6 3.7 4.1 3.9 4.4 4.0 4.1 3.7 4.3 4.1 3.8 3.9

Determina:

a) Media. b) Mediana. c) Moda. d) Varianza. e) Desviación Estándar. f) Coeficiente de variabilidad. g) Simetría. h) Sesgamiento.

Page 61: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

68

Solución: a) Media:

1

n

i i x

x n

= = ∑

3.8 3.6 4.2 4.5 3.7 4.1 3.9 4.4 4.0 4.1 3.7 4.3 4.1 3.8 3.9 60.1 15 15

x + + + + + + + + + + + + + + = =

4.00 x =

b) Mediana:

1 15 1 16 2 2 2 n Md x x x + +

= = =

8 Md x =

El dato 8 es = 3.9

Md= 3.9

c) Moda:

Mo. 4.1, por ser el dato que más se repite.

1. 3.6 2. 3.6 3. 3.7 4. 3.7 5. 3.8 6. 3.8 7. 3.9 8. 3.9 9. 4.0 10. 4.1 11. 4.1 12. 4.1 13. 4.2 14. 4.3 15. 4.4

Page 62: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

69

d) Varianza:

( ) ( ) ( ) ( ) ( ) 2

2 2 2 2 2 2 1

( ) 3.6 4 3.6 4 3.7 4 ... 4.3 4 4.4 4 1 15 1

n

i i

x x s

n =

− − + − + − + + − + −

= = − −

2 0.16 0.16 0.09 0.09 0.04 0.04 0.01 0.01 0 0.01 0.01 0.01 0.04 0.09 0.16 14

s + + + + + + + + + + + + + + =

2 0.5 0.036 14

s = =

e) Desviación estándar:

2 0.036 0.189 s s = = =

f) Coeficiente de variabilidad:

0.189 0.047 4

s CV x

= = =

g) Simetría: 3( ) 3(4 3.9) 3(0.1) 0.3

0.189 0.189 0.189 x Md AS s

− − = = = =

1.58 AS =

h) Sesgo: 4 x =

3.9 Md =

Como Md=3.9 se tiene sesgo nulo.

Page 63: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

70

4. La siguiente lista corresponde a la temperatura de un paciente tomada cada 30 minutos a partir de las 5 de la mañana:

37, 37.5, 38, 38, 38.5, 39, 38, 38.5, 37, 36, 37.5, 38, 37, 37.5, 37

Calcula: a) Media. b) Moda. c) Varianza. d) Desviación estándar. e) Coeficiente de Variabilidad.

Solución:

a) Media:

n= 15

37 37.5 38 38 38.5 39 38 38.5 37 36 37.5 38 37 37.5 37 15

x + + + + + + + + + + + + + + =

564.5 37.63 15

x = =

b) Moda:

La moda es 38 por ser el dato que más se repite.

c) Varianza:

( ) ( ) ( ) ( ) ( ) 2 2 2 2 2 2 37 37.63 37.5 37.63 38 37.63 ... 37.5 37.63 37 37.63

15 1 s

− + − + − + + − + − =

2 8.2335 0.5881 14

s = =

d) Desviación estándar:

2 0.5881 0.7668 s s = = =

e) Coeficiente de variabilidad:

Page 64: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

71

0.7668 0.02 37.63

s CV x

= = =

5. Considerando los datos agrupados en la siguiente tabla: Intervalo Marca de Clase

i Mc Frecuencia

i f Frecuencia acumulada

i fa 17.5 – 20.5 19 2 2 20.5 – 23.5 22 6 8 23.5 – 26.5 25 14 22 26.5 _ 29.5 28 5 27 29.5 – 32.5 31 3 30

Determina:

a) Media. b) Mediana. c) Moda. d) Varianza. e) Desviación estándar. f) Coeficiente de Variabilidad.

Page 65: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

72

Solución:

a) i i

f Mc x

n = ∑

(12 19) (6 22) (14 25) (5 28) (3 31) 30

x x x x x x + + + + =

38 132 350 140 93 753 30 30

x + + + + = =

25.1 x =

b) Mediana

Md = Li clase Mediana + ) 2 i

i

n fa Anterior clase mediana A

f Clase mediana

Para la clase mediana 30 15

2 2 n

= =

El dato 15 se encuentra en la clase 23.5­ 26.5

30 8 2 23.5 3 14

Md x − = +

15 8 7 23.5 3 23.5 3 14 4

Md − = + = +

( ) 23.5 0.5 3 23.5 1.5 Md = + = +

25 Md =

Page 66: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

73

c) Clase modal:

Clase Mo = Li Clase modal + 1

2 1

d A d d

+

1 d = 3 f clase modal – 2 f clase anterior

2 d = 3 f clase modal – 4 f clase siguiente

El intervalo con mayor frecuencia es: 23.5 – 26.5

1 d = 14 – 6 = 8

2 d = 14 – 5 = 9

3 3 8 8 23.5 23.5

8 9 17 Mo x x = + = + +

23.5 (0.47)3 23.5 1.41 24.91 Mo = + = + =

24.91 Mo =

d) Varianza

Para varianza agregamos columnas en la tabla de datos:

Intervalo Marca de clase

i Mc

Frecuencia

i f Frecuencia acumulada

i fa

i Mc x − 2 ( ) i Mc x − 2 ( ) i i Mc x f −

17.5 – 20.5 19 2 2 ­6.1 37.21 74.42 20.5­23.5 22 6 8 ­3.1 9.61 57.66 23.5­26.5 25 14 22 ­0.1 0.01 0.14 26.5­29.5 28 5 27 2.9 8.41 42.05 29.5­32.5 31 3 30 5.9 34.81 104.43

( ) 2 2 1 278.7 278.7 1 30 1 29

n i i i

Mc x f s

n =

− = = =

− − ∑

2 9.61 s =

Page 67: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

74

e) 2 9,61 s s = =

3.1 s = f)

3.1 25.1

s CV x

= =

0.1235 CV =

6. De la tabla de frecuencias siguiente obtén: a) Media. b) Mediana. c) Moda. d) Varianza. e) Desviación estándar. f) Coeficiente de Variabilidad.

Intervalo Marca de clase i Mc

Frecuencia

i f Frecuencia acumulada

i fa 15 – 19 17 2 2 19 – 23 21 3 5 23 – 27 25 17 22 27 _ 31 29 14 36 31 – 35 33 8 44 35 – 39 37 6 50

a) Media:

( ) ( ) ( ) ( ) ( ) ( ) 2 17 3 21 17 25 14 29 8 33 6 37 50

x x x x x x x

+ + + + + =

34 63 425 406 264 222 1414 50 50

x + + + + + = =

28.28 x =

Page 68: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

75

b) Mediana:

50 25 2 2 n

= =

El dato 25 se encuentra en el inter: 27­31

31 27 4 A Ls Li = − = − =

50 22 25 22 2 27 4 27 4 14 14

Md − − = + = +

3 27 4 27 0.214 4 27 0.857 14

Md = + = + • = +

27.857 Md =

c) Moda: La clase con mayor frecuencia es 23­27

1 d = 17 – 3= 14

2 d = 17­14 = 3

14 14 23 4 23 4 14 3 17

Mo = + = + +

( ) 23 0.82 4 23 3.294 Mo = + = +

26.294 Mo =

Page 69: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

76

d) Varianza: Para la varianza agregamos columnas en tabla de datos

Intervalo Marca de clase i Mc

Frecuencia

i f i Mc x − 2 ( ) i Mc x − 2 ( ) i i Mc x f −

15 – 19 17 2 ­11.28 127.238. 254.476 19 – 23 21 3 ­7.28 52.998 158.994 23 – 27 25 17 ­3.28 10.758 182.886 27 – 31 29 14 0.72 0.518 7.252 31 – 35 33 8 4.72 22.278 178.224 35 – 39 37 6 8.72 76.038 456.228

( ) 2 2 1 1238.06 1238.06 1 50 1 49

n i i i

Mc x f s

n =

− = = =

− − ∑

2 25.26 s =

e) Desviación estándar: 2 25.26 s s = =

5.026 s =

f) Coeficiente de variabilidad: 5.026 28.28

s CV x

= =

0.177 CV =

Page 70: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

77

1. Organización y Tratamiento de Datos Estadísticos. Imagina que hemos preguntado a un conjunto de N personas su opinión con respecto a la subvención que el gobierno de una capital ha concedido para la remodelación de una colonia. Las N respuestas se encuentran en una escala que va del 1 al 9, donde 1 representa un total desacuerdo con la subvención, mientras que 9, un acuerdo total. El resultado de la medición es el siguiente:

7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4 8 4 3 4 3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2

6 3 4 2 4 1 3 6 3 1 2 4 4 6 2 4 7 4 2 4 6 4 4 6 7 5 8 5 7 6 5 6 5 7 5 6 4 5 4 1 6 5 6 5 5 5 4 5 5 6 5 4 4 3 5 5 9 4 3 6 5 7 3 2 4 4 7 4 2 1 8 2 7 4 5 5 7 5 5 1 5 8 5 6 7 6 6 7 7 5 2 5

6 5 8 5 3 6 5 5

i. Organiza los datos. ii. Elabora una tabla de frecuencias. iii. Responde las siguientes preguntas:

a) ¿Cuántas personas fueron encuestadas? b) ¿Cuál fue la respuesta más frecuente? (Moda) c) ¿Cuántas personas tienen, como máximo, una actitud de cuatro

puntos en la escala (es decir, cuántas personas se encuentran en desacuerdo con la subvención)?

d) Exprésalo en términos porcentuales. e) ¿Cuál fue la opinión del 75% de las personas encuestadas?

Page 71: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

78

Solución:

i. Para organizar los datos se elabora la tabla de frecuencias de datos no agrupados, ya que el rango que presentan los mismos es de 9 unidades, lo que permite estudiar la variable de forma individual.

ii. Opinión

i x Frecuencia

i f Frecuencia acumulada

i fa

Frecuencia relativa

i fr

Frecuencia relative porcentual

%

Frecuencia relative acumulada

i fra

1 6 6 0.0413 4.13% 4.13%

2 11 17 0.0758 7.56 11.69

3 11 28 0.0758 7.56 19.25

4 30 58 0.2068 20.70 39.95

5 38 96 0.262 26.20 66.15

6 23 119 0.1586 15.86 82.01

7 14 133 0.0965 9.66 91.67

8 9 142 0.062 6.20 97.87

9 3 145 0.0206 2.07 99.9

iii. a) 145 b) 5 c) 58 personas d) 39.95%

Page 72: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

79

e) En este caso se trata del cálculo del tercer cuartil:

3 3 3(145) 435 108.75 4 4 4 n Q = = = =

Se ubica el dato 108 y 109 y se interpolan sus respectivos valores: Los dos corresponden al valor de 6 en Xi. Por lo que el 75% de la muestra tiene una opinión que va del 1 y hasta el 6 de calificación en el desacuerdo.

2. Población tangible o conceptual. Defina la población y diga si es tangible o conceptual. Se recibe un cargamento de tornillos de un distribuidor. Para verificar si la remesa es aceptable con respecto a la fuerza de corte, un ingeniero selecciona 10 tornillos, uno por uno, del recipiente para probarlos.

Solución: Tangible.

3. Verdadero o falso. a) Una muestra aleatoria simple es garantía de que refleja exactamente a la

población de la que se extrajo.

Solución: Falso.

b) Una muestra aleatoria simple está libre de cualquier tendencia sistemática en diferir de la población de la que se extrajo.

Solución: Verdadero.

Page 73: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

80

4. Media aritmética. De entre 100 números, 20 son cuatros, 40 son cincos, 30 son seises y los restantes sietes. Determina la media aritmética.

R.

i x i f i i x f

4 20 80

5 40 200

6 30 180

7 10 70

530 5.30

100 x = = ∑

5. Medidas de tendencia central. Si se desea obtener una indicación acerca de lo bien que ha estado bateando un jugador, ¿qué medida de tendencia central se debe observar?

Solución:

La media de bateo.

6. Completa el siguiente enunciado: La mediana es aquel punto bajo el cual______________________________

Solución:

La serie de datos se distribuye en un 50% de datos menores a la mediana y un 50% de datos mayores a ésta.

Page 74: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

81

7. Varianza. Un hombre midió cuatro pizarrones y los resultados fueron 2, 2, 3 y 5 metros de longitud. Calcula la varianza de las longitudes.

Solución: 2 1.5 s =

Page 75: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

82

8. De la siguiente serie de datos calcula: a) La Media. b) La Mediana. c) La Moda. d) La Varianza. e) La Desviación estándar. f) El Coeficiente de variabilidad.

12 17 17 18 19 11 16 14 17 16 15 14 18 13 17

Solución: a) 15.6 b) 8 c) 17 d) 5.5 e) 2.34 f) 0.15

9. De los siguientes datos obtén: a) La Media. b) La Mediana. c) La Moda.

69 73 82 83 90 64 76 59 77 86 90 84 83 88 81 95 83 92 91 83

Solución:

a) 81.45 b) 83 c) 83

Page 76: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

83

10. De los siguientes datos agrupados obtenidos de las edades de los asistentes a un curso se obtuvieron los siguientes resultados

Intervalo Frecuencia

i f 23 ­ 27 11 28 – 32 19 33 – 37 23 38 – 42 22 43 – 47 14 48 – 52 7 53 – 57 4

Calcula:

a) La media. b) La mediana. c) La moda.

Solución:

a) 37.3 b) 31.91 c) 37

Page 77: Estadística descriptiva. - · PDF fileLa estadística descriptiva es una rama de las matemáticas que se encarga d e la recolección ... obtienen en cualquier momento de un proceso.

84

11. Al obtener los resultados de la calificación de los exámenes de matemáticas se apreciaron los siguientes datos agrupados:

Intervalos Frecuencia

i f 4.05 ­ 5.05 4 5.05 ­ 6.05 6 6.05 ­ 7.05 12 7.05 ­ 8.05 16 8.05 ­ 9.05 8 9.05 ­ 10.05 4

Calcula: a) La Media. b) La mediana. c) La moda. d) La Varianza. e) La desviación estándar. f) El coeficiente de variabilidad.

Solución:

a) 7.15 b) 7.18 c) 7.33 d) 1.79 e) 1.33 f) 0.187