Estadistica 2. distribucion de frecuencias

25
Ing. Edward Ropero Magister en Gestión, Aplicación y Desarrollo de Software

Transcript of Estadistica 2. distribucion de frecuencias

Ing. Edward Ropero Magister en Gestión,

Aplicación y Desarrollo de Software

La distribución de frecuencias, es un método utilizado para organizar y resumir información. Bajo este método, los datos recolectados se ordenan y clasifican, indicándonos la frecuencia o sea el número de veces que se repiten.

Población o universo, se entiende como un conjunto de medidas para ser aplicadas a una característica cuantitativa, o como el recuento de todas las unidades que presentan una característica común, siendo ésta cualitativa.

También se puede definir a la población como un conjunto de elementos o unidades. Lo que se estudia en una unidad o elemento son sus características

Muestra, para que sea representativa de la población, requiere que las unidades o elementos sean seleccionadas al azar, en tal forma que cada una de ellas tenga la misma posibilidad de ser seleccionada.

Los caracteres de los elementos de una población pueden ser cualitativos o cuantitativos, Los datos cualitativos, denominados también atributos, son todos aquellos elementos que pueden ser descritos cualitativamente, es decir mediante palabras; son ejemplos de atributos: la clasificación de los alumnos de una universidad por lugar de origen; clasificación de un grupo de personas por ocupación, por cargo, por sexo, etc.

Los caracteres cuantitativos denominados variables, son todas aquellas características susceptibles de ser expresadas cuantitativamente, es decir, mediante números. Ejemplo: peso, estatura, edad, número de hijos, salarios, etc.

Las variables se dividen en discretas y continuas. Es de tener en cuenta que esta clasificación tiene más valor teórico que práctico

Las variables discretas son aquéllas que admiten solamente valores enteros, es decir, no tienen valores intermedios. Ejemplo: el número de hijos por familia será discreta, ya que no se podrá decir que una familia tiene dos hijos y medio; el número de empleados por departamento en una empresa, etc.

Las variables continuas son aquéllas que admiten valores fraccionarios, pudiéndose establecer intervalos. Ejemplo: la estatura de una persona que mide un metro con setenta centímetros; que pesa sesenta kilos, una libra y cuatro onzas, etc.

Variables Estadísticas

Ejemplo: Supongamos que se tiene una población constituida por 2000 cajas y

deseamos examinarlas con el fin de determinar el número de piezas o elementos defectuosos que contiene cada caja. Por diferentes razones, se desea que la investigación no sea exhaustiva, es decir, no examinar la totalidad de las 2000 cajas o universo sino, por el contrario, seleccionar una muestra de tamaño 30, correspondiente a una investigación parcial.

N = 2000 n = 30

Tabulación Distribución de Frecuencias Variable Discreta

Número de Piezas

Número de Cajas

0 4

1 5

2 7

3 8

4 6

Σ 30

yi ni hi Ni Hi

0 4 0,13 4 0,13

1 5 0,17 9 0,30

2 7 0,23 16 0,53

3 8 0,27 24 0,80

4 6 0,20 30 1,00

Σ 30 1,00 - -

Xi fi fi/n Fi Hi

Con la información del ejemplo anterior determinar los valores que toma:

y3 = ? N2 = ? n5 = ? H3 = ? h4 = ? X16 = ?

Ejemplo: Consideremos que se seleccionó una muestra de 30 alumnos, a fin de conocer su peso en kilos; para facilitar el trabajo redondeamos las cifras.

Xmax= 94 Xmin= 47

m = número de intervalos y C = amplitud del intervalo

m = 1 + 3,3 log n m = 1 + 3,3 log 30 m = 5,6 ≅ 6

El número de intervalos se puede calcular de modo arbitrario, que sea mayor o igual a cinco, y menor o igual a 16; o con la siguiente fórmula:

La amplitud por otra parte depende del rango y los intervalos determinados anteriormente:

C = Rango/m C = 47 / 6 C = 7,83 ≅ 8

Siempre se aproxima el rango al valor siguiente

Distribución de Frecuencias - Variable Discreta

y´i-1 - y´i ni hi Ni Hi yi

46,1 - 54 3 0,10 3 0,10 50

54,1 – 62 6 0,20 9 0,30 58

62,1 – 70 8 0,27 17 0,57 66

70,1 – 78 6 0,20 23 0,77 74

78,1 – 86 4 0,13 27 0,90 82

86,1 - 94 3 0,10 30 1,00 92

Σ 30 1,00 - - -

X´i-1 - X´i fi fi/n Fi Hi Xi

Las marcas de clase se obtienen promediando el intervalo

Con la información del ejemplo anterior determinar los valores que toma:

N3 = ? X13 = ? n1 = ? h5 = ? H2 = ? y4 = ?

Ejemplo: En los ejemplos siguientes señalar con una A las series constituidas por datos cualitativos (atributos) y con una V los datos cuantitativos (variables).

1. Distribución de alumnos por mes de nacimiento (A)

2. Distribución de alumnos por nacionalidad (A)

3. Distribución de profesionales por estatura y peso. (V)

4. Distribución de oficiales por sueldo. (V)

5. Distribución de accidentes por causa. (A)

Ejemplo: Señale con C las series de variable continua y con D las de variable discreta.

1. Distribución de obreros por salarios (C)

2. Distribución de fallecimientos por edades (C)

3. Distribución de alumnos por número de hermanos (D)

4. Distribución de alumnos por estatura (C)

Diagramas de frecuencias. Son muy utilizados para representar las frecuencias absolutas y relativas, incluyendo las acumuladas que ocurren con respecto a una variable aleatoria discreta. Se representan por líneas delgadas ya sean verticales u horizontales, colocando las frecuencias

Histograma. Son diagramas de frecuencias unidimensionales, en los cuales se levantan rectángulos de áreas, proporcionales a las frecuencias de clases sobre los intervalos del eje horizontal, por lo tanto es utilizado para representar a la variable continua, cuando la amplitud es constante.

Histograma.

𝐴𝑙𝑡𝑢𝑟𝑎 = 𝑛𝑖/𝑐𝑖

Histograma.

Ojiva. La representación gráfica para las frecuencias absolutas y relativas acumuladas en una variable continua se hace a través de una ojiva ascendente. Para ello se determinan los puntos de intersección entre cada valor de la variable y su respectiva frecuencia; luego se unen con trazos rectilíneos. Prácticamente es un polígono de frecuencias, con la diferencia de ser aplicado a una tabla de frecuencias absolutas acumuladas.

Polígono de frecuencias. En la variable continua es bastante utilizado este diagrama, fijando puntos, utilizando las marcas de clase y las frecuencias, luego se unen dando una línea quebrada. Si en el histograma de frecuencias unimos los puntos medios en la parte superior de cada rectángulo, obtenemos el polígono de frecuencias

Diagramas de puntos

Diagramas de tallo y hojas

Diagramas de Pareto