Medidas de tendencia central, desviación y varianza.

5
EVIDENCIA DE APRENDIZAJE: CONCLUSIONES Engelbert Isaac Balderas Gloria Es162003115 Estadística Básica Semestre 2016-2-B1 Prof. Héctor Hernández Ramírez 18/09/2016.

Transcript of Medidas de tendencia central, desviación y varianza.

Page 1: Medidas de tendencia central, desviación y varianza.

EVIDENCIA DE APRENDIZAJE:

CONCLUSIONES

Engelbert Isaac Balderas Gloria

Es162003115

Estadística Básica

Semestre 2016-2-B1

Prof. Héctor Hernández Ramírez

18/09/2016.

Page 2: Medidas de tendencia central, desviación y varianza.

1. A partir de la base de datos (Población) completa la tabla de distribución de frecuencias por intervalos de la

población para determinar lo que se pide en los demás puntos.

Periodo Dato Periodo Dato Periodo Dato

2005/01 3,95 2008/07 4,13 2012/01 4,88

2005/02 3,77 2008/08 4,06 2012/02 5,28

2005/03 3,63 2008/09 4,14 2012/03 4,52

2005/04 3,36 2008/10 4,17 2012/04 4,86

2005/05 3,30 2008/11 4,32 2012/05 4,67

2005/06 3,48 2008/12 4,02 2012/06 4,75

2005/07 3,92 2009/01 5,01 2012/07 4,99

2005/08 3,67 2009/02 5,24 2012/08 5,33

2005/09 3,58 2009/03 4,66 2012/09 4,91

2005/10 3,39 2009/04 5,06 2012/10 5,03

2005/11 2,94 2009/05 5,23 2012/11 5,05

2005/12 2,77 2009/06 4,98 2012/12 4,40

2006/01 3,48 2009/07 5,82 2013/01 5,41

2006/02 3,75 2009/08 6,15 2013/02 4,75

2006/03 3,31 2009/09 6,42 2013/03 4,48

2006/04 3,20 2009/10 5,67 2013/04 4,96

2006/05 2,84 2009/11 5,11 2013/05 4,91

2006/06 3,26 2009/12 4,73 2013/06 5,00

2006/07 4,01 2010/01 5,76 2013/07 5,13

2006/08 3,87 2010/02 5,28 2013/08 5,18

2006/09 4,00 2010/03 4,74 2013/09 5,31

2006/10 3,82 2010/04 5,35 2013/10 5,01

2006/11 3,50 2010/05 5,00 2013/11 4,48

2006/12 3,32 2010/06 4,92 2013/12 4,27

2007/01 4,05 2010/07 5,59 2014/01 5,07

2007/02 4,05 2010/08 5,42 2014/02 4,66

2007/03 3,73 2010/09 5,66 2014/03 4,80

2007/04 3,51 2010/10 5,48 2014/04 4,85

2007/05 3,15 2010/11 5,17 2014/05 4,94

2007/06 3,28 2010/12 4,94 2014/06 4,82

2007/07 3,79 2011/01 5,34 2014/07 5,47

2007/08 3,83 2011/02 5,34 2014/08 5,19

2007/09 3,76 2011/03 4,64 2014/09 5,09

2007/10 3,77 2011/04 5,13 2014/10 4,78

2007/11 3,35 2011/05 5,18 2014/11 4,53

2007/12 3,11 2011/06 5,40 2014/12 3,76

2008/01 4,12 2011/07 5,48 2015/01 4,51

2008/02 3,89 2011/08 5,71 2015/02 4,33

2008/03 3,61 2011/09 5,43 2015/03 3,86

2008/04 3,48 2011/10 4,99 2015/04 4,31

2008/05 3,29 2011/11 4,96 2015/05 4,45

2008/06 3,37 2011/12 4,51

Población desocupada

Ruta temática Ocupación, empleo y remuneraciones> Tasas de ocupación, desocupación y subocupación (resultados mensuales de la ENOE, 15 años y más)> Nacional> Población total>

Población económicamente activa> Población desocupada

Periodicidad Mensual

Unidad de medida Porcentaje

Fuente INEGI. Encuesta Nacional de Ocupación y Empleo.

Cifras preliminares 2005/01

Nota En virtud de la reciente reforma constitucional que elevó la edad legal mínima para trabajar de los 14 a los 15 años, las cifras aquí contenidas corresponden al universo de las personas

de 15 años de edad en adelante y, por lo tanto, las series anteriores cuya cobertura era la población de 14 años y más, ya no serán actualizadas.

Fecha inicial 2015/05

Fecha final 2005/01

Última actualización 2015/06/26

No de clases

Intervalo tasa de

desempleo

Frecuencia (f)

Marca de clase

(Mc) Mc*f Fa (Mc-µ) (Mc-µ)² f*(Mc-µ)²

1 2,3 2,8 1

2 2,9 3,4 15

3 3,5 4 24

4 4,1 4,6 21

5 4,7 5,2 40

6 5,3 5,8 21

7 5,9 6,4 2

8 6,5 7 1

Totales 125

Dónde: Fa = frecuencia acumulada; µ = Media Aritmética

Page 3: Medidas de tendencia central, desviación y varianza.

Tabla de Frecuencias

No de clases

Intervalo tasa de desempleo

Frecuencia (f)

Marca de clase (Mc)

Mc*f Fa (Mc-µ) (Mc-µ)² f*(Mc-µ)²

1 2.3 2.8 1 2.55 2.55 1 -1.968 3.8730 3.87

2 2.9 3.4 15 3.15 47.25 16 -1.368 1.8714 28.07

3 3.5 4 24 3.75 90.0 40 -0.768 0.5898 14.16

4 4.1 4.6 21 4.35 91.35 61 -0.168 0.0282 0.59

5 4.7 5.2 40 4.95 198.0 101 0.432 0.1866 7.46

6 5.3 5.8 21 5.55 116.55 122 1.032 1.0650 22.37

7 5.9 6.4 2 6.15 12.3 124 1.632 2.6634 5.33

8 6.5 7 1 6.75 6.75 125 2.232 4.9818 4.98

Totales 125 564.75 86.83

Media 4.518

2. A partir de la tabla elabora un histograma de frecuencias y una ojiva de frecuencias acumuladas que

describan el comportamiento de los datos.

Histograma de Frecuencias.

Ojiva de Frecuencias Acumuladas.

3. Calcula las medidas de tendencia central de los datos, la moda, la mediana y la media de la población.

Media.

Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango establecido entre un límite

inferior y un límite superior. Recuerda que las tablas de intervalos muestran el número de datos que abarca cada

intervalo (frecuencia por intervalo).

1

15

2421

40

21

2 1

0

5

10

15

20

25

30

35

40

45

2.3-2.8 2.9-3.4 3.5-4.0 4.1-4.6 4.7-5.2 5.3-5.8 5.9-6.4 6.5-7.0

Frec

uen

cias

Intervalos

Histograma de Frecuencias

1

40

61

101

122 124 125

0

20

40

60

80

100

120

140

2.55 3.75 4.35 4.95 5.55 6.15 6.75

Fre

cue

nci

a A

cum

ula

da

Marca de Clase

Ojiva de Frecuencias Acumuladas

Page 4: Medidas de tendencia central, desviación y varianza.

Población

𝜇 =∑ 𝑀𝑐𝑖𝑓𝑖

𝒩𝑖=1

𝒩

𝜇 =564.75

125 𝜇 = 4.518

Mediana.

Cuando se quiere calcular la mediana en datos agrupados por intervalos se tiene que buscar el intervalo donde la

frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el

intervalo donde se encuentre 𝑁

2, para lo cual se utiliza la siguiente fórmula:

𝑴𝒆 = 𝑳𝒊 +

𝑵𝟐

− 𝑭𝒊−𝟏

𝒇𝒊− 𝒂𝒊

Tabla de Frecuencias

No de clases

Intervalo tasa de desempleo

Frecuencia (f)

Marca de clase (Mc)

Mc*f Fa (Mc-µ) (Mc-µ)² f*(Mc-µ)²

1 2.3 2.8 1 2.55 2.55 1 -1.968 3.8730 3.87

2 2.9 3.4 15 3.15 47.25 16 -1.368 1.8714 28.07

3 3.5 4 24 3.75 90.0 40 -0.768 0.5898 14.16

4 4.1 4.6 21 4.35 91.35 61 -0.168 0.0282 0.59

5 4.7 5.2 40 4.95 198.0 101 0.432 0.1866 7.46

6 5.3 5.8 21 5.55 116.55 122 1.032 1.0650 22.37

7 5.9 6.4 2 6.15 12.3 124 1.632 2.6634 5.33

8 6.5 7 1 6.75 6.75 125 2.232 4.9818 4.98

Totales 125 564.75 86.83

Media 4.518

Sustituyendo.

𝑴𝒆 = 𝟒. 𝟕 +

𝟏𝟐𝟓𝟐

− 𝟔𝟏

𝟒𝟎• (. 𝟓)

Me = 4.72

Moda.

La moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta es mayor, y se denota

como Mo. Algunas veces el valor que más se repite puede no ser único, es decir, puede haber dos o más datos que

aparezcan con la misma frecuencia absoluta, siendo ésta la mayor. En esas ocasiones se habla de poblaciones o

muestras bimodales cuando existen dos modas o multimodales si existen más de dos.

Cuando la distribución de datos es por intervalos de clase, primero se localiza el intervalo que tiene mayor frecuencia

absoluta y se utiliza la siguiente fórmula para calcular la moda:

𝑴𝒐 = 𝑳𝒊 +𝒇𝒊 − 𝒇𝒊−𝟏

(𝒇𝒊 − 𝒇𝒊−𝟏) + (𝒇𝒊 − 𝒇𝒊+𝟏)• 𝒂𝒊

Sustituyendo.

𝑴𝒐 = 𝟒. 𝟕 +𝟒𝟎 − 𝟐𝟏

(𝟒𝟎 − 𝟐𝟏) + (𝟒𝟎 − 𝟐𝟏)• (. 𝟓)

𝑴𝒐 = 𝟒. 𝟗𝟓

Page 5: Medidas de tendencia central, desviación y varianza.

4. Calcula las medidas de dispersión de los datos, la varianza y la desviación estándar de la población.

Varianza.

Las fórmulas para calcular la varianza en datos agrupados por intervalos son las siguientes:

En una Población

𝜎2 = ∑ 𝑓𝑖(𝑀𝑐𝑖 − 𝜇)2𝑵

𝑖=1

𝑁

En este caso se realiza la sumatoria de cada marca de clase menos la media (ya sea poblacional o muestral, según

sea el caso) y se eleva al cuadrado, al final se divide entre la población o bien la muestra, según se trate.

𝜎2 = 86.83

125= 𝟎. 𝟔𝟗𝟓

Desviación Típica o estándar.

En una población

𝜎 = √𝜎2 = √∑ 𝑓𝑖(𝑀𝑐𝑖−𝜇)2𝑛

𝑖=1

𝑁

𝜎 = √𝜎2= √0.695

𝜎 = 0.834