Manual Estadística I Parte 2015

download Manual Estadística I Parte 2015

of 39

description

aaaaaa

Transcript of Manual Estadística I Parte 2015

PRACTICA N 1

Estadstica Descriptiva Dr. Vctor Pastor Talledo

PARTE 1

FUNDAMENTOS DE ESTADSTICACAPITULO I

CONCEPTOS BSICOS1.1. Qu es la Estadstica?

Es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos para ayudar en una toma de decisiones ms efectiva.

Para realizar esto, la Estadstica toma en cuenta las siguientes acciones:

Coleccin y recoleccin de datos

Ordenamiento de datos

Clasificacin de datos

Presentacin numrica

Presentacin grfica

Clculo de estadgrafos

Relacin entre dos o ms variables

Proyeccin de datos

Anlisis e interpretacin de datos

1.2 Definicin de trminos estadsticos

1. Estadgrafo. Es cualquier funcin de datos empricos que se usa con fines descriptivos o analticos; son MEDIDAS DE RESUMEN ESTADSTICO de un conjunto de datos. Por ejemplo: la media aritmtica, la mediana, la varianza, el coeficiente de correlacin, etc.

2. Parmetro. Es el valor obtenido para describir en forma resumida las caractersticas pertinentes o ms importantes acerca de la poblacin. Una poblacin puede tener muchas caractersticas y por lo tanto muchos parmetros

Los parmetros son las MEDIDAS RESUMEN DE UNA POBLACIN, en tanto que las medidas de una muestra se llaman estadgrafos.

3.Poblacin. Conjunto finito o infinito de elementos o datos que presentan una caracterstica particular a ser analizada o estudiada. La poblacin se presenta con la letra N. Ejemplos:

La poblacin formada por todos los alumnos del instituto (poblacin finita o numerables)

Todas las veces que aparece un tres (3) al tirar un dado.

4. Muestra. PARTE REPRESENTATIVA que se toma de una poblacin con el fin de investigar sus caractersticas.

La muestra se representa con la letra n.

5. Variable.Es toda la caracterstica sujeta a medida, cuenta o calificacin.

DATOQUE SUFRE VARIACIN dentro de una escala o recorrido.

Las variables pueden ser cuantitativas o cualitativas.

a. Variable Cuantitativa.-

Se DESCRIBE MEDIANTE NMEROS. Los valores que pueden ser ordenados y medidos. Esta variable a su vez se clasifica en:

DISCRETA:

Cuando toma VALORES ENTEROS, o es susceptible de contar.

Generalmente se representa con X.

CONTINUA:

Toma VALORES FRACCIONADOS o es susceptible de medir generalmente se representa con X.

b. Variable Cualitativa

Se expresa MEDIANTE PALABRAS o expresados de acuerdo por su nombre.

Se clasifica en

ORDINAL

Son susceptibles de ordenamiento en forma implcita

NOMINAL

Se expresan mediante sus propias denominaciones

1.3 Clases de Estadstica

1. Estadstica Descriptiva

Aquella cuya finalidad es solamente la de DESCRIBIR EN FORMA GENERAL un conjunto de datos, para posteriormente interpretarlos y PREPARAR CONCLUSIONES GENERALES.

2. Estadstica Inferencial

Aquella que realiza un ESTUDIO DETALLADO de los elementos de una determinada muestra para posteriormente poder PROYECTARLOS o GENERALIZARLOS a la poblacin.

1.4 Etapas de la Investigacin Estadstica

La investigacin estadstica es fundamentalmente de TIPO DESCRIPTIVO, se preocupa de la confiabilidad, validez y significacin de los datos, de las muestras, as como de los mtodos y tcnicas de recoleccin y anlisis estadstico. En este proceso se distinguen las siguientes fases:

1ra. Recoleccin de datos. Se refiere a los MECANISMOS DE OBTENCIN DE LA INFORMACIN; stos son diversos y dependen de las posibilidades de acceso o contacto con los elementos investigados, del tamao de la poblacin y de la oportunidad de obtener datos.

2da. Organizacin de datos. Despus de la recoleccin de datos se realiza una evaluacin, correccin y ajuste de datos. Luego se precede a la clasificacin para la AGRUPACIN DE DATOS.

3ra. Presentacin de datos. Son los procedimientos de elaboracin de la informacin para ser presentados de acuerdo a un plan de TABULACIN que puede ser en TABLAS ESTADSTICAS, CUADRO RESUMEN o GRFICOS.

4ta. Anlisis e Interpretacin de datos. A travs de mtodos estadsticos, se calculan INDICADORES y MEDIDAS DE RESUMEN, se establecen relaciones entre dos o ms variables, se estiman valores, se ejecutan pruebas estadsticas: como elementos de referencia para la descripcin, anlisis e interpretacin del comportamiento de os datos, HACER INFERENCIAS VALIDAS y OBTENER INFORMACIN DE LOS ELEMENTOS o UNIDADES ESTUDIADAS.

CAPITULO II

DISTRIBUCIN DE FRECUENCIAS2.1. Tipos de Presentacin de Datos Estadsticos

La presentacin de datos estadsticos se realiza en dos formas:

a. Presentacin Numrica: a travs de los CUADROS ESTADSTICOS y TABLAS DE FRECUENCIAS.

b. Presentacin Grfica: a travs de una variedad de GRFICOS ESTADSTICOS.

2.2 Presentacin Numrica

2.2.1 CUADROS ESTADSTICOS

El cuadro estadstico es el arreglo ORDENADO de columnas y filas de datos estadsticos, con el objeto de ofrecer informacin estadstica de fcil lectura, comparacin e interpretacin.

Partes Principales: En general un cuadro estadstico puede tener 8 partes:

1) Nmero del Cuadro: Cdigo o elemento de identificacin que permite ubicar el cuadro en el interior de un documento.

2) Ttulo del Cuadro: Descripcin resumida del contenido del cuadro. Debe ser breve, claro y completo. Un ttulo debe indicar:

a. QUE hay en el cuadro (caracterstica principal)

b. DONDE corresponde la informacin, se refiere al lugar geomtrico o institucin

c. COMO estn ordenados o clasificados los datos

d. CUANDO que momento o perodo de tiempo est referida la informacin

3) Concepto o encabezamiento: Son las descripciones de las filas y columnas del cuadro. El encabezamiento se ubica en la parte superior del cuadro. Indica las variables y sus categoras o valores.

4) Cuerpo del cuadro: Contenido numrico del cuadro. Presenta la distribucin de los elementos segn la clasificacin en categoras de las variables.

5) Notas del Pie o llamada: Usada para aclarar trminos o siglas.

6) Fuente: Indicacin al pie del cuadro, sirve para nombrar la publicacin, entidad, estudio o fuente de donde se obtuvieron los datos.

7) Nota de Unidad de Medida: Se escribe debajo del ttulo original, usada cuando se abrevia la escritura de las cifras y para indicar en que unidades est expresada la variable.

8) Elaboracin: Menciona al responsable de la elaboracin del cuadro estadstico final.

2.2.2 TABLA DE DISTRIBUCIN DE FRECUENCIA

Es el resumen que se realiza en funcin de la totalidad de elementos de una poblacin con respecto a una caracterstica o variable de estudio.

Elementos de una tabla de distribucin de frecuencias

1) Variable ( Xi) Valor asociado a una determinada caracterstica que toma diferentes valores2) Frecuencia Absoluta (fi) Nmero de veces que se repite un dato, como valor de la variable. La suma de las frecuencias absolutas debe corresponder al nmero de datos (n), es decir: (f = n

3) Frecuencia Relativa (hi) Es el cociente de cada frecuencia absoluta entre el nmero total de datos (n). Indica que porcentaje del total corresponde a cada dato. Se calcula mediante:

fihi = --------

n

La suma de las frecuencias relativas debe ser uno (100%)

4) Frecuencia Absoluta Acumulada (Fi) Es la acumulacin de cada frecuencia absoluta. Para determinar la frecuencia acumulativa, se suma la frecuencia acumulada anterior a la frecuencia absoluta, se decir:

F1 = f1

F2 = f1 + f2

= F1 + f2

F3 = f1 + f2 +f3 = F2 + f3

lo que significa que la ltima frecuencia absoluta acumulada debe ser igual al nmero de datos.

5) Frecuencia Relativa Acumulada (Hi) Es la acumulacin de cada frecuencia relativa. Se obtiene de forma similar a la frecuencia absoluta acumulada

lo que significa que la ltima frecuencia relativa acumulada debe ser igual a 1

Tambin:

Fi

Hi = --------

n

6) Clases o Intervalos (m) Es el nmero de partes en que se divide a los elementos de una poblacin. Cuando no est determinada, se calcula por la formula de Sturges:m = 1 + 3.3 Log (n)

7) Amplitud (Ci) Es la diferencia entre el lmite superior e inferior de cada intervalo. Es el tamao de cada clase. Indica el nmero de elementos que existe en cada intervalo. Se calcula mediante:

Ci = Ls - Li

donde: Ls : lmite superior

Li : Lmite inferior

8) Marca de clase (Yi) Es el punto medio de cada intervalo. Se calcula por:

Yi = (Ls + Li ) / 2

Ejemplo:

IntervalosYifihiFiHi

-

-

-

-

-

-

sumas

2.3 Construccin de Tablas de frecuencias para Variables Cuantitativas

A. Para datos no agrupados

Por ser la informacin bastante pequea, no existen las tablas de frecuencias, y nicamente los datos se presentan ordenados, en filas o columnas.

Ejemplo: En una encuesta se obtuvo la siguiente informacin referente a la edad de 10 personas:

19312230252742335021

Ordenado los datos y presentndolos en columna se tiene:

Edades (Xi)

iXi

1

2

3

4

5

6

7

8

9

10

B. Para datos agrupados sin intervalos

Se procede de la siguiente manera:

1) Identificar la variable en estudio (Xi)

2) Ordenar los datos en forma creciente (o decreciente)

3) Efectuar la respectiva tabulacin de los datos

4) Calcular los elementos de la tabla de frecuencias

Ejemplo: En una encuesta de presupuestos familiares, se pregunt por el nmero de hijos que tena cada familia. Se entrevistaron 20 familias obtenindose lo siguiente:

1243633824

6410322122

Se pide completar la tabla de frecuencias:

iXiMarca de conteofihiFiHi

1

2

3

4

5

6

7

sumas

Interpretando la tercera fila ( i = 3)

f3 =

h3 =

F3 =

H3 =

CAPITULO IIIDISTRIBUCIN DE FRECUENCIAS (Continuacin)

C. Para Datos Agrupados en Intervalos

Se procede de la siguiente manera:

1) Identificar la variable en estudio (Xi)

2) Calcular el rango (R ) de los datos, mediante:

R = dato mayor - dato menor

3) Determinar el nmero de intervalos (m), en caso de que se desconozca

Regla de Sturges>>>>> m = 1+3.3 log(n)

4) Calcular la amplitud (C) para cada intervalo, mediante

C = R / m

5) Construir los intervalos, empezando por el dato menor, al cual se suma la amplitud del intervalo.

6) Efectuar la tabulacin respectiva

7) Calcular cada uno de los elementos de la tabla de distribucin de frecuencias

Ejemplo: Las ventas mensuales de 50 restaurantes se dan a continuacin en miles de soles

35422725552252382260

47152548633639375429

29152227371145336635

46291127351740343537

42183923385112362763

Se pide:

i) Clasificar los datos en una tabla de distribucin de frecuencias

ii) Interpretar ciertos elementos de dicha tabla

iii) Porcentaje de restaurante que tienen ventas mensuales menores de 35 mil

iv) Nmero de restaurante que tienen una venta mensual mayor o igual a 27 mil

Solucin (i)

1) VariableXi =

2) Rango

R =

3) Intervalosm =

4) AmplitudC =

ii) Tabla de frecuencias

iIntervalosConteoYifiFihiHi

1-

2-

3-

4-

5-

6

7-

sumas

ii) Interpretar la tabla para i = 4

f4 =

h4 =

F4 =

H4 =

iii) Porcentaje de restaurantes que venden menos de 35 mil soles

iv) Nmero de restaurantes que venden ms o igual a 27 mil soles

CAPITULO IVGRFICOS ESTADSTICOS4.1 Presentacin grfica de datos estadsticos

Un Grfico es una representacin pictrica con el objeto de ilustrar los cambios de una variable, para comparar visualmente dos o ms variables similares o relacionadas.

En estadstica se emplea una diversidad de grficos, cuya forma depender de la naturaleza de los datos y del objetivo. Los grficos de una variable sirven para comparar cantidades absolutas, tasas, variaciones, etc. y pueden tener forma de columnas, barras, puntos o lneas. Los grficos de dos variables se construyen en el plano cartesiano, teniendo en el eje X (abcisa) el registro de la variable independiente; y en el eje Y (ordenada) se colocan los valores de la variable dependiente.

Partes de un Grfico

En todo grfico se debe considerar el ttulo, leyenda, escala, fuente y elaboracin; aunque dependiendo de la complejidad del grfico, los elementos pueden variar

A. Ttulo: es una descripcin del contenido del grfico, explica el contenido

se coloca en la parte superior o inferior del grfico

B. Diagrama: es el propio dibujo del grfico, donde se encuentran ubicados los datos.

C. Escala: es la unidad de medida que se considera en los ejes

D. Fuente: indica el origen de los datos, se ubica en la parte inferior del grfico

E. Leyenda. Hace referencia al diagrama.

4.2 Clasificacin de Grficos

A. Lineales

1. En coordenadas rectangulares

Diagramas de frecuencias

Polgonos de frecuencias

Histograma de frecuencias

Series cronolgicas

Nube de puntos, etc.

2. En coordenadas polares

Diagrama de telaraa

B. De Superficie, en este grupo se tiene:

Grficos de barras verticales, simples, compuestas

Grficos de barras horizontales, simples, compuestas

Coronas circulares

Pirmides

Cilindros, conos, etc.

C. Grficos de dimensiones

De rea, cuando se consideran dos dimensiones

De Volumen, cuando se consideran tres dimensiones

D. Mapas estadsticos o cartogramas

E. Pictogramas

4.3 Grfica de las Distribuciones de Frecuencias

3.3.1 Grfica de Variable Discreta

Este grfico se denomina grfico de bastones, donde en el eje X se registran los valores de la variable (Xi) y en el eje Y se indican las frecuencias

Ejemplo: Graficar los siguientes datos, referidos a las edades de un grupo de turistas

iXifiFihiHi

1160.10

2176

3180.25

419

52040.20

total

01617181920016171819

4.3.2 Grfica de Variable Continua

Las representaciones grficas de las distribuciones de frecuencias para una variable continua se conocen como: histogramas y polgonos de frecuencias

A. HISTOGRAMA

Un histograma o Histograma de Frecuencias est formado por una serie de rectngulos que tienen sus bases sobre un eje horizontal (eje X) e iguales a la amplitud o tamao de cada clase (Ci). Su altura es igual a la frecuencia de clase

B. POLGONO

Es un grfico de lneas trazado sobre los puntos medio de cada clase (en el caso de las frecuencias simple)

Se obtiene uniendo los puntos medios de los extremos superiores de cada rectngulo del histograma. Se acostumbra prolongar el polgono hasta los puntos medios inferior y superior de las clases inmediatas asumidas con frecuencia cero.

Para el caso de las frecuencias acumuladas, el polgono tambin se denomina OJIVA, el cual se obtiene uniendo los lmites superiores de cada intervalo a la altura indicada por la respectiva frecuencia; para el primer intervalo se empieza desde el lmite inferior.

Ejemplo: Construir un histograma y un polgono de frecuencias para la distribucin de frecuencias de 400 tubos (en horas) e intervalos constantes

Hrs300-400500-600700-800800-900

Tubos14365882623822

IIntervalosYifihiFiHi

1-

2-

3-

4-

5-

6-

7-

8-

sumas

90

80

70

60

50

40

30

20

10

30040050060070080090010001100

400

375

350

325

300

275

250

225

200

175

150

125

100

75

50

25

30040050060070080090010001100

90

80

70

60

50

40

30

20

10

30040050060070080090010001100

400

375

350

325

300

275

250

225

200

175

150

125

100

75

50

25

30040050060070080090010001100

CAPITULO V

GRFICOS ESTADSTICOS (Continuacin)

5.3.3 Grfica de Variable Cualitativa

Una distribucin de frecuencias de variables cualitativas, pueden ser presentadas grficamente MEDIANTE UN DIAGRAMA DE BARRAS, en la cual la longitud de cada barra es proporcional a la frecuencia del atributo que representa.

Las barras deben ser de igual ancho, pudiendo ser stas horizontales o verticales.

Tambin se puede utilizar GRFICAS CIRCULARES donde los sectores se obtienen convirtiendo los porcentajes en ngulos sexagesimales, para lo cual debe multiplicarse la frecuencia relativa (hi) por 360.

Ejemplo: La siguiente tabla muestra la superficie en millones de millas cuadradas de los ocanos del mundo.

OcanoAntrticorticoAtlnticoIndicoPacfico

Superficie7.64.841.228.570.8

Representar los datos utilizando:

a. Diagramas de barras

b. Diagrama circular

Solucin

OcanofihiSector

Antrtico7.6

rtico4.8

Atlntico41.2

Indico28.5

Pacfico70.8

Suma

Antrtico

rtico

Atlntico

Indico

Pacfico

010203040506070

5.3.4 Otros Tipos de Grficos Estadsticos

1. Columnas Dobles

Sirven para comparar dos series de datos referidos a datos estadsticos

Si se desea puede incluirse los rtulos de datos en las cabeceras de las columnas, con lo cual puede omitirse la escala

2. Columnas Apiladas o Superpuestas

Permiten comparar los elementos con respecto al total

3. Diagrama de Lneas o Grfico Poligonal

Se utiliza para representar series de tiempo (cronolgicas) o cuando se requiere presentar varias series de datos en el mismo grfico.

4. Pictogramas

Son diagramas de figuras, donde las barras son reemplazadas por figuras que representan la variable. Por ejemplo, la importacin de automviles podra graficarse con la figura de un automvil en la escala

Ejemplo:

La tabla estadstica corresponde a la produccin de naranja de un grupo de valles correspondiente al II Semestre del ao anterior expresado en miles de kg.

_________________________________________________________________

Produccin de

Nmero de Valles______________________

naranja en

Naranja

Naranja

Naranja

__miles de Kg.

Francia

Hualcar

Huando____

40 - 70

6

12

10

70 -100

10

5

16

__

100-130

14

10

8________

130-160

8

19

12

160-190

20

22

40

__

190-220

16

25

12_______

220-250

30

15

6

250-280

7

13

17

__

280-310

8

6

9________

a. Graficar la produccin de naranja Hualcar con barras verticales

b. Graficar la produccin de naranja Francia y Hualcar con barras compuestas

c. Graficar la produccin total de naranja con un grfico circular

Produccin.Valles

hisector

40 - 70

70 -100

100-130

________________

130-160

160-190

190-220

________________

220-250

250-280

280-310_____________________

T o t a l

d. Graficar la produccin de naranja mediante barras verticales incrementadas o apiladas

e. Graficar la produccin de naranja Huando mediante barras horizontales

310

280

250

220

190

160

130

100

70

40

510152025303540

f. Grfico Poligonal

Ventas mensuales en soles, de una empresa comercial (datos en miles de soles)

MesEneFebMarAbrMayJunJulAgoSepOctNovDic

Ventas18.921.718.99.915.517.625.312.214.221.215.617.1

30

25

20

15

10

5

EFMAMJJASOND

PARTE 2

MEDIDAS DE POSICINCAPITULO VIESTADIGRAFOS DE TENDENCIA CENTRAL6.1 Definicin

Son estadgrafos que describen la posicin que ocupan los datos alrededor de un valor central. Se les conoce como PROMEDIOS, y permiten el anlisis de una distribucin y la comparacin entre distribuciones.

Los estadgrafos de tendencia central ms importantes son: media aritmtica, media aritmtica ponderada, media armnica, media geomtrica, moda, mediana y los cuantiles.

6.2 La Media Aritmtica

Es el cociente que resulta de dividir la suma de todos los datos entre el nmero de observaciones.

Se le conoce como media o promedio y determina el punto medio de la distribucin. Se simboliza por X M[Xi(Los tipos de media aritmtica son: media aritmtica simple, ponderada y de datos agrupados.

6.2.1 Media Aritmtica Simple

Se suman todas las observaciones, y el total se divide entre el nmero de datos.

_X1 + X2 + X3 + ... + Xi

X = ----------------------------------

n

donde:

Xi : variable o datos

n : nmero de datos

Ejemplo 1: Hallar la media aritmtica de las siguientes edades:

9, 15, 12, 19, 17, 22

Ejemplo 2: Calcular el promedio de los precios:

5.7, 9.2, 6.4, 11.8, 13.7

Ejemplo 3: Si una alumna obtiene en la asignatura de Estadstica las siguientes notas: 16, 15, 14, 13 y 10; calcular el promedio

Ejemplo 4: Si los dimetros en pulgadas de una muestra de aros metlicos es la siguiente: 0.211, 0.294, 0.465, 0.325, 0.373, 0.389, 0.256. Hallar la media de los dimetros.

6.2.2 Media Aritmtica PonderadaEn este caso la variable o dato es multiplicada por un peso o ponderacin. Para determinar el promedio la suma de estos productos se divide entre la suma de los pesos

_x1.w1 + x2.w2 + x3.w3 + ... + xi.wi

X = ------------------------------------------------------

w1 + w2 + w3 + ... + widonde:

xi : variable o dato

wi: ponderacin

Ejemplo: La siguiente distribucin corresponde al nmero de mens vendidos por ciertos restaurantes en forma diaria. Hallar la media aritmtica

Nro Mens142845586470

Nro Restauran387201210

Solucin

Nro. Mens (X)Restauran (w)

Total:

Ejemplo 2: Se ha clasificado a los turistas en 3 grupos de acuerdo a sus patrones de gasto que constituyen el 60%, 30% y 10%. Si el promedio de gasto de cada grupo es de 300, 420 y 650 dlares respectivamente; hallar el gasto promedio total.

Solucin

6.2.2 Media Aritmtica de Datos AgrupadosEn este caso los datos se encuentran agrupados en clases, para calcular la media aritmtica se utiliza la marca de clase (Yi) que corresponde a cada frecuencia de clase, de decir:

_(YI.fI

X = --------------

nEjemplo: Hallar la media aritmtica de la distribucin de sueldos de una empresa (en soles)

Sueldos500-600600-700700-800800-900900-10001000-12001200-1800

Empleados81016151083

Solucin

Sueldos (Xi)YifiYi.fi

Total:

6.2.3 Propiedades de la media aritmtica

La media aritmtica es el centro de gravedad de la distribucin

Es la medida de tendencia central ms estable

Para un conjunto de observaciones la media es nica.

Si un valor se modifica, entonces la media cambia de valor

Si la media sustituye a cada observacin, la suma total no cambia

La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero..

Si a cada observacin se le suma algebraicamente una constante, la media queda sumada algebraicamente en esa constante.

Si a cada observacin se le multiplica por una constante la media queda multiplicada por la constante

Si Wj = aXj + b entonces Media(w) = a media(x) + b

6.2.4 La Media armnica

La media armnica (H) de una serie de n nmeros x1, x2, x3, ... xn es la reciproca de la media aritmtica de los recprocos de los nmeros

_

X = n/ ( (1/xj )

Ejemplo : Si un auto recorre los primeros 10 Km a razn de 30 Km/h y los 10 Km siguientes a razn de 60 Km/h. Determine la velocidad media durante todo el trayecto.

_

XA = 2/( 1/30+1/60 ) = 40 Km/h

6.3 La Media GeomtricaLa Media Geomtrica (G) de una serie de n nmeros X1, X2, X3 ... Xn es la raz ensima del producto de los nmeros. Este promedio se utiliza para calcular nmeros ndices y tasas promedio de variacin

n------------------------

G = ( X1 . X2. X3......Xn Ejemplo 1 : Calcular la media geomtrica de los nmeros 2, 4 y 8

Para datos agrupados se considera la marca de clase (Y)

n-------------------------------

G = ( X1f1 X2 f2 X3 f3.....Xn fn Aplicando logaritmos

( (fi .LogXi)

Log G = ------------------------

nEjemplo 1: Determinar la media geomtrica de la distribucin de remuneraciones de un grupo de trabajadores de la Empresa Delta

Sueldos (Xi)fiYiLogYifi .LogYi

420 - 4906

490 - 56010

560 - 6307

630 - 700

11

700 - 77018

770 - 84015

840 - 91013

910 - 9809

980 - 10503

Total:Total:

Ejemplo 2: Suponga que la poblacin de una ciudad aumento de a 12600 en el periodo de 1995 a 1999, como se indica a continuacin. Halle la tasa de crecimiento.

AoPoblacinTasa de cambio

( ao base: 1995 )

199510000---

1996105001.050

199711200

199812000

199912600

4.3.2 Otras aplicaciones

La media geomtrica es util para encontrar el promedio de porcentajes, razones, tasas de crecimiento.

Ejemplo 1 Suponga que recibe un aumento de 5% en su sueldo del ao pasado y recibir uno de 15% este ao. El aumento porcentual promedio es:

Respuesta: 9.89%

Ejemplo 2: Las ganancias obtenidas por la empresa constructora Alfa en 4 proyectos recientes fueron de 3%, 2%, 4%, y 6%. Cual es la media geomtrica de las ganancias?

Respuesta: 3.46%

Ejemplo 3: Suponga que el nmero de alojamientos tursticos en cierta ciudad eran 2 en 1992 y para el 2002 era 22 Cual es la tasa de incremento porcentual anual promedio para el periodo?

Respuesta: 27.1%

6.5 La Mediana

La Mediana de una coleccin de datos ordenados por su magnitud, corresponde al valor de la variable que divide al nmero de frecuencias en 2 partes iguales. Esto significa que a uno y otro lado de este valor medio se encuentra no ms del 50% de los datos.

Se simboliza por Me

6.5.1 Mediana de una Distribucin Simple

Para calcular la Mediana, los datos se ordenan en forma ascendente o descendente, y luego se observa:

a. Si el nmero de datos es impar la Mediana es igual al valor central

b. Si el nmero de datos es par la Mediana es igual al promedio de los dos valores centrales.

Ejemplo 1. Hallar la mediana de las siguientes notas:

15, 10, 12, 14, 8

Ejemplo 2. Hallar la mediana del nmero de empleados:

12, 10, 18, 13, 11, 21

Ejemplo 3. Hallar la mediana de los siguientes costos unitarios de produccin de componentes:

0.24, 0.31, 0.52, 0.27, 0.38, 0.42, 0.62, 0.46

6.5.2 Mediana de una Distribucin Agrupada

La Mediana determina el punto medio de la distribucin, dividindola en dos partes iguales.

(n+1/100)x50 es entero (E) me = X(E)Me = X (n+1/100)x50 , SI

(n+1/100)x50 es decimal (E.d) me =X(E) + 0.d x (X(E+1)- X(E) )

Ejemplo 1 Los siguientes datos corresponden a los pesos, en Kg de 10 personas: 50, 52, 53, 63, 64, 75, 76, 77, 80. Calcule la mediana.

Solucin: 63.5 Kg.

Ejemplo 2. Sea la variable Z = nmero de hijos por familia y fi = nmero de familias calcular la mediana:

Z)fi

035

115

218

322

Total:N=80

Solucin: me = 1.5 hijos por familia

Ejemplo 3. Hallar la mediana de la siguiente distribucin correspondiente a las edades de los turistas que visitaron cierta atraccin turstica

Edad (Xi)fi

18 - 222066

22 - 2624915

26 - 30281833

30 - 34321447

34 - 38362774

38 - 42402094

42 - 464412106

46 - 50488114

Total:n=114

n _ Fj-1

2

Me = Li + Cj -----------------

Fj - Fj-1

donde

Me:Mediana

n/2:forma de ubicar la clase mediana

Fj-1:Frecuencia absoluta acumulada continua

inferior con respecto a la clase mediana

Fj:Frecuencia absoluta acumulada de la clase

mediana

Li :Lmite inferior de la clase mediana

Cj:Amplitud del intervalo mediano

N = 114

Fj-1 = 47

Fj = 74

Li = 34

Cj = 4

Solucion : 35.48

4.5.3 Importancia de la Mediana

* No es afectada por los valores extremos

* Aplicable a distribuciones con extremos indeterminados

* Su desventaja radica en no considerar todos los datos

6.6 La Moda

Es el valor ms frecuente de una variable, es decir es el valor ms comn

Se simboliza por Mo6.6.1 Moda de una Distribucin Simple

Es el dato estadstico que se repite el mayor nmero de veces

Puede ser unimodal, bimodal o multimodal

Ejemplo 1. Hallar la moda de las siguientes notas:

10, 13, 14, 12, 14, 11, 14, 12, 14

Ejemplo 2. Hallar la moda de los siguientes precios

3.8, 4.2, 5.3, 7.2, 3.9, 5.3, 4.2, 4.1, 4,5

6.6.2 Moda de una Distribucin Agrupada

Determina el punto medio de la distribucin

Para hallar la moda se ubica la mayor frecuencia absoluta y su clase se le denomina clase modal. Luego se ubican las frecuencias absolutas que son inferior y superior respecto a la clase modal.

d1

Mo = Li + Cj -----------------

d1 + d2

donde

Mo:Moda

d1:fj - fj-1

diferencia premodal

d2:fj - fj+1

diferencia postmodal

Li :Lmite inferior del intervalo modal

Cj:Amplitud del intervalo modal

6.6.3 Importancia de la Moda

* Aplicable a datos cualitativos

* No es afectada por valores altos o bajos de la distribucin

* Clculo rpido

* Tiene como desventaja el perder validez cuando es multimodal

Ejemplo 1. Hallar la moda para la siguiente distribucin correspondiente al nmero de trabajadores en empresa hoteleras, donde n = 200

Trabajadores

(Xi)Empresas

fi

06 - 1020

10 -1430

18 - 2260

22 - 2620

Total:

Ejemplo 2. Hallar la moda para la siguiente distribucin de un grupo de empresas de transportes, donde la utilidad se expresa en miles de dlares

Utilidades

(Xi)Empresas

fi

50 - 608

60 - 7010

16

14

10

5

110 - 1202

Total:

PARTE 3

MEDIDAS DE DISPERSINCAPITULO VIIESTADIGRAFOS DE DISPERSIN7.1 Definicin

Los estadgrafos de dispersin son medidas que nos dan la mayor o menor concentracin de observaciones o datos con respecto a un valor central.

Miden el grado de dispersin o concentracin de los datos o valores, alrededor de algunas de las medidas de tendencia central.

Los estadgrafos de dispersin son los siguientes:

A. Medidas de Dispersin Absoluta

* Rango o Recorrido

* Varianza

* Desviacin Estndar

B. Medidas de Dispersin Relativa

* Coeficiente de Variacin

* Coeficiente de Asimetra

* Coeficiente de Curtosis

7.2 El Recorrido o RangoEst definido por la diferencia existente entre el mayor valor y el menor valor de una variable estadstica.

R = XM - Xm

donde:

XM: Mayor valor de la variable

Xm: menor valor de la variable

Cuando mayor es el rango, mayor es la dispersin de los datos alrededor de la medida de tendencia central; aunque debe considerarse que el rango depende de la distancia que existe entre sus dos valores extremos con relacin a los dems valores.

Ejemplo 1. Determinar el rango para las siguientes notas:

12,13,15,18,10,05,04

Ejemplo 2. Determinar el rango en la siguiente distribucin (miles $)

Inversin (Xi)empresas fi

80-8510

85-9015

90-9520

95-10025

100-105 7

7.3 La VarianzaEs el promedio del cuadrado de las desviaciones de la variable respecto a la media aritmtica

Se representa por V(x) S2Proporciona informacin sobre el grado de dispersin de los valores de una serie con respecto a su media aritmtica; mientras mayor sea el valor de la varianza, mayor es la dispersin. Lo anterior implica que cuanto ms pequea sea la varianza, mayor es la concentracin de los datos alrededor de la media aritmtica.

7.4 La Desviacin Estndar o TpicaMide el grado de normalidad de la distribucin de datos de la muestra alrededor de la media aritmtica dentro de sus valores extremos; es decir mide la dispersin alrededor de la media.

La desviacin estndar se define como la raz cuadrada (positiva) de la varianza y se representa por S

___

S = +( S27.5 Clculo de la Varianza y la Desviacin Estndar

7.5.1 Distribucin Simple

_

( (Xi - X ) 2

donde:

S2 = -------------------

S2 : Varianza

n

n : Nro datos

Xi : Variable

(X2

(X 2

X : Promedio

S2 = ------ - -----

n

n

Ejemplo. Determinar la desviacin estndar de los resultados en la evaluacin de 7 alumnos:7,5,10,11,13,15,16

XiXi2Xi - X(Xi - X)2

7.5.2 Distribucin Agrupada

_

( (Yi - X ) 2 fi

donde:

S2 = -------------------

S2 : Varianza

n

n : Nro datos

Yi : Marca clase

(Y2 fi(Yi fi 2

X : Promedio

S2 = -------- - -------

fi : Frecuencia

n

n

Ejemplo 1. Determinar la desviacin estndar para la siguiente distribucin sobre lesiones promedio por cada 1000 horas-hombre de una industria

lesionesfi

1.5 - 1.8 3

1.8 - 2.112

2.1 - 2.414

2.4 - 2.7 9

2.7 - 3.0 7

3.0 - 3.3 5

Total

Ejemplo 2. Determinar la desviacin estndar de la distribucin de ingresos quincenales (en dlares) de los empleados de Beta S.A.C. durante la ltima quincena del mes pasado

Ingresosfi

85 - 939

93 - 1015

101 - 1092

109 - 1171

117 - 1251

125 - 1332

Total

7.6 MEDIDAS DE DISPERSIN RELATIVA

Caractersticas

* Medidas expresadas en porcentaje

* Generan informacin de alta o baja dispersin por s solos

* Mayor porcentaje implica mayor dispersin

7.6.1 COEFICIENTE DE VARIACIN

Es til para realizar comparaciones cuando se usan diferentes unidades de medida de la variable

Se emplea tambin cuando se comparan dos distribuciones con diferente nmero de observaciones

S

CV = ----------100

| X |

donde

CV:Coeficiente de Variacin (%)

S:Desviacin Estndar

X:Media Aritmtica

Se interpreta como el porcentaje de variabilidad de los datos con respecto a la media aritmtica

Por convencin, si el coeficiente de variacin es mayor a 15% la dispersin es alta

Ejemplo. Con los siguientes datos, calcular el coeficiente de variacin:

0.320.440.510.720.770.91

XiXi2Xi - X(Xi - X)2

7.6.2 MEDIDAS DE ASIMETRAEl grado de oblicuidad de una distribucin puede ser medido mediante los coeficientes de asimetra o deformacin

Las medidas de dispersin solamente indican la magnitud de las variaciones, pero no proveen informacin acerca de la direccin hacia donde tienden a ocurrir las variaciones

Por tanto, las medidas de asimetra no slo indican la falta de simetra en la distribucin sino tambin la direccin hacia donde se inclina la distribucin

Si una distribucin es simtrica, no tiene sesgo, es decir, su asimetra es nula.

Si una o ms observaciones son sumamente grandes, la media de la distribucin se vuelve mayor que la mediana o moda. En tales casos se dice que la distribucin tiene asimetra positiva o sesgo positivo. Por el contrario, si hay una o ms observaciones muy pequeas, la media es la menor de las tres medidas de tendencia central, y se dice que la distribucin tiene asimetra negativa o sesgo negativo.

1. Coeficiente de Asimetra de Pearson (A1)

Se define por la siguiente relacin entre media aritmtica, mediana, moda y desviacin estndar

_

_

3 (X - Me)

X - Mo

A1 = ------------------

A1 = --------------

S

S

donde:_

X:Media Aritmtica

Me:Mediana

Mo:Moda

Se presentan los siguientes resultados:

A1 > 0la media aritmtica se inclina a valores extremos altos y por tanto existe asimetra positiva

A1 = 0 la distribucin es simtrica

A1 < 0la media aritmtica se inclina a valores extremos bajos y por tanto existe asimetra negativa

Ejemplo. Graficar el histograma y calcular el coeficiente de asimetra de la produccin de una mquina durante 23 das

produccin0-55-1010-1515-2020-25

Das35753

Adems X=12.5S=3.30Mo=12.5

Solucin

8

6

4

2

0510152025

2. Coeficiente de Asimetra de Fisher (A2)

Se define por la siguiente frmula

_

((X - X) 31

A2 = ---------------. ------

nS3

donde:_

X:Media Aritmtica

S:Desviacin Estndar

Se presentan los siguientes resultados:

A2 > 0asimetra positiva

A2 = 0 la distribucin es simtrica

A2 < 0asimetra negativa

3. Coeficiente de Asimetra de Bacley (A3)

Emplea los cuartiles en su frmula

Q3 - 2 Q2 + Q1

A3 = ------------------------

Q3 - Q1

Se presentan los siguientes resultados:

A3 > 0asimetra positiva

A3 = 0 la distribucin es simtrica

A3 < 0asimetra negativa

Ejemplo. Determinar la asimetra de la distribucin de salarios quincenales de los obreros de la Constructora Delta (datos en dlares)

Salarios ($)obrerosyiyi fiyi2yi2 fi

85 - 949

94 - 1036

103 - 1122

112 - 1211

121 - 1301

130 - 1391

Total

Grfica

10

8

6

4

2

8594103112121130139

CAPITULO VIIIESTADIGRAFOS DE APUNTAMIENTO8.1 MEDIDAS DE APUNTAMIENTO: CURTOSIS

Miden el grado de agudeza o apuntamiento de una distribucin.

El trmino KURTOSIS significa el grado de achatamiento que exhibe una distribucin de frecuencias.

Se analiza comparando la distribucin con la forma de la curva normal, as se tiene 3 casos:

Platikurtica

Mesokurtica

Leptokurtica

8.2 Coeficiente de Kurtosis. Metodo de Cuartiles

Se determina por la siguiente formula:

Q3 Q1

Ki = ----------------

2(P90-P10)

Kurtosis

Limites

Platikurtica

0< Ki < 0.263Mesokurtica

K1 = 0.263

Leptokurtica

0.263< Ki < 0.5

1

_1179074199.xlsGrfico1

191715131820

201810152025

302520253540

&A

Pgina &P

Ene

Feb

Mar

Abr

May

Jun

Gastos por Categoras(soles)

Hoja1

ComidasTransporteAlojamiento

Ene192030

Feb171825

Mar151020

Abr131525

May182035

Jun202540

&A

Pgina &P

_1179074201.xlsGrfico1

7.611111

4.8ArticoArticoArticoArticoArtico

41.2AtlnticoAtlnticoAtlnticoAtlnticoAtlntico

28.5

70.8

&A

Pgina &P

Superficie

#REF!

#REF!

#REF!

#REF!

#REF!

Hoja1

AntrticoArticoAtlnticoIndicoPacfico

Superficie7.64.841.228.570.8

&A

Pgina &P