PRACTICA N 1
Estadstica Descriptiva Dr. Vctor Pastor Talledo
PARTE 1
FUNDAMENTOS DE ESTADSTICACAPITULO I
CONCEPTOS BSICOS1.1. Qu es la Estadstica?
Es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos para ayudar en una toma de decisiones ms efectiva.
Para realizar esto, la Estadstica toma en cuenta las siguientes acciones:
Coleccin y recoleccin de datos
Ordenamiento de datos
Clasificacin de datos
Presentacin numrica
Presentacin grfica
Clculo de estadgrafos
Relacin entre dos o ms variables
Proyeccin de datos
Anlisis e interpretacin de datos
1.2 Definicin de trminos estadsticos
1. Estadgrafo. Es cualquier funcin de datos empricos que se usa con fines descriptivos o analticos; son MEDIDAS DE RESUMEN ESTADSTICO de un conjunto de datos. Por ejemplo: la media aritmtica, la mediana, la varianza, el coeficiente de correlacin, etc.
2. Parmetro. Es el valor obtenido para describir en forma resumida las caractersticas pertinentes o ms importantes acerca de la poblacin. Una poblacin puede tener muchas caractersticas y por lo tanto muchos parmetros
Los parmetros son las MEDIDAS RESUMEN DE UNA POBLACIN, en tanto que las medidas de una muestra se llaman estadgrafos.
3.Poblacin. Conjunto finito o infinito de elementos o datos que presentan una caracterstica particular a ser analizada o estudiada. La poblacin se presenta con la letra N. Ejemplos:
La poblacin formada por todos los alumnos del instituto (poblacin finita o numerables)
Todas las veces que aparece un tres (3) al tirar un dado.
4. Muestra. PARTE REPRESENTATIVA que se toma de una poblacin con el fin de investigar sus caractersticas.
La muestra se representa con la letra n.
5. Variable.Es toda la caracterstica sujeta a medida, cuenta o calificacin.
DATOQUE SUFRE VARIACIN dentro de una escala o recorrido.
Las variables pueden ser cuantitativas o cualitativas.
a. Variable Cuantitativa.-
Se DESCRIBE MEDIANTE NMEROS. Los valores que pueden ser ordenados y medidos. Esta variable a su vez se clasifica en:
DISCRETA:
Cuando toma VALORES ENTEROS, o es susceptible de contar.
Generalmente se representa con X.
CONTINUA:
Toma VALORES FRACCIONADOS o es susceptible de medir generalmente se representa con X.
b. Variable Cualitativa
Se expresa MEDIANTE PALABRAS o expresados de acuerdo por su nombre.
Se clasifica en
ORDINAL
Son susceptibles de ordenamiento en forma implcita
NOMINAL
Se expresan mediante sus propias denominaciones
1.3 Clases de Estadstica
1. Estadstica Descriptiva
Aquella cuya finalidad es solamente la de DESCRIBIR EN FORMA GENERAL un conjunto de datos, para posteriormente interpretarlos y PREPARAR CONCLUSIONES GENERALES.
2. Estadstica Inferencial
Aquella que realiza un ESTUDIO DETALLADO de los elementos de una determinada muestra para posteriormente poder PROYECTARLOS o GENERALIZARLOS a la poblacin.
1.4 Etapas de la Investigacin Estadstica
La investigacin estadstica es fundamentalmente de TIPO DESCRIPTIVO, se preocupa de la confiabilidad, validez y significacin de los datos, de las muestras, as como de los mtodos y tcnicas de recoleccin y anlisis estadstico. En este proceso se distinguen las siguientes fases:
1ra. Recoleccin de datos. Se refiere a los MECANISMOS DE OBTENCIN DE LA INFORMACIN; stos son diversos y dependen de las posibilidades de acceso o contacto con los elementos investigados, del tamao de la poblacin y de la oportunidad de obtener datos.
2da. Organizacin de datos. Despus de la recoleccin de datos se realiza una evaluacin, correccin y ajuste de datos. Luego se precede a la clasificacin para la AGRUPACIN DE DATOS.
3ra. Presentacin de datos. Son los procedimientos de elaboracin de la informacin para ser presentados de acuerdo a un plan de TABULACIN que puede ser en TABLAS ESTADSTICAS, CUADRO RESUMEN o GRFICOS.
4ta. Anlisis e Interpretacin de datos. A travs de mtodos estadsticos, se calculan INDICADORES y MEDIDAS DE RESUMEN, se establecen relaciones entre dos o ms variables, se estiman valores, se ejecutan pruebas estadsticas: como elementos de referencia para la descripcin, anlisis e interpretacin del comportamiento de os datos, HACER INFERENCIAS VALIDAS y OBTENER INFORMACIN DE LOS ELEMENTOS o UNIDADES ESTUDIADAS.
CAPITULO II
DISTRIBUCIN DE FRECUENCIAS2.1. Tipos de Presentacin de Datos Estadsticos
La presentacin de datos estadsticos se realiza en dos formas:
a. Presentacin Numrica: a travs de los CUADROS ESTADSTICOS y TABLAS DE FRECUENCIAS.
b. Presentacin Grfica: a travs de una variedad de GRFICOS ESTADSTICOS.
2.2 Presentacin Numrica
2.2.1 CUADROS ESTADSTICOS
El cuadro estadstico es el arreglo ORDENADO de columnas y filas de datos estadsticos, con el objeto de ofrecer informacin estadstica de fcil lectura, comparacin e interpretacin.
Partes Principales: En general un cuadro estadstico puede tener 8 partes:
1) Nmero del Cuadro: Cdigo o elemento de identificacin que permite ubicar el cuadro en el interior de un documento.
2) Ttulo del Cuadro: Descripcin resumida del contenido del cuadro. Debe ser breve, claro y completo. Un ttulo debe indicar:
a. QUE hay en el cuadro (caracterstica principal)
b. DONDE corresponde la informacin, se refiere al lugar geomtrico o institucin
c. COMO estn ordenados o clasificados los datos
d. CUANDO que momento o perodo de tiempo est referida la informacin
3) Concepto o encabezamiento: Son las descripciones de las filas y columnas del cuadro. El encabezamiento se ubica en la parte superior del cuadro. Indica las variables y sus categoras o valores.
4) Cuerpo del cuadro: Contenido numrico del cuadro. Presenta la distribucin de los elementos segn la clasificacin en categoras de las variables.
5) Notas del Pie o llamada: Usada para aclarar trminos o siglas.
6) Fuente: Indicacin al pie del cuadro, sirve para nombrar la publicacin, entidad, estudio o fuente de donde se obtuvieron los datos.
7) Nota de Unidad de Medida: Se escribe debajo del ttulo original, usada cuando se abrevia la escritura de las cifras y para indicar en que unidades est expresada la variable.
8) Elaboracin: Menciona al responsable de la elaboracin del cuadro estadstico final.
2.2.2 TABLA DE DISTRIBUCIN DE FRECUENCIA
Es el resumen que se realiza en funcin de la totalidad de elementos de una poblacin con respecto a una caracterstica o variable de estudio.
Elementos de una tabla de distribucin de frecuencias
1) Variable ( Xi) Valor asociado a una determinada caracterstica que toma diferentes valores2) Frecuencia Absoluta (fi) Nmero de veces que se repite un dato, como valor de la variable. La suma de las frecuencias absolutas debe corresponder al nmero de datos (n), es decir: (f = n
3) Frecuencia Relativa (hi) Es el cociente de cada frecuencia absoluta entre el nmero total de datos (n). Indica que porcentaje del total corresponde a cada dato. Se calcula mediante:
fihi = --------
n
La suma de las frecuencias relativas debe ser uno (100%)
4) Frecuencia Absoluta Acumulada (Fi) Es la acumulacin de cada frecuencia absoluta. Para determinar la frecuencia acumulativa, se suma la frecuencia acumulada anterior a la frecuencia absoluta, se decir:
F1 = f1
F2 = f1 + f2
= F1 + f2
F3 = f1 + f2 +f3 = F2 + f3
lo que significa que la ltima frecuencia absoluta acumulada debe ser igual al nmero de datos.
5) Frecuencia Relativa Acumulada (Hi) Es la acumulacin de cada frecuencia relativa. Se obtiene de forma similar a la frecuencia absoluta acumulada
lo que significa que la ltima frecuencia relativa acumulada debe ser igual a 1
Tambin:
Fi
Hi = --------
n
6) Clases o Intervalos (m) Es el nmero de partes en que se divide a los elementos de una poblacin. Cuando no est determinada, se calcula por la formula de Sturges:m = 1 + 3.3 Log (n)
7) Amplitud (Ci) Es la diferencia entre el lmite superior e inferior de cada intervalo. Es el tamao de cada clase. Indica el nmero de elementos que existe en cada intervalo. Se calcula mediante:
Ci = Ls - Li
donde: Ls : lmite superior
Li : Lmite inferior
8) Marca de clase (Yi) Es el punto medio de cada intervalo. Se calcula por:
Yi = (Ls + Li ) / 2
Ejemplo:
IntervalosYifihiFiHi
-
-
-
-
-
-
sumas
2.3 Construccin de Tablas de frecuencias para Variables Cuantitativas
A. Para datos no agrupados
Por ser la informacin bastante pequea, no existen las tablas de frecuencias, y nicamente los datos se presentan ordenados, en filas o columnas.
Ejemplo: En una encuesta se obtuvo la siguiente informacin referente a la edad de 10 personas:
19312230252742335021
Ordenado los datos y presentndolos en columna se tiene:
Edades (Xi)
iXi
1
2
3
4
5
6
7
8
9
10
B. Para datos agrupados sin intervalos
Se procede de la siguiente manera:
1) Identificar la variable en estudio (Xi)
2) Ordenar los datos en forma creciente (o decreciente)
3) Efectuar la respectiva tabulacin de los datos
4) Calcular los elementos de la tabla de frecuencias
Ejemplo: En una encuesta de presupuestos familiares, se pregunt por el nmero de hijos que tena cada familia. Se entrevistaron 20 familias obtenindose lo siguiente:
1243633824
6410322122
Se pide completar la tabla de frecuencias:
iXiMarca de conteofihiFiHi
1
2
3
4
5
6
7
sumas
Interpretando la tercera fila ( i = 3)
f3 =
h3 =
F3 =
H3 =
CAPITULO IIIDISTRIBUCIN DE FRECUENCIAS (Continuacin)
C. Para Datos Agrupados en Intervalos
Se procede de la siguiente manera:
1) Identificar la variable en estudio (Xi)
2) Calcular el rango (R ) de los datos, mediante:
R = dato mayor - dato menor
3) Determinar el nmero de intervalos (m), en caso de que se desconozca
Regla de Sturges>>>>> m = 1+3.3 log(n)
4) Calcular la amplitud (C) para cada intervalo, mediante
C = R / m
5) Construir los intervalos, empezando por el dato menor, al cual se suma la amplitud del intervalo.
6) Efectuar la tabulacin respectiva
7) Calcular cada uno de los elementos de la tabla de distribucin de frecuencias
Ejemplo: Las ventas mensuales de 50 restaurantes se dan a continuacin en miles de soles
35422725552252382260
47152548633639375429
29152227371145336635
46291127351740343537
42183923385112362763
Se pide:
i) Clasificar los datos en una tabla de distribucin de frecuencias
ii) Interpretar ciertos elementos de dicha tabla
iii) Porcentaje de restaurante que tienen ventas mensuales menores de 35 mil
iv) Nmero de restaurante que tienen una venta mensual mayor o igual a 27 mil
Solucin (i)
1) VariableXi =
2) Rango
R =
3) Intervalosm =
4) AmplitudC =
ii) Tabla de frecuencias
iIntervalosConteoYifiFihiHi
1-
2-
3-
4-
5-
6
7-
sumas
ii) Interpretar la tabla para i = 4
f4 =
h4 =
F4 =
H4 =
iii) Porcentaje de restaurantes que venden menos de 35 mil soles
iv) Nmero de restaurantes que venden ms o igual a 27 mil soles
CAPITULO IVGRFICOS ESTADSTICOS4.1 Presentacin grfica de datos estadsticos
Un Grfico es una representacin pictrica con el objeto de ilustrar los cambios de una variable, para comparar visualmente dos o ms variables similares o relacionadas.
En estadstica se emplea una diversidad de grficos, cuya forma depender de la naturaleza de los datos y del objetivo. Los grficos de una variable sirven para comparar cantidades absolutas, tasas, variaciones, etc. y pueden tener forma de columnas, barras, puntos o lneas. Los grficos de dos variables se construyen en el plano cartesiano, teniendo en el eje X (abcisa) el registro de la variable independiente; y en el eje Y (ordenada) se colocan los valores de la variable dependiente.
Partes de un Grfico
En todo grfico se debe considerar el ttulo, leyenda, escala, fuente y elaboracin; aunque dependiendo de la complejidad del grfico, los elementos pueden variar
A. Ttulo: es una descripcin del contenido del grfico, explica el contenido
se coloca en la parte superior o inferior del grfico
B. Diagrama: es el propio dibujo del grfico, donde se encuentran ubicados los datos.
C. Escala: es la unidad de medida que se considera en los ejes
D. Fuente: indica el origen de los datos, se ubica en la parte inferior del grfico
E. Leyenda. Hace referencia al diagrama.
4.2 Clasificacin de Grficos
A. Lineales
1. En coordenadas rectangulares
Diagramas de frecuencias
Polgonos de frecuencias
Histograma de frecuencias
Series cronolgicas
Nube de puntos, etc.
2. En coordenadas polares
Diagrama de telaraa
B. De Superficie, en este grupo se tiene:
Grficos de barras verticales, simples, compuestas
Grficos de barras horizontales, simples, compuestas
Coronas circulares
Pirmides
Cilindros, conos, etc.
C. Grficos de dimensiones
De rea, cuando se consideran dos dimensiones
De Volumen, cuando se consideran tres dimensiones
D. Mapas estadsticos o cartogramas
E. Pictogramas
4.3 Grfica de las Distribuciones de Frecuencias
3.3.1 Grfica de Variable Discreta
Este grfico se denomina grfico de bastones, donde en el eje X se registran los valores de la variable (Xi) y en el eje Y se indican las frecuencias
Ejemplo: Graficar los siguientes datos, referidos a las edades de un grupo de turistas
iXifiFihiHi
1160.10
2176
3180.25
419
52040.20
total
01617181920016171819
4.3.2 Grfica de Variable Continua
Las representaciones grficas de las distribuciones de frecuencias para una variable continua se conocen como: histogramas y polgonos de frecuencias
A. HISTOGRAMA
Un histograma o Histograma de Frecuencias est formado por una serie de rectngulos que tienen sus bases sobre un eje horizontal (eje X) e iguales a la amplitud o tamao de cada clase (Ci). Su altura es igual a la frecuencia de clase
B. POLGONO
Es un grfico de lneas trazado sobre los puntos medio de cada clase (en el caso de las frecuencias simple)
Se obtiene uniendo los puntos medios de los extremos superiores de cada rectngulo del histograma. Se acostumbra prolongar el polgono hasta los puntos medios inferior y superior de las clases inmediatas asumidas con frecuencia cero.
Para el caso de las frecuencias acumuladas, el polgono tambin se denomina OJIVA, el cual se obtiene uniendo los lmites superiores de cada intervalo a la altura indicada por la respectiva frecuencia; para el primer intervalo se empieza desde el lmite inferior.
Ejemplo: Construir un histograma y un polgono de frecuencias para la distribucin de frecuencias de 400 tubos (en horas) e intervalos constantes
Hrs300-400500-600700-800800-900
Tubos14365882623822
IIntervalosYifihiFiHi
1-
2-
3-
4-
5-
6-
7-
8-
sumas
90
80
70
60
50
40
30
20
10
30040050060070080090010001100
400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
30040050060070080090010001100
90
80
70
60
50
40
30
20
10
30040050060070080090010001100
400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
30040050060070080090010001100
CAPITULO V
GRFICOS ESTADSTICOS (Continuacin)
5.3.3 Grfica de Variable Cualitativa
Una distribucin de frecuencias de variables cualitativas, pueden ser presentadas grficamente MEDIANTE UN DIAGRAMA DE BARRAS, en la cual la longitud de cada barra es proporcional a la frecuencia del atributo que representa.
Las barras deben ser de igual ancho, pudiendo ser stas horizontales o verticales.
Tambin se puede utilizar GRFICAS CIRCULARES donde los sectores se obtienen convirtiendo los porcentajes en ngulos sexagesimales, para lo cual debe multiplicarse la frecuencia relativa (hi) por 360.
Ejemplo: La siguiente tabla muestra la superficie en millones de millas cuadradas de los ocanos del mundo.
OcanoAntrticorticoAtlnticoIndicoPacfico
Superficie7.64.841.228.570.8
Representar los datos utilizando:
a. Diagramas de barras
b. Diagrama circular
Solucin
OcanofihiSector
Antrtico7.6
rtico4.8
Atlntico41.2
Indico28.5
Pacfico70.8
Suma
Antrtico
rtico
Atlntico
Indico
Pacfico
010203040506070
5.3.4 Otros Tipos de Grficos Estadsticos
1. Columnas Dobles
Sirven para comparar dos series de datos referidos a datos estadsticos
Si se desea puede incluirse los rtulos de datos en las cabeceras de las columnas, con lo cual puede omitirse la escala
2. Columnas Apiladas o Superpuestas
Permiten comparar los elementos con respecto al total
3. Diagrama de Lneas o Grfico Poligonal
Se utiliza para representar series de tiempo (cronolgicas) o cuando se requiere presentar varias series de datos en el mismo grfico.
4. Pictogramas
Son diagramas de figuras, donde las barras son reemplazadas por figuras que representan la variable. Por ejemplo, la importacin de automviles podra graficarse con la figura de un automvil en la escala
Ejemplo:
La tabla estadstica corresponde a la produccin de naranja de un grupo de valles correspondiente al II Semestre del ao anterior expresado en miles de kg.
_________________________________________________________________
Produccin de
Nmero de Valles______________________
naranja en
Naranja
Naranja
Naranja
__miles de Kg.
Francia
Hualcar
Huando____
40 - 70
6
12
10
70 -100
10
5
16
__
100-130
14
10
8________
130-160
8
19
12
160-190
20
22
40
__
190-220
16
25
12_______
220-250
30
15
6
250-280
7
13
17
__
280-310
8
6
9________
a. Graficar la produccin de naranja Hualcar con barras verticales
b. Graficar la produccin de naranja Francia y Hualcar con barras compuestas
c. Graficar la produccin total de naranja con un grfico circular
Produccin.Valles
hisector
40 - 70
70 -100
100-130
________________
130-160
160-190
190-220
________________
220-250
250-280
280-310_____________________
T o t a l
d. Graficar la produccin de naranja mediante barras verticales incrementadas o apiladas
e. Graficar la produccin de naranja Huando mediante barras horizontales
310
280
250
220
190
160
130
100
70
40
510152025303540
f. Grfico Poligonal
Ventas mensuales en soles, de una empresa comercial (datos en miles de soles)
MesEneFebMarAbrMayJunJulAgoSepOctNovDic
Ventas18.921.718.99.915.517.625.312.214.221.215.617.1
30
25
20
15
10
5
EFMAMJJASOND
PARTE 2
MEDIDAS DE POSICINCAPITULO VIESTADIGRAFOS DE TENDENCIA CENTRAL6.1 Definicin
Son estadgrafos que describen la posicin que ocupan los datos alrededor de un valor central. Se les conoce como PROMEDIOS, y permiten el anlisis de una distribucin y la comparacin entre distribuciones.
Los estadgrafos de tendencia central ms importantes son: media aritmtica, media aritmtica ponderada, media armnica, media geomtrica, moda, mediana y los cuantiles.
6.2 La Media Aritmtica
Es el cociente que resulta de dividir la suma de todos los datos entre el nmero de observaciones.
Se le conoce como media o promedio y determina el punto medio de la distribucin. Se simboliza por X M[Xi(Los tipos de media aritmtica son: media aritmtica simple, ponderada y de datos agrupados.
6.2.1 Media Aritmtica Simple
Se suman todas las observaciones, y el total se divide entre el nmero de datos.
_X1 + X2 + X3 + ... + Xi
X = ----------------------------------
n
donde:
Xi : variable o datos
n : nmero de datos
Ejemplo 1: Hallar la media aritmtica de las siguientes edades:
9, 15, 12, 19, 17, 22
Ejemplo 2: Calcular el promedio de los precios:
5.7, 9.2, 6.4, 11.8, 13.7
Ejemplo 3: Si una alumna obtiene en la asignatura de Estadstica las siguientes notas: 16, 15, 14, 13 y 10; calcular el promedio
Ejemplo 4: Si los dimetros en pulgadas de una muestra de aros metlicos es la siguiente: 0.211, 0.294, 0.465, 0.325, 0.373, 0.389, 0.256. Hallar la media de los dimetros.
6.2.2 Media Aritmtica PonderadaEn este caso la variable o dato es multiplicada por un peso o ponderacin. Para determinar el promedio la suma de estos productos se divide entre la suma de los pesos
_x1.w1 + x2.w2 + x3.w3 + ... + xi.wi
X = ------------------------------------------------------
w1 + w2 + w3 + ... + widonde:
xi : variable o dato
wi: ponderacin
Ejemplo: La siguiente distribucin corresponde al nmero de mens vendidos por ciertos restaurantes en forma diaria. Hallar la media aritmtica
Nro Mens142845586470
Nro Restauran387201210
Solucin
Nro. Mens (X)Restauran (w)
Total:
Ejemplo 2: Se ha clasificado a los turistas en 3 grupos de acuerdo a sus patrones de gasto que constituyen el 60%, 30% y 10%. Si el promedio de gasto de cada grupo es de 300, 420 y 650 dlares respectivamente; hallar el gasto promedio total.
Solucin
6.2.2 Media Aritmtica de Datos AgrupadosEn este caso los datos se encuentran agrupados en clases, para calcular la media aritmtica se utiliza la marca de clase (Yi) que corresponde a cada frecuencia de clase, de decir:
_(YI.fI
X = --------------
nEjemplo: Hallar la media aritmtica de la distribucin de sueldos de una empresa (en soles)
Sueldos500-600600-700700-800800-900900-10001000-12001200-1800
Empleados81016151083
Solucin
Sueldos (Xi)YifiYi.fi
Total:
6.2.3 Propiedades de la media aritmtica
La media aritmtica es el centro de gravedad de la distribucin
Es la medida de tendencia central ms estable
Para un conjunto de observaciones la media es nica.
Si un valor se modifica, entonces la media cambia de valor
Si la media sustituye a cada observacin, la suma total no cambia
La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero..
Si a cada observacin se le suma algebraicamente una constante, la media queda sumada algebraicamente en esa constante.
Si a cada observacin se le multiplica por una constante la media queda multiplicada por la constante
Si Wj = aXj + b entonces Media(w) = a media(x) + b
6.2.4 La Media armnica
La media armnica (H) de una serie de n nmeros x1, x2, x3, ... xn es la reciproca de la media aritmtica de los recprocos de los nmeros
_
X = n/ ( (1/xj )
Ejemplo : Si un auto recorre los primeros 10 Km a razn de 30 Km/h y los 10 Km siguientes a razn de 60 Km/h. Determine la velocidad media durante todo el trayecto.
_
XA = 2/( 1/30+1/60 ) = 40 Km/h
6.3 La Media GeomtricaLa Media Geomtrica (G) de una serie de n nmeros X1, X2, X3 ... Xn es la raz ensima del producto de los nmeros. Este promedio se utiliza para calcular nmeros ndices y tasas promedio de variacin
n------------------------
G = ( X1 . X2. X3......Xn Ejemplo 1 : Calcular la media geomtrica de los nmeros 2, 4 y 8
Para datos agrupados se considera la marca de clase (Y)
n-------------------------------
G = ( X1f1 X2 f2 X3 f3.....Xn fn Aplicando logaritmos
( (fi .LogXi)
Log G = ------------------------
nEjemplo 1: Determinar la media geomtrica de la distribucin de remuneraciones de un grupo de trabajadores de la Empresa Delta
Sueldos (Xi)fiYiLogYifi .LogYi
420 - 4906
490 - 56010
560 - 6307
630 - 700
11
700 - 77018
770 - 84015
840 - 91013
910 - 9809
980 - 10503
Total:Total:
Ejemplo 2: Suponga que la poblacin de una ciudad aumento de a 12600 en el periodo de 1995 a 1999, como se indica a continuacin. Halle la tasa de crecimiento.
AoPoblacinTasa de cambio
( ao base: 1995 )
199510000---
1996105001.050
199711200
199812000
199912600
4.3.2 Otras aplicaciones
La media geomtrica es util para encontrar el promedio de porcentajes, razones, tasas de crecimiento.
Ejemplo 1 Suponga que recibe un aumento de 5% en su sueldo del ao pasado y recibir uno de 15% este ao. El aumento porcentual promedio es:
Respuesta: 9.89%
Ejemplo 2: Las ganancias obtenidas por la empresa constructora Alfa en 4 proyectos recientes fueron de 3%, 2%, 4%, y 6%. Cual es la media geomtrica de las ganancias?
Respuesta: 3.46%
Ejemplo 3: Suponga que el nmero de alojamientos tursticos en cierta ciudad eran 2 en 1992 y para el 2002 era 22 Cual es la tasa de incremento porcentual anual promedio para el periodo?
Respuesta: 27.1%
6.5 La Mediana
La Mediana de una coleccin de datos ordenados por su magnitud, corresponde al valor de la variable que divide al nmero de frecuencias en 2 partes iguales. Esto significa que a uno y otro lado de este valor medio se encuentra no ms del 50% de los datos.
Se simboliza por Me
6.5.1 Mediana de una Distribucin Simple
Para calcular la Mediana, los datos se ordenan en forma ascendente o descendente, y luego se observa:
a. Si el nmero de datos es impar la Mediana es igual al valor central
b. Si el nmero de datos es par la Mediana es igual al promedio de los dos valores centrales.
Ejemplo 1. Hallar la mediana de las siguientes notas:
15, 10, 12, 14, 8
Ejemplo 2. Hallar la mediana del nmero de empleados:
12, 10, 18, 13, 11, 21
Ejemplo 3. Hallar la mediana de los siguientes costos unitarios de produccin de componentes:
0.24, 0.31, 0.52, 0.27, 0.38, 0.42, 0.62, 0.46
6.5.2 Mediana de una Distribucin Agrupada
La Mediana determina el punto medio de la distribucin, dividindola en dos partes iguales.
(n+1/100)x50 es entero (E) me = X(E)Me = X (n+1/100)x50 , SI
(n+1/100)x50 es decimal (E.d) me =X(E) + 0.d x (X(E+1)- X(E) )
Ejemplo 1 Los siguientes datos corresponden a los pesos, en Kg de 10 personas: 50, 52, 53, 63, 64, 75, 76, 77, 80. Calcule la mediana.
Solucin: 63.5 Kg.
Ejemplo 2. Sea la variable Z = nmero de hijos por familia y fi = nmero de familias calcular la mediana:
Z)fi
035
115
218
322
Total:N=80
Solucin: me = 1.5 hijos por familia
Ejemplo 3. Hallar la mediana de la siguiente distribucin correspondiente a las edades de los turistas que visitaron cierta atraccin turstica
Edad (Xi)fi
18 - 222066
22 - 2624915
26 - 30281833
30 - 34321447
34 - 38362774
38 - 42402094
42 - 464412106
46 - 50488114
Total:n=114
n _ Fj-1
2
Me = Li + Cj -----------------
Fj - Fj-1
donde
Me:Mediana
n/2:forma de ubicar la clase mediana
Fj-1:Frecuencia absoluta acumulada continua
inferior con respecto a la clase mediana
Fj:Frecuencia absoluta acumulada de la clase
mediana
Li :Lmite inferior de la clase mediana
Cj:Amplitud del intervalo mediano
N = 114
Fj-1 = 47
Fj = 74
Li = 34
Cj = 4
Solucion : 35.48
4.5.3 Importancia de la Mediana
* No es afectada por los valores extremos
* Aplicable a distribuciones con extremos indeterminados
* Su desventaja radica en no considerar todos los datos
6.6 La Moda
Es el valor ms frecuente de una variable, es decir es el valor ms comn
Se simboliza por Mo6.6.1 Moda de una Distribucin Simple
Es el dato estadstico que se repite el mayor nmero de veces
Puede ser unimodal, bimodal o multimodal
Ejemplo 1. Hallar la moda de las siguientes notas:
10, 13, 14, 12, 14, 11, 14, 12, 14
Ejemplo 2. Hallar la moda de los siguientes precios
3.8, 4.2, 5.3, 7.2, 3.9, 5.3, 4.2, 4.1, 4,5
6.6.2 Moda de una Distribucin Agrupada
Determina el punto medio de la distribucin
Para hallar la moda se ubica la mayor frecuencia absoluta y su clase se le denomina clase modal. Luego se ubican las frecuencias absolutas que son inferior y superior respecto a la clase modal.
d1
Mo = Li + Cj -----------------
d1 + d2
donde
Mo:Moda
d1:fj - fj-1
diferencia premodal
d2:fj - fj+1
diferencia postmodal
Li :Lmite inferior del intervalo modal
Cj:Amplitud del intervalo modal
6.6.3 Importancia de la Moda
* Aplicable a datos cualitativos
* No es afectada por valores altos o bajos de la distribucin
* Clculo rpido
* Tiene como desventaja el perder validez cuando es multimodal
Ejemplo 1. Hallar la moda para la siguiente distribucin correspondiente al nmero de trabajadores en empresa hoteleras, donde n = 200
Trabajadores
(Xi)Empresas
fi
06 - 1020
10 -1430
18 - 2260
22 - 2620
Total:
Ejemplo 2. Hallar la moda para la siguiente distribucin de un grupo de empresas de transportes, donde la utilidad se expresa en miles de dlares
Utilidades
(Xi)Empresas
fi
50 - 608
60 - 7010
16
14
10
5
110 - 1202
Total:
PARTE 3
MEDIDAS DE DISPERSINCAPITULO VIIESTADIGRAFOS DE DISPERSIN7.1 Definicin
Los estadgrafos de dispersin son medidas que nos dan la mayor o menor concentracin de observaciones o datos con respecto a un valor central.
Miden el grado de dispersin o concentracin de los datos o valores, alrededor de algunas de las medidas de tendencia central.
Los estadgrafos de dispersin son los siguientes:
A. Medidas de Dispersin Absoluta
* Rango o Recorrido
* Varianza
* Desviacin Estndar
B. Medidas de Dispersin Relativa
* Coeficiente de Variacin
* Coeficiente de Asimetra
* Coeficiente de Curtosis
7.2 El Recorrido o RangoEst definido por la diferencia existente entre el mayor valor y el menor valor de una variable estadstica.
R = XM - Xm
donde:
XM: Mayor valor de la variable
Xm: menor valor de la variable
Cuando mayor es el rango, mayor es la dispersin de los datos alrededor de la medida de tendencia central; aunque debe considerarse que el rango depende de la distancia que existe entre sus dos valores extremos con relacin a los dems valores.
Ejemplo 1. Determinar el rango para las siguientes notas:
12,13,15,18,10,05,04
Ejemplo 2. Determinar el rango en la siguiente distribucin (miles $)
Inversin (Xi)empresas fi
80-8510
85-9015
90-9520
95-10025
100-105 7
7.3 La VarianzaEs el promedio del cuadrado de las desviaciones de la variable respecto a la media aritmtica
Se representa por V(x) S2Proporciona informacin sobre el grado de dispersin de los valores de una serie con respecto a su media aritmtica; mientras mayor sea el valor de la varianza, mayor es la dispersin. Lo anterior implica que cuanto ms pequea sea la varianza, mayor es la concentracin de los datos alrededor de la media aritmtica.
7.4 La Desviacin Estndar o TpicaMide el grado de normalidad de la distribucin de datos de la muestra alrededor de la media aritmtica dentro de sus valores extremos; es decir mide la dispersin alrededor de la media.
La desviacin estndar se define como la raz cuadrada (positiva) de la varianza y se representa por S
___
S = +( S27.5 Clculo de la Varianza y la Desviacin Estndar
7.5.1 Distribucin Simple
_
( (Xi - X ) 2
donde:
S2 = -------------------
S2 : Varianza
n
n : Nro datos
Xi : Variable
(X2
(X 2
X : Promedio
S2 = ------ - -----
n
n
Ejemplo. Determinar la desviacin estndar de los resultados en la evaluacin de 7 alumnos:7,5,10,11,13,15,16
XiXi2Xi - X(Xi - X)2
7.5.2 Distribucin Agrupada
_
( (Yi - X ) 2 fi
donde:
S2 = -------------------
S2 : Varianza
n
n : Nro datos
Yi : Marca clase
(Y2 fi(Yi fi 2
X : Promedio
S2 = -------- - -------
fi : Frecuencia
n
n
Ejemplo 1. Determinar la desviacin estndar para la siguiente distribucin sobre lesiones promedio por cada 1000 horas-hombre de una industria
lesionesfi
1.5 - 1.8 3
1.8 - 2.112
2.1 - 2.414
2.4 - 2.7 9
2.7 - 3.0 7
3.0 - 3.3 5
Total
Ejemplo 2. Determinar la desviacin estndar de la distribucin de ingresos quincenales (en dlares) de los empleados de Beta S.A.C. durante la ltima quincena del mes pasado
Ingresosfi
85 - 939
93 - 1015
101 - 1092
109 - 1171
117 - 1251
125 - 1332
Total
7.6 MEDIDAS DE DISPERSIN RELATIVA
Caractersticas
* Medidas expresadas en porcentaje
* Generan informacin de alta o baja dispersin por s solos
* Mayor porcentaje implica mayor dispersin
7.6.1 COEFICIENTE DE VARIACIN
Es til para realizar comparaciones cuando se usan diferentes unidades de medida de la variable
Se emplea tambin cuando se comparan dos distribuciones con diferente nmero de observaciones
S
CV = ----------100
| X |
donde
CV:Coeficiente de Variacin (%)
S:Desviacin Estndar
X:Media Aritmtica
Se interpreta como el porcentaje de variabilidad de los datos con respecto a la media aritmtica
Por convencin, si el coeficiente de variacin es mayor a 15% la dispersin es alta
Ejemplo. Con los siguientes datos, calcular el coeficiente de variacin:
0.320.440.510.720.770.91
XiXi2Xi - X(Xi - X)2
7.6.2 MEDIDAS DE ASIMETRAEl grado de oblicuidad de una distribucin puede ser medido mediante los coeficientes de asimetra o deformacin
Las medidas de dispersin solamente indican la magnitud de las variaciones, pero no proveen informacin acerca de la direccin hacia donde tienden a ocurrir las variaciones
Por tanto, las medidas de asimetra no slo indican la falta de simetra en la distribucin sino tambin la direccin hacia donde se inclina la distribucin
Si una distribucin es simtrica, no tiene sesgo, es decir, su asimetra es nula.
Si una o ms observaciones son sumamente grandes, la media de la distribucin se vuelve mayor que la mediana o moda. En tales casos se dice que la distribucin tiene asimetra positiva o sesgo positivo. Por el contrario, si hay una o ms observaciones muy pequeas, la media es la menor de las tres medidas de tendencia central, y se dice que la distribucin tiene asimetra negativa o sesgo negativo.
1. Coeficiente de Asimetra de Pearson (A1)
Se define por la siguiente relacin entre media aritmtica, mediana, moda y desviacin estndar
_
_
3 (X - Me)
X - Mo
A1 = ------------------
A1 = --------------
S
S
donde:_
X:Media Aritmtica
Me:Mediana
Mo:Moda
Se presentan los siguientes resultados:
A1 > 0la media aritmtica se inclina a valores extremos altos y por tanto existe asimetra positiva
A1 = 0 la distribucin es simtrica
A1 < 0la media aritmtica se inclina a valores extremos bajos y por tanto existe asimetra negativa
Ejemplo. Graficar el histograma y calcular el coeficiente de asimetra de la produccin de una mquina durante 23 das
produccin0-55-1010-1515-2020-25
Das35753
Adems X=12.5S=3.30Mo=12.5
Solucin
8
6
4
2
0510152025
2. Coeficiente de Asimetra de Fisher (A2)
Se define por la siguiente frmula
_
((X - X) 31
A2 = ---------------. ------
nS3
donde:_
X:Media Aritmtica
S:Desviacin Estndar
Se presentan los siguientes resultados:
A2 > 0asimetra positiva
A2 = 0 la distribucin es simtrica
A2 < 0asimetra negativa
3. Coeficiente de Asimetra de Bacley (A3)
Emplea los cuartiles en su frmula
Q3 - 2 Q2 + Q1
A3 = ------------------------
Q3 - Q1
Se presentan los siguientes resultados:
A3 > 0asimetra positiva
A3 = 0 la distribucin es simtrica
A3 < 0asimetra negativa
Ejemplo. Determinar la asimetra de la distribucin de salarios quincenales de los obreros de la Constructora Delta (datos en dlares)
Salarios ($)obrerosyiyi fiyi2yi2 fi
85 - 949
94 - 1036
103 - 1122
112 - 1211
121 - 1301
130 - 1391
Total
Grfica
10
8
6
4
2
8594103112121130139
CAPITULO VIIIESTADIGRAFOS DE APUNTAMIENTO8.1 MEDIDAS DE APUNTAMIENTO: CURTOSIS
Miden el grado de agudeza o apuntamiento de una distribucin.
El trmino KURTOSIS significa el grado de achatamiento que exhibe una distribucin de frecuencias.
Se analiza comparando la distribucin con la forma de la curva normal, as se tiene 3 casos:
Platikurtica
Mesokurtica
Leptokurtica
8.2 Coeficiente de Kurtosis. Metodo de Cuartiles
Se determina por la siguiente formula:
Q3 Q1
Ki = ----------------
2(P90-P10)
Kurtosis
Limites
Platikurtica
0< Ki < 0.263Mesokurtica
K1 = 0.263
Leptokurtica
0.263< Ki < 0.5
1
_1179074199.xlsGrfico1
191715131820
201810152025
302520253540
&A
Pgina &P
Ene
Feb
Mar
Abr
May
Jun
Gastos por Categoras(soles)
Hoja1
ComidasTransporteAlojamiento
Ene192030
Feb171825
Mar151020
Abr131525
May182035
Jun202540
&A
Pgina &P
_1179074201.xlsGrfico1
7.611111
4.8ArticoArticoArticoArticoArtico
41.2AtlnticoAtlnticoAtlnticoAtlnticoAtlntico
28.5
70.8
&A
Pgina &P
Superficie
#REF!
#REF!
#REF!
#REF!
#REF!
Hoja1
AntrticoArticoAtlnticoIndicoPacfico
Superficie7.64.841.228.570.8
&A
Pgina &P
Top Related