Estadistica 01

44
Distribución de frecuencias sin intervalos: La distribución de frecuencia sin intervalos o clases es recomendable utilizarse cuando se tienen pocas observaciones y, por tanto, la variable estadística tome pocos valores; o también cuando se han hecho muchas observaciones y, sin embargo, la variable toma muy pocos valores distintos, incidiendo de una manera considerable el estudio de las repeticiones de cada valor. Estos casos caerán dentro del estudio de variable discreta. Cuando se estudia una variable cuantitativa X de la población, el mayor interés es conocer la distribución de esta variable a través de los posibles valores del mismo. Suponga que se han recolectado n valores de alguna variable discreta X. El procedimiento más simple de organizar estos n datos, consiste en ordenar estos valores numéricos en forma ascendente. Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k ( kn ) valores distintos de X, digamos, x 1 ,x 2 , ...,x k , con frecuencias absolutas respectivas n 1 ,n 2 , ... ,n k , la distribución de frecuencias de estos n datos se resume en la tabla 2.5 como sigue: Tabla Distribución de frecuencias de variable discreta Valores de la variable X Frecuenci as absolutas n i Frecuencias relativas h i Frecuencias porcentajes p i x 1 x 2 . . x k n 1 n 2 . . n k h 1 h 2 . . h k p 1 p 2 . . p k Total i=1 k n i =n i=1 k h i =1 i=1 k p i =100

description

REGTE

Transcript of Estadistica 01

Distribucin de frecuencias sin intervalos:

La distribucin de frecuencia sin intervalos o clases es recomendable utilizarse cuando se tienen pocas observaciones y, por tanto, la variable estadstica tome pocos valores; o tambin cuando se han hecho muchas observaciones y, sin embargo, la variable toma muy pocos valores distintos, incidiendo de una manera considerable el estudio de las repeticiones de cada valor. Estos casos caern dentro del estudio de variable discreta.Cuando se estudia una variable cuantitativa X de la poblacin, el mayor inters es conocer la distribucin de esta variable a travs de los posibles valores del mismo.Suponga que se han recolectado n valores de alguna variable discreta X. El procedimiento ms simple de organizar estos n datos, consiste en ordenar estos valores numricos en forma ascendente.

Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k () valores distintos de X, digamos, , con frecuencias absolutas respectivas , la distribucin de frecuencias de estos n datos se resume en la tabla 2.5 como sigue:

Tabla Distribucin de frecuencias de variable discreta

Valores de la variable XFrecuencias absolutas n iFrecuencias relativas h iFrecuencias porcentajes p i

x 1x 2..

x kn 1n 2..

n kh 1h 2..

h kp 1p 2..

p k

Total

Ejemplo Supngase que ante la pregunta del nmero de hijos por familia (variable X) una muestra de 20 hogares, marc las siguientes respuestas:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribucin de frecuencias de X se da en la tabla 2.6.

Tabla Distribucin de frecuencias del nmero de hijos por familia.

Nmero dehijosXiFrecuenciasAbsolutasniFrecuenciasRelativashiFrecuenciasPorcentajeshi (%)

01234147620.050.200.350.300.10520353010

Total201.00100

Fuente.- Datos obtenidos de los formularios de la encuesta.

Distribucin de frecuencias por intervalos.

La distribucin de frecuencia por intervalos o clases se usa cuando se han hecho muchas observaciones y la variable estadstica (contina) toma muchos valores distintos o cuando el nmero de valores distintos de una variable discreta es grande, con lo que el campo de variabilidad es muy grande.En este caso, trataremos de agrupar los valores de la variable en intervalos adecuadamente elegidos para no perder mucha informacin.

Para esclarecer la construccin de la tabla de frecuencia para datos agrupados en intervalos de clase, desarrollaremos un ejemplo.

Ejemplo La siguiente informacin corresponde a las medidas de las alturas de 100 alumnos (dados en cm.) tomados en la oficina mdica de Bienestar Universitario de la UNP, durante la ltima semana de setiembre de 2007.

151 161 166 168 169 170 173 176 179 182 152 162 166 168 169 170173 176 179 182 154 163 166 168 169 171 174 176 180 183 155 163167 168 169 171 174 177 180 184 158 163 167 168 169 171 174 177180 185 159 164 167 168 170 171 175 177 181 186 159 165 167 168170 172 175 177 181 187 160 165 167 168 170 172 175 178 181 188189 181 178 175 172 170 169 168 165 161 161 166 168 169 170 173176 178 161 156

Se pide representar los datos en una tabla de frecuencias.

Solucin.

1. Debemos de determinar el rango ( R ) de variacin de los datos que se define por:

R = X max - X min

En nuestro ejemplo, tenemos:Valor mnimo X min = 151Valor mximo X mx = 189

Luego el rango es R= 189 - 151= 38

2. Tenemos que calcular cuantas clases deben formarse?. Para eso se usa la frmula de Sturges:

donde: K = nmero de clases n = nmero de elementos en la muestra (tamao de la muestra).

Est formula es muy til porque orienta al principiante. Sin embargo, es un poco conservador y tiende a dar un nmero de clases un poco menor del que se utiliza en la practica.

En nuestro ejemplo: K = ? , n = 100

Aplicando la frmula tenemos:

redondeando al entero inmediato mayor por que, como ya se indico, la formula es un poco conservadora, obtenemos: K = 8.

Nota.- por razones extradas de la prctica, se adoptan los siguientes lmites para K.

3. La idea es resumir los valores con el fin de percibir algunas caractersticas o propiedades de los datos que no aparecen a simple vista. Para esto vamos a clasificar los 100 alumnos en 8 clases, de acuerdo con la formula de Sturges.

La amplitud de cada intervalo de clase que representamos con la letra c, se obtiene por medio de la formula:

Aplicando los datos a la frmula anterior, se tiene:

Redondeamos a 5.

Luego c = 5 y por tanto, el nuevo recorrido ser:

4. Teniendo en cuenta que este recorrido es mayor que el recorrido original, buscaremos el exceso:Exceso = 40 - 38= 2 cm.

Debemos repartir este exceso a los dos extremos del recorrido original, mitad a cada lado, en este caso 1 a cada extremo. Sumamos el nmero 1 al valor mximo: 189 + 1 = 190 y restamos el nmero 1 al valor mnimo: 151 - 1 = 150.

A partir de este valor 150 agregamos sucesivamente la amplitud 5 y obtenemos los puntos de divisin que determinan los 8 intervalos (ver figura 1.2).

150 155 160 165 170 175 180 185 190

Figura

Sin embargo una dificultad se presenta cuando algunos de los datos coincide con cualquiera de los puntos de divisin: 150, 155, 160, 165, 170, 175, 180, 185 y 190.

5. Supongamos que un dato es 155 donde lo colocamos?- en el primer intervalo cuyos extremos son 150 y 155?- (ver Fig. 2.1) en el segundo intervalo que tiene por extremos 155 y 160?-

Para aclarar est ambigedad adoptamos, el intervalo abierto por la izquierda que no incluye al valor 150 (lmite inferior del intervalo) y cerrado por la derecha que incluye al valor 155 (lmite superior del intervalo). Este tipo de intervalo se representa matemticamente por:, donde representa el lmite inferior del intervalo y representa el lmite superior.

As, en nuestro ejemplo el primer intervalo lo escribiremos como .

Por tanto los intervalos de clase quedan definidos como:Intervalo de clases(150 - 155](155 - 160](160 - 165](165 - 170](170 - 175](170 - 180]

(180 - 185](185 - 190]

Nota.- Tambin existen otros dos tipos de intervalos de clases, definidas como:

Intervalo abierto. Los lmites son abiertos e indican que la clase contiene valores superiores al lmite inferior y valores inferiores al lmite superior.

Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda (incluye al lmite inferior del intervalo) y abierto por la derecha (no incluye al lmite superior del intervalo).

Intervalo cerrado. Este intervalo incluye a ambos lmites del intervalo.

6. Es conveniente que todos y cada uno de los datos que se hallen dentro de un mismo intervalo, estn representados por un mismo valor. Este valor caracteriza a la clase y por eso se llama marca de clase, se obtiene promediando los lmites de cada intervalo. Una formula para calcular la marca de clase o punto medio de un intervalo es:

7. A continuacin debemos realizar la clasificacin y conteo de los datos (ver tabla 1.2), es decir, colocar cada uno de ellos dentro de su clase, todos representados por un mismo signo: una tarja.

TablaIntervalo de clase

Marca de claseYiConteoFrecuenciani

150 - 155152.5

155 - 160157.5

160 - 165162.5

165 - 170167.5

170 - 175172.5

175 - 180177.5

180 - 185182.5

185 - 190182.5

A continuacin presentamos la tabla 2.8, conocida como tabla de distribucin de frecuencias absolutas.

Tabla Distribucin de frecuencias de 100 alumnos de la Universidad Nacional de Piura, segn su estatura (en cm.). Oficina de Bienestar Universitario. Setiembre de 2007.

Intervalo de clase

Marca de claseYiFrecuencianiFrecuenciarelativaFrecuencia acumuladaFrecuencia acumulada

150 - 155152.540.0440.04

155 - 160157.550.0590.09

160 - 165162.5120.12210.21

165 - 170167.5330.33540.54

170 - 175172.5170.17710.71

175 - 180177.5160.16870.87

180 - 185182.590.09960.96

185 - 190187.540.041001.00

Total1001.00

Fuente.- Registro de la atencin medica de la Oficina de Bienestar Universitario de la UNP. 24 de setiembre de 2007.

1. Frecuencia absoluta: (ni )Llamaremos frecuencia absoluta de un valor xi de la variable estadstica X, al nmero de veces aparece repetido dicho valor en el conjunto de las observaciones realizadas.

Propiedad.

2. Frecuencia absoluta acumulada: (Ni )La frecuencia absoluta de un valor xi de la variable X es igual a la suma de los valores inferiores o iguales a dicho valor evidentemente. As, la frecuencia absoluta acumulada del ultimo valor ser n (donde n = nmero de observaciones realizadas).

Propiedad. , de donde

3. Frecuencia relativa: (hi )Llamaremos frecuencia relativa de un valor observado xi de la variable X, al cociente entre su frecuencia absoluta y el nmero de observaciones realizadas (n), y se denota por:

, ,

Propiedad.

1. Frecuencia relativa acumulada: (Hi )Se llama frecuencia relativa acumulada de un valor xi de la variable X, al cociente entre su frecuencia absoluta acumulada y el nmero de observaciones realizadas (n), y se denota por:

Propiedad.

Interpretacin.

n2 = 5, significa que 5 alumnos tienen una estatura mayor de 155 cm. y menor o igual a 160 cm.

N4 = 54, significa que 54 alumnos tienen una estatura mayor que 150 cm. y menor o igual que 170 cm., o tambin significa que 54 alumnos tienen una estatura menor o igual a que 170 cm.

h3 = 0.12, significa que el 12% de los alumnos tienen una estatura mayor de 160 cm. y menor o igual a 165 cm.

H6 = 0.87, significa que el 87% de los alumnos tienen una estatura mayor que 150 cm. y menor o igual que 180 cm., o tambin significa que 87% de los alumnos tienen una estatura menor o igual a que 180 cm.

N6 - N2 = 87 - 9 = 78 alumnos tienen una estatura mayor que 160 cm. Y menor o igual que 180 cm.

REPRESENTACIN GRFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS.

La presentacin de datos a travs de tablas estadsticas es una actividad importante dentro de los sistemas de informacin general, estas se fortalecen significativamente cuando se la acompaan con grficos descriptivos e ilustrativos. En el contexto de los sistemas de informacin, en ms de una oportunidad se encontrar que un buen grfico resume y expresa mucho ms que prrafos completos de comentarios e interpretaciones literales.

En general la representacin grfica de una tabla de frecuencias permite percibir con mayor claridad algunas caractersticas de la masa de datos que se investiga. Por ello, a travs de grficos, resulta bastante ms fcil transmitir conclusiones a personas no habituadas a la interpretacin de tablas de frecuencias.

A continuacin en trminos generales, se dan algunas recomendaciones para la elaboracin de graficas.

La mejor grfica es la ms simple.

Las grficas deben ser tan sencillas y claras, de tal manera que sean comprensibles sin la ayuda de las descripciones del texto.

Las grficas no sustituyen a la tabla o cuadro, al contrario deben complementarse.

Las grficas ms comunes se elaboran teniendo como base los ejes de coordenadas cartesianas.

La finalidad de las graficas es visualizar mejor la informacin.

La grfica es considerada como el medio de expresin de la estadstica, ms llamativa y sugestiva, a la vez que presenta la ventaja de dejar en la memoria una expresin ms duradera que los cuadros o el texto, en un menor tiempo de lectura.

Si el informe tiene dos o ms grficas debern numerarse.

Toda grfica debe tener ttulo que indique con claridad el contenido de la misma.

La lnea vertical (ordenada) representa las frecuencias, y se debe comenzar de cero.

Las variables o caractersticas cualitativas y cuantitativas, por lo general, van en la lnea horizontal (abscisa).

La lectura de la escala del eje horizontal se hace de izquierda a derecha. La lectura del eje vertical debe hacerse de abajo hacia arriba.

Cuando la grfica presenta ms de una caracterstica o variable, deber diferenciarse por medio de leyendas, notas o signos convencionales.

En toda grfica se debe explicar la fuente de donde fueron obtenidos los datos; adems aclarar las escalas, leyendas, notas y convenciones que ayuden a identificar las caractersticas presentadas.

Grfico de la distribucin sin intervalos.

La representacin grfica ms comn para este tipo distribucin de frecuencias es el diagrama de barras que consiste en trazar en cada valor distinto de la variable, segmentos de lneas proporcionales a su frecuencia.

Ejemplo Supngase que ante la pregunta del nmero de hijos por familia (variable X) una muestra de 20 hogares, marc las siguientes respuestas:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribucin de frecuencias de X se da en la tabla 2.6.

Tabla . Distribucin de frecuencias del nmero de hijos por familia.

Nmero dehijosXiFrecuenciasAbsolutasniFrecuenciasRelativashiFrecuenciasPorcentajeshi (%)

01234147620.050.200.350.300.10520353010

Total201.00100

Fuente.- Datos obtenidos de los formularios de la encuesta.

Grafica: Distribucin del nmero de hijos por familia

Fuente.- Datos obtenidos de los formularios de la encuesta.

GRFICO DE LA DISTRIBUCIN POR INTERVALOS.

Los grficos ms usadas son: Histograma, Polgono de frecuencias y polgono de frecuencias acumuladas u ojiva.

a) Histograma.Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de clase, mediante una serie de rectngulos contiguos que tienen: sus bases sobre un eje horizontal y cuya longitud ser igual al tamao de los intervalos de clase. Las alturas proporcionales a la frecuencia (absoluta o relativa).

Ejemplo. Dada la siguiente distribucin de empresas segn el nmero de empleados, se pide:a) Dibujar el histograma y el polgono de frecuencias.

Solucin. Completando la tabla de distribucin de frecuencias, tenemos:

Nmero de empleadosn iAmplitudC ih iDensidadh i /c i100 x h i %

[ 0 - 10)[ 10 - 20)[ 20 - 30)[ 30 - 40)[ 40 - 60)[ 60 - 80)[ 80 - 100)[ 100 - 140)[ 140 - 180)[ 180 - 260)5203540503020201515101010102020204040800.020.080.140.160.200.120.080.080.060.060.0020.0080.0140.0160.0100.0060.0040.002 0.0015 0.0008 2 % 8 %14 %16 %20 %12 % 8 % 8 % 6 % 6 %

Total250250250250250

a) El histograma y el polgono de frecuencias de estos datos se muestra en la figura 3.11.

Densidades 16%0.016 14%0.014

0.012 20%0.010 8%0.008 12%0.006 8%0.004 8%0.002 6% 6%

0 10 20 30 40 60 80 100 140 180 260

Ejemplo La siguiente informacin corresponde a las medidas de las alturas de 100 alumnos (dados en cm.) tomados en la oficina mdica de Bienestar Universitario de la UNP, durante la ltima semana de setiembre de 2007.

151 161 166 168 169 170 173 176 179 182 152 162 166 168 169 170173 176 179 182 154 163 166 168 169 171 174 176 180 183 155 163167 168 169 171 174 177 180 184 158 163 167 168 169 171 174 177180 185 159 164 167 168 170 171 175 177 181 186 159 165 167 168170 172 175 177 181 187 160 165 167 168 170 172 175 178 181 188189 181 178 175 172 170 169 168 165 161 161 166 168 169 170 173176 178 161 156

Tabla Distribucin de frecuencias de 100 alumnos de la Universidad Nacional de Piura, segn su estatura (en cm.). Oficina de Bienestar Universitario. Setiembre de 2007.

Intervalo de clase

Marca de claseYiFrecuencianiFrecuenciarelativaFrecuencia acumuladaFrecuencia acumulada

150 - 155152.540.0440.04

155 - 160157.550.0590.09

160 - 165162.5120.12210.21

165 - 170167.5330.33540.54

170 - 175172.5170.17710.71

175 - 180177.5160.16870.87

180 - 185182.590.09960.96

185 - 190187.540.041001.00

Total1001.00

Fuente.- Registro de la atencin medica de la Oficina de Bienestar Universitario de la UNP. 24 de setiembre de 2007.

Ejemplo . Abriendo la ventana Descripcin y luego escogiendo la opcin Datos numricos Anlisis unidimensional Opciones grficas y finalmente seleccionar Histograma de frecuencias en el programa estadstico STAGRAPHICS, obtener el grfico de histograma de frecuencias absolutas para el ejemplo 2.32.

Figura . Histograma de frecuencias de los alumnos segn su estatura

b) Polgono de frecuencias. Cuando la variable est agrupada en intervalo de clase, el polgono de frecuencia se obtiene uniendo los puntos medios de las bases superiores de cada rectngulo en el histograma.

Ejemplo 2.34. Abriendo la ventana Descripcin y luego escogiendo la opcin Datos numricos Anlisis unidimensional Opciones grficas y finalmente seleccionar Histograma de frecuencias en el programa estadstico STAGRAPHICS, obtener el grfico de histograma de frecuencias absolutas para el ejemplo 2.32.

Figura 2.7. Polgono de frecuencias de la estatura de los alumnos .

c) Polgono de frecuencias acumuladas u ojivas.Est representacin es vlida para variables estadsticas agrupadas en intervalos de clase. En el eje de las abscisas representamos los distintos intervalos de clase que han de estar naturalmente traslapados. En el extremo superior de cada intervalo se levanta una vertical con altura igual a la frecuencia (absoluta o relativa) acumulada, luego se unen los extremos superiores de las verticales con segmentos rectilneos. As el polgono de frecuencias acumuladas absolutas alcanzar su mxima altura en el ltimo intervalo.

Abriendo la ventana Descripcin Datos numricos Anlisis unidimensional Opciones grficas Histograma y haciendo clic con el botn derecho del mouse para que aparezca la ventana de dialogo Opciones de ventana, seleccionar en Tipo de grfico la opcin Polgono y finalmente seleccionar en Frecuencia la opcin Acumulada, para obtener el polgono de frecuencias acumuladas absolutas (menor o igual que) para el ejemplo 2.32.

Figura . Polgono de frecuencias acumuladas Menor o igual que para la estatura de los alumnos .

GRFICO PARA LA DISTRIBUCIN DE FRECUENCIA DE VARIABLE CUALITATIVA.

Los grficos ms comunes para la distribucin de frecuencias de variable cualitativa son el de diagrama de rectngulos y el de sectores circulares.

En un Diagrama de rectngulos los datos de cada una de las modalidades (caracteres cualitativos) se representa por un rectngulo vertical (u horizontal), cuya altura (o largo) es proporcional a su frecuencia (absoluta o relativa). Los rectngulos se dibujan dejando un espacio entre ellos.

Ejemplo: En una encuesta de opinin acerca de las preferencias de una marca de bebidas gaseosas por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:

B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.

Construir la distribucin de frecuencias.

Solucin.

La tabulacin de estos datos, donde la variable cualitativa es X: Color de bebida gaseosa, es la distribucin de frecuencias .

Tabla . Distribucin de personas por su color preferido de la bebida gaseosa.

Color deBebidaNmero deConsumidores: niFrecuenciasrelativas: hiFrecuenciasPorcentajes: hi(%)

Blanco (B)Negro (N)Rojo (R)8930.400.450.15404515

Total201.00100

Fuente.- Datos obtenidos de la encuesta realizada.

Ejemplo . Abriendo la ventana Descripcin, escogiendo Datos cualitativos Tabulacin y finalmente en el icono Opciones grficas seleccionar Diagrama de barras para obtener el diagrama de rectngulos para los datos de la tabla .

Figura . Diagrama de rectngulos para los datos de la tabla 2.9.

En un grfico circular, los datos de cada categora se representan por un sector circular. Es utilizado principalmente cuando se pretende comparar cada valor de la variable con el total. Para construir se divide el circulo en sectores, cuyas reas sern proporcionales a los valores de la variable. Est divisin es obtenida a travs de la regla de 3 simples.

Total 360o Parte xo

Ejemplo . Construir el diagrama de sectores para la informacin contenida en la tabla 2.9. Abriendo la ventana descripcin, escogiendo Datos cualitativos Tabulacin y finalmente en el icono Opciones grficas seleccionar Diagrama de sectores.

Figura . Diagrama de sectores circulares para los datos de la tabla 2.9.

Observacin 2. (Intervalos de clases de tamaos desiguales). Es muy comn el uso de intervalos de clases con tamaos desiguales en el agrupamiento de los datos en tablas de frecuencias. En estos casos se deber tomar algunos cuidados especiales en cuanto al anlisis y construccin del histograma.

Un primer cuidado es construir una columna que indique las amplitudes c i de cada clase.

Un segundo paso es la construccin de la columna de las densidades de frecuencias en cada clase, que es obtenido dividiendo las frecuencias relativas h i por las amplitudes c i. Esto es, una medida que indique cul es la concentracin por unidad de variable.1. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN PARA DATOS SIMPLES.Entre las medidas de tendencia central tenemos: Media. Media geomtrica. Media armnica. Mediana. Moda.Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se est observando.

1.1 Medidas de tendencia central

Media: () Es el promedio aritmtico de todos los valores que componen el conjunto de datos. Se calcula mediante la siguiente frmula.

No olvidando que la () est afectada por los valores extremos .si el valor muy grande o muy pequeo con respecto al resto de valores.

1.1.2 DATOS NO TABULADOS SIN AGRUPAR

Para una muestra y para una poblacin se tiene respectivamente: Muestra Poblacin

Ejemplo 1: En un equipo de ftbol, una muestra de estaturas de sus integrantes son las siguientes:

1.70,1.79,1.73,1.67,1.60,1.65,1.79,1.84,1.67,1.82, 1.74. Calcule la media.

Si es representativa (Homogeneidad Datos)

Ejemplo 2: Dado los Siguientes Datos siguientes: 2, 3, 5, 100

Calcule la media.

No es Representativo (No homogeneidad de Datos)

1.1.3 DATOS TABULADOS AGRUPADOS

Se considera dos casos para datos agrupados en tablas sin intervalos y otros en tablas por intervalos al cual se puede aplicar la siguiente Formula

Para una muestra y para una poblacin se tiene respectivamente: Muestra Poblacin

Ejemplo 1: En un saln de clase se pregunto el nmero de mascotas que tenan en Casa cuales repuestas fueron las siguientes:

VariablesX# de MascotasfiXi . fi

0

1

2

343

8

5

4

50

8

10

12

20

Total2550

0 = no tienen mascotas1 = Tienen una mascota 2 = Tienen dos mascotas3 = Tienen tres mascotas4 = Tienen cuatro mascotas Calcule la media.

Si es

Ejemplo 2: Formula de la Marca de claseClases Intervalos

Marca de ClaseXi

FrecuenciafiXi . fi

0.4 - 2.72.7 - 5.05.0 - 7.37.3 - 9.69.6 - 11.911.9 - 14.214.2 - 16.51.553.856.158.4510.7513.0515.355814117327.7530.886.192.9575.2539.530.7

TOTAL-------50= 363.05

Formula de la Media ()

MEDIANA: ( me) Es la medida de Tendencia Central que divide un conjunto ordenado en forma creciente o decreciente en dos grupos iguales de modo que la mitad (50%)de las observaciones tendr valores que son menores que la mediana y la otra mitad (50%) alcanzara valores mayores que esta .

DATOS NO TABULADOS SIN AGRUPAR:

, Si es una muestra.

, Si es una Poblacin.

Si es impar :la mediana es la observacin que esta en el lugar (n+1)/2 ,esto es :

Si es par :la mediana es el promedio de las observaciones n/2 y n/2+1 , esto es:

Nota: Se aplica a datos Cuantitativos.

Ejemplo 1: Encuentre la mediana para los siguientes Datos impares. 9, 12, 5, 16, 8, 3,11

1. Ordenamos los Datos:3, 5, 8, 9, 11, 12, 162. Una vez ordenado los datos , como el numero de datos es impar (7) se busca el que tiene

la posicin sea este nmero es el 4 ,buscamos el

Nmero que ocupa la cuarta posicin en los datos ordenados encontramos el valor de la mediana Me = 9

Ejemplo 2: Encuentre la mediana para los siguientes Datos inpares.

1.74 , 1.79 , 1.79 , 1.67 , 1.67 , 1.70 , 1.73 , 1.82 , 1.84 , 1.60 , 1.65

1. Primero Ordenamos los datos de mayor a menor se obtiene:

1.60 , 1.65 , 1.67 , 1.67 , 1.70 , 1.73 , 1.74 , 1.79 , 1.79 , 1.82 , 1.84;2. Una vez ordenado los datos , como el numero de datos es impar (11) se busca el que

tiene la posicin sea este nmero es el 6 ,

Buscando el nmero que ocupa la sexta posicin en los datos ordenados encontramos el valor de la mediana Me = 1.73.

Ejemplo 3: Encuentre la mediana para los siguientes Datos Pares.

El riesgo de manifestar deficiencia de hierro en algn momento es alto , en particular durante el embarazo .el problema con esta deteccin de deficiencia es que algunos mtodos para cuantificar el hierro se ven afectados por el estado de embarazo , considere los siguientes datos en relacin con la concentracin de receptor de trasferencia para una muestra de mujeres con pruebas de laboratorio de anemia explicita por deficiencia de hierro (Serum Transferrin receptor for the Detection of Iron Deficiency in Pregnancy , Amen .J.of Clinical Nutrition, 1991: 1077-1081):

15.2 9.3 7.6 11.9 10.4 9.7 20.4 9.4 11.5 16.2 9.4 8.3 Determine la mediana (Me):

1. Primero Ordenamos los datos de mayor a menor se obtiene:

7.6 , 8.3 , 9.3 , 9.4 , 9.4 , 9.7 ,10.4 , 11.5 ,11.9, 15.2 ,16.2, 20.4

2. Una vez ordenado los datos , como el numero de datos es par (12) utilizamos la siguiente Frmula:

3. En este caso n = 12 , por consiguiente la mediana se localiza entre los valores centrales X6 y X7 Es decir entre los valores 9.7 y 10.4 . Por lo tanto , el valor mediano es :

El valor de la mediana Me = 10.05

Nota: Estas formulas son muy objetivas y de fcil aplicacin , pero no siempre se utilizan ;generalmente se apela a una distribucin de frecuencias , cuando es grande la cantidad de datos disponibles .

EJEMPLOS DE DATOS TABULADOS - AGRUPADOS:

Se considera dos casos para datos agrupados en tablas sin intervalos y otros en tablas por intervalos al cual se puede aplicar la siguiente Formula

Ejemplo 1: Encuentre la mediana para los siguientes Datos

VariablesXFrecuenciaFiFrecuencia AcumuladFi

0

1

2

3

2

5

2611

345

416

20

Total20-

Fi - 1 Fi

Fi + 1

1) Calculamos la Posicin de Orden

2)Por las frecuencias Acumuladas se identifica la clase que contiene a la mediana , esto es ,la clase para el cual se cumple .

Fi 1 (n/2) Fi

5 (10) 11

Con lo cual la mediana estar en la clase que tiene como frecuencia acumulada Fi al cual aplicamos la siguiente Formula :

Ejemplo 2: Encuentre la mediana para los siguientes Datos

Se obtuvo una distribucin de frecuencias de 100 alumnos de la UNP, segn su estatura, se pide determinar el valor mediano de las estaturas.

Li - LsMarca de claseXfiFi

150 - 155155 - 160160 - 165152.5157.5162.5451249

21

165 - 170167.53354

170 - 175175 - 180180 - 185185 - 190172.5177.5182.5187.5171694718796100

Total-100-

FI- 1 Fi Fi+1

1) Calculamos la Posicin de Orden

2) Por las frecuencias Acumuladas se identifica la clase que contiene a la mediana, esto es, la clase para el cual se cumple.

Fi 1 (n/2) Fi

21 (50) 54

Remplazamos los datos en la formula obtendremos:

Interpretacin: Este valor mediano significa, que el 50% de los alumnos tienen una estatura menor o igual que 170 Cm. , en tanto que el otro 50% tienen una estatura mayor que 170 Cm.

MODA (Mo) :

Es el valor que se representa con mayor frecuencia en un conjunto de datos Mo = Observacin con mayor frecuencia

DATOS NO TABULADOS SIN AGRUPAR:

Ejemplo 01:Muestra : 2 ; 2 ; 4 ; 5 ; 5 ; 6 ; 6 ; 7 ; 9 ; 1 ; 8 ; 8 ; 8 ; 3Mo =8 Distribucin monomodal (Tiene una Mo)

Poblacin : 3 ; 3 ;4 ;1 ;5 ; 6 ;7 ;3 ;8 ;7; 9 ;2 ;7Mo =3 Mo =7 Distribucin bimodal (Tiene dos Mo)Muestra: 1; 2; 3; 6; 7:9; 8

Mo =No hay moda Distribucin Amodal o Uniforme Nota: La moda es una medida de tendencia Central muy inestable porque cambia de valor al pasar de una muestra a otra.

DATOS TABULADOS AGRUPADOS:

TABLAS SIN INTERVALOS: La clase que contiene la mayor frecuencia ser la que contiene a la moda y se llama clase modal.

N de Hijos por familiaNmero de Familias (fi)

01260120

210

3360

456 a mas1605030

Total990

Fi-1 Fi

Fi+1

En este caso la frecuencia Apsoluta Maxima es de n4 =360 Luego , la moda es el valor de la variable que corresponde a la frecuencia n4 =360 , Mo=3

Tablas con intervalos: para poder desarrollar utilizaremos la formula de Cruzber Donde:

d1 =fi fi-1d2 =fi fi+1

Li =Limite inferior de la clase modal Fi = Frecuencia absoluta de la clase modal.Fi-1 = Frecuencia absoluta de la clase inmediatamente anterior a la clase modal .Fi+1 = Frecuencia absoluta de la clase inmediatamente Posterior a la clase modalTic= amplitud .

Determinar Para la siguiente distribucin :

Li - LsMarca de claseXfi

150 - 155155 - 160160 - 165152.5157.5162.545

12

165 - 170167.533

170 - 175175 - 180180 - 185185 - 190172.5177.5182.5187.5171694

Total-100

Fi-1 Fi Fi+1

1 Tomamos el punto central a si como dice la teora Tomamos de referencia la mayor frecuencia como punto central o Fi

2 Luego recin aplicamos la formula

d1 =33 12 = 21d2 =33 17 = 16Tic = 5

LA MEDIA GEOMTRICA(DATOS NO TABULADOS O NO AGRUPADOS)

Es una cantidad arbitraria de nmeros (por decir n nmeros) es la raz n-sima del producto de todos los nmeros, es recomendada para datos de progresin geomtrica, para promediar razones, inters compuesto y nmeros ndices

MEDIA GEOMETRICA (DATOS TABULADOS O AGRUPADOS)

Primero debemos de aplicar logaritmo de base 10 con la siguiente Formula :

Luego la media Geomtrica :

Pero para desarrollar el antilog10 (log10)Se aplica cierta propiedad matemtica la cual es :

EJEMPLO 01

Marca de Clase92 93 94 95 96

Frecuencia4 11 21 10 4

Ordenamos los Datos YiniLog10Yini log10 Yi

9293949596411211041.963787871.96898291.97312781.97772361.98227127.855151321.65331241.43568419.7772367.929084

Total50-------98.650464

Primero calculamos Log con base 10 (Yi).

Segundo los resultados los multiplicamos por ni.

Primero aplicamos la formula Log base 10:

Para despus aplicar la formula de la media Geomtrica:

MEDIA GEOMTRICA AHORA PARA DATOS CON INTERVALOS

Donde:MG es media geomtrica, yi es marca de clase, fi la frecuencia de clase correspondiente, n el nmero total de datos utilizados.

LA MEDIA ARMONICASe define como la inversa de la media aritmtica de los inversos de un conjunto de datos

Calcula la media armnica para este conjunto de datos.

5 , 9 , 12 , 7 , 15 , 3

Nota: La media armnica siempre es menor o igual que la media aritmtica, ya que para cualesquiera nmeros reales positivos Considera todos los valores de la distribucin y en ciertos casos, es ms representativa que la media aritmtica. La influencia de los valores pequeos y el hecho que no se puede determinar en las distribuciones con algunos valores iguales a cero; por eso no es aconsejable su empleo en distribuciones donde existan valores muy pequeos. Se suele utilizar para promediar velocidades, tiempos, rendimientos, etc.Media Armnica de datos agrupados. La media armnica para datos tabulados (media armnica ponderada) se define por:

(23)

donde k = nmero de clases, yi = marca de clase, ni = frecuencia de clase con i=1, 2,, k

Ejemplo Con los datos de la siguiente tabla de frecuencias, correspondiente a una distribucin continua, calcular la media armnica

Li - LSf iX if i /Xi

2.1 - 6.0 6.1 - 10.010.1 - 14.014.1 - 18.018.1 - 22.037121620 4 81216200.7500.8751.0000.5000.500

40-3.625

Ventajas y desventajas de la Media Armnica.

Ventajas.1. Se usa preferentemente para calcular la velocidad media.2. De gran utilidad cuando la variable est dada en forma de tasa, costo medio de bienes comprados con una cantidad fija.

Desventajas1. La media armnica se basa en todas las observaciones por lo que est afectado por los valores extremos. 2. La media armnica no esta definido, si alguno de los valores es cero.

Propiedades de la Media Armnica.

1. La media Armnica se basa en todas las observaciones, por lo que est afectado por todos los valores de la variable. Da a los valores extremadamente grandes un peso menor que el que las d la media geomtrica, mientras que a los valores pequeos les da un peso mucho mayor que el que las d la media aritmtica como la media geomtrica.

2. La suma algebraica de las desviaciones de los recprocos de las observaciones del recproco de la media armnica es nula. Es decir,

3. Para trminos positivos, la media armnica es menor o igual que la media geomtrica. O sea,

4. De la propiedad 3 y la propiedad 4 (de la media geomtrica), se tiene:

Siempre que se trate del mismo conjunto de datos.

Aplicaciones de la media armnica.

La media armnica se aplica en los casos siguientes:1. Cuando se tiene trminos para cuyos recprocos se quiere calcular su media.

2. Cuando se presenta una relacin inversa entre las variables implcitas, como por ejemplo, entre la productividad y el tiempo. Es decir,

de donde

donde e = espacio ; p = productividad ; t = tiempo

La velocidad y el tiempo tambin estn en relacin inversa:

,

donde e = espacio ; v = velocidad ; t = tiempo

Ejemplo

Suponga que ha gastado usted, un sol por 3 docenas de naranjas en una tiende, otro sol por 4 docenas de naranja en una segunda tienda y otro sol ms por 5 docenas en una tercera tienda. Determine el precio promedio por una docena de naranjas.

Solucin. Obtendremos primero el precio pagado por docena de naranja. En la primera ud. ha gastado 1 sol por 3 docenas de naranjas o sea 1/3 de sol por docena.En la segunda gast 1 sol por 4 docenas, es decir de sol por cada docena.En la tercera tienda gast 1 sol por 5 docenas, o sea 1/5 de sol por cada docena.En otras palabras queremos calcular la media de los recprocos de los nmeros 3, 4 y 5. Entonces, la media armnica es el promedio correcto. Luego n = 3, x1 = 1/3, x2 = 1/4, x3 = 1/5, es decir

Por tanto, el precio promedio por docena es 0.25 soles.

Comprobacin. Se compr 12 docenas de naranjas por 3 soles. Veamos si pagando en promedio 0.25 por docena, en doce docenas se gasta 3 soles.

0.25 x 12 = 3 solesVeamos que ocurre si usamos la media aritmtica:

En este caso el promedio por docena es 0.261Pagando 0.261 soles por docena, tendramos

0.261 x 12 = 3.132 solesEs decir, se obtiene 0.132 soles ms de lo que en realidad se gast por las 12 docenas. Por tanto, la media aritmtica en este caso es incorrecta.VARIANZA

Es una medida que nos ayuda a comprender la variabilidad de los datos, que tan distanciados estn de la media. Si los valores tienden a concentrase alrededor de su media , la varianza ser pequea . Si los valores tienden a distribuirse lejos de la media , la varianza ser grande .

La varianza calculada a partir de la media ser denotada por y referida a una poblacin se denota por 2

Para datos sin Agrupar o no Tabulados

Para datos Agrupados o Tabulados en Intervalos

Para la Muestra

Para la Poblacin

Nota : para la aplicacin de estas formulas si queremos sacar la desviacin estndar solo le sacamos la raz cuadrada .

Ejemplo -Para datos sin Agrupar o no Tabulados Se determino los pesos de una muestra de cartas procesadas en una oficina postal ,pesadas hasta el gramo mas prximo ,son : 21 , 28 , 30 , 12 , 14 , 17 , 28 ,10 , 16 , 25

Gramos al cuadrado

Aplicando el mtodo abreviado

Para Datos Agrupados

Ejemplo 01:

Li Ls

30 3532.52243.36486.72

35 4037.54112.32449.44

40 -4542.5731.36219.52

45 -5047.5180.366.48

50 5552.51219.36232.32

55 - 6057.5688.36530.16

60 6562.51207.36207.36

Total---50---2132

Solucin:

Varianza

Desviacin estndar

Ejemplo 02:

Aplicando frmula Reducida:

Li - Ls

30 3532.52652112.5

35 4037.541505625

40 -4542.57297.512643.75

45 -5047.51885540612.5

50 5552.51263033075

55 - 6057.5634519837.5

60 6562.5162.53906.25

Total---502405117812.5

Varianza

Desviacin estndar

Propiedades de la varianza.

1. La varianza de un conjunto de observaciones x1, x2, , xn siempre es un nmero no negativo. Esto es

2. La varianza de una constante es cero. Esto significa, que si x1= x2= = xn = b constante, entonces:

DESVIACIN ESTNDAR

Es la raz cuadrada positiva de la varianza La desviacin estndar calculada a partir de la Muestra se denota por y referida a una poblacin se denota por

DATOS SIN AGRUPAR O NO TABULADOS

Esto seria = para la Muestra

Esto seria = para la Poblacin

Desviacin Para datos sin Agrupar o no Tabulados

Ejemplo 01 :

Calcular la desviacin estndar

4 , 9 , 14 , 19 , 23 , 28 , 37 , 54 , 62 , 70

n = 10= 32 ;= 1024

Desviacin Para datos Agrupados o Tabulados

Ejemplo 02 :

Calcular la siguiente distribucin de frecuencias por intervalos encontrar la desviacin estndar

Li - Ls

40 50453-17306.25918.75

50 60555-7.556.25281.25

60 -706572.56.2543.75

70 8075412.5156.25625.00

80 -9085122.5506.25506.25

TOTAL---20------

Primero calculamos la Media para datos tabulados y le restamos a la Marca de clase :S

Luego : 45 - 62.5 = -17.575 - 62.5 = 12.555 - 62.5 = -7.585 - 62.5 =22.565 - 62.5 = 2.5

Luego : ( -17.5 )2= 306.25( 12.5) 2= 156.25( -7.5 )2= 56.25 (22.5) 2= 506.25( 2.5 ) 2= 6.25

Luego : (3*306.25)=918 (4* 156.25)=625.00( 5*56.25)=281.25 ( 1*506.25)=506.25( 7*6.25)=43.75

Propiedades de la Desviacin Estndar. Las propiedades de este estadgrafo de dispersin son triviales y similares a la de la varianza, por lo que no se demostrar.

1. La desviacin estndar de un conjunto de observaciones x1, x2,..., xn , siempre es un nmero no negativo. Es decir,

2. La desviacin estndar de una constante, es cero, As, si c = constante, entonces,

Nota : Aplicando estas formulas Encontramos la Desviacin estndar y solo habra que elevarlas al cuadrado para encontrar la VARIANZA.

Sin embargo, a veces es necesario comparar dos o ms conjunto de datos expresados en unidades diferentes, Es esta situacin hay que utilizar una medida relativa de dispersin que sera el coeficiente de variacin.Coeficiente de Variacin :El coeficiente de Variacin o Dispersin , es una medida de dispersin relativa de la desviacin estndar con respecto a la media , es decir :

COEFICIENTE DE VARIACIN : Generalmente el coeficiente de variacin se expresa como un porcentaje . El coeficiente de variacin es un numero puro independiente de la unidad de medicin .

Observacin :

Si el coeficiente de Variacin es menor del 10% Se dice que hay poca dispersin

Si el coeficiente de Variacin oscila entre 10% y el 33% porciento La dispersin existente es aceptable .

Si el coeficiente de Variacin oscila 33% y el 50% Se dice que hay alta dispersin .

Pero el coeficiente de Variacin es mayor del 50% se dice que la dispersin es muy alta .

Ejemplo:

Al calcular la dispersin relativa de los datos de un ejemplo Tenemos la Media y la Desviacin Estndar:

= 48.1 y = 6.596226

Entonces el coeficiente de Variacin es:

Como el valor de Coeficiente de Variacin es igual al 13.71 % y se encuentra entre el 10% y 33% indica que la dispersin es aceptable.