Medidas de Tendencia Central

13
MEDIDAS DE TENDENCIA CENTRAL 1. DEFINICIONES Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4 de estos valores también conocidos como estadígrafos, la media aritmética, la mediana, la moda y al rango medio. La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de observaciones, la media aritmética es la suma de todos y cada uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorsionada de la información de los datos. La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas. La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es más variables que la media y la mediana. Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como medida de posición, pero ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos. 2. DATOS DISCRETOS DATOS DISCRETOS NO AGRUPADOS

description

Medidas de Tendencia Central

Transcript of Medidas de Tendencia Central

MEDIDAS DE TENDENCIA CENTRAL

1. DEFINICIONES

Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados segn su magnitud. Generalmente se utilizan 4 de estos valores tambin conocidos como estadgrafos, la media aritmtica, la mediana, la moda y al rango medio.

La media aritmtica es la medida de posicin utilizada con ms frecuencia. Si se tienen n valores de observaciones, la media aritmtica es la suma de todos y cada uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorsionada de la informacin de los datos.

La Mediana, es el valor que ocupa la posicin central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas.

La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es ms variables que la media y la mediana.

Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como medida de posicin, pero ofrece un valor adecuado, rpido y sencillo para resumir al conjunto de datos.

2. DATOS DISCRETOS

DATOS DISCRETOS NO AGRUPADOS

Analicemos para ello las edades que utilizamos cuando se vio la organizacin y presentacin de datos discretos:

1215141516

1819141517

1517181619

1617151517

1618171917

2316171819

Estos fueron los datos mostrados originalmente, no se han ordenado ni agrupado, determinemos ahora los valores de la Media, la Mediana y la moda, para ello recurramos a las frmulas de estas medidas que resumimos en la siguiente tabla:

MedidaFormulaObservaciones

MediaDonde xi se refiere a todo y cada uno de los elementos de la muestra y n es el nmero total de elementos en la muestra.

Medianaa) p = (n/2)Es la posicin en donde se encuentra la mediana.Si n es impar, entonces es la opcin a, en caso contrario, la b.El valor de la mediana se obtiene por observacin

b) p = (n/2) + 1

ModaSe obtiene el valor por observacin

Rango Medio(Valor mximo + Valor Mnimo) / 2

Aplicando, se obtienen los siguientes valores:

Para la media:

Para la mediana deber ordenarse el grupo de datos, como n = 30, utilizaremos la posicin p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

Para la moda:

La moda estara determinada por observacin directa, y correspondera al valor 17, que se presenta hasta 7 veces en la muestra.

Para el rango medio:

El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5

Si observamos los valores obtenidos veremos que solo para el clculo de la mediana se obtiene tuvo que ordenar la informacin (as lo especfica la definicin), sin embargo podemos tambin observar que este ordenamiento no afecta de manera directa ninguno de los clculos, de esta manera se puede construir la siguiente tabla:

MedidaValor CalculadoObservaciones

Media16.6667

Mediana17Se requiri el clculo de la frecuencia acumulada

Moda17

Rango Medio17.5

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.

DATOS DISCRETOS AGRUPADOS

Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado utilizando:

ClaseRepeticionesTotal de Aos de la clase

12112

14228

15690

16580

177119

18472

19476

23123

Total30500

En donde podemos observar la suma de las frecuencias y de los aos multiplicados por la clase que agrupa a los datos coinciden con los datos utilizados cuando no se agruparon en la seccin anterior, utilizando ahora las formulas de la siguiente tabla:

MedidaFormulaObservaciones

MediaDonde xi se refiere a todo y cada uno de los elementos de la muestra y n es el nmero total de elementos en la muestra y fi se refiere a la frecuencia de la clase.

Mediana

p = (n/2)Es la posicin en donde se encuentra la mediana.Se ubica en la tabla el primer valor de frecuencia acumulada mayor a la posicin calculada, si ese valor es mayor, entonces la mediana es la clase correspondiente al mismo. Si el valor es igual a la posicin, entonces se suman el valor anterior ms el valor obtenido y se divide entre 2.

ModaSe obtiene el valor por observacin de la mayor frecuencia

Rango Medio(Valor mximo + Valor Mnimo) / 2

Aplicando, se obtienen los siguientes valores:

Para la media:

Para la mediana:

Para la Mediana, utilizaremos la frecuencia acumulada:

ClaseFrecuenciaFrecuencia Acumulada

1211

1423

1569

16514

17721

18427

19429

23130

Total30

Como n = 30, utilizaremos la posicin p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

Para la moda:

La moda estara determinada por observacin directa, y correspondera al valor 17, que se presenta hasta 7 veces en la muestra.

Para el rango medio:

El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5

Si observamos los valores obtenidos veremos que solo para el clculo de la mediana se obtiene tuvo que ordenar la informacin (as lo especfica la definicin), sin embargo podemos tambin observar que este ordenamiento no afecta de manera directa ninguno de los clculos, de esta manera se puede construir la siguiente tabla:

MedidaValor CalculadoObservaciones

Media16.6667

Mediana17Se requiri el clculo de la frecuencia acumulada

Moda17

Rango Medio17.5

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.

3. DATOS CONTINUOS

NO AGRUPADOS

Las medidas de tendencia central para datos continuos no agrupados no tienen mayor significacin, ya que el comportamiento es similar al de datos discretos no agrupados, por ello utilizaremos las mismas formulas, pero ahora con los datos continuos del ejercicio de la seccin correspondiente:

1.251.21.281.291.21.24

1.271.211.321.271.181.29

1.21.231.251.281.241.28

1.271.251.241.251.271.28

1.291.181.211.241.21.23

1.251.271.281.241.291.21

Aplicando, se obtienen los siguientes valores:

Para la media:

Para la media, aplicando la formula de la media para datos no agrupados (vista en la seccin de datos discretos):

Para la mediana:

Para la Mediana, como n = 36, es par, utilizaremos la posicin p = (36/2) = 18

Por lo que la mediana se encontrar entre los valores que se ubiquen (de manera ordenada) entre las posiciones 18 y 19 (observa que antes de esa posicin hay 17 y despus tambin hay 17 valores), se encuentran 1.25 y 1.25, por lo que la mediana sera 1.25.

Para la moda:

La moda estara determinada por observacin directa, y corresponderan a los valores 1.24, 1.25 y 1.27 que se repiten en la muestra 5 veces, por lo que la caracterstica segn la moda es una muestra trimodal (normalmente se le conoce como multimodal).

Para el rango medio:

El rango medio se determina por la suma entre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25

Si observamos los valores obtenidos veremos que solo para el clculo de la mediana se tuvo que ordenar la informacin (as lo especfica la definicin), sin embargo podemos tambin observar que este ordenamiento no afecta de manera directa ninguno de los clculos, de esta manera se puede construir la siguiente tabla:

MedidaValor CalculadoObservaciones

Media1.24805556

Mediana1.25Se requiri del ordenamiento de los datos

Moda1.24,1.25, 1.27Muestra multimodal

Rango Medio1.25

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.

AGRUPADOS

Retomando los clculos realizados en la seccin correspondiente a organizacin y presentacin de datos continuos agrupados.

ClasesLiComment by Yoly: Limite Inferior (Li)LsComment by Yoly: Limite Superior (Ls)McComment by Yoly: Marca de ClaseFComment by Yoly: Frecuencia (F)faComment by Yoly: Frecuencia Acumulada (fa)fcfrComment by Yoly: Frecuencia Relativa (fr)fraComment by Yoly: Frecuencia Relativa Acumulada (fra)frc

I1.1751.2031.189663016.67%16.67%83.33%

II1.2131.2411.22710162027.78%44.44%55.56%

III1.2511.2791.26510261027.78%72.22%27.78%

IV1.2891.3171.303935125.00%97.22%2.78%

V1.3271.3551.34113602.78%100.00%0.00%

En ella se pueden observar los lmites superiores e inferiores de cada clase, lo que indica (de no conocer los datos originales) que por ejemplo esos 6 valores de la clase pueden ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202, 1.18, 1.1901.

Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos parmetros como elementos para el clculo de las medidas de tendencia central, por ello se realiz el clculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de cada clase, que servir para el clculo de la media como lo establecemos en la siguiente tabla de clculo para las medidas de tendencia central:

MedidaFormulaObservaciones

MediaDonde Mc se refiere a la marca de clase de cada clase, n es el nmero total de elementos en la muestra y fi se refiere a la frecuencia de la clase.

Mediana

p = (n/2)Es la posicin en donde se encuentra la mediana.Se ubica en la tabla el primer valor de frecuencia acumulada mayor a la posicin calculada. El valor de la mediana se calcula tomando la formula del 5to. Decil.

Moda

Donde Li es el lmite inferior de la clase que tiene la mayor frecuencia.fm es la frecuencia modal (aquella donde se encuentra la frecuencia mayor)f(m -1) es la frecuencia anterior a la frecuencia modal, en caso de encontrarse en la primera clase, este valor es cero.F(m+1) es la frecuencia posterior a la frecuencia modal, en caso de encontrarse en la ltima clase, este valor es cero.A es la amplitud de la clase modal.

Rango Medio(Valor mximo + Valor Mnimo) / 2

Aplicndolas para calcular la media y complementando la tabla anterior:

ClasesLiLsMcFfafcfrfrafrcMc * f

I1.1751.2031.189663016.67%16.67%83.33%7.134

II1.2131.2411.22710162027.78%44.44%55.56%12.27

III1.2511.2791.26510261027.78%72.22%27.78%12.65

IV1.2891.3171.303935125.00%97.22%2.78%11.727

V1.3271.3551.34113602.78%100.00%0.00%1.341

3645.122

Con fundamento en la tabla podemos entonces obtener:

Para la media:

Para el clculo de la mediana, se utiliza la frmula del 5to. Decil (puede ser el 50tavo percentil), para ello determinamos la posicin de este estadgrafo, p = (36/10)*5 = 3.6 * 5 = 18.

Con este valor recurrimos a la columna de la frecuencia acumulada y observamos que el primer elemento mayor al valor calculado se ubica en la clase III, aplicando la frmula obtenemos:

Para la moda:

La moda se encontrara en las clases II y III, son las que mayores frecuencias manifiestan, por lo tanto podemos definir que existen una caracterstica de multimodalida en la muestra, calculemos la primera moda (dejamos como actividad complementaria el clculo de la segunda moda).

Para el rango medio:

El rango medio se determina por la suma entre 1.18 y 1.32 dividido entre 2

(1.18 + 1.32) / 2 = 2.5 / 2 = 1.25

Si observamos los valores obtenidos veremos que solo para el clculo de la mediana se tuvo que ordenar la informacin (as lo especfica la definicin), sin embargo podemos tambin observar que este ordenamiento no afecta de manera directa ninguno de los clculos, de esta manera se puede construir la siguiente tabla:

MedidaValor CalculadoObservaciones

Media1.253388889

Mediana1.2566Se requiri del uso de frmulas del 5to decil, se pudieron usar las de 50tavo centil.

Moda1.241Muestra multimodal, solo se calcul la primera moda

Rango Medio1.25

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.

Construyamos una tabla comparativa de resultados de clculo de estas medidas;

MedidaNo agrupadosAgrupados

Media1.248055561.253388889

Mediana1.251.2566

Moda1.24,1.25, 1.271.241

Rango Medio1.251.25

Puede en esta tabla observarse una diferencia marcada en los valores obtenidos por agrupamiento y no agrupamiento para la media, la mediana y la moda, la ltima, por observacin en el caso de no agrupamiento nos presenta 3 modas, mientras que en el agrupamiento, se obtienen 2 modas, la realidad es que el agrupar datos continuos se tiene una prdida de valores por la aproximacin que se tiene al calcular por ejemplo la marca de clase como valor representativo medio de la misma.