Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la...

32
Medidas de la tendencia central y de la dispersión Tendencia central Dispersión Datos no agrupados Recorrido Desviación media absoluta Varianza y desviación típica Percentiles Datos agrupados Percentiles Varianza y desviación típica Datos no agrupados Media aritmética Mediana Moda Media aritmética ponderada Media geométrica Datos agrupados Media aritmética Mediana Moda Conceptos relacionados Teorema de Chebyshev Regla empírica Sesgo Coeficiente de variación

Transcript of Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la...

Page 1: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Medidas de la tendencia central y de la dispersión

Tendencia central Dispersión

Datos no agrupados

Recorrido

Desviación media absoluta

Varianza y desviación típica

Percentiles

Datos agrupados

Percentiles

Varianza y desviación típica

Datos no agrupados

Media aritmética

Mediana

Moda

Media aritmética ponderada

Media geométrica

Datos agrupados

Media aritmética

Mediana

Moda

Conceptos relacionados

Teorema de Chebyshev

Regla empírica Sesgo Coeficiente de variación

Page 2: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Medidas de la

tendencia

central y de la dispersi

ón

Las medidas de tendencia

central ttienen como

objetivo el sintetizar los datos

en un valor representa

tivo, las medidas de dispersión nos dicen hasta que

punto estas

medidas de tendencia

central son representativas como síntesis de

la informació

n. Las medidas de dispersión cuantifican

la separación

, la dispersión,

la variabilida

d de los valores de

la distribución respecto

al valor central.

Distinguimos entre

medidas de dispersión absolutas, que no son comparables entre

diferentes muestras y

las relativas que nos

permitirán comparar

varias muestras.

Page 3: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

Page 4: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.
Page 5: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIA ARITME

TICA

EjemploLos pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el

peso medio.

Es el valor resultante que se obtiene al dividir

la sumatoria de un conjunto de datos sobre

el número total de datos. Solo es aplicable para el tratamiento de

datos cuantitativos.

Page 6: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIANA Ejempl

o: Encontrar la

mediana para los siguientes

datos:4 1 2 3 4 2 2 1

5 5 3SOLUCIÓN

1: Ordenar los datos.

1 1 2 2 2 3 3 4 4 5 5

2: Localizar el valor que divide

en dos parte iguales el

número de datos.

1 1 2 2 2 3 3 4 4 5 5

La mediana es 3, dejando 5 datos a cada

lado.

Mediana (Me): Valor que divide una serie de

datos en dos partes iguales. La cantidad de datos que queda por

debajo y por arriba de la mediana son iguales.

Page 7: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MODA

ejemplo: “hallar la moda del siguiente

conjunto de datos.”

14,15,16,18,5,7,5,9,15,5. se ordenan:

5,5,5,7,9,14,15,15,16,18. la moda es igual a 5..

La moda es el valor que se presenta con

mayor frecuencia en un

conjunto de datos. a una

distribucion que tiene una sola

moda se le denomina

unimodal, si tiene dos datos que se repiten igualmente, se le conoce como

bimodal, y si tiene tres o mas

modas se le conoce como multimodal. si ningun dato se

repite, entonces no tiene moda.

Page 8: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIA ARITMETIC

A PONDERAD

A

Tiene en cuenta la

importancia relativa de

las observacio

nes, es superior a la media

aritmética simple

Page 9: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIA GOMETR

ICA

Por ejemplo, la media

geométrica de 2 y 18 es

En matemáticas y estadística, la media geométrica de una

cantidad arbitraria de números (digamos n números) es la raíz n-ésima del producto de

todos los números.

Page 10: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

DATOS AGRUPADOS

En la mayor parte de casos tenemos un número grande de datos y

tomamos en cuenta que en estos casos generalmente los datos son

resumidos en una tabla de frecuencia. La fórmula para el

cálculo cuando se trata de datos agrupados es diferente a la de los no

agrupados.

Page 11: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIA ARITME

TICA

Si los datos vienen

agrupados en una tabla de frecuenci

as, la expresión

de la media

es:

La media aritmética es igual a la división de la sumatoria del

producto de las clases por la

frecuencia sobre el número de datos.

Page 12: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIANA

EJEMPLOLas

calificaciones en la

asignatura de

Matemáticas de 39

alumnos de una clase

viene dada por la

siguiente tabla:

Calificaciones 1 2 3 4 5 6 7 8 9 Número de alumnos 2 2 4 5 8 9 3 4

2 Se halla las frecuencias absolutas

acumuladas .Asociada a la

mediana para n impar, se obtiene .Ni-1< n/2 < Ni = N19 < 19.5 < N20

Me = 5 puntos, la

mitad de la clase ha

obtenido un 5 o menos, y la otra mitad un 5 o más.

En el ámbito de la

estadística, una

mediana es el valor de la variable que

deja el mismo

número de datos antes y después que él, una vez ordenados

estos.

Page 13: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MODA Ejemplo

Encontrar la estatura

modal de un grupo que se

encuentra distribuido de la siguiente

forma:Entre 1.80 y 1.70 hay 6

estudiantes.Resolviendo:

Se suma 0.075 (la distancia parcial) a

1.60 (el límite inferior),

obteniéndose la moda.

la moda es la

observación que se

presenta mas a

menudo, se encontrara en la clase

de frecuencia mas alta. Esta clase de máxima frecuencia se llama

clase modal.

Page 14: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

MEDIDAS DE DISPERSIÓN

MEDIDAS DE DISPERSIÓN

Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que

permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables

cuantitativas.

Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que

permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables

cuantitativas.

La dispersión es importante porque:

La dispersión es importante porque:

Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.

Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.

Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Page 15: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Datos no agrupados

Ejemplo: 5,7,2,15,2,6,12,5,5,20

,10. numero de personas

que ayudaron a una causa.

Datos no agrupados

es el conjunto de observaciones que se presentan

en su forma original tal

y como fueron

recolectados, para obtener

información directamente de ellos.

Page 16: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

EL RANGO

O RECORR

IDO ( R ):

Es la medida

de variabilidad más fácil de calcular.

Para datos

finitos o sin

agrupar, el rango se define como la

diferencia entre el

valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin)

en un conjunto de datos.

Rango para

datos no agrupados;

R = Xmáx.-Xmín

= Xn-X1

Ejemplo:

Se tienen las edades de

cinco estudiant

es universita

rios de 1er año, a

saber: 18,23, 27,34 y

25., para calcular la

media aritmética (promedio

de las edades, se tiene

que: R = Xn-

X1 ) = 34-18 = 16 años

Page 17: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Desviación media absolutaDesviación media absoluta

La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable.

Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética por la mediana M. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.

La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable.

Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética por la mediana M. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.

Page 18: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Ejemplo: Desviación media para datos no agrupadosTres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional.El número de preguntas buenas por materia se muestra a continuación:

Materia Carlos Pedro Juan

1 2 7 5

2 9 2 6

3 10 2 5

4 2 6 5

5 3 6 5

6 1 3 5

7 9 6 4

8 9 7 5

9 1 6 6

10 4 5 4

SOLUCIÓNLo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas.Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?.Complementemos el análisis anterior calculando la desviación media:Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6).

Page 19: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.
Page 20: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.
Page 21: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

CENTILES O PERCENTILE

S

Los percentiles son, tal vez, las medidas

más utilizadas para

propósitos de ubicación o clasificación

de las personas cuando

atienden características

tales como peso,

estatura, etc. Los

percentiles son ciertos

números que dividen la

sucesión de datos

ordenados en cien partes

porcentualmente iguales.

Estos son los 99 valores

que dividen en cien partes

iguales el conjunto de

datos ordenados.

Los percentiles (P1, P2,...

P99), leídos primer

percentil,..., percentil 99.

Page 22: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

DATOS AGRUPADOS

En la mayor parte de casos tenemos un número grande de datos y

tomamos en cuenta que en estos casos generalmente los datos son

resumidos en una tabla de frecuencia. La fórmula para el

cálculo cuando se trata de datos agrupados es diferente a la de los no

agrupados.

Page 23: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

PERCENTILES:PERCENTILES:

Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.

Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.

Para datos agrupados los deciles se calculan mediante la fórmula.

k= 1,2,3,... 9

Donde:

Lk = Límite real inferior de la clase del decil k

n = Número de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.

fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k

Para datos agrupados los deciles se calculan mediante la fórmula.

k= 1,2,3,... 9

Donde:

Lk = Límite real inferior de la clase del decil k

n = Número de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.

fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k

Page 24: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Salarios No. De fa

(I. De Clases) Empleados (f1)

200-299 85 85

300-299 90 175

400-499 120 295

500-599 70 365

600-699 62 427

700-800 36 463

EJEMPLO.- Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla:Como son datos agrupados, se utiliza la fórmula

Como son datos agrupados, se utiliza la fórmula

Siendo

Page 25: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.
Page 26: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.
Page 27: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética.

Varianza

El coeficiente de variación:

Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.

Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.

Page 28: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 - 1/k2, donde k es una constante mayor que 1.

Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 - 1/k2, donde k es una constante mayor que 1.

Page 29: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Regla empírica: Para una distribución de frecuencias simétrica de campana, aproximadamente 68% de las observaciones estará a más y menos una desviación estándar desde la media, aproximadamente 95% de tales observaciones se encontrará a más y menos dos desviaciones estándares de la misma; y prácticamente todas las observaciones (99,7%) se hallarán a más y menos tres desviaciones con respecto a la media.

Regla empírica: Para una distribución de frecuencias simétrica de campana, aproximadamente 68% de las observaciones estará a más y menos una desviación estándar desde la media, aproximadamente 95% de tales observaciones se encontrará a más y menos dos desviaciones estándares de la misma; y prácticamente todas las observaciones (99,7%) se hallarán a más y menos tres desviaciones con respecto a la media.

Page 30: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

SESGONo todas las distribuciones son normales, algunas están sesgadas a la izquierda o a la derecha, en ambos casos la moda es, por definición aquella observación que ocurre con más frecuencia .por consiguiente esta en el pico de la distribución ,por su propia naturaleza la media aritmética resulta afectada, sobre todo, por observaciones extremas, así pues, está desviada a la dirección del sesgo más que la mediana, que queda situada en algún punto entre la media aritmética y moda.

SESGONo todas las distribuciones son normales, algunas están sesgadas a la izquierda o a la derecha, en ambos casos la moda es, por definición aquella observación que ocurre con más frecuencia .por consiguiente esta en el pico de la distribución ,por su propia naturaleza la media aritmética resulta afectada, sobre todo, por observaciones extremas, así pues, está desviada a la dirección del sesgo más que la mediana, que queda situada en algún punto entre la media aritmética y moda.

Page 31: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

El coeficiente de variación

Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.

Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación

(las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea.

Page 32: Medidas de la tendencia central y de la dispersión Medidas de la tendencia central y de la dispersión Tendencia centralDispersión Datos no agrupados Recorrido.

Ejemplo: Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?