Ejercicios Resueltos de Cuartiles

14
Estadística Aplicada Doc. Juan Roberto Morales Romero 1 Definiciones generales Objetivo Brindar al participante los conceptos teóricos básicos sobre Media Aritmética para datos no agrupados y agrupados En esta sesión - Conceptos básicos de Media Aritmética para datos agrupados y no agrupados - Formulas - Ejemplos Resueltos - Ejercicios Propuestos

Transcript of Ejercicios Resueltos de Cuartiles

Page 1: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

1

Definiciones generales

Objetivo

Brindar al participante los conceptos teóricos básicos sobre Media Aritmética para datos noagrupados y agrupados

En esta sesión

- Conceptos básicos de Media Aritmética para datos agrupados y no agrupados- Formulas- Ejemplos Resueltos- Ejercicios Propuestos

Page 2: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

2

Conceptos básicos de Media Aritmética

Media Aritmética

Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. Por lotanto, la medida posicional más utilizada en los estudios estadísticos. Por su fácil cálculo e interpretación, esla medida de posición más conocida y más utilizada en los cálculos estadísticos. La media es el valor másrepresentativo de la serie de valores, es el punto de equilibrio, es el centro de gravedad de la serie dedatos.

Esta dada por la suma de todos los datos de la población dividida entre el numero total de ellos.

Desviaciones o desvíos

Son diferencias algebraicas entre cada valor de la serie o cada punto medio y la media aritmética de dichaserie, o un valor cualquiera tomado arbitrariamente. Los desvíos o desviación se designan con la letra di.Dado una serie de valores X1, X2, X3, .......Xn , se llama desvío a la diferencia entre un valor cualquiera Xi dela serie y un valor indicado k de esa misma serie. Si el valor indicado k de la serie corresponde precisamentea la media aritmética de esos valores dados, se dice entonces que los desvíos son con respecto a la mediaaritmética. En símbolo: ).( XXd ii −=

Propiedades de la media aritmética

1. – La suma de las desviaciones con respecto a la media aritmética es igual a cero. .0=∑ id2. – La suma de las desviaciones al cuadrado de los diversos valores con respecto a la media aritmética es

menor que la suma de las desviaciones al cuadrado de los diversos valores con respecto a cualquier

punto K, que no sea la media aritmética. ( )2∑ − XX i < ( )2

∑ − KX i .

Características principales de la media aritmética

1. – El valor de la media depende de cada una de las medidas que forman la serie de datos, y se hallaafectada excesivamente por los valores extremos de la serie de datos.

2. – La media se calcula con facilidad y es única para cada caso y permite representar mediante un solovalor la posición de la serie de valores.

3. – La media es una medida de posición que se calcula con todos los datos de la serie de valores y essusceptible de operaciones algebraicas.

Page 3: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

3

Definiciones generales

Objetivo

Brindar al participante los conceptos teóricos básicos sobre medidas de posición ( Cuartil , Decil yPercentil ).

En esta sesión

- Conceptos básicos de Cuartil Decil y Percentil- Formulas- Ejemplos Resueltos- Ejercicios Propuestos

Page 4: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

4

Conceptos básicos de Cuartil, Decil y Percentil

Cuartiles

Medida de posición que divide en cuatro partes iguales al conjunto de los valores ordenados de una

distribución de frecuencias. Las medidas son el primer cuartil Q1, el segundo cuartil Q2 y el tercer cuartil

Q3.

♦ PRIMER CUARTIL

Distribuye a la izquierda el 25% de los datos y al lado derecho el 75 % ver figura 1

♦ SEGUNDO CUARTIL

Coincide con la mediana entonces el segundo cuartil es igual a la mediana Q2 = Md

♦ TERCER CUARTIL

Distribuye a la izquierda el 75% del numero de datos y al otro lado el 25% del numero de valores ver

figura 2

Deciles

Medida de posición que divide en 10 partes iguales al conjunto de valores ordenados de una distribución de

frecuencias . Estas medidas son : El primer decil D1, el segundo decil D2 hasta el noveno decil D9.

Q1

Q2 = Md

25%75%

25%75%

Q2 = Md

Page 5: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

5

♦ El primer decil distribuye al lado izquierdo el 10% de los datos y al otro lado el 90%. Ocupa la posición

(n/ 10).

♦ El segundo decil distribuye al lado izquierdo el 20% de los datos y al otro lado el 80%. Ocupa la posición

(2n/ 10).

♦ El noveno decil distribuye al lado izquierdo el 90% de los datos y al otro lado el 10%. Ocupa la posición

(9n/ 10).

Percentiles

Medida de posición que divide en 100 partes iguales al conjunto de valores ordenados de una distribución de

frecuencias y se indican con P1, P2,...... P99 . El 50 percentil coincide con la mediana.

Formulas

D1 D2 D3 D4 D90

0 n /10 2n /10 3n /10 9n/10

0 P1 P2 P3P99

Page 6: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

6

Cuartiles

Q1 = Extremo Inferior + ( n/4 - Fi - 1 ) *c

Q3 = Extremo Inferior + ( 3n/4 - Fi - 1 ) *c

Deciles

Dr = Extremo Inferior + ( r n /10 - Fi - 1 ) *c

Percentiles

Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c

Ejemplos Resueltos

CuartilesEJERCICIO 1

Al aplicar una evaluación de Teoría política a un grupo de 138 alumnos se obtuvieron los siguientes

puntajes organizado en la siguiente distribución de frecuencias.

a) Determinar el 25% inferior y el 25% superior.

Intervalos fi Fi

40-45 4 4

45-50 8 12

50-55 15 27

55-60 24 51

60-65 31 82

65-70 19 101

70-75 16 117

f

f

f

f

f

Dr = Decil BuscadoExtremo Inferior = Extremo inferior donde se hallael decil buscador = indica el decil . Tercer decil ( r=3 ) r tomavalores de 1 hasta el 9.rn / 10 = indica la situación del decil . Intervalodonde esta el decil

Pr = Indica percentil BuscadoExtremo Inferior = Extremo inferior donde se hallael percentilr = es el rango percentil, es decir , la situacióndentro de la escala ordenada de cien elementos.rn / 100 = indica el intervalo de la distribución defrecuencia donde se halla el percentil

Page 7: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

7

75-80 10 127

80-85 8 135

85-90 3 138

Determinar el 25% superior :

Calculando el cuartil Q3Para determinar el intervalo donde esta el Q3 dividimos :

3n / 4 = 3 * 138 /4 = 103.5 se halla en el sétimo intervalo empieza en 102 y termina en 117

Aplicando formula : Q3 = Extremo Inferior + ( 3n/4 - Fi - 1 ) *c

Fi - 1 = F 7 - 1 = F 6 = 101f7 = 16

Q3 = 70 + (103.5 – 101)*5

Q3 = 70+0.78

Q3 = 70.78

Q3 = 71

Todos los alumnos con puntaje superior a 71 se hallan en el 25% superior.

DecilesEJERCICIO 2

Se tiene los puntajes obtenidos por 269 alumnos en una prueba de rendimiento de Geometría.a) Determinar los puntajes de los que se hallan en el 20% inferior y cuales puntajes se ubican en el décimosuperior

Intervalos fi Fi

20-24 3 3

24-28 8 11

28-32 16 27

n = 138

24

f

16

Page 8: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

8

32-36 25 52

36-40 41 93

40-44 55 148

44-48 48 196

48-52 33 229

52-56 21 250

56-60 12 262

60-64 7 269

Puntajes de los que se hallan en el 20% inferior

Calculando el segundo decil. Entonces r=2

Ubicación del segundo decil

2n / 10 = (2*269) /10 =53.8 Entonces el segundo decil esta en el quinto intervalo

Aplicando la formula :

Dr = Extremo Inferior + ( r n /10 - Fi - 1 ) *c

D2 = 36 + ( 53.8 - 52 ) *4

D2 = 36.18

Todos los alumnos que tengan puntajes desde 20 hasta 36 entero inmediato anterior a 36.18 se encuentra en el20% inferior

Puntajes se ubican en el décimo superior

Calculando el noveno decil. Entonces r=9

Ubicación del segundo decil

9n / 10 = (9*269) /10 = 242.1 Entonces el noveno decil esta en el noveno intervalo

Aplicando la formula :

Dr = Extremo Inferior + ( r n /10 - Fi - 1 ) *c

D9 = 52 + ( 242.1 - 229 ) *4

n = 269

f

41

f

21

Page 9: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

9

D9 = 54.50

Todos los alumnos que tengan puntajes desde 55 se hallaran en el décimo superior

PercentilesEJERCICIO 3Con la siguiente distribución de frecuencia calcular P10 y P90

Intervalos fi Fi

30-40 4 4

40-50 6 10

50-60 8 18

60-70 12 30

70-80 9 39

80-90 7 46

90-100 4 50

Calculando P10

Empleando la formula :

Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c

Calculando P10. Entonces r=10

Ubicación del décimo percentil

r n / 100 = (10*50) /100 = 5 Entonces el décimo percentil esta en el segundo intervalo

Aplicando la formula :

Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c

P10 = 40 + ( 5 - 4 ) *10

P10 = 41.67 = 42 puntos

Calculando P90

n=50

f

6

f

Page 10: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

10

Empleando la formula :

Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c

Calculando P90. Entonces r=90

Ubicación de P90.

r n / 100 = (90*50) /100 = 45 Entonces el P90. esta en el sexto intervalo

Aplicando la formula :

Pr = Extremo Inferior + ( r n /100 - Fi - 1 ) *c

P90 = 80 + ( 45 - 39 ) *10

P90 = 88.57 = 89 puntos

Ejercicio Propuestos

Cuartiles Intervalos fi Fi

116-125 1 1

125-134 4 5

134-143 10 15

143-152 12 27

152-161 6 33

161-170 5 38

170-179 2 40

Respuestas :

f

7

f

n=40

Intervalos fi Fi

66-73 2 2

73-80 9 11

80-87 8 19

87-94 14 33

94-101 9 42

101-108 6 48

108-115 2 50

Respuestas :

Q1 = 81.31

n = 50

Intervalos fi Fi

11-13 1 1

13-15 5 6

15-17 9 15

17-19 14 29

19-21 12 41

Intervalos fi Fi

31-38 2 2

38-45 2 4

45-52 5 9

52-59 12 21

Page 11: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

11

Q1 = 138.5 = 139

Q3 = 156.5 = 157

Deciles Y Percentiles

Page 12: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

12

Definiciones generales

Objetivo

Determinar que los datos tienden a alejarse de los valores medios o tendencia central es decir losdatos presentan dispersión.

En esta sesión

- Conceptos básicos de Medida de dispersión, rango, desviación estándar o desviación típica yvarianza

- Formulas- Ejemplos Resueltos- Ejercicios Propuestos

Page 13: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

13

- Conceptos básicos de Medida de dispersión, rango, desviación estándaro desviación típica y varianza

Medida de dispersión

Determinan el grado de alejamiento de los datos respecto a una medida de posición que generalmente suele ser lamedia . nos da una idea de lo agrupado que están los datos

Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores conrespecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promediode una distribución de frecuencia.

Las Medidas de Dispersión relativa. Son relaciones entre medidas de dispersión absolutas y medidas de tendenciacentral multiplicadas por 100, por lo tanto vienen expresadas en porcentaje

Cuando la dispersión es baja indica que la serie de valores es relativamente homogénea mientras que una variabilidadalta indica una serie de valores heterogénea.

RANGO O RECORRIDO(R)

Es la primera medida de dispersión, no esta relacionada con ningún promedio en particular, ya que este se relacionacon los datos mismos, puesto que su cálculo se determina restándole al dato mayor de una serie el dato menor de lamisma

Rango(R) = Dato mayor (XM)−Dato Menor (Xm)

R = XM − Xm. El rango es la medida de dispersión más sencilla e inexacta dentro de las medidas de dispersión absoluta.

Indica la extension de los valores que puede tomar la variable cuyas medidas constituyen los datos

Rango = Valor Máximo – Valor Mínimo

Se utiliza cuando se desea una rápida apreciación de la extensión de los datos es afectado por los valores extremos notoma en cuenta las variaciones al interior de la distribución.

DESVIACIÓN MEDIA

Su uso es restringido porque existen otras medidas mas precisas . La desviación media es la media de las desviaciones

La desviación media de un conjunto de N observaciones x1, x2, x3,.............xn, es el promedio de los valores absolutos delas desviaciones (di) con respecto a la media aritmética o la mediana. Si se denomina como DM a la desviación mediaObservamos que es las desviaciones de cada valor con respecto a la media . Las desviaciones se toman en valorabsoluto . La suma obtenida se divide entre el numero de elementos.

Page 14: Ejercicios Resueltos de Cuartiles

EEssttaaddííssttiiccaa AApplliiccaaddaa DDoocc.. JJuuaann RRoobbeerrttoo MMoorraalleess RRoommeerroo

14

DESVIACIÓN TÍPICA O ESTÁNDAR

Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que para su calculose utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y además, se toman en cuentalos signos de esos desvíos. Se le designa con la letra castellana S . La desviación típica es una forma refinada de ladesviación media”. Es la raíz cuadrada de la suma de los cuadrados de las desviaciones de cada valor con respecto a lamedia , dividida entre el numero de valores.

INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA

La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos conrespecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayordispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.

Formulas

Desviación Media

Desviacion Estandar o tipica

Datos no agrupados

Ó (xi – x )2

S =

Datos Agrupados

Ó fi(xi – x )2

S =

N

d

N

XXDM

N

ii

N

ii ∑∑

== =

= 11

n

n