Medidas d..[1]

23
Instituto Guatemalteco Americano Bachillerato en Ciencias y Letras Temario Prof. Alejandro Cruz Medidas de Posición para Datos Simples y Agrupados (Borrador no. 1)

description

Este es un ensayo que muestra las medidas de posicion no centrales que se utlizan en Estadistica en datos, tantos simples com oagrupados

Transcript of Medidas d..[1]

Page 1: Medidas d..[1]

Instituto Guatemalteco Americano Bachillerato en Ciencias y LetrasTemarioProf. Alejandro Cruz

Medidas de Posición para Datos Simples y Agrupados

(Borrador no. 1)

Quinto Bachillerato “E”Manuel Salvador Franco

Ana Saraí de León HernándezJoselyn Dennise Barrera Rodríguez

Pablo Josué Chaclán Leiva

Guatemala, 4 de Abril del 2011

Page 2: Medidas d..[1]

MEDIDAS DE POSICIÓN PARA DATOS SIMPLES Y AGRUPADOS

En estadística se necesita dividir los datos recopilados, para tener una mejor comprensión de lo

que se está investigando. Es por esto, que la estadística, para llegar a una conclusión más objetiva

o más formal ha creado diferentes maneras de descomposición de datos que permitan evaluar

individualmente valores. A esta descomposición de datos se calculan mediante las medidas de

posición.

Cuando se tienen algunos datos, la mejor forma de ser estudiados es agrupándolos, para que se

poder localizar cuál de los datos es más interesante que otro y merece mayor atención. Una de las

características más importantes en un conjunto de datos es su posición o localización, en

específico, su centro.

Existen medidas de posición centrales y no centrales. Ambas medidas describen conductas de la

distribución de una frecuencia, pero las medidas centrales son limitadas, por lo tanto al utilizarlas

las conclusiones son muy generales y no se puede realizar estudios muy profundos. Es por esto

que las medidas de posición no centrales ayudan al comprender el comportamiento de una

manera más específica, creando grupos de los cuales pueden encontrarse características con las

cuales las conclusiones no van a ser tan generales, sino que se van a extraer diferentes cantidades

numéricas que nos ayuden a comprender la variabilidad que existe en los datos.

En las medidas de posición no centrales se dividen en medidas cuantiles, desviación media y

desviación estándar. Las medidas cuantiles consisten en dividir los datos para encontrar una

característica en particular, esto sucede ya que las medidas cuantiles son los porcentajes que

ayudan a entender de una mejor manera las conductas de los grupos de datos (frecuencia)

Las medidas cuantiles en cuartiles deciles y percentiles, de las cuales se pueden extraer decimas

cuartas partes de la cantidad de datos en estudio. Por lo tanto el motivo de este ensayo es, explicar

las medidas de posiciones cuantiles en datos simples y agrupados y su aplicación en la vida real.

CUARTILES

Según (Triola, 2004) son valores que son iguales o menores a la mediana y que dividen los datos

en cuatro partes iguales y según (Devore, 2005), en términos generales, los cuartiles dividen el

conjunto de datos en cuatro partes iguales, donde las observaciones arriba del tercer cuartil son el

cuarto superior del conjunto de datos, el segundo cuartil es idéntico a la mediana y el primer cuartil

separa el cuarto inferior de los tres cuartos superiores. Entonces, los cuartiles dividen los datos

obtenidos en cuatro partes iguales encontrando tres cuartiles que dividan la cantidad de datos en

Page 3: Medidas d..[1]

cuatro partes iguales, esto quiere decir que los cuartiles son el 25, 50 y 75% de los datos y son

representados como Q1, Q2 y Q3, en donde Q2 es igual a la mediana de los datos, ya que es el 50%.

Para poder calcular un cuartil para datos agrupados se utiliza la siguiente fórmula:

En donde:

- k es igual al número de cuartil

- N es la suma de las frecuencias

- Li es el inferior de la clase en donde se encuentra el cuartil

- Fi – 1 es la frecuencia anterior acumulada

- ai es la amplitud de la clase

Ejemplos:

PROBLEMA: 1

En la siguiente tabla de distribución de frecuencias de la edad de los ancianos del asilo San

Vicente de Paul de la zona 5 de la ciudad de Guatemala. Calcule los cuartiles según las

frecuencias establecidas.

SOLUCIÓN:

EDADESNúmero de Ancianos

fi (frecuencia simple)Fi (frecuencia acumulada)

[50-60) 8 8

[61-70) 10 18

[71-80) 16 34

[81-90) 14 48

[91-100) 10 58

[101-110) 5 63

[111-120) 2 65

TOTAL 65

Page 4: Medidas d..[1]

Para encontrar los tres cuartiles se utilizará la fórmula, tomando en cuenta la jerarquía de

operaciones matemáticas para tener una mejor comprensión.

1. El primer paso es operar k*N; esto es igual a multiplicar el número cuartil que se quiere

calcular (en este caso sería Q1) por la suma total de las frecuencias (65) y esto dividirlo

entre cuatro, ya que son cuartiles.

1∗654

=16.25

2. El segundo paso es buscar en que clase o intervalo se encuentra 16.25 en la tabla se

puede observar que este dato se encuentra en la clase de [61-70), 16.5 se le resta Fi-1

(frecuencia acumulada anterior), que sería 8.

16.25−8=8.25

3. El tercer paso, sabiendo que el intervalo en donde se encuentra 16.25 es [61-70). Se divide

por fi (frecuencia simple del intervalo), que en este caso sería 10.

8.2510

=0.825

4. El cuarto paso es, que al 0.825 encontrado en el paso anterior, se multiplica por a i

(amplitud de la clase o frecuencia) del intervalo [61-70) que sería 9.

0.825∗9=7.425

5. El quinto paso es sumarle al dato encontrado en el paso anterior Li (inferior de la clase en

donde se encuentra el cuartil). Sabiendo que 16.25 se encuentra en la clase o intervalo

[61-70)

7.425+61=68.425

Entonces, se tiene que Q1 = 68.425 y para calcular Q2 y Q3 se realiza el mismo procedimiento con

la excepción que en el primer paso, siendo Q2 el que se busca k =2; siendo Q3 el que se busca k=3.

RESPUESTAS:

Page 5: Medidas d..[1]

Las respuestas finales son:

Q1 = 68.43 años

Q2 = 79.16 años

Q3 = 91.67 años

Q2 y Q3 se calculan de la misma manera que Q1.

En asilo San Vicente de Paul el 25% de los ancianos del acilo tienen una edad aproximada a 68

años, el 50% tiene una edad aproximada de 79 años y el 75% tiene una edad aproximada a 92

años.

Para poder calcular un cuartil para datos simples se utiliza la siguiente fórmula:

1+i (n−1 )4

En donde:

- i es el número de cuartil

- n es igual a la cantidad de valores

Ejemplos:

PROBLEMA:

Según el Prensa Libre las personas en Guatemala leen de 3 a 33 libros en un año según los datos

dados determine el valor de los cuartiles de los siguientes 15 valores ordenados: 3, 5, 6, 11, 14, 18,

18, 20, 24, 25, 27, 27, 28, 31, 33. En los cuales los números representan la cantidad de libros

leídos.

SOLUCIÓN:

1. El primer paso es sustituir los datos de la fórmula. Ya que se sabe que i va a ser igual al

número de cuartil y en este ejemplo se están pidiendo todos, se va poner 1 en el lugar de i.

También, sabiendo que n va a ser igual a la cantidad de valores dados, en la fórmula se

va a colocar 15.

Page 6: Medidas d..[1]

1+1 (15−1 )4

=4.5

2. El segundo paso es, ya sabiendo que Q1 = 4.5 entonces para determinar el valor que

corresponde a la posición 4.5 se debe sumar la cuarta posición (11), cinco décimas de la

diferencia entre el valor de la cuarta posición y de la quinta (14 - 11 = 2), es decir, 11 +

0.5(3) =12.5. Entonces el resultado aproximando seria 4 para la posición del primer decil,

y su valor, 13 libros.

Este sería el procedimiento para calcular los cuartiles en datos simples o no agrupados, sabiendo

esto, al calcular Q2 se sabe que utilizando la fórmula el resultado seria 8 y la posición 8 de los

datos es equivalente a 20. Para calcular Q3 se sabe que utilizando la fórmula el resultado seria

11.5, al restar 27 – 27 = 0; entonces si 27 + 0.5(0) = 27 años, esto quiere decir que Q3 = 27.

RESPUESTAS:

Q1 = 13

Q2 = 20

Q3 = 27

Según Prensa Libre el 25% de las personas en Guatemala leen un aproximado de 13 libros en un

año, el 50% de las personas leen 20 libros en un año y por último el 75% de las personas leen 27

libros en un año.

RANGO INTERCUARTIL

Cuando se pretende encontrar el rango que existe en una serie de datos, se entiende que es la

diferencia entre el valor más grande y el más pequeño, pero el rango se deja influir por los valores

extremos y por esto se ha creado el rango intercuartil, para eliminar la influencia de los datos

extremos.

El rango intercuartil es la diferencia que existe entre Q3 y Q1.

Rango Intercuartil Q=¿ Q3 – Q1

Page 7: Medidas d..[1]

Ahora bien, cuando el rango intercuartil es dividido entre dos, se le conoce como rango

semiintercuartil o desviación cuartil; es la mitad del rango intercuartil y se representa como QD.

QD = Q3 – Q1

Ejemplo:

PROBLEMA:

Utilizando el mismo ejemplo de cuartiles en datos agrupados, encontrar el rango intercuartil y la

desviación cuartil.

SOLUCIÓN:

1. Mediante la fórmula del rango intercuarti sustituir los datos, sabiendo que Q3 = 91.67 y que

Q1 = 68.43. Entonces esto es igual a:

Q = 91.67 – 68.43

Q = 23.24 años

2. Ahora ya conociendo el rango intercuartil, ya se puede calcular la desviación cuartil,

mediante la fórmula, sabiendo que QD es igual al a mitad del rango intercuaril.

QD = 23.24

QD = 11.62 años

DECILES

La definición de (Goviden, 1998) para deciles dice que estos fraccionan en diez partes iguales los

datos ordenados obtenidos, en donde el primer decil es el 10% de los datos, el segundo el 20%, y

así sucesivamente entonces, los deciles dividen los datos obtenidos en diez partes iguales. Es

encontrar nueve deciles que dividan todos los datos en diez partes iguales, esto quiere decir que

los deciles son el 10, 20, 30,…, 80 y 90% de los datos y son representados como D1, D2, D3,…, D8 y

D9, en donde D5 es igual a la mediana de los datos, ya que representa el 50%.

2

2

Page 8: Medidas d..[1]

Para calcular los deciles para datos agrupados utiliza la siguiente fórmula:

En donde:

- k es igual al número de decil

- N es la suma de las frecuencias

- Li es el inferior de la clase en donde se encuentra el decil

- Fi – 1 es la frecuencia anterior acumulada

- ai es la amplitud de la clase

Ejemplo:

PROBLEMA:

Utilizando el mismo ejemplo de los cuartiles en datos agrupados, ahora van a ser calculados los

deciles según la tabla de frecuencias dada.

SOLUCIÓN:

1. El primer paso es operar k*N; esto es igual a multiplicar el número cuartil que se quiere

calcular (en este caso sería D1) por la suma total de las frecuencias (65) y esto dividirlo

entre diez, ya que son deciles.

1∗6510

=6.5

2. El segundo paso es buscar en que clase o intervalo se encuentra 6.5 en la tabla. Teniendo

esto se puede observar que este dato se encuentra en la clase de [51-60), 16.5 se le resta

Fi-1 (frecuencia acumulada anterior), pero como no se existe una frecuencia anterior no se

le puede restar nada al 6.5.

6.5−0=6.5

Page 9: Medidas d..[1]

3. ya sabiendo que el intervalo en donde se encuentra 6.5 es [51-60). Se divide fi (frecuencia

simple del intervalo), que en este caso sería 10.

6.510

=0.65

4. El cuarto paso es, que al 0.65 encontrado en el paso anterior se va a multiplicar por ai

(amplitud de la clase o frecuencia) del intervalo [51-60) que sería 9.

0.65∗9=5.85

5. El quinto paso es, sumarle al dato encontrado en el paso anterior Li (inferior de la clase en

donde se encuentra el cuartil). Sabiendo que 6.5 se encuentra en la clase o intervalo [51-

60)

5.85+50=55.85

Entonces, se tiene que D1 = 55.85 y para calcular D2 y D3 se realiza el mismo procedimiento con la

excepción que en el primer paso, siendo D2 el que se busca k =2; siendo D3 el que se busca k=3,

así sucesivamente hasta llegar a D9.

Para poder calcular un decil para datos simples se utiliza la siguiente fórmula:

1+i (n−1 )10

En donde:

- i es el número de decil

- n es igual a la cantidad de valores

Ejemplo:

PROBLEMA:

Utilizando el mismo ejemplo de los cuartiles en datos simples, ahora van a ser calculados los

deciles según los valores de las edades dadas.

SOLUCIÓN:

Page 10: Medidas d..[1]

1. El primer paso es sustituir los datos de la fórmula. Ya que se sabe que i va a ser igual al

número de decil y en este ejemplo se están pidiendo todos, se va poner 1 en el lugar de i.

También, sabiendo que n va a ser igual a la cantidad de valores dados, en la fórmula se

va a colocar 15.

1+1 (15−1 )10

=2.4

2. El segundo paso es, que D1 = 2.4 entonces para determinar el valor que corresponde a la

posición 2.4 se debe sumar la segundo posición que sería 5, (cuatro décimas de la

segunda posición y seis décimas de la tercera) cuatro décimas de la diferencia entre el

valor de la cuarto posición y la tercera (6 - 5 = 1), es decir, 5 + 0.4(1) = 5.4. Entonces el

resultado aproximando seria la posición 5 la cual es 14 años. D1 =.14 libros.

El mismo procedimiento se realiza con los nueve deciles a calcular y la posición del decil va a ser

igual a la cantidad de libros leídos.

PERCENTILES

Los percentiles consisten en dividir los datos obtenidos en cien partes iguales. Es encontrar

noventa y nueve percentiles que dividan la cantidad de datos en cien partes iguales, esto quiere

decir que los percentiles son el 1, 2, 3,…, 27…98 y 99% de los datos y son representados como P1,

P2 y P3, en donde P50 es igual a la mediana de los datos, ya que es el 50%.

Para calcular los percentiles para datos agrupados utiliza la siguiente fórmula:

En donde:

- k es igual al número de percentil

- N es la suma de las frecuencias

- Li es el inferior de la clase en donde se encuentra el percentil

- Fi – 1 es la frecuencia anterior acumulada

- ai es la amplitud de la clase

Page 11: Medidas d..[1]

Ejemplo:

PROBLEMA:

Utilizando el mismo ejemplo de los cuartiles en datos agrupados, ahora van a ser calculados los

percentiles 18, 19, 26, 45, 49, 58, 78, 93, 95 según la tabla de frecuencias dada.

SOLUCION:

1. El primer paso es operar k*N; esto es igual a multiplicar el número de percentil que se

quiere calcular (en este caso sería P1) por la suma total de las frecuencias (65) y esto

dividirlo entre cien, ya que son percentiles.

18∗65100

= 11.7

2. El segundo paso es buscar en que clase o intervalo se encuentra 11.7 en la tabla.

Teniendo esto se puede observar que este dato se encuentra en la clase de [61-70), ya

teniendo esto, se puede decir que 11.7 se le resta Fi-1 (frecuencia acumulada anterior),

entonces se le resta 8.

11.7 – 8 = 3.7

3. El tercer paso es, que el intervalo en donde se encuentra 11.7 es [61-70). Se le va a dividir

fi (frecuencia simple del intervalo), que en este caso sería 10.

3.710

=0.37

4. El cuarto paso es, que al 0.37 encontrado en el paso anterior se va a multiplicar por ai

(amplitud de la clase o frecuencia) del intervalo [61-70) que sería 9.

0.37*9 = 3.33

Page 12: Medidas d..[1]

5. El quinto paso es, sumarle al dato encontrado en el paso anterior Li (inferior de la clase en

donde se encuentra el cuartil). Sabiendo que 11.7 se encuentra en la clase o intervalo [61-

70)

61+3.33 = 64.33

Sabiendo cómo realizar cada procedimiento ya se puede saber que los otro percentiles eran

equivalentes a:

P18= 64.33 años

P19= 64.91 años

P26= 69.01 años

P45= 77.33 años

P49= 70.79 años

P58= 83.38 años

P78= 93.43 años

P93= 105.41 años

P95= 107.75 años

Para poder calcular un percentil para datos simples se utiliza la siguiente fórmula:

1+i (n−1 )100

En donde:

- i es el número de percentil

- n es igual a la cantidad de valores

Ejemplo:

PROBLEMA

Utilizando el mismo ejemplo de los cuartiles en datos simples, ahora van a ser calculados los

percentiles 17 y 29 según los valores de las edades dadas.

SOLUCION:

1. El primer paso es sustituir los datos de la formula. Ya que se sabe que i va a ser igual al

número de percentil y en este ejemplo se están pidiendo todos, se va poner 17 en el lugar

Page 13: Medidas d..[1]

de i. También, sabiendo que n va a ser igual a la cantidad de valores dados, en la fórmula

se va a colocar 15.

1+17 (15−1 )100

=3.38

2. El segundo paso es, ya sabiendo que P1 = 3.38 entonces para determinar el valor que

corresponde a la posición 3.38 se debe sumar la tercera posición, la cual sería 6, (treinta y

ocho centésimas de la tercera posición y a sesenta y dos centésimas de la cuarta posición)

treinta y ocho centésimas de la diferencia entre el valor de la tercera posición y de la cuarta

(11 - 6 = 5), es decir, 6 + 0.38(5) = 6.9. Entonces el resultado aproximando seria la

posición 7 la cual es 18 libros.

Realizando el mismo procedimiento ahora, al calcular P29 se sabe que es equivalente a 5.06

entonces se sabe que 18 – 14 = 4; entonces 5 + 0.06(4) = 5.24 años, esto se aproxima a 5,

entonces la posición 5 es igual a 14 libros.

Para tener una mejor compresión de los conceptos que representan los cuantiles se ha elaborado

el siguiente cuadro comparativo:

MEDIDAS CUANTILES

CUARTILES DECILES PERCENTILES

Divide los datos

ordenados en cuatro

partes iguales que son

el 25, 50 y 75%. De

los cuales se puede

calcular:

- El rango

intercuartil.

- La desviación

cuartil.

Dividen los datos

ordenados en diez

partes iguales, que

son el 10, 20, 30,…,

80, 90%.

Dividen los datos

ordenados en cien

partes iguales. Que es

aproximadamente el

1% de los valores en

cada grupo.

Page 14: Medidas d..[1]

MEDIANA

Divide el conjunto de datos en dos partes iguales. En donde una mitad

de los datos es menor que la mediana y la otra mitad es mayor que la

mediana.

Donde Q2, D5 y P50 es igual a la mediana de los datos ya que es el 50%

Ya teniendo todos estos ejemplos y el cuadro comparativo, se puede resaltar que el Q2, D5, P50 son

equivalentes a la mediana (que pertenece a las medidas de posición centrales), por eso en el

siguiente ejemplo se va a demostrar que Q2 = D5 = P50. Este ejemplo busca de poner en práctica lo

ya explicado en un aspecto de la vida real.

Ejemplo:

PROBLEMA:

Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año

recibieron peticiones de una clínica, de reportes clínicos para realizar estudios de glucosa. Según

la tabla de frecuencias, encontrar Q2, D5 y P50.

Días Número de pacientes fi Frecuencia acumulada  Fi

1 día a 9 días 5 5

10 día a 19 días 6 11

20 día a 29 días 8 19

30 día a 39 días 8 27

40 día a 49 días 4 31

50 día a 59 días 5 36

60 día a 69 días 7 43

70 día a 79 días 8 51

80 día a 89 días 4 55

90 día a 100 días 8 63

 

SOLUCION:

Page 15: Medidas d..[1]

Calculando Q2:

1. Empleando la fórmula para calcular cuartiles cuando los datos son agrupados, se

empiezan a sustituir los datos, dejando K*N = 2*63 =126, este dato se divide entre 4 y el

resultado es 31.5.

2. Cuando ya se tiene este resultado buscamos este dato en la tabla de frecuencias. El dato

se encuentra en la sexta clase o en el intervalo de [50-59], sabiendo esto a 31.5 se le resta

la frecuencia anterior acumulada, 31.5 – 31 = 0.5.

3. Esta cantidad (0.5) es dividida por la frecuencia simple de la clase en donde se encuentra

31.5. Entonces 0.5 / = 0.1.

4. Después esta cantidad (0.1) se multiplica por la amplitud de la clase que es de 9 y se le

suma la cantidad menor del intervalo. 0.1*9 + 50= 50.9

RESPUESTA 1: El Q2 es igual a 50.9 días.

Calculando D5:

1. Empleando la fórmula para calcular deciles cuando los datos son agrupados, se empiezan

a sustituir los datos, dejando k*N = 5*63 = 315, este dato divide entre 10 y el resultado es

31.5.

2. Si se presta atención los datos que faltan a ingresar a la fórmula son los mismos que se

ingresaron en el procedimiento para sacar el Q2.

RESPUESTA 2: El D5 es igual a 50.9 días.

Calculando P50:

1. Empleando la fórmula para calcular percentiles cuando los datos son agrupados, se

empiezan a sustituir los datos, dejando k*N = 50*63 = 3 150, este dato se divide entre cien

y el resultado es 31.5.

2. Ocurre lo mismo que con el D5, el resultado es el mismo que en el Q2, entonces, los datos

restantes de incluir de la fórmula van a ser los mismos

RESPUESTA 3: El P50 es igual a 50.9 días

1. CONCLUSÓN:

Quedo comprobado que Q2, D5 y P50 son los mismos datos siempre y son equivalentes a la

mediana de los datos de medida de posición central.

Page 16: Medidas d..[1]

En conclusión, las medidas de posición de datos simples y agrupados, son aquellas que nos

ayudan a la descomposición de datos, es decir,  a la separación de los datos relevantes de los

irrelevantes, las medidas de posición.

Son porcentajes que se utilizan para conocer los comportamientos en una frecuencia, existen

medidas de posición centrales y no centrales, ambas describen conductas de las distribuciones de

una frecuencia las centrales son limitadas, esto nos dice que no se pueden realizar estudios muy

profundos  y las no centrales nos ayudan a comprender las cosas de una manera más específicas

se dividen en:  medidas cuantiles, desviación media y desviación estándar, las medidas cuantiles,

nos ayudan a dividir datos, son porcentajes que utilizamos para entender de una mejor forma las

conductas de los grupos de datos, se dividen en:  

cuartiles es la división de datos en 4 partes iguales

deciles son nueve valores que dividen la serie de datos en 10 partes iguales

percentiles son series de datos estadísticos que se dividen en intervalos iguales y que

existen 99 percentiles.

Para poder explicar de una manera más sencilla como se podría aplicar esto a la vida, se decidió

tomar como ejemplo a una docente de tercer grado primaria, que desea saber en qué nivel de

aprendizaje en el que sus alumnos se encuentran, le sirve para poder mejorar su técnicas de

enseñanza es por eso que en base a las calificaciones utilizara las formas de agrupación simple

para encontrar el nivel. La clase es de veinte alumnos, entre los cuales 8 alumnos tuvieron notas

de  de 60-70 pts. 5 alumnos obtuvieron una nota de 71-80 pts. 5 alumnos más sacaron una nota de

81-90 pts. Cada uno y 2 alumnos obtuvieron 91-100 puntos,  en relación de los datos anteriores la

maestra la maestra se dio cuenta del nivel en que sus alumnos se encontraban. 

Page 17: Medidas d..[1]

BIBLIOGRAFÍA

Devore, J. L. (2005). Probabilidad y Estadística Para Ingeniería y Ciencias sexta edición. Col. Polanco, Mexico D.F.: THOMPSON.

Govinden, L. P. (1998). Introducción a la Estadística segunda edición. Santafé de Bogotá, Colombia: McGrawHill.

Triola, M. F. (2004). Probabilidad y Estadística novena edición. México D.F.: PEARSON EDUCACIÓN.

Page 18: Medidas d..[1]