tablas de frecuencia

9
EJERCICIO RESUELTO DE ESTADÍSTICA Las estaturas de 27 jóvenes, en cm, son las siguientes: 155 178 170 165 173 168 160 166 176 169 158 170 179 161 164 156 170 171 167 151 163 158 164 174 176 164 154 a) Tabular los datos en intervalos de clase de amplitud 5. b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas. c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviación Típica. d) Dibujar los datos en un gráfico adecuado. Solución : a) Tabular los datos en intervalos de clase de amplitud 5. Se trata de una variable estadística continua, por lo que tiene sentido tabular los datos en intervalos. Calculamos los valores mayor y menor de la muestra: 179 y 151. La diferencia es el rango: R = 179-151 = 28. Localizamos el múltiplo de 5 (la amplitud de los intervalos) más próximo a 28 pero mayor o igual que 28: 30. Ésta será la amplitud total de todos los intervalos de clase. Dividiendo 30/5 = 6 obtenemos el número total de intervalos de clase. Si empezamos el primero de los intervalos en 150 (por ejemplo) como la amplitud total de todos los intervalos será 30, terminaremos en 150+30 = 180. Estas elecciones son válidas, porque cubrimos desde el menor valor (151) hasta el mayor valor (179) de la muestra.

description

tablas de frecuencia ejercicio resuelto

Transcript of tablas de frecuencia

EJERCICIO RESUELTO DE ESTADSTICA Las estaturas de 27 jvenes, en cm, son las siguientes:155178170165173168160166176

169158170179161164156170171

167151163158164174176164154

a) Tabular los datos en intervalos de clase de amplitud 5.b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas.c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviacin Tpica.d) Dibujar los datos en un grfico adecuado.Solucin:a) Tabular los datos en intervalos de clase de amplitud 5.Se trata de unavariable estadstica continua, por lo que tiene sentido tabular los datos en intervalos.Calculamos los valores mayor y menor de la muestra: 179 y 151.La diferencia es elrango:R= 179-151 = 28.Localizamos el mltiplo de 5 (la amplitud de los intervalos) ms prximo a 28 pero mayor o igual que 28: 30. sta ser la amplitud total de todos los intervalos de clase.Dividiendo 30/5 = 6 obtenemos el nmero total de intervalos de clase.Si empezamos el primero de los intervalos en 150 (por ejemplo) como la amplitud total de todos los intervalos ser 30, terminaremos en 150+30 = 180. Estas elecciones son vlidas, porque cubrimos desde el menor valor (151) hasta el mayor valor (179) de la muestra.Construimos la tabla con los intervalos resultantes: [150, 155); [155, 160); [160, 165); [165, 170); [170, 175); [175, 180] y haciendo un recuento de cuantos datos de la muestra caen dentro de cada uno de ellos (es decir, lasfrecuencias absolutas):xifi

[150, 155)2

[155, 160)4

[160, 165)6

[165, 170)5

[170, 175)6

[175, 180]4

n= 27

La suma de la columna de las frecuencias es elnmero total de datosn= 27.Aadimos una columna con lasmarcas de clase. stas son los puntos medios de cada uno de los intervalos. Hay dos formas de calcularlos:1) Sumamos los extremos del intervalo y dividimos el resultado entre 2. Por ejemplo, para el primer intervalo, la marca de clase es (150+155)/2 = 152,5.2) Calculamos la mitad de la amplitud de los intervalos: 5/2 = 2,5. Sumamos esta mitad al extremo inferior de cada intervalo y nos sale la marca de clase. Para el primer intervalo es: 150+2,5 = 152,5.La tabla, con la columna demarcas de clase, es:xifi

[150, 155)152,52

[155, 160)157,54

[160, 165)162,56

[165, 170)167,55

[170, 175)172,56

[175, 180]177,54

n= 27

A partir de ahora,trabajamosla tablacomo si fuera una tabla de datos sin agrupar en intervalos(es decir, ignoraremos la primera columna). Entonces, para los clculos, supondremos que los datos son las marcas de clase, con lo que sera como si 152,5 se repitiera 2 veces (su frecuencia), 157,5 4 veces, etc.b) Incluir en la tabla las frecuencias absolutas acumuladas, las frecuencias relativas, los tantos por ciento y las frecuencias relativas acumuladas.Lasfrecuencias absolutas acumuladasson la suma de las frecuencias absolutas de todas las filas que estn por encima del dato actual, incluida la fila de dicho dato:xifiFi

[150, 155)152,522El mismo valor que enfi

[155, 160)157,546El valor anterior deFi(2) ms el defide al lado (4)

[160, 165)162,5612El valor anterior deFi(6) ms el defide al lado (6)

[165, 170)167,551712+5

[170, 175)172,562317+6

[175, 180]177,542723+4

n= 27

Lasfrecuencias relativasson los cocientes entre lasfrecuencias absolutasyn:xifiFihi

[150, 155)152,5222 / 27 = 0,0740

[155, 160)157,5464 / 27 = 0,1481

[160, 165)162,56126 / 27 = 0,2222

[165, 170)167,55175 / 27 = 0,1852

[170, 175)172,56236 / 27 = 0,2222

[175, 180]177,54274 / 27 = 0,1481

n= 27

La suma de lasfrecuencias relativasdebe ser 1. Si las sumamos escritas en forma de fraccin, en efecto resulta 1. No es as en forma decimal a causa de los redondeos (se desprecian muchos decimales).Lostantos por cientoson lasfrecuencias relativasmultiplicadas por 100:xifiFihi%

[150, 155)152,5222 / 27 = 0,07407,40%

[155, 160)157,5464 / 27 = 0,148114,81%

[160, 165)162,56126 / 27 = 0,222222,22%

[165, 170)167,55175 / 27 = 0,185218,52%

[170, 175)172,56236 / 27 = 0,222222,22%

[175, 180]177,54274 / 27 = 0,148114,81%

n= 27

Al igual que antes, la columna debera sumar 100. Si no es as es a causa de los errores que se comenten redondeando.Lasfrecuencias relativas acumuladasse calculan dividiendo lasFientren:xifiFihi%Hi

[150, 155)152,5222 / 27 = 0,07407,40%2 / 27 = 0,0740

[155, 160)157,5464 / 27 = 0,148114,81%6 / 27 = 0,2222

[160, 165)162,56126 / 27 = 0,222222,22%12 / 27 = 0,4444

[165, 170)167,55175 / 27 = 0,185218,52%17 / 27 = 0,6296

[170, 175)172,56236 / 27 = 0,222222,22%23 / 27 = 0,8519

[175, 180]177,54274 / 27 = 0,148114,81%27 / 27 = 1

n= 27

c) Hallar la Media, la Mediana, la Moda, los Cuartiles y la Desviacin Tpica.La frmula de lamedia aritmticaes:

es decir, sumamos cada datoximultiplicado por su frecuenciafiy dividimos el resultado total entren. Para facilitar los clculos, creamos una columna con los productos de cadaxipor su correspondientefiy sumaremos la columna, lo que nos dar el numerador de la frmula:xifiFihi%Hixifi

[150, 155)152,5222 / 27 = 0,07407,40%2 / 27 = 0,0740305

[155, 160)157,5464 / 27 = 0,148114,81%6 / 27 = 0,2222630

[160, 165)162,56126 / 27 = 0,222222,22%12 / 27 = 0,4444975

[165, 170)167,55175 / 27 = 0,185218,52%17 / 27 = 0,6296837,5

[170, 175)172,56236 / 27 = 0,222222,22%23 / 27 = 0,85191035

[175, 180]177,54274 / 27 = 0,148114,81%27 / 27 = 1710

n= 27

Por lo que:

Si hemos estudiado el ejercicio 1, que es el mismo que ste pero con los datos sin agrupar en intervalos, veremos que este resultado no coincide con el que all se obtuvo, aunque se trata del mismo problema. Lamediacorrecta es la del ejercicio 1, porque all empleamos los datos originales. Aqu hemos utilizado lasmarcas de clase, lo cual supone una aproximacin. Por ejemplo, en el primer intervalo hay 2 datos, que realmente son 151 y 154. Pero nosotros hemos hecho los clculos como si ambos fuesen 152,2.Si hacemos los clculos con la calculadora cientfica, basta introducir los datosxiy sus respectivas frecuenciasfiy la calculadora nos da, no slo lamedia, sino tambin ladesviacin tpicay la suma de la columnaxifi. En el ejercicio 1 se explic cmo manejar la calculadora para esto. En este ejercicio, el primer dato a introducir en la calculadora ser la primeramarca de clase152,5 y su frecuencia, 2; el segundo, 157,5 y su frecuencia 4; etc.Lamedianaes el dato que ocupa la posicin (n+1)/2, ya quen= 27 es impar. Dicha posicin es 28/2 = 14. Dicho dato es 167,5 (observando la columna de frecuencias vemos que 152,2 ocupa las dos primeras posiciones; 157,5 las 4 siguientes, es decir, la 3, 4, 5 y 6. 162,5 ocupa las 6 siguientes, hasta la 12. 167,5 ocupa las 5 siguientes, hasta la 17. Por tanto, ocupa la 14 posicin). Por consiguiente:Me= 167,5Al igual que antes, al compararlo con el ejercicio 1 no da el mismo resultado. El correcto es aquel, porque aqu estamos aproximando, como explicamos antes.Lamodaes el resultado que ms se repite. Esta muestra esbimodalporquetiene 2 modas: 162,5 y 172,5, ya que ambos se repiten 6 veces.Elprimer cuartilQ1es el primer dato de la muestra, una vez ordenada, que deja por debajo el 25% de los datos. Como los datos son 27, resulta que el 25% de 27 = 0,25 27 = 6,75. El primer dato que deja por debajo a los 6,75 anteriores es el 7 (en realidad, ningn dato puede ocupar la posicin 6,75). Con el mismo razonamiento que seguimos para calcular la mediana, deducimos que:Q1= 162,5Elsegundo cuartilcoincide con lamediana, calculada anteriormente. Luego:Q2= 167,5Eltercer cuartiles el primer dato que deja por debajo el 75% de los datos de la muestra; esto es, 75% de 27 = 0,75 27 = 20,25 datos. Por tanto, ser el que ocupe la posicin 21, por lo que:Q3= 172,5d) Dibujar los datos en un grfico adecuado.Como se trata de unavariable continua,el grfico ms adecuado es elhistograma. Aqu si empleamos losintervalos de clase, que constituirn las bases de los rectngulos, mientras que las alturas sern lasfrecuencias absolutas.