Cálculo de parámetros estadísticos

13
Ana Isabel Aparicio Cervantes http://ticmatec.blogspot.com/

description

En este documento se resumen como calcular distintos parámetros estadíscos y algunos ejemplos

Transcript of Cálculo de parámetros estadísticos

Page 1: Cálculo de parámetros estadísticos

 

 

 

 

 

 

 

 

 

 

Ana Isabel Aparicio Cervantes

http://ticmatec.blogspot.com/

 

Page 2: Cálculo de parámetros estadísticos

 

 

ÍNDICE 

 

1. MEDIDAS DE TENDENCIA CENTRAL ................................................................................................. 3 

1.1 LA MEDIA ARITMÉTICA ....................................................................................................................... 3 

1.2 LA MEDIANA ....................................................................................................................................... 3 

1.3 LA MODA ............................................................................................................................................ 4 

2. MEDIDAS DE DISPERSIÓN ............................................................................................................... 5 

2.1 RANGO................................................................................................................................................ 5 

2.2 DESVIACIÓN MEDIA ............................................................................................................................ 5 

2.3 VARIANZA ........................................................................................................................................... 5 

2.4 DESVIACIÓN TÍPICA ............................................................................................................................ 6 

2.5 COEFICIENTE DE VARIACIÓN ............................................................................................................... 6 

3. MEDIDAS DE POSICIÓN ................................................................................................................... 7 

3.1 CUARTILES .......................................................................................................................................... 7 

3.2 PERCENTILES ....................................................................................................................................... 7 

4. EJEMPLOS ...................................................................................................................................... 8 

4.1 EJEMPLO 1 .......................................................................................................................................... 8 

4.2 EJEMPLO 2 ........................................................................................................................................ 11 

 

 

Page 3: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 3 de 13 

1. MEDIDAS DE TENDENCIA CENTRAL 

Las medidas de centralización nos indican en torno a qué valores se encuentran los

datos.

Las medidas de centralización más importantes son:

La media aritmética o promedio.

La mediana.

La moda.

1.1 LA MEDIA ARITMÉTICA 

Se define media aritmética, , de una variable estadística como el cociente entre la

suma de todos los valores de dicha variable y el número de éstos. Si la variable X

toma los valores con frecuencias absolutas la media aritmética se calcula como:

∑∑

Si los datos están agrupados, se toma para las marcas de clase.

La media es un parámetro que nos informa sobre el centro alrededor del cual se

distribuyen los valores, pero podemos encontrarnos distribuciones muy distintas con la

misma media.

Además la media tiene el problema de verse muy influenciada por valores extremos.

Por ejemplo un alumnos puede sacar en un examen un 0 y en otro un 10 y la media le

daría 5, igual que un alumno que sacara un 4,5 y 5,5.

Por todo ello necesitamos de otros parámetros que nos indiquen las diferencias entre

las distribuciones.

1.2 LA MEDIANA 

Si ordenamos los datos de menor a mayor, la mediana, Me, es el valor que está en

medio; es decir, tiene tantos individuos por debajo como por encima.

Si los datos están agrupados, el intervalo o clase mediana es el primer intervalo cuya

frecuencia absoluta acumulada es mayor que la mitad del número de datos.

Page 4: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 4 de 13 

Si el número de datos fuera par, a la mediana se le asigna el valor medio de los dos

términos centrales.

La mediana cubre algunos de los flacos débiles de la media, siendo mucho más

robusta frente a la presencia de anomalías.

1.3 LA MODA 

La moda de una variable estadística es el valor de dicha variable que tiene mayor

frecuencia absoluta, y se representa por Mo.

Si los datos están agrupados en clases se toma como valor aproximado de la moda la

marca de la clase que presenta mayor frecuencia absoluta. Esta clase se llama clase

modal.

Tenemos que tener en cuenta que la moda no siempre tiene que estar situada en la

zona central, a veces se encuentra próxima a los extremos.

   

Page 5: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 5 de 13 

2. MEDIDAS DE DISPERSIÓN 

Estos parámetros sirven para medir como de dispersos están los datos. En todos ellos,

la idea clave es medir el grado de separación de los datos a la media.

Las medidas de dispersión más importantes son:

Rango o recorrido

Desviación media

Varianza

Desviación típica

Coeficiente de variación

2.1 RANGO 

El rango o recorrido de un distribución es la diferencia entre el mayor y el menor valor

de la variable estadística.

Cuanto mayor es el rango, más dispersos están los datos de un conjunto.

2.2 DESVIACIÓN MEDIA 

Para ver si los datos de una variable estadística están cerca de la media calculamos

las deviaciones respecto a la media, que son para cada dato la diferencia entre el dato

y la media. La desviación media es el promedio de las distancias de los datos a la

media.

| | | | | | ∑| |

Para calcular la desviación media de un conjunto de datos seguimos los siguientes

pasos:

1) Desviación respecto a la media: dato –media

2) Valores absolutos de las desviaciones: I dato-media I

3) Media aritmética de estos valores absolutos de las desviaciones

2.3 VARIANZA 

La varianza nos sirve para medir la dispersión y se define como el promedio de los

cuadrados de las distancias de los datos a la media.

Page 6: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 6 de 13 

También se puede escribir como  ∑

 

El inconveniente que presenta es que sus unidades son las de los datos elevados al

cuadrado

2.4 DESVIACIÓN TÍPICA 

La desviación típica es la raíz cuadrada de la varianza

Debemos tener en cuenta que cuanto menor es el rango, la varianza o la desviación

típica de la distribución, mayor es el grado de representabilidad de las medidas de

centralización.

2.5 COEFICIENTE DE VARIACIÓN 

Para poder comparar las dispersiones de población heterogéneas se define el

coeficiente de variación, como el cociente entre la desviación típica y la media.

A esto lo llamamos normalizar la variabilidad con respecto a la media.

Page 7: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 7 de 13 

3. MEDIDAS DE POSICIÓN 

Las medidas de posición sirven para “establecer mojones”, delimitar zonas en el

conjunto de los datos y así tener una referencia para la localización de los valores.

Las dos medidas de posición más importantes son:

Cuartiles

Percentiles

3.1 CUARTILES 

Si partimos la totalidad de los individuos en cuatro partes iguales (todas ellas con el

mismo número de individuos), los puntos de separación se llaman cuartiles.

El cuartil inferior, Q1, es un valor de la variable que deja por debajo de él al 25% de la

población, y por encima al 75%.

El cuartil superior, Q3, es un valor de la variable que deja por debajo de él al 75% de la

población, y por encima al 25%.

Se designan Q1 y Q3 porque la mediana coincide con Q2.

3.2 PERCENTILES 

Si partimos la población en 100 partes y señalamos el lugar que deja debajo de k de

ellas, el valor de la variable correspondiente a ese lugar se designa por pk y se

denomina centil k o percentil k.

Q1=p25; Q3=p75

Page 8: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 8 de 13 

4. EJEMPLOS 

4.1 EJEMPLO 1 

En una maternidad se han tomado los pesos (en kilogramos) de 50 recién

nacidos:

2,8; 3,2, 3,8; 2,5; 2,7; 3,7; 1,9; 2,6; 3,5; 2,3; 3,0; 2,6; 1,8; 3,3; 2,9; 2,1; 3,4; 2,8; 3,1;

3,9; 2,9; 3,5, 3,0; 3,1; 2,2; 3,4; 2,5; 1,9; 3,0; 2,9; 2,4; 3,4; 2,0; 2,6; 3,1; 2,3; 3,5; 2,9;

3,0; 2,7; 2,9; 2,8; 2,7; 3,1; 3,0; 3,1; 2,8; 2,6; 2,9; 3,3

a) Construye una tabla con los datos agrupados en 6 intervalos de amplitud 0,4

kg.

IntervalosMarcas de clase

1,65-2,05 1,65 2,052

1,85

2,05-2,45 2,05 2,452

2,25

2,45-2,85 2,45 2,852

2,65

2,85-3,25 2,85 ,252

3,05

3,25-3,65 3,25 3,652

3,45

3,65-4,05 3,65 4,052

3,85

Page 9: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 9 de 13 

b) Haz una tabla de frecuencias y representa los datos en el diagrama adecuado.

Intervalos

Marcas de clase

Frecuencia absoluta

Frecuencia absoluta

acumulada

Frecuencia relativa

Frecuencia relativa

acumulada

1,65-2,05

1,65 2,052

1,85 4 4

450

225

450

225

2,05-2,45

2,05 2,452

2,25 5  9 

550

110

950

2,45-2,85

2,45 2,852

2,65 13  22 

1350

2250

1125

2,85-3,25

2,85 ,252

3,05 17  39 

1750

3950

3,25-3,65

3,25 3,652

3,45 8  47 

850

425

4750

3,65-4,05

3,65 4,052

3,85 3  50 

350

5050

1

Representamos los datos en un histograma; al ser los

intervalos de la misma amplitud, la altura de cada barra

corresponde a la frecuencia ( fi ) de cada intervalo.

Page 10: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 10 de 13 

c) Si es posible calcula los parámetros de centralización.

Intervalos | |

1,65-2,05 1,65 2,05

21,85 4 4

450

225

450

225

7,4  13,69  1,032 

2,05-2,45 2,05 2,45

22,25 5  9 

550

110

950

11,25 25,31  0,632 

2,45-2,85 2,45 2,85

22,65 13 22

1350

2250

1125

34,45 91,29  0,235 

2,85-3,25 2,85 ,25

23,05 17 39

1750

3950

51,85 158,14  0,168 

3,25-3,65 3,25 3,65

23,45 8  47

850

425

4750

27,6  95,22  0,565 

3,65-4,05 3,65 4,05

23,85 3  50

350

5050

1 11,55 44,47  0,968 

  50   144,1 428,12  3,6 

Media:  

∑∑

144,150

2,882 

Moda: es el valor que más se repite. La moda es 3,05.

Mediana: tenemos 6 términos, luego tendremos que hacer la media entre el tercer y

cuarto término. , ,

2,85 

d) Si es posible calcula los parámetros de dispersión.

Localizamos los valores extremos: 1,8 y 3,9.

Rango: valores entre los que se encuentra la variables. 3,9 – 1,8 = 2,1. El rango es

2,1.

Desviación media:  | | | | | | ∑| | 3,6

500,072

Page 11: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 11 de 13 

Varianza: 

 ∑

 428,1250

2,882

8,5624 8,305924 0,256476

Desviación típica: 0,256476 0,51

Coeficiente de variación: 0,512,882

0,18

4.2 EJEMPLO 2 

El número de faltas de ortografía que cometieron un grupo de estudiantes en un

dictado fue:

0, 3, 1, 2, 0, 0, 1, 1, 4, 3, 5, 0, 2, 1, 0, 2, 1, 0, 0, 3, 2, 1, 3, 0, 4, 5, 3, 2, 4, 1, 0, 0, 0, 2, 1,

0, 5, 3, 2, 1

a) Di cual es la variable y de qué tipo es.

La variable es el número de faltas ortográficas cometidas, y es cuantitativa discreta (se

puede contar y tienen que ser números enteros.

b) Haz una tabla de frecuencias y representa los datos en el diagrama adecuado.

1) En la primera columna ponemos es número de faltas ortográficas 2) En la segunda columna ponemos cuantas veces se repite ese número de faltas

(frecuencia absoluta). 3) En la tercera columna ponemos las frecuencias absolutas acumuladas.

Fi=f1+f2+…+fi

4) En la cuarta columna colocamos las frecuencias relativas

5) En la tercera columna ponemos las frecuencias relativas acumuladas

.

Page 12: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 12 de 13 

Nº de faltas ortográficas

Frecuencia absoluta

Frecuencia absoluta

acumulada

Frecuencia relativa

Frecuencia relativa

acumulada

0 12 12 1240

310

310

1 9 21 940

2140

2 7 28 740

2840

710

3 6 34 640

320

3440

1720

4 3 37 340

3740

5 3 40 340

4040

1

El mejor diagrama para representar los datos sería un diagrama de barras.

c) Si es posible calcula los parámetros de centralización.

Media:  

∑∑

0 12 1 9 2 7 3 6 4 3 5 340

9 14 18 12 1540

6840

1,7 

Page 13: Cálculo de parámetros estadísticos

CÁLCULO DE PARÁMETROS ESTADÍSTICOS

http://ticmatec.blogspot.com/ Página 13 de 13 

Moda: es el valor que más se repite. La moda es 0 faltas.

Mediana: tenemos 6 términos, luego tendremos que hacer la media entre el tercer y

cuarto término. 2,5 

d) Si es posible calcula los parámetros de dispersión.

0 12 12 1240

310

310

0  0 

1 9 21 940

2140

9  9 

2 7 28 740

2840

710

14  28 

3 6 34 640

320

3440

1720

18  54 

4 3 37 340

3740

12  48 

5 3 40 340

4040

1 15  75 

40 68  214 

Rango: valores entre los que se encuentra la variables. 5-0=5. El rango es 5.

Desviación media:  | | | | | | ∑| |

|0 1,7| |1 1,7| |2 1,7| |3 1,7| |4 1,7| |5 1,7|

40| 1,7| | 0,7| |0,3| |1,3| |2,3| |3,3|

40 

1,7 0,7 0,3 1,3 2,3 3,340

9,640

0,24

Varianza: 

 ∑

 21440

1,7 5,35 2,89 2,46

Desviación típica: √2,46 1,57

Coeficiente de variación: 1,571,7

0,92