Cálculo de parámetros estadísticos
-
Upload
ana-isabel-aparicio -
Category
Documents
-
view
214 -
download
2
description
Transcript of Cálculo de parámetros estadísticos
Ana Isabel Aparicio Cervantes
http://ticmatec.blogspot.com/
ÍNDICE
1. MEDIDAS DE TENDENCIA CENTRAL ................................................................................................. 3
1.1 LA MEDIA ARITMÉTICA ....................................................................................................................... 3
1.2 LA MEDIANA ....................................................................................................................................... 3
1.3 LA MODA ............................................................................................................................................ 4
2. MEDIDAS DE DISPERSIÓN ............................................................................................................... 5
2.1 RANGO................................................................................................................................................ 5
2.2 DESVIACIÓN MEDIA ............................................................................................................................ 5
2.3 VARIANZA ........................................................................................................................................... 5
2.4 DESVIACIÓN TÍPICA ............................................................................................................................ 6
2.5 COEFICIENTE DE VARIACIÓN ............................................................................................................... 6
3. MEDIDAS DE POSICIÓN ................................................................................................................... 7
3.1 CUARTILES .......................................................................................................................................... 7
3.2 PERCENTILES ....................................................................................................................................... 7
4. EJEMPLOS ...................................................................................................................................... 8
4.1 EJEMPLO 1 .......................................................................................................................................... 8
4.2 EJEMPLO 2 ........................................................................................................................................ 11
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 3 de 13
1. MEDIDAS DE TENDENCIA CENTRAL
Las medidas de centralización nos indican en torno a qué valores se encuentran los
datos.
Las medidas de centralización más importantes son:
La media aritmética o promedio.
La mediana.
La moda.
1.1 LA MEDIA ARITMÉTICA
Se define media aritmética, , de una variable estadística como el cociente entre la
suma de todos los valores de dicha variable y el número de éstos. Si la variable X
toma los valores con frecuencias absolutas la media aritmética se calcula como:
∑∑
Si los datos están agrupados, se toma para las marcas de clase.
La media es un parámetro que nos informa sobre el centro alrededor del cual se
distribuyen los valores, pero podemos encontrarnos distribuciones muy distintas con la
misma media.
Además la media tiene el problema de verse muy influenciada por valores extremos.
Por ejemplo un alumnos puede sacar en un examen un 0 y en otro un 10 y la media le
daría 5, igual que un alumno que sacara un 4,5 y 5,5.
Por todo ello necesitamos de otros parámetros que nos indiquen las diferencias entre
las distribuciones.
1.2 LA MEDIANA
Si ordenamos los datos de menor a mayor, la mediana, Me, es el valor que está en
medio; es decir, tiene tantos individuos por debajo como por encima.
Si los datos están agrupados, el intervalo o clase mediana es el primer intervalo cuya
frecuencia absoluta acumulada es mayor que la mitad del número de datos.
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 4 de 13
Si el número de datos fuera par, a la mediana se le asigna el valor medio de los dos
términos centrales.
La mediana cubre algunos de los flacos débiles de la media, siendo mucho más
robusta frente a la presencia de anomalías.
1.3 LA MODA
La moda de una variable estadística es el valor de dicha variable que tiene mayor
frecuencia absoluta, y se representa por Mo.
Si los datos están agrupados en clases se toma como valor aproximado de la moda la
marca de la clase que presenta mayor frecuencia absoluta. Esta clase se llama clase
modal.
Tenemos que tener en cuenta que la moda no siempre tiene que estar situada en la
zona central, a veces se encuentra próxima a los extremos.
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 5 de 13
2. MEDIDAS DE DISPERSIÓN
Estos parámetros sirven para medir como de dispersos están los datos. En todos ellos,
la idea clave es medir el grado de separación de los datos a la media.
Las medidas de dispersión más importantes son:
Rango o recorrido
Desviación media
Varianza
Desviación típica
Coeficiente de variación
2.1 RANGO
El rango o recorrido de un distribución es la diferencia entre el mayor y el menor valor
de la variable estadística.
Cuanto mayor es el rango, más dispersos están los datos de un conjunto.
2.2 DESVIACIÓN MEDIA
Para ver si los datos de una variable estadística están cerca de la media calculamos
las deviaciones respecto a la media, que son para cada dato la diferencia entre el dato
y la media. La desviación media es el promedio de las distancias de los datos a la
media.
| | | | | | ∑| |
Para calcular la desviación media de un conjunto de datos seguimos los siguientes
pasos:
1) Desviación respecto a la media: dato –media
2) Valores absolutos de las desviaciones: I dato-media I
3) Media aritmética de estos valores absolutos de las desviaciones
2.3 VARIANZA
La varianza nos sirve para medir la dispersión y se define como el promedio de los
cuadrados de las distancias de los datos a la media.
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 6 de 13
∑
También se puede escribir como ∑
El inconveniente que presenta es que sus unidades son las de los datos elevados al
cuadrado
2.4 DESVIACIÓN TÍPICA
La desviación típica es la raíz cuadrada de la varianza
∑
Debemos tener en cuenta que cuanto menor es el rango, la varianza o la desviación
típica de la distribución, mayor es el grado de representabilidad de las medidas de
centralización.
2.5 COEFICIENTE DE VARIACIÓN
Para poder comparar las dispersiones de población heterogéneas se define el
coeficiente de variación, como el cociente entre la desviación típica y la media.
A esto lo llamamos normalizar la variabilidad con respecto a la media.
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 7 de 13
3. MEDIDAS DE POSICIÓN
Las medidas de posición sirven para “establecer mojones”, delimitar zonas en el
conjunto de los datos y así tener una referencia para la localización de los valores.
Las dos medidas de posición más importantes son:
Cuartiles
Percentiles
3.1 CUARTILES
Si partimos la totalidad de los individuos en cuatro partes iguales (todas ellas con el
mismo número de individuos), los puntos de separación se llaman cuartiles.
El cuartil inferior, Q1, es un valor de la variable que deja por debajo de él al 25% de la
población, y por encima al 75%.
El cuartil superior, Q3, es un valor de la variable que deja por debajo de él al 75% de la
población, y por encima al 25%.
Se designan Q1 y Q3 porque la mediana coincide con Q2.
3.2 PERCENTILES
Si partimos la población en 100 partes y señalamos el lugar que deja debajo de k de
ellas, el valor de la variable correspondiente a ese lugar se designa por pk y se
denomina centil k o percentil k.
Q1=p25; Q3=p75
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 8 de 13
4. EJEMPLOS
4.1 EJEMPLO 1
En una maternidad se han tomado los pesos (en kilogramos) de 50 recién
nacidos:
2,8; 3,2, 3,8; 2,5; 2,7; 3,7; 1,9; 2,6; 3,5; 2,3; 3,0; 2,6; 1,8; 3,3; 2,9; 2,1; 3,4; 2,8; 3,1;
3,9; 2,9; 3,5, 3,0; 3,1; 2,2; 3,4; 2,5; 1,9; 3,0; 2,9; 2,4; 3,4; 2,0; 2,6; 3,1; 2,3; 3,5; 2,9;
3,0; 2,7; 2,9; 2,8; 2,7; 3,1; 3,0; 3,1; 2,8; 2,6; 2,9; 3,3
a) Construye una tabla con los datos agrupados en 6 intervalos de amplitud 0,4
kg.
IntervalosMarcas de clase
1,65-2,05 1,65 2,052
1,85
2,05-2,45 2,05 2,452
2,25
2,45-2,85 2,45 2,852
2,65
2,85-3,25 2,85 ,252
3,05
3,25-3,65 3,25 3,652
3,45
3,65-4,05 3,65 4,052
3,85
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 9 de 13
b) Haz una tabla de frecuencias y representa los datos en el diagrama adecuado.
Intervalos
Marcas de clase
Frecuencia absoluta
Frecuencia absoluta
acumulada
Frecuencia relativa
Frecuencia relativa
acumulada
1,65-2,05
1,65 2,052
1,85 4 4
450
225
450
225
2,05-2,45
2,05 2,452
2,25 5 9
550
110
950
2,45-2,85
2,45 2,852
2,65 13 22
1350
2250
1125
2,85-3,25
2,85 ,252
3,05 17 39
1750
3950
3,25-3,65
3,25 3,652
3,45 8 47
850
425
4750
3,65-4,05
3,65 4,052
3,85 3 50
350
5050
1
Representamos los datos en un histograma; al ser los
intervalos de la misma amplitud, la altura de cada barra
corresponde a la frecuencia ( fi ) de cada intervalo.
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 10 de 13
c) Si es posible calcula los parámetros de centralización.
Intervalos | |
1,65-2,05 1,65 2,05
21,85 4 4
450
225
450
225
7,4 13,69 1,032
2,05-2,45 2,05 2,45
22,25 5 9
550
110
950
11,25 25,31 0,632
2,45-2,85 2,45 2,85
22,65 13 22
1350
2250
1125
34,45 91,29 0,235
2,85-3,25 2,85 ,25
23,05 17 39
1750
3950
51,85 158,14 0,168
3,25-3,65 3,25 3,65
23,45 8 47
850
425
4750
27,6 95,22 0,565
3,65-4,05 3,65 4,05
23,85 3 50
350
5050
1 11,55 44,47 0,968
50 144,1 428,12 3,6
Media:
∑∑
144,150
2,882
Moda: es el valor que más se repite. La moda es 3,05.
Mediana: tenemos 6 términos, luego tendremos que hacer la media entre el tercer y
cuarto término. , ,
2,85
d) Si es posible calcula los parámetros de dispersión.
Localizamos los valores extremos: 1,8 y 3,9.
Rango: valores entre los que se encuentra la variables. 3,9 – 1,8 = 2,1. El rango es
2,1.
Desviación media: | | | | | | ∑| | 3,6
500,072
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 11 de 13
Varianza:
∑
428,1250
2,882
8,5624 8,305924 0,256476
Desviación típica: 0,256476 0,51
Coeficiente de variación: 0,512,882
0,18
4.2 EJEMPLO 2
El número de faltas de ortografía que cometieron un grupo de estudiantes en un
dictado fue:
0, 3, 1, 2, 0, 0, 1, 1, 4, 3, 5, 0, 2, 1, 0, 2, 1, 0, 0, 3, 2, 1, 3, 0, 4, 5, 3, 2, 4, 1, 0, 0, 0, 2, 1,
0, 5, 3, 2, 1
a) Di cual es la variable y de qué tipo es.
La variable es el número de faltas ortográficas cometidas, y es cuantitativa discreta (se
puede contar y tienen que ser números enteros.
b) Haz una tabla de frecuencias y representa los datos en el diagrama adecuado.
1) En la primera columna ponemos es número de faltas ortográficas 2) En la segunda columna ponemos cuantas veces se repite ese número de faltas
(frecuencia absoluta). 3) En la tercera columna ponemos las frecuencias absolutas acumuladas.
Fi=f1+f2+…+fi
4) En la cuarta columna colocamos las frecuencias relativas
5) En la tercera columna ponemos las frecuencias relativas acumuladas
.
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 12 de 13
Nº de faltas ortográficas
Frecuencia absoluta
Frecuencia absoluta
acumulada
Frecuencia relativa
Frecuencia relativa
acumulada
0 12 12 1240
310
310
1 9 21 940
2140
2 7 28 740
2840
710
3 6 34 640
320
3440
1720
4 3 37 340
3740
5 3 40 340
4040
1
El mejor diagrama para representar los datos sería un diagrama de barras.
c) Si es posible calcula los parámetros de centralización.
Media:
∑∑
0 12 1 9 2 7 3 6 4 3 5 340
9 14 18 12 1540
6840
1,7
CÁLCULO DE PARÁMETROS ESTADÍSTICOS
http://ticmatec.blogspot.com/ Página 13 de 13
Moda: es el valor que más se repite. La moda es 0 faltas.
Mediana: tenemos 6 términos, luego tendremos que hacer la media entre el tercer y
cuarto término. 2,5
d) Si es posible calcula los parámetros de dispersión.
0 12 12 1240
310
310
0 0
1 9 21 940
2140
9 9
2 7 28 740
2840
710
14 28
3 6 34 640
320
3440
1720
18 54
4 3 37 340
3740
12 48
5 3 40 340
4040
1 15 75
40 68 214
Rango: valores entre los que se encuentra la variables. 5-0=5. El rango es 5.
Desviación media: | | | | | | ∑| |
|0 1,7| |1 1,7| |2 1,7| |3 1,7| |4 1,7| |5 1,7|
40| 1,7| | 0,7| |0,3| |1,3| |2,3| |3,3|
40
1,7 0,7 0,3 1,3 2,3 3,340
9,640
0,24
Varianza:
∑
21440
1,7 5,35 2,89 2,46
Desviación típica: √2,46 1,57
Coeficiente de variación: 1,571,7
0,92