2. estadística inferencial medidas de dispersión

Post on 15-Apr-2017

266 views 0 download

Transcript of 2. estadística inferencial medidas de dispersión

Medidas de tendencia central y de dispersión

Estadística Inferencial

Dr. Gonzalo Navarro

Contenido– Medidas de Tendencia central

• Media, • Mediana, • Moda

– Medidas de dispersión• Rango, • Varianza y • Desviación típica o Estándar

ContenidoII. Estadística inferencialEstimación del tamaño de la muestra

– Necesidad de la muestra– Riesgos de las muestras– Criterios de la estimación– Modelos de estimación– Ejercicios de estimación.

Asociacion estadística– Indicadores de asociación– La Tabla de 2x2– Validez estadística– Formulación y comprobación de hipótesis

Estadistica descriptiva

• El análisis del comportamiento de las variables numéricas

• Medidas de Tendencia central

• Medidas de Dispersión

Las series de datos

• Una serie de datos es la expresión de los diferentes valores resultantes de las mediciones de una variable

• Series naturales

• Series biológicas

La curva normal• La gráfica de esta función tiene

forma de campana y se conoce con el nombre de campana de Gauss.

• Observa que la forma de la campana y la situación respecto a los ejes dependen de los parámetros m (μ) y s (σ)

• .• Este modelo representa el

comportamiento de los mediciones en la mayoría de las variables biológicas continuas.

• Importancia

Comportamiento de las características biológicas

II. Medidas de tendencia central

• a) Medidas de posición Series simples• Las principales medidas de Tendencia

central son:

• Media• Mediana• Moda

Media • Media aritmética • Supongamos que tenemos la siguiente serie:

4,6,6,7,9,11,13• La Media se calcula sumando todos los términos y

dividiendo la suma (56) entre el número de términos (7)• Media= 56 / 7 = 8.

Formula

Xj: Cada valor posible de X n: Número de términos de la serie

Nota: Un inconveniente de esta medida es que Puede verse afectada por valores extremos

Mediana (Me)

• Es un número que supera la mitad de los valores de la serie y es superada por la otra mitad

• Serie impar: 4,6,7,8,9,11,13• Me = 8

• Nota: No está influida por valores extremos

Mediana (Me)

• Serie par: 4,6,6,7,9,11,13, 15• Me = (7+9) / 2 = 8

• Nota: No está influida por valores extremos

Moda• 2.- Moda: es el valor

(o valores) de la serie de datos que mas se repiten.

Nota: Una serie puede tener mas de una moda o no tener ninguna,

• En la Serie• 4,6,6,7,8,9,13

• Mo= 6.

Distribución Sesgada a la Derecha

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

ModaMedian

aMedia

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10 11 12 13

ModaMedian

aMedia

Distribución Sesgada a la Izquierda

0

10

20

30

40

50

60

70

80

90

1 2 3 4 5 6 7 8 9 10 11 12 13

ModaMedian

aMedia

Distribución Simétrica

Cálculo de Media, Mediana y Moda

a partir de una Tabla de Frecuencia Xj fj fjXj

X1

X2

.

.Xn

f1

f 2

.

. fn

f1X1

f 2 X2

.

.fnXn

∑ fj ∑ fjXj

Xj fj

X1

X2

.

.Xn

f1

f 2

.

. fn

∑ fj

Cálculo de Media

a partir de una Tabla de Frecuencia Xj fj fjXj0123456789

10

2453

11211611453

04

109

441059677324530

85 452

Xj fj

0123456789

10

2453

11211611453

La Media = 452 / 85 = 5,31

Cálculo de Mediana

a partir de una Tabla de Frecuencia acumulada Xj fj % %

acumu lado

0123456789

10

2453

11211611453

2.34.65.93.5

12.924.718.812.94.65.93.5

2.36.9

12.816.329.253.972.785.690.296.199.6

85 100

Xj fj

012345678910

2453

11211611453

85La Mediana = 5

Ejercicio individual 2 APLICANDO LOS CONOCIMIENTOS ADQUIRIDOS EN CLASE DETERMINE LOS VALORES DE: MEDIA, MEDIANA Y MODA

ALUMNO # SERIE

1. Barrantes 12,4, 23, 32, 33, 54, 32.19,20,32,44,12

2. Blandón 44,23,32,15,78,65,65,45,35,43,44

3. Escorcia 95,99,87,67,67,87,88,45,56,54,63,66

4. García 21,22,11,13,14,43,21,22,32,11,23,

5. Gonzalez. 44,43,34,35,54,46,56,44,34,34,54,55,

6. Granado 76,77,77,87,67,67,55,56,76,75,87,88,

7. Guerrero 23,32,23,24,21,14,23,24,25,32,33,

8. Herrera 77,67,68,87,86,67,66,56,65,66,68,76,

9. Huembes 12,13,14,15,21,22,23,24,25,31,32

10. Lainez 43,35,35,55,46,56,41,34,34,54,55, 53

11. Palacios 44,43,34,35,54,46,56,44,34,34,54,55,

12. Paz 90,99,87,67,67,88,45,56,54,63,76

13. Pérez 20,22,11,13,16,43,21,21,32,11,23,

14. Pineda 41,32,35,64,54,34,34,23,34,34,21,21

Ejercicio individual 2 APLICANDO LOS CONOCIMIENTOS ADQUIRIDOS EN CLASE

DETERMINE LOS VALORES DE: MEDIA, MEDIANA Y MODA

.

ALUMNO # SERIE

15. Sanchez 4, 23, 32, 33, 54, 32.19,20,32,44,12, 12

16. Torrez 44, 44, 23, 32,15,78, 65, 65, 45, 35,

17. Vega 66, 95,99,87,67,67,87,88,45,56,54,63

18. Weil 23, 21,22,11,13,14,43,21,22,32,11,

Calculo de la media

• Serie simple

Cálculo de la Media• (1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + .... + (1,29 * 3) + (1,30 * 3)

• Xm = ----------------------------------------------------------------• 30

• Luego: Xm =1,25

• Por lo tanto, la estatura media de este grupo de alumnos es de 1,25 cm.

Cálculo de la Mediana• La mediana de esta

muestra es 1,26 cm, ya que por debajo está el 50% de los valores de la serie.

• Esto se puede ver al analizar la columna de frecuencias relativas acumuladas

Variable Frecuencias absolutas Frecuencias relativas(Valor) Simple Acumulada Simple Acumulada

x x x x x1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%

Cálculo de la Moda• 4.- Moda:• Hay 3 valores que se

repiten en 4 ocasiones:

• el 1,21, • el 1,22 • y el 1,28,• por lo tanto esta serie

cuenta con 3 modas. (Serie trimodal).

Variable Frecuencias absolutas Frecuencias relativas(Valor) Simple Acumulada Simple Acumulada

x x x x x1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%

Medidas de dispersion

MEDIDAS DE DISPERSIONCómo se alejan los valores de la Media?

• RANGO

• VARIANZA

• DESVIACION ESTANDAR

.

III. Medidas de dispersión• Estudia la distribución

de los valores de la serie, analizando si estos se encuentran más o menos dispersos.

• Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:

• Rango• Varianza• Desviacion típica

Forma de la curva normal y Desviacion estandar

CURVA A CURVA B CURVA C

Medidas de dispersión• En el ejemplo de la

tabla calcule el Rango:

• R= 130cm – 120cm• R= 10cm

Variable Frecuencias absolutas Frecuencias relativas(Valor) Simple Acumulada Simple Acumulada

x x x x x1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%

Medidas de dispersión• 2.- Varianza:

Mide la distancia existente entre los valores de la serie y la media.

• Expresa la medida en que los valores tienden alejarse de la Media.

• Se calcula como la sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor.

• La sumatoria obtenido se divide por el tamaño de la muestra.

Varianza S²• La varianza siempre será mayor que cero.

• Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media.

• Por el contrario, mientras mayor sea la varianza, más dispersos están.

Varianza (S²)

Xj = Cada valor de la variable en la serie de datos n = Número de individuos en la serieS²x = Varianza de la variable X

Medidas de dispersión• 3.- Desviación típica:

• Se calcula como raíz cuadrada de la varianza.

• S=√S² __

A B C

X y Spequeñas

X y Smayores

X y SMas grandes

Distribución normal y Desviación estandar

"La distribución normal desempeña una función central en las estadísticas clásicas tradicionales y la desviación estándar es la manera usual de representar la dispersión de una distribución normal.

Cálculo de Medidas de dispersión

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

X x X x x

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Cálculo de Medidas de dispersión

• 1.- Rango: • Diferencia entre el

mayor valor de la muestra (1,30) y el menor valor (1,20).

• Luego el rango de esta muestra es

• 1,30 -1,20 =0,10 m.

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

X x X x x

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Varianza

• 2.- Varianza:

• Mide la distancia existente entre los valores de la serie y la media.

• Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media,.

• La sumatoria obtenida se divide por el tamaño de la muestra.

3.- Desviación típica o estándar

• Se calcula como raíz cuadrada de la varianza.

• Varianza.

• Desviación estándar

•Expresa la dispersión de la •distribución de los datos .

Ejemplo: vamos a utilizar la serie de datos de la edad, en años cumplidos, de los alumnos de una clase y a calcular sus medidas de

dispersión.

• Dada la serie• 30,19,21,20,20,25,27,25,28,30,19,25

• Procedemos a ordenar los datos• 19,19,20,20,21,23,25,25,27,28,30,30

• Ahora calculemos el Rango• 30-19 = 11

Cálculo de la Varianza

1. Revisar la serie2. Calcular el valor de la Media3. Obtener la diferencia del valor de la Media con

cada uno de los datos de la serie.4. Calcular el cuadrado de cada diferencia5. Sumar todos los cuadrados de las diferencias.6. Dividir la suma anterior entre el número de

datos de la serie.!Ya tiene usted el valor de la Varianza!

Calculo de la VarianzaVALOR

X

PROMEDIO

X

DIFERENCIA

X - X

DIFERENCIA AL CUADRADO

(X - X )

VARIANZA

Σ (X-x)

19

24

24-19=5 25

19 24-19=5 25

20 24-20=4 16

20 24-20=4 16

21 24-21=3 9

23 24-23=1 1

25 24-25=--1 1

25 24-25=-1 1

27 24-27=-3 9

28 24-28=-4 16

30 24-30=-6 36

31 24-31=-7 49

11 204 204/12=17

__2 2

/ n _

Desviacion tipica o estándar• Y sí ya tiene la Varianza

• ! Ya tiene la Desviacion estándar !

• La DE = a la Raiz cuadrada de la Varianza

Respuestas• 1.- Rango: Diferencia entre el mayor valor de la muestra (31) y el menor valor (19). Luego el

rango de esta muestra es.• 31-19 = 21• 2.- Varianza: recordemos que la media de esta muestra es 24. Luego, aplicamos la fórmula:

• Por lo tanto, la varianza es: 204/12=17

• 3.- Desviación estandar: es la raíz cuadrada de la varianza.

• √17 =4.1