La varianza

7
Medidas de Dispersión Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Varianza: El término varianza fue acuñado por Ronald Fisher en un artículo de 1918 titulado The Correlation Between Relatives on the Supposition of Mendelian Inheritance. Varianza (S 2 o 2 ): Es el resultado de la división de la sumatoria de las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total de datos. Distinguimos dos símbolos para identificar la varianza: S 2 para datos muestrales, s 2 =¿¿ Y σ 2 para datos poblacionales. σ 2 =¿¿ Note que la fórmula para la varianza muestral presenta en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los estadísticos para denotar una varianza más conservadora. Para series simples. La siguiente información corresponde a las calificaciones de un grupo de alumnos de la cátedra Psicoestadística, quienes obtuvieron los siguientes resultados. x x- x 2 (xi- x ¿ 2 2 -4 16 3 -3 9 4 -2 4 5 -1 1

Transcript of La varianza

Page 1: La varianza

Medidas de Dispersión

Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.

Varianza:El término varianza fue acuñado por Ronald Fisher en un artículo de 1918 titulado The Correlation Between Relatives on the Supposition of Mendelian Inheritance.

 Varianza (S2 o 2): Es el resultado de la división de la sumatoria de las distancias existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total de datos.

Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales,

s2=∑¿¿

Y σ2 para datos poblacionales.

σ 2=∑¿¿

Note que la fórmula para la varianza muestral presenta en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los estadísticos para denotar una varianza más conservadora.

Para series simples.

La siguiente información corresponde a las calificaciones de un grupo de alumnos de la cátedra Psicoestadística, quienes obtuvieron los siguientes resultados.

x x-x2 (xi-x ¿2

2 -4 163 -3 94 -2 45 -1 16 0 07 1 18 2 49 3 9

10 4 16∑54 60

Una vez localizado el centro con las medidas de tendencia central la investigación en busca de información a partir de los conjuntos de datos se dirigen ahora, a las medidas de dispersión, estas incluyen el rango, la varianza

Page 2: La varianza

y la variabilidad que se encuentra en datos bastantes agrupados y poseen valores relativamente pequeños y datos más dispersos tienen valores más dispersos.

El agrupamiento más estrecho ocurre cuando los datos carecen de dispersión (todos los datos tienen el mismo valor) para los cuales la medida de dispersión es cero.

Paso: 1. encontrar la sumatoria de las x o número de datos.

X=54

Paso: 2. Encontrar la media aritmética.

x = ∑xn

x=259

x=6

Paso: 3.Encontrar cada desviación

X - x

2-6=-4

3-6=-3

4-6=-2

5-6=-1

6-6=0

7-6=1

8-6=2

9-6=3

10-6=4

Paso: 4. Encontrar la sumatoria de las desviaciones.

Page 3: La varianza

∑(x-x ¿2=60

(-4¿2=16

(-3¿2=9

(-2¿2=4

(-1¿2=1

(0¿¿2=0

(1¿2=1

(2¿2=4

(3¿2=9

(4¿2 = 16

Paso: 5. Encontrar la varianza

s2=∑¿¿

s2=¿ 60

9¿

La varianza es s2=¿6.67 ¿

Una advertencia en el uso de esta medida, es que al elevar las distancias al cuadrado, automáticamente se elevan las unidades. Por ejemplo, si la unidad trabajada en los datos es centímetros, la varianza da como resultados centímetros al cuadrado.

5.2.1 Ejemplo: Varianza para datos no agrupados

Formula: S=∑¿¿

La siguiente muestra representa las edades de 25 personas sometidas a un análisis de preferencias para un estudio de mercado. 

25 19 21 35 44

20 27 32 38 33

18 30 19 29 33

26 24 28 39 31

31 18 17 30 27

Page 4: La varianza

X F Pm Pm .f (Pm-x ¿2 (Pm-x ¿2 .f16-20 5 17 85 59.67 11.93421-25 3 23 69 27.04 81.1226-30 6 28 168 0.04 0.2431-35 7 33 231 23.04 161.2836-40 4 38 152 96.04 384.1641-45 1 43 43 219.04 219.04

25 705 205,83 638,73

Solución

Paso: 1. encontrar la sumatoria de las frecuencias. ∑f.

∑f=25

Paso: 2. Encontrar la media aritmética.

x = ∑pm . fn

x=70525

=28.2

x=28.2

Paso: 3.Encontrar el punto medio menos la media aritmética

(Pm-x ¿2 1ro. 17-28.2 = (11.2¿2=125.44

(Pm-x ¿2 =125.44

Paso: 4. Encontrar el punto medio menos la media aritmética al cuadrado por la frecuencia.

(Pm-x ¿2.f

(125.44*17=2132.48

(Pm-x ¿2.f= 2132.48

Paso: 5. Encontrar la varianza para datos agrupados

s2=∑¿¿

Page 5: La varianza

Primer dato = s2=¿

¿∑ (F2 :F 6)638.73425

¿=25.54936

La varianza para datos agrupados es

s2=¿¿25.54936

Determinar la varianza.

SOLUCIÓN

PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza

En este punto, la varianza es identificada por S2.

La varianza equivale a 51,8567. Por elevar las unidades al cuadrado, carece de un significado contextual dentro del análisis descriptivo del caso.

5.2.2 Ejemplo: Varianza para datos agrupados

Calcular la varianza a partir de la siguiente tabla de frecuencia (suponga que los datos son poblacionales).

 

Ni Lm Ls f Mc

1 [15 17) 2 16

2 [17 19) 5 18

3 [19 21) 13 20

4 [21 23) 4 22

5 [23 25] 1 24

Total 25  

SOLUCIÓN

Page 6: La varianza

PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza

En este punto, la varianza es identificada por S2.