Dispersion Agrupados y No Agrupados
-
Author
esteban-perez -
Category
Documents
-
view
42 -
download
1
Embed Size (px)
Transcript of Dispersion Agrupados y No Agrupados
-
Medidas de Dispersin
"No se puede entender cabalmente la historia de un pueblo si no se conoce la dinmica de su pueblo. Y no se puede planificar
y tomar decisiones sabias en un pas (municipio, comunidad
o grupo), si no se considera cuidadosamente
su situacin demogrfica y sus perspectivas futuras". Dr. Jos Vzquez Calzada
Una de las funciones de la estadstica se relaciona con el clculo de la
variabilidad. Conocer las medidas de dispersin (variacin) es de suma importancia,
ya que la no consideracin de diferencias puede conducir a errores de juicio en la
toma de decisiones (Snchez, 1992). Una medida particular de tendencia central da
lugar a una puntuacin que, en cierto sentido, "representa" a todas las puntuaciones
de un grupo (Glass & Stanley, 1974). Sin embargo, cuando se usa cualquier medida
de tendencia central, sta nos da slo un cuadro incompleto de un conjunto de datos
y, por consiguiente, podra conducir a conclusiones errneas o distorsionadas (Levin,
1979), porque este proceso pasa por alto las diferencias entre las puntuaciones en s
(Glass & Stanley, 1974). Sera incorrecto concluir que dos (2) conjuntos de datos son
iguales slo porque tienen la mismas medidas de tendencia central, es decir, que el
valor de la media aritmtica sea el mismo para ambos conjuntos, cuando la distancia
de los datos de ambos conjuntos se distribuyen de una forma diferente (Elorza, 1987).
Para describir una distribucin en forma ms completa o para interpretar con
ms detalle una calificacin, necesitamos informacin adicional acerca de la
dispersin de las calificaciones con respecto a nuestra medida de tendencia central
(Haber & Runyon, 1992). Es necesario un ndice de cmo estn diseminados los
puntajes alrededor del centro de la distribucin. A tales distancias se les suele
6
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
154
denominar medidas de dispersin o variacin. Las medidas de dispersin, tambin
conocidas como medidas de variacin o variabilidad, indican el grado en que los
sujetos se dispersan respecto al centro de la distribucin. A travs de las mismas el
investigador verifica cun homogneos, parecidos o estables son los elementos bajo
estudio, en contraste con otros grupos de inters (Snchez, 1992). Si todos los
valores son los mismos, no existe dispersin; si no todos son los mismos, hay
dispersin en los datos. La magnitud de la dispersin puede ser pequea, cuando los
valores, aunque diferentes, estn prximos entre s. Si los valores estn ampliamente
separados, la dispersin es mayor.
Este captulo trata slo de la medidas de dispersin o variabilidad ms
conocidas: el recorrido (rango) y la desviacin estndar. Estas tcnicas estarn
enmarcadas segn la composicin de los datos, es decir, arreglo de datos, datos no
agrupados y datos agrupados. Adems, se evaluar la tcnica de coeficiente de
variacin para variables cuantitativas y cualitativas, tales como: coeficiente de
variacin e ndice de dispersin cuantitativo.
[6.1] Tipos de Medidas de Dispersin
Cuando nuestro inters se centra en las medidas de dispersin, debemos
buscar un ndice de variabilidad que indique la distancia a lo largo de la escala de
calificaciones (Runyon & Haber, 1992). El recorrido y la desviacin estndar realizan
dicha labor.
Recorrido Una manera de medir la variacin en un conjunto de valores es calculando el
recorrido. El recorrido es la ms sencilla y directa de las medidas de dispersin
(Runyon & Haber, 1992), y a la vez la menos confiable de las medidas de variacin
(Snchez, 1992). Se trata simplemente de la distancia entre el valor menor y el valor
mayor en un conjunto de observaciones. El hecho de que slo tome en consideracin
dos (2) valores, hace que la medida sea muy pobre. Ntese que si hay un valor
extremo en la distribucin, se tendr la impresin de que la dispersin es grande
cuando, en realidad, si hiciramos caso omiso de esa calificacin, podramos
-
Medidas de Dispersin
155
encontrar que dicha distribucin es, por el contrario, una distribucin "compacta". El
recorrido refleja nicamente las dos (2) calificaciones extremas de la distribucin
(Runyon & Haber, 1992), es decir, solamente dos (2) puntuaciones exactas de un
grupo son las que los determina, ignorando as, todas las dems puntuaciones, a
excepcin de los extremos (Glass & Stanley, 1974). El recorrido no puede darnos una
idea precisa con respecto a la dispersin y, en el mejor de los casos, debe
considerarse slo como un ndice preliminar o muy aproximado (Levin, 1977). Puede
expresarse de la siguiente manera:
R = Recorrido, rango o amplitud
Vmax = Valor mximo de los datos de un conjunto
Vmin = Valor mnimo de los datos de un conjunto
Varianza y Desviacin Estndar
La desviacin estndar (DE) es la medida de dispersin ms adecuada para la
estadstica descriptiva (Haber & Runyon, 1992). Tanto en la escalas de intervalo
como en las de razones, la varianza y la desviacin estndar son las mejores medidas
de dispersin. Toman en consideracin todos los puntajes y controlan por el efecto de
valores extremos. La DE permite una interpretacin precisa de las calificaciones
dentro de una distribucin (Runyon & Haber, 1992). Si todos los sujetos son iguales
en una caracterstica (por ejemplo, ndice acadmico), entonces el resultado ser igual
a cero. Por el contrario, si aumentan las diferencias, aumentar el ndice, alejndose
ms y ms del punto cero. La varianza se define como las desviaciones cuadradas
medias respecto a la media. La desviacin estndar es la raz cuadrada de la
varianza. La desviacin estndar estar formulada de la siguiente manera:
R = Vmax - Vmin
donde;
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
156
Frmulas para poblacin
Frmulas para muestras
()
N
N donde:
=
Desviacin
estndar para
arreglos de datos
usando el
universo
x (x)
N
N donde:
=
Desviacin
estndar para
datos no
agrupados y datos
agrupados usando
el universo
()
n
n-1 donde:
s =
Desviacin
estndar para
arreglos de datos
usando muestra
x (x)
n
n-1 donde:
s =
Desviacin
estndar para
datos no
agrupados y datos
agrupados usando
muestra
-
Medidas de Dispersin
157
=
Desviacin estndar de la poblacin.
s = Desviacin estndar de la muestra
= Sumatoria de los valores que toma la variable (x), cuando estamos trabajando con datos no agrupados.
Para los datos agrupados el smbolo cambia a x.
= Sumatoria de los valores que toma la variable (x) al cuadrado, cuando estamos trabajando con datos no agrupados. Para los datos agrupados el smbolo
cambia a x.
N = Tamao del universo o la poblacin
n = Tamao de la muestra
n-1 = Tamao de la muestra menos uno (1)
[6.2] Anlisis de Dispersin a partir de los Arreglos de Datos
Para poder evaluar este tpico retomaremos el ejemplo de datos hipotticos del
captulo 5, seccin 5.2 (ver pgina 116). Uno de los primeros paso en el formato de
arreglo de datos es acomodar los datos de una forma til. El mismo consiste en
organizar los datos obtenidos de una forma ordenada, de menor a mayor o viceversa.
Con esta estructura establecida, podemos con facilidad aplicar diversos mtodos
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
158
estadsticos para poder entender mejor el conjunto de datos en estudio. Si
quisiramos realizar un anlisis de dispersin sobre la edad inicial del uso de Internet
entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico del
ao acadmico 2003-2004, el primer paso sera organizar los porcentajes de mayor a
menor o viceversa (ver figura 6.1).
Recorrido El recorrido sera la distancia que existe entre la edad mas alta vs. la edad ms
baja sobre el inicio en el Internet en los estudiantes de ciencias polticas de la
Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004. Es
recomendable que se organicen las categoras de la variable de inters de menor a
mayor o viceversa. En la figura 6.1 las edades de inicio en el Internet entre los
estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao
acadmico 2003-2004 fueron organizados de menor a mayor. Si observamos
detenidamente las edades organizadas (ver figura 6.1), notaremos que el dato ms
alto fue la edad 23 aos, mientras que el dato ms bajo fue la edad 10 aos. Con esta
informacin podemos obtener el recorrido de la siguiente manera:
R = edad ms alta edad ms baja
R = 23 10
R = 13
Figura 6.1
Edades organizadas de menor a mayor
10 10 10 12 12 12 12 13 13 13
13 13 13 15 15 15 15 15 15 15
16 16 16 16 16 16 18 18 18 21
21 21 21 22 22 23 23 23 23 23
N= 40 datos hipotticos
-
Medidas de Dispersin
159
Podemos indicar que en la Universidad pitirre de Puerto Rico para el ao
acadmico 2003-2004 la diferencia de la edad de inicio en el Internet entre los
estudiantes de ciencias polticas fue de 13 aos.
Desviacin Estndar
Para buscar la desviacin estndar entre las edades sobre el inicio del Internet
en los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el
ao acadmico 2003-2004 es necesario elaborar una nueva columna conocida como
(). La columna se obtiene elevando al cuadrado a la frecuencia () como
observamos en la figura 6.2. Una vez realizado dicha operacin se suman por
separado ambas columnas, para obtener: (sumatoria de las edades) y (sumatoria
de las edades al cuadrado).
Con la columna establecida (ver figura 6.2) podremos buscar la desviacin
estndar () de la siguiente manera:
Figura 6.2 Desarrollo de los datos para establecer la Desviacin Estndar
[10] 100
[10] 100
[10] 100
[12] 144
[12] 144
[12] 144
[12] 144
[13] 169
[13] 169
[13] 169
[13] 169
[13] 169
[13] 169
[15] 225
[15] 225
[15] 225
[15] 225
[15] 225
[15] 225
[15] 225
[16] 256
[16] 256
[16] 256
[16] 256
[16] 256
[16] 256
[18] 324
[18] 324
[18] 324
[21] 441
[21] 441
[21] 441
[21] 441
[22] 484
[22] 484
[23] 529
[23] 529
[23] 529
[23] 529
[23] 529
= 654
=11,350
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
160
Podemos concluir que en la Universidad pitirre de Puerto Rico para el ao
acadmico 2003-2004 la desviacin estndar de la edad de inicio en el Internet
entre los estudiantes de ciencias polticas fue de 4.05 aos.
11,350 (654)
40
40
11,350 427,716
40
40
11,350 10,692.9
40
= 657.1
40
= 16.4275
= 4.0530852
= 4.05
=
=
=
-
Medidas de Dispersin
161
Ejercicios de Dispersin segn arreglo de datos Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________
NUMERO DE ESTUDIANTE: SECCION: ___________
Ejercicio 6.2.1 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.
Estudiantes de pre-jurdico sobre la edad de inicio en el consumo de bebidas alcohlicas, Universidad Pitirre, Puerto Rico: 2000
10 23 19 17 15 23 19 16 10 16 19 23 17 19 10
23 19 16 10 19 17 10 16 19 15 10 15 14 23 16
19 16 10 16 19 15 17 19 10 23 19 19 15 17 10
17 19 23 16 14 17 23 10
Casos hipotticos
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
162
Ejercicio 6.2.2 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.
Estudiantes de ciencias polticas respecto al gasto en dlares diario de gasolina, Universidad Pitirre, Puerto Rico: 2000
12 20 15 10 22 15 10 12 09 22 09 12 08 10 15
10 22 10 12 09 08 15 05 22 05 15 08 10 20 09
20 12 08 15 09 12 05 20 12 10 22 20 12 15
Casos hipotticos
-
Medidas de Dispersin
163
Ejercicio 6.2.3 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.
Estudiantes de economa con respecto a la cantidad de hermanos en su familia, Universidad Pitirre, Puerto Rico: 2000
2 1 4 3 6 2 7 3 5 1 2 6 3 5 1 3 4 1 2 3 1 4
3 1 3 4 2 8 3 2 5 7 3 2 9 3 1 1 5 3 8 5 1
3 4 3 5 2 1 4 6
Casos hipotticos
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
164
Ejercicio 6.2.4 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.
Estudiantes de antropologa con respecto a la cantidad de crditos acumulado de concentracin, Universidad Pitirre, Puerto Rico: 2000
18 12 15 20 15 21 27 18 14 16 27 21 24 15 15
27 15 12 18 15 15 18 14 18 16 27 16 18 21 15
18 12 15 27 15 12 18 16 12 15 20 18 16 13 21
15 27 18 12 14 18 27 20 15 14 27 18 20 16 15
Casos hipotticos
-
Medidas de Dispersin
165
[6.3] Anlisis de Dispersin a partir de los Datos no Agrupados
En Puerto Rico para el ao 1993 se
registraron 12,820 nacimientos que provienen de
madres adolescentes. Los nacimientos se
ubicaron segn el orden de embarazo de la madre
adolescente (ver cuadro 6.1). El orden de
embarazo supone la posicin que ocupar el
infante con respecto a sus hermanos(as).
Ejemplo, podemos observar en el cuadro 6.1 que
8,709 nacimientos representan el primer hijo(a)
para las madres adolescentes 12 nacimientos
representan el sexto hijo(a) para las madres
adolescentes.
Recorrido Si su inters como estudioso es realizar un anlisis de dispersin al orden de
embarazo que representa dicho nacimiento en la mujer ocurrido en Puerto Rico para
el ao 1990, podramos buscar el recorrido y la desviacin estndar. El recorrido, es
decir, la distancia que existe entre el orden de embarazo mayor menos el orden de
embarazo menor, sera:
Cuadro 6.1 Nacimientos por Orden de embarazo
por madres adolescentes Puerto Rico, 1993
Orden de embarazo
(x) nacimientos
()
1 8,709
2 2,958
3 903
4 195
5 37
6 12
7+ 6 Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenido del Departamento de Salud de Puerto Rico, 1992. Informe Anual de Estadsticas Vitales de
Puerto Rico: 1990. Nacimientos Vivos, tabla 15, pg. 68.
R = Orden de embarazo Orden de embarazo
mayor menor
R = 7 1
R = 6
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
166
Podemos interpretar que en Puerto Rico para el ao 1993 la distancia
observada o el recorrido entre el orden de embarazo de los nacimientos de las
madres adolescentes fue de seis (6).
Desviacin Estndar Para buscar la desviacin estndar entre el orden de embarazo de los
nacimientos de las madres adolescentes ocurridos en Puerto Rico para el 1993 es
preciso elaborar varias columnas adicionales a las establecidas en el cuadro 6.1.
Como observamos en la figura 6.3, las columnas adicionales para elaborar la
desviacin estndar son (x) y (x). La columna x se obtiene multiplicando las
categoras de la variable (x) con su frecuencia () correspondiente. La columna x se
obtiene multiplicando la columna (x) por la categora (x) correspondiente. Notemos,
que no estamos elevando al cuadrado la columna (x). De realizar dicho clculo se
invalida el resultado. La poblacin o universo (N) es obtenido por la suma de la
columna de la frecuencia ().
Figura 6.3. Procedimiento para obtener x y x, segn los datos del cuadro 6.1
Orden de
embarazo
x
1
2
3
4
5
6
7+
Nacimientos
8,709
2,958
903
195
37
12
6
x
= 8,709
= 11,832
8,127
3,120
925
432
294
x
= 8,709
= 5,916
= 2,709
780
185
72
42
por
por
por
por
por
N 12,820 x 18,413 33,439
-
Medidas de Dispersin
167
Con la columna establecida (ver figura 6.3) podremos buscar la desviacin
estndar () de la siguiente manera:
Podemos concluir que en Puerto Rico para el ao 1990 la desviacin
estndar entre el orden de embarazo de las madres adolescentes fue de .74
33,439 (18,413)
12,820
12,820
33,439 26,446.066
12,820
6,992.9338
12,820
= .5454707
= .7385599
= .74
=
=
=
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
168
-
Medidas de Dispersin
169
Ejercicios de Dispersin segn datos no agrupados Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________
NUMERO DE ESTUDIANTE: SECCION: ___________
Ejercicio 6.3 Favor de utilizar los datos que reflejan la cantidad menores contra quienes se presentaron querellas por sexo y edad, Puerto Rico, ao fiscal 1991-1992.
Sexo
Edad Hombres
Mujeres
Ambos
Sexos
TOTAL 9 aos
25
3
28
10 aos
34
4
38
11 aos
73
6
79
12 aos
141
24
165
13 aos
316
62
378
14 aos
536
117
653
15 aos
884
120
1,004
16 aos
1,160
134
1,294
17 aos
1,428
106
1,534
18 aos
144
18
162
TOTAL
4,741
594
5,335
Fuente: Tribunal Superior de Puerto Rico, Asunto de Menores
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
170
[6.3.1] Favor de calcular y analizar el recorrido de la edad de las menores (mujeres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.
[6.3.2] Favor de calcular y analizar la desviacin estndar de la edad de las menores (mujeres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.
-
Medidas de Dispersin
171
[6.3.3] Favor de calcular y analizar el recorrido de la edad de los menores (hombres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.
[6.3.4] Favor de calcular y analizar la desviacin estndar de la edad de los menores (hombres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
172
[6.3.5] Favor de calcular y analizar el recorrido de la edad total de los menores (ambos sexos) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.
[6.3.6] Favor de calcular y analizar la desviacin estndar de la edad total de los menores (ambos sexos) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.
-
Medidas de Dispersin
173
[6.4] Anlisis de Dispersin a partir de los Datos Agrupados
El Departamento de Salud de Puerto Rico
inform que para el ao 1993 murieron 1,148
personas debido al virus de inmunodeficiencia
humana (SIDA). El cuadro 6.2 refleja las muertes
ocurridas por SIDA ubicadas por grupos de
edades. Si usted suma todas las defunciones por
SIDA ubicadas en grupos de edades notar una
diferencia de doce (12) casos. Dicha diferencia se
debe a los casos que no informaron o se
desconoce la edad. Para este ejercicio se tomar
en cuenta todos los casos que informaron la edad,
es decir, 1,139 defunciones. Si su inters como
investigador es analizar la dispersin o variabilidad
de la edad de las personas que murieron por SIDA
en Puerto Rico para el ao 1993, podramos
buscar el recorrido y la desviacin estndar. Para
obtener el recorrido y la desviacin estndar segn
la configuracin de datos agrupados es necesario
elaborar tres (3) columnas adicionales: (Pt); (x) y
(x). La columna (Pt) y (x) ya han sido
explicadas y elaboradas en el captulo 5 (ver tpico
5.4). La columna x se obtiene mediante la
multiplicacin de la columna x por la columna Pt.
Cuadro 6.2
Frecuencia de muertes
por SIDA y edad
Puerto Rico, 1993
Edad
(clase)
x
0-4 14
5-9 4
10-14 0
15-19 0
20-24 20
25-29 118
30-34 237
35-39 268
40-44 214
45-49 115
50-54 65
55-59 32
60-64 14
65-69 19
70-74 6
75-79 6
80-84 5
85-89 2 Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenidos del Departamento de Salud de Puerto Rico, 1995. Informe Anual de Estadsticas Vitales: Puerto Rico, 1993. Mortalidad, tabla 15a: pg. 187; Existen 12 casos sin especificar las edades
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
174
Recorrido
El recorrido, es decir la diferencia de la edad mayor vs. la edad menor de las
personas que murieron por SIDA, debe conseguirse en el punto medio (Pt) de la clase de
edad mayor vs. la clase de edad menor. Si observamos la figura 6.4 el punto medio de la
clase mayor (85 - 89) es 87 aos, mientras que el punto medio de la clase menor (0 - 4) es
2 aos. Con estos elementos el recorrido podr obtenerse de la siguiente forma:
Figura 6.4 Columnas necesarias como Pt, x y x, segn los datos del cuadro 6.2
Edades|
(clases)
0-4
5-9
10-14
15-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80-84
85-89
14
4
0
0
20
118
237
268
214
115
65
32
14
19
6
6
5
2
Pt
x
2
7
12
17
22
27
32
37
42
47
52
57
62
67
72
77
82
87
x
28
28
0
0
440
3,186
7,584
9,916
8,988
5,405
3,380
1,824
868
1,273
432
462
410
174
x
56
196
0
0
9,680
86,022
242,688
366,892
377,496
254,035
175,760
103,968
53,816
85,291
31,104
35,574
33,620
15,138
N= 1,139 x =44,389 x =1,871,336
-
Medidas de Dispersin
175
1,871,336 (44,398)
1,139
1,139
1,871,336 1,730,625.5
1,139
140,710.54
1,139
= 123.53866
= 11.114795
= 11.12 aos
Podemos indicar que el recorrido observado en la edad de las personas que
murieron por SIDA en Puerto Rico para el ao 1993 fue de 85 aos.
Desviacin Estndar
Como hemos establecido, para
obtener la desviacin estndar segn la
configuracin de datos agrupados es
necesario elaborar dos (2) columnas
adicionales: (x) y (x). La columna x es
obtenida mediante la multiplicacin de la
columna frecuencias () por la columna del
punto medio (Pt). La columna x es
obtenida mediante la multiplicacin de la
columna x por la columna Pt. Con estas
columnas realizadas en la figura 6.4 podemos
buscar la varianza y luego la desviacin
estndar.
Podemos afirmar que en Puerto Rico
para el ao 1993 la desviacin estndar de
la edad por defunciones debido al SIDA
fue de 11.12 aos.
R = Pt de la Pt de la
clase mayor clase menor
R = 87 2
R = 85 aos
=
=
=
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
176
-
Medidas de Dispersin
177
Ejercicios de Dispersin segn datos agrupados Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________
NUMERO DE ESTUDIANTE: SECCION: ___________
Ejercicio 6.4 Favor de utilizar los datos que reflejan la cantidad de defunciones por accidentes de trfico de vehculos de motor por edad, Puerto Rico: 1980, 1985 y 1990.
Aos naturales
Grupo de
edad 1980
1985
1990
5 - 14
44
53
43
15 - 24
145
129
107
25 - 34
97
110
84
35 - 44
65
90
87
45 - 54
67
65
67
55 - 64
47
55
62
65 - 74
53
42
52
75 - 84
20
27
33
85 - 94
10
5
8
Fuente: Departamento de Salud, 1993. Estadsticas Vitales de Puerto Rico: Resumen de una dcada 1980 al 1990. San Juan, P.R.: pg. 108.
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
178
[6.4.1] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1980.
[6.4.2] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1980. Incluya una tabla con las columnas necesarias para completar el ejercicio.
-
Medidas de Dispersin
179
[6.4.3] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1985.
[6.4.4] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1985. Incluya una tabla con las columnas necesarias para completar el ejercicio.
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
180
[6.4.5] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1990.
[6.4.6] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1990. Incluya una tabla con las columnas necesarias para completar el ejercicio.
-
Medidas de Dispersin
181
[6.5] Funcin de la Desviacin Estndar
Una vez obtenida la desviacin estndar, conforme uno de los tres (3) tipos de
organizacin de datos, la pregunta inminente es qu implicacin o funcin tiene
dicha medida?. Al principio de este captulo indicamos que el objetivo de las medidas
de dispersin es indicar el grado en que los sujetos se dispersan (se alejan o se
acercan) respecto al centro (la media) de una distribucin. La desviacin estndar
cumple a cabalidad con dichos objetivos. A mayor la desviacin estndar mayor es la
dispersin o a menor la desviacin estndar menor es la dispersin de los sujetos, con
respecto a la media. Como funcin de la desviacin estndar podemos encontrar
cun homogneos, parecidos o estables son los sujetos bajo estudio cuando estos
son comparados con otro(s) grupo(s) de inters.
Por ejemplo, en dos (2) secciones del curso de estadstica social la edad media
fue igual, es decir, 21.4 aos de edad. La desviacin estndar para la seccin 1 fue
de 10 aos y la desviacin estndar de la seccin 2 fue de 2 aos. Qu podemos
inferir de las resultados obtenidos tanto de la seccin 1 como de la seccin 2?
Primeramente, debemos sealar que la comparacin de la desviacin estndar de
ambas secciones es posible, nica y exclusivamente, porque la media es igual. Al
comparar la desviacin estndar notamos una diferencia. La desviacin estndar de
la seccin 1 (10 aos) es mayor que la seccin 2 (2 aos). Esto sugiere que en la
seccin 2 del curso de estadstica social los estudiantes son ms homogneos
(parecidos) en la edad que los estudiantes de la seccin 1.
Otro ejemplo, para visualizar la utilidad de la desviacin estndar es el
siguiente. Se le someti a dos grupos profesionales una situacin determinada y se le
tom el tiempo en resolver dicha encomienda. El grupo de criminlogos obtuvo un
media de 45 minutos, con una desviacin estndar de 3 minutos. El grupo de
trabajadores sociales obtuvieron una media de 45 minutos con una desviacin
estndar de 11 minutos. Notemos, que la media es la misma para ambos grupos
profesionales. No obstante, la desviacin estndar es diferente para ambos grupos.
Dicha diferencia nos sugiere que el tiempo en terminar de resolver el problema en
cuestin fue ms homogneo o ms parecido en el grupo de criminlogos que el
tiempo obtenido en el grupo de trabajadores sociales. Como hemos observado, las
comparaciones que se han realizado en este tpico son posibles porque la media
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
182
aritmtica de cada distribucin ha sido igual. Pero, qu pasara si al comparar dos
distribuciones las medias son diferentes? Sencillamente, no podramos analizar la
homogeneidad como lo hemos hecho en este tpico. Sin embargo, es posible realizar
la comparacin utilizando un coeficiente de variacin. En el tpico siguiente se
desarrollar el coeficiente de variacin.
[6.6] Coeficiente de Variacin
La desviacin estndar DE es til como medida de la variacin dentro de un
conjunto de datos. Mas an, si las medias son iguales se pueden comparar
directamente las dos DE (Snchez, 1992). Sin embargo, cuando se desea comparar
la dispersin en dos conjuntos de datos, comparar las DE pueden conducir a
resultados sin sentido, si las medias difieren o si las unidades de medicin son
diferentes. Esto es as, puesto que cada DE se obtiene a partir de la media particular
que corresponde a cada conjunto (Snchez, 1992).
Lo que se necesita en situaciones como sta es una medida de variacin
relativa, en lugar de una variacin absoluta (Daniel, 1985). La medida que nos puede
resolver este problema es el coeficiente de variacin (C.V.), llamado de Pearson, que
es la relacin entre la DE y la media aritmtica (Elorza, 1987). Se multiplica adems
por 100, para considerar el resultado en forma de porcentaje. A mayor el porcentaje,
mayor es la variacin y viceversa. La frmula est dada por:
s = Desviacin estndar de una muestra
x = media aritmtica de una muestra
C.V. = s x (100) donde:
-
Medidas de Dispersin
183
= Desviacin estndar de la poblacin
= Media aritmtica de la poblacin
Para poder entender el coeficiente de variacin analizaremos la siguiente
situacin hipottica. Supongamos que la Universidad Pitirre de Puerto Rico en el
semestre de agosto a diciembre del 2002 se ofrecieron tres (3) curso de estadstica
social. Una vez finalizado los cursos se pudo obtener la media de notas generales, la
desviacin estndar de notas generales y la cantidad de estudiantes por cada curso.
Promedios finales de tres cursos de
estadstica social, Universidad Pitirre,
agosto-diciembre del 202 Parmetros
Sec. 01 Sec. 02 Sec. 03
Poblacin (N) 25 20 28
Media () 90 78.2 62.9
Desviacin Estndar () 12.6 11.2 9.6
Si nuestro inters es indagar entre las secciones de estadstica social, cul de ellos,
con respecto a las notas, tiende ha ser ms homognea o ms parecidas, debemos
incursionar en la dispersiones de las notas. Recuerde que sealamos que a mayor
dispersin de los valores de una poblacin de estudio, menos se paren los valores
sugiriendo que hay poca homogeneidad. Lo inverso sugiere que a menor dispersin
de los valores de una poblacin de estudio, ms se paren los valores sugiriendo que
hay mucha homogeneidad. Notemos que para establecer la comparacin de
homogeneidad en el ejercicio que nos compete, la media de las tres (3) secciones de
estadstica social no son iguales. Este factor es muy importante, previo al manejo de
la homogeneidad, porque teniendo las medias diferentes, no es posible obtener el
grado de homogeneidad utilizando como punto de referencia la desviacin estndar.
C.V. = (100) donde:
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
184
Por ejemplo, si no tomramos en consideracin la disparidad de las medias y
analizramos nica y exclusivamente la desviacin estndar para conseguir el grado
de homogeneidad, podramos concluir, dado que la desviacin estndar es menor en
la seccin 3 ( =9.6) con respecto a la seccin 2 ( =11.2) y la seccin 1 ( =12.6),
que las notas de la seccin 3 del curso de estadstica social tienden hacer ms
parecidas (homogneas) que entre las dems secciones. Sin embargo, esta
conclusin adolece de veracidad porque cuando las medias en una comparacin no
son iguales, no se puede utilizar la desviacin estndar para obtener el grado de
homogeneidad. Para resolver el dilema, sugerimos que se busque el coeficiente de
variacin en todos los grupos de inters y luego sera posible concluir sobre el grado
de homogeneidad, veamos:
Si analizamos los resultados de los coeficiente de variacin nos percataremos que la
seccin 01 de estadstica social obtuvo el resultado ms bajo (14.00 %) con respecto
a las otras dos secciones. Recuerde, mientras ms bajo es la dispersin, una vez se
compara con los dems grupos de inters, el mismo sugiere alto grado de
homogeneidad. Podemos concluir que las notas entre los estudiantes del curso de
estadstica social de la seccin 01, tienden a ser ms parecidas (homogneas) que
entre las secciones 02 y 03 del mismo curso de la Universidad Pitirre de Puerto Rico
para el semestre de agosto a diciembre del 2002.
Seccin 01 = 12.6 (100)
90
= 14.00 %
Seccin 02 = 11.2 (100)
78.2
= 14.32 %
Seccin 03 = 9.6 (100)
62.9
= 15.26 %
-
Medidas de Dispersin
185
Ejercicios Coeficiente de Variacin Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________
NUMERO DE ESTUDIANTE: SECCION: ___________ [6.6.1] Favor de buscar la media aritmtica y la desviacin estndar de las edades por suicidio para los aos 1980, 1990 y 2000 segn los datos del cuadro 4.1 de la pgina 105. Luego calcule y analice el coeficiente de variacin para todos los aos.
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
186
[6.6.2] Favor de buscar la media aritmtica y la desviacin estndar de los ejercicios 5.4.1.a pgina 145 y 5.4.2 de la pgina 147. Luego calcule y analice el coeficiente de variacin.
-
Medidas de Dispersin
187
[6.6.3] Favor de buscar la media aritmtica y la desviacin estndar de las edades de los varones y mujeres segn el ejercicio 6.3 de la pgina 169. Luego calcule y analice el coeficiente de variacin.
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
188
[6.6.4] Favor de buscar la media aritmtica y la desviacin estndar de las edades por defunciones para cada anoo segn el ejercicio 6.4 de la pgina 177. Luego calcule y analice el coeficiente de variacin.
-
Medidas de Dispersin
189
[6.7] ndice de Dispersin Cualitativa
Normalmente en el campo de las ciencias sociales se utilizan o manejan
muchas variables cualitativas. Se puede observar previamente que dichas variables
pueden variar de clase o cantidad. La premisa sera cun diferentes son esas
observaciones. Utilizando el coeficiente de variacin cualitativa o un ndice de
dispersin podemos encontrar dichas diferencias en las observaciones. El ndice de
dispersin flucta entre cero (0) y uno (1), donde cero (0) implica homogeneidad
perfecta y uno (1) representa heterogeneidad perfecta. Si los casos o sujetos estn
distribuidos entre las categoras de una forma equitativa, es decir, que para cada
categora de la variable existe la misma cantidad de casos, podemos indicar que
existe una distribucin heterognea (equitativa) en las categoras de la variable de
inters. Por el contrario, si todos los casos estn ubicados en una sola categora
podemos indicar que existe una distribucin homognea (desproporcional). El ndice
de dispersin cualitativo se expresa de la siguiente manera:
D = ndice de dispersin cualitativo
k = nmero de categoras
= suma de frecuencias cuadradas () de cada categora
n = total de casos Tomemos dos (2) municipios de Puerto Rico y analicemos la distribucin de
matrimonios conforme los tipos de celebraciones. Segn el cuadro 6.3 podemos
observar tanto para el municipio de Loza como para el municipio de Hormigueros la
cantidad () de matrimonios celebrados segn el tipo de celebrantes.
k [ (n) () ]
[ (n) (k-1) ]
donde:
D =
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
190
Para buscar el ndice de dispersin cualitativo necesitamos (ver figura 6.5)
elevar la frecuencia () de cada categora al cuadrado ().
Cuadro 6.3
Cantidad de matrimonios por tipo de celebracin en Loza y
Hormigueros, Puerto Rico: 1993.
Celebrantes
Sacerdotes
Ministros
Juez
TOTAL
Loza
8
122
11
141
Hormiguero
30
48
43
121
Fuente: Departamento de Salud de Puerto Rico, 1996. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Matrimonios y Divorcios, tabla 5, pg. 331-334.
Figura 6.5 Procedimiento para obtener la columna ,segn los datos del cuadro 6.3
Celebrantes
Sacerdotes
Ministros
Juez
TOTAL
8
122
11
141
64
14,884
121
15,069
30
48
43
121
900
2,304
1,849
5,053
Loza
Hormiguero
-
Medidas de Dispersin
191
Con la columna de () debidamente elaborada (ver figura 6.5) podemos
calcular el ndice de dispersin cualitativo para los dos (2) municipios.
Analizando los resultados de los ndices de dispersin para ambos municipios
podemos inferir lo siguiente:
_ En Loza, Puerto Rico para el ao 1993 el ndice de dispersin
cualitativa por tipos de celebraciones fue de .36.
_ En Hormigueros, Puerto Rico para el ao 1993 el ndice de dispersin
cualitativa por tipos de celebraciones fue de .98.
Cuando comparamos los dos (2) municipios observamos que los matrimonios
ocurridos en Hormigueros tienden a ser ms heterogneos conforme a los tipos de
celebraciones que los matrimonios ocurridos en el municipio de Loza, Puerto Rico.
Si analizamos el cuadro 6.3 podemos notar que los matrimonios ocurridos en Loza,
Loza
D = 3[ (141) - 15,069 ]
[ (141) (3-1)]
= 3[ 19,881 - 15,069 ]
[ (19,881) (2) ]
= 3[ 4,812 ]
39,762
= 14,436
39,762
= .3630602
= .36
Hormiguero
D = 3[ (121) - 5,053 ]
[ (121) (3-1) ]
= 3[ 14,641 - 5,053 ]
[ (14,641) (2) ]
= 3[ 9,588 ]
29,282
= 28,764
29,282
= .9823099
= .98
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
192
Puerto Rico para el ao 1993 estn mayormente concentrados en el tipo de
celebracin con ministros. Para el municipio de Hormigueros, Puerto Rico, para el
ao 1993 los matrimonios tienden a distribuirse casi equitativamente entre los tres (3)
tipos de celebrantes.
-
Medidas de Dispersin
193
Ejercicios de ndice de dispersin cualitativa
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.
NOMBRE: FECHA: _______________
NUMERO DE ESTUDIANTE: SECCION: ___________
Ejercicio 6.7 Favor de utilizar los datos que reflejan la cantidad de matrimonios por tipo de celebracin en Villalba, Utuado y Ponce Puerto Rico: 1993.
Celebrantes
Sacerdotes
Ministros
Juez
TOTAL
74
14
50
82
116
111
Villalba
Utuado
Ponce
532
360
743
Fuente: Departamento de Salud de Puerto Rico, 1996. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Matrimonios y Divorcios, tabla 5, pg. 331-334.
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
194
[6.7.1] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Villalba, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.
[6.7.2] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Utuado, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.
[6.7.3] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Ponce, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.
-
Medidas de Dispersin
195
[6.8] Frmulas
Recorrido
Desviacin Estndar para poblacin
Desviacin Estndar para muestras
Coeficiente de Variacin
ndice de dispersin cualitativa
R = Vmax - Vmin
() N
N
Arreglos de datos
=
x (x)
N
N
Datos no agrupados
Datos agrupados
=
()
n
n-1
Arreglos de datos
s =
x (x)
n
n-1
Datos no agrupados
Datos agrupados
s =
C.V. = s x (100)
muestra
C.V. = (100)
poblacion
k [ (n) () ]
[ (n) (k-1) ]
D =
-
Arnaldo Torres Degr y Evelyn Afanador Mejas
196
[6.9] Ejercicios Adicionales Arreglo de datos [6.9.1] Favor de buscar y analizar el recorrido y la desviacin estndar de la nota del primer examen de los
atletas de la Universidad Pitirre para el ao 2004 en el curso de primeros auxilios: datos hipotticos 56; 78; 78; 75; 77; 72; 75; 79; 79; 80; 72; 73; 74; 72; 75; 73; 72; 70; 72; 80; 77; 75; 72; 90; 88; 72; 74; 78; 80; 66; 72; 76; 83; 90; 72; 77; 79.
[6.9.2] Favor de buscar y analizar el recorrido y la desviacin estndar de la cantidad de horas semanales
viendo televisin entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 15; 10; 20; 10; 10; 27; 22; 10; 16; 16; 09; 17; 28; 19; 15; 15; 15; 18; 10; 10; 10; 14; 17; 20; 13; 12; 12; 18; 20; 08; 09; 10; 12; 14; 20; 16; 12.
[6.9.3] Favor de buscar y analizar el recorrido y la desviacin estndar de la cantidad en dlares por concepto
en compra de libros para estudios entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 95; 76; 50; 88; 50; 89; 74; 90; 56; 86; 89; 90; 69; 150; 120; 120; 90; 96; 89; 100; 89; 58; 90; 60; 100; 58; 88; 79; 90; 100; 120; 90; 99; 87; 90; 99; 130.
Datos no agrupados [6.9.4] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de las mujeres menores
quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.
[6.9.5] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de las varones menores
quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169..
[6.9.6] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de todos los menores
quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.
Datos agrupados [6.9.7] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico
para el ao 1980, segn los datos registrados en el cuadro 4.1 de la pgina 105. [6.9.8] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico
para el ao 1990, segn los datos registrados en el cuadro 4.1 de la pgina 105. [6.9.9] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico
para el ao 2000, segn los datos registrados en el cuadro 4.1 de la pgina 105.