Dispersion Agrupados y No Agrupados

of 44 /44
Medidas de Dispersión "No se puede entender cabalmente la historia de un pueblo si no se conoce la dinámica de su pueblo. Y no se puede planificar y tomar decisiones sabias en un país (municipio, comunidad o grupo), si no se considera cuidadosamente su situación demográfica y sus perspectivas futuras". Dr. José Vázquez Calzada Una de las funciones de la estadística se relaciona con el cálculo de la variabilidad. Conocer las medidas de dispersión (variación) es de suma importancia, ya que la no consideración de diferencias puede conducir a errores de juicio en la toma de decisiones (Sánchez, 1992). Una medida particular de tendencia central da lugar a una puntuación que, en cierto sentido, "representa" a todas las puntuaciones de un grupo (Glass & Stanley, 1974). Sin embargo, cuando se usa cualquier medida de tendencia central, ésta nos da sólo un cuadro incompleto de un conjunto de datos y, por consiguiente, podría conducir a conclusiones erróneas o distorsionadas (Levin, 1979), porque este proceso pasa por alto las diferencias entre las puntuaciones en sí (Glass & Stanley, 1974). Sería incorrecto concluir que dos (2) conjuntos de datos son iguales sólo porque tienen la mismas medidas de tendencia central, es decir, que el valor de la media aritmética sea el mismo para ambos conjuntos, cuando la distancia de los datos de ambos conjuntos se distribuyen de una forma diferente (Elorza, 1987). Para describir una distribución en forma más completa o para interpretar con más detalle una calificación, necesitamos información adicional acerca de la dispersión de las calificaciones con respecto a nuestra medida de tendencia central (Haber & Runyon, 1992). Es necesario un índice de cómo están diseminados los puntajes alrededor del centro de la distribución. A tales distancias se les suele 6

Embed Size (px)

Transcript of Dispersion Agrupados y No Agrupados

  • Medidas de Dispersin

    "No se puede entender cabalmente la historia de un pueblo si no se conoce la dinmica de su pueblo. Y no se puede planificar

    y tomar decisiones sabias en un pas (municipio, comunidad

    o grupo), si no se considera cuidadosamente

    su situacin demogrfica y sus perspectivas futuras". Dr. Jos Vzquez Calzada

    Una de las funciones de la estadstica se relaciona con el clculo de la

    variabilidad. Conocer las medidas de dispersin (variacin) es de suma importancia,

    ya que la no consideracin de diferencias puede conducir a errores de juicio en la

    toma de decisiones (Snchez, 1992). Una medida particular de tendencia central da

    lugar a una puntuacin que, en cierto sentido, "representa" a todas las puntuaciones

    de un grupo (Glass & Stanley, 1974). Sin embargo, cuando se usa cualquier medida

    de tendencia central, sta nos da slo un cuadro incompleto de un conjunto de datos

    y, por consiguiente, podra conducir a conclusiones errneas o distorsionadas (Levin,

    1979), porque este proceso pasa por alto las diferencias entre las puntuaciones en s

    (Glass & Stanley, 1974). Sera incorrecto concluir que dos (2) conjuntos de datos son

    iguales slo porque tienen la mismas medidas de tendencia central, es decir, que el

    valor de la media aritmtica sea el mismo para ambos conjuntos, cuando la distancia

    de los datos de ambos conjuntos se distribuyen de una forma diferente (Elorza, 1987).

    Para describir una distribucin en forma ms completa o para interpretar con

    ms detalle una calificacin, necesitamos informacin adicional acerca de la

    dispersin de las calificaciones con respecto a nuestra medida de tendencia central

    (Haber & Runyon, 1992). Es necesario un ndice de cmo estn diseminados los

    puntajes alrededor del centro de la distribucin. A tales distancias se les suele

    6

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    154

    denominar medidas de dispersin o variacin. Las medidas de dispersin, tambin

    conocidas como medidas de variacin o variabilidad, indican el grado en que los

    sujetos se dispersan respecto al centro de la distribucin. A travs de las mismas el

    investigador verifica cun homogneos, parecidos o estables son los elementos bajo

    estudio, en contraste con otros grupos de inters (Snchez, 1992). Si todos los

    valores son los mismos, no existe dispersin; si no todos son los mismos, hay

    dispersin en los datos. La magnitud de la dispersin puede ser pequea, cuando los

    valores, aunque diferentes, estn prximos entre s. Si los valores estn ampliamente

    separados, la dispersin es mayor.

    Este captulo trata slo de la medidas de dispersin o variabilidad ms

    conocidas: el recorrido (rango) y la desviacin estndar. Estas tcnicas estarn

    enmarcadas segn la composicin de los datos, es decir, arreglo de datos, datos no

    agrupados y datos agrupados. Adems, se evaluar la tcnica de coeficiente de

    variacin para variables cuantitativas y cualitativas, tales como: coeficiente de

    variacin e ndice de dispersin cuantitativo.

    [6.1] Tipos de Medidas de Dispersin

    Cuando nuestro inters se centra en las medidas de dispersin, debemos

    buscar un ndice de variabilidad que indique la distancia a lo largo de la escala de

    calificaciones (Runyon & Haber, 1992). El recorrido y la desviacin estndar realizan

    dicha labor.

    Recorrido Una manera de medir la variacin en un conjunto de valores es calculando el

    recorrido. El recorrido es la ms sencilla y directa de las medidas de dispersin

    (Runyon & Haber, 1992), y a la vez la menos confiable de las medidas de variacin

    (Snchez, 1992). Se trata simplemente de la distancia entre el valor menor y el valor

    mayor en un conjunto de observaciones. El hecho de que slo tome en consideracin

    dos (2) valores, hace que la medida sea muy pobre. Ntese que si hay un valor

    extremo en la distribucin, se tendr la impresin de que la dispersin es grande

    cuando, en realidad, si hiciramos caso omiso de esa calificacin, podramos

  • Medidas de Dispersin

    155

    encontrar que dicha distribucin es, por el contrario, una distribucin "compacta". El

    recorrido refleja nicamente las dos (2) calificaciones extremas de la distribucin

    (Runyon & Haber, 1992), es decir, solamente dos (2) puntuaciones exactas de un

    grupo son las que los determina, ignorando as, todas las dems puntuaciones, a

    excepcin de los extremos (Glass & Stanley, 1974). El recorrido no puede darnos una

    idea precisa con respecto a la dispersin y, en el mejor de los casos, debe

    considerarse slo como un ndice preliminar o muy aproximado (Levin, 1977). Puede

    expresarse de la siguiente manera:

    R = Recorrido, rango o amplitud

    Vmax = Valor mximo de los datos de un conjunto

    Vmin = Valor mnimo de los datos de un conjunto

    Varianza y Desviacin Estndar

    La desviacin estndar (DE) es la medida de dispersin ms adecuada para la

    estadstica descriptiva (Haber & Runyon, 1992). Tanto en la escalas de intervalo

    como en las de razones, la varianza y la desviacin estndar son las mejores medidas

    de dispersin. Toman en consideracin todos los puntajes y controlan por el efecto de

    valores extremos. La DE permite una interpretacin precisa de las calificaciones

    dentro de una distribucin (Runyon & Haber, 1992). Si todos los sujetos son iguales

    en una caracterstica (por ejemplo, ndice acadmico), entonces el resultado ser igual

    a cero. Por el contrario, si aumentan las diferencias, aumentar el ndice, alejndose

    ms y ms del punto cero. La varianza se define como las desviaciones cuadradas

    medias respecto a la media. La desviacin estndar es la raz cuadrada de la

    varianza. La desviacin estndar estar formulada de la siguiente manera:

    R = Vmax - Vmin

    donde;

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    156

    Frmulas para poblacin

    Frmulas para muestras

    ()

    N

    N donde:

    =

    Desviacin

    estndar para

    arreglos de datos

    usando el

    universo

    x (x)

    N

    N donde:

    =

    Desviacin

    estndar para

    datos no

    agrupados y datos

    agrupados usando

    el universo

    ()

    n

    n-1 donde:

    s =

    Desviacin

    estndar para

    arreglos de datos

    usando muestra

    x (x)

    n

    n-1 donde:

    s =

    Desviacin

    estndar para

    datos no

    agrupados y datos

    agrupados usando

    muestra

  • Medidas de Dispersin

    157

    =

    Desviacin estndar de la poblacin.

    s = Desviacin estndar de la muestra

    = Sumatoria de los valores que toma la variable (x), cuando estamos trabajando con datos no agrupados.

    Para los datos agrupados el smbolo cambia a x.

    = Sumatoria de los valores que toma la variable (x) al cuadrado, cuando estamos trabajando con datos no agrupados. Para los datos agrupados el smbolo

    cambia a x.

    N = Tamao del universo o la poblacin

    n = Tamao de la muestra

    n-1 = Tamao de la muestra menos uno (1)

    [6.2] Anlisis de Dispersin a partir de los Arreglos de Datos

    Para poder evaluar este tpico retomaremos el ejemplo de datos hipotticos del

    captulo 5, seccin 5.2 (ver pgina 116). Uno de los primeros paso en el formato de

    arreglo de datos es acomodar los datos de una forma til. El mismo consiste en

    organizar los datos obtenidos de una forma ordenada, de menor a mayor o viceversa.

    Con esta estructura establecida, podemos con facilidad aplicar diversos mtodos

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    158

    estadsticos para poder entender mejor el conjunto de datos en estudio. Si

    quisiramos realizar un anlisis de dispersin sobre la edad inicial del uso de Internet

    entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico del

    ao acadmico 2003-2004, el primer paso sera organizar los porcentajes de mayor a

    menor o viceversa (ver figura 6.1).

    Recorrido El recorrido sera la distancia que existe entre la edad mas alta vs. la edad ms

    baja sobre el inicio en el Internet en los estudiantes de ciencias polticas de la

    Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004. Es

    recomendable que se organicen las categoras de la variable de inters de menor a

    mayor o viceversa. En la figura 6.1 las edades de inicio en el Internet entre los

    estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao

    acadmico 2003-2004 fueron organizados de menor a mayor. Si observamos

    detenidamente las edades organizadas (ver figura 6.1), notaremos que el dato ms

    alto fue la edad 23 aos, mientras que el dato ms bajo fue la edad 10 aos. Con esta

    informacin podemos obtener el recorrido de la siguiente manera:

    R = edad ms alta edad ms baja

    R = 23 10

    R = 13

    Figura 6.1

    Edades organizadas de menor a mayor

    10 10 10 12 12 12 12 13 13 13

    13 13 13 15 15 15 15 15 15 15

    16 16 16 16 16 16 18 18 18 21

    21 21 21 22 22 23 23 23 23 23

    N= 40 datos hipotticos

  • Medidas de Dispersin

    159

    Podemos indicar que en la Universidad pitirre de Puerto Rico para el ao

    acadmico 2003-2004 la diferencia de la edad de inicio en el Internet entre los

    estudiantes de ciencias polticas fue de 13 aos.

    Desviacin Estndar

    Para buscar la desviacin estndar entre las edades sobre el inicio del Internet

    en los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el

    ao acadmico 2003-2004 es necesario elaborar una nueva columna conocida como

    (). La columna se obtiene elevando al cuadrado a la frecuencia () como

    observamos en la figura 6.2. Una vez realizado dicha operacin se suman por

    separado ambas columnas, para obtener: (sumatoria de las edades) y (sumatoria

    de las edades al cuadrado).

    Con la columna establecida (ver figura 6.2) podremos buscar la desviacin

    estndar () de la siguiente manera:

    Figura 6.2 Desarrollo de los datos para establecer la Desviacin Estndar

    [10] 100

    [10] 100

    [10] 100

    [12] 144

    [12] 144

    [12] 144

    [12] 144

    [13] 169

    [13] 169

    [13] 169

    [13] 169

    [13] 169

    [13] 169

    [15] 225

    [15] 225

    [15] 225

    [15] 225

    [15] 225

    [15] 225

    [15] 225

    [16] 256

    [16] 256

    [16] 256

    [16] 256

    [16] 256

    [16] 256

    [18] 324

    [18] 324

    [18] 324

    [21] 441

    [21] 441

    [21] 441

    [21] 441

    [22] 484

    [22] 484

    [23] 529

    [23] 529

    [23] 529

    [23] 529

    [23] 529

    = 654

    =11,350

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    160

    Podemos concluir que en la Universidad pitirre de Puerto Rico para el ao

    acadmico 2003-2004 la desviacin estndar de la edad de inicio en el Internet

    entre los estudiantes de ciencias polticas fue de 4.05 aos.

    11,350 (654)

    40

    40

    11,350 427,716

    40

    40

    11,350 10,692.9

    40

    = 657.1

    40

    = 16.4275

    = 4.0530852

    = 4.05

    =

    =

    =

  • Medidas de Dispersin

    161

    Ejercicios de Dispersin segn arreglo de datos Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

    NOMBRE: FECHA: _______________

    NUMERO DE ESTUDIANTE: SECCION: ___________

    Ejercicio 6.2.1 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

    Estudiantes de pre-jurdico sobre la edad de inicio en el consumo de bebidas alcohlicas, Universidad Pitirre, Puerto Rico: 2000

    10 23 19 17 15 23 19 16 10 16 19 23 17 19 10

    23 19 16 10 19 17 10 16 19 15 10 15 14 23 16

    19 16 10 16 19 15 17 19 10 23 19 19 15 17 10

    17 19 23 16 14 17 23 10

    Casos hipotticos

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    162

    Ejercicio 6.2.2 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

    Estudiantes de ciencias polticas respecto al gasto en dlares diario de gasolina, Universidad Pitirre, Puerto Rico: 2000

    12 20 15 10 22 15 10 12 09 22 09 12 08 10 15

    10 22 10 12 09 08 15 05 22 05 15 08 10 20 09

    20 12 08 15 09 12 05 20 12 10 22 20 12 15

    Casos hipotticos

  • Medidas de Dispersin

    163

    Ejercicio 6.2.3 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

    Estudiantes de economa con respecto a la cantidad de hermanos en su familia, Universidad Pitirre, Puerto Rico: 2000

    2 1 4 3 6 2 7 3 5 1 2 6 3 5 1 3 4 1 2 3 1 4

    3 1 3 4 2 8 3 2 5 7 3 2 9 3 1 1 5 3 8 5 1

    3 4 3 5 2 1 4 6

    Casos hipotticos

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    164

    Ejercicio 6.2.4 Favor de utilizar los datos para calcular y analizar el recorrido y la desviacin estndar segn el formato de arreglo de datos.

    Estudiantes de antropologa con respecto a la cantidad de crditos acumulado de concentracin, Universidad Pitirre, Puerto Rico: 2000

    18 12 15 20 15 21 27 18 14 16 27 21 24 15 15

    27 15 12 18 15 15 18 14 18 16 27 16 18 21 15

    18 12 15 27 15 12 18 16 12 15 20 18 16 13 21

    15 27 18 12 14 18 27 20 15 14 27 18 20 16 15

    Casos hipotticos

  • Medidas de Dispersin

    165

    [6.3] Anlisis de Dispersin a partir de los Datos no Agrupados

    En Puerto Rico para el ao 1993 se

    registraron 12,820 nacimientos que provienen de

    madres adolescentes. Los nacimientos se

    ubicaron segn el orden de embarazo de la madre

    adolescente (ver cuadro 6.1). El orden de

    embarazo supone la posicin que ocupar el

    infante con respecto a sus hermanos(as).

    Ejemplo, podemos observar en el cuadro 6.1 que

    8,709 nacimientos representan el primer hijo(a)

    para las madres adolescentes 12 nacimientos

    representan el sexto hijo(a) para las madres

    adolescentes.

    Recorrido Si su inters como estudioso es realizar un anlisis de dispersin al orden de

    embarazo que representa dicho nacimiento en la mujer ocurrido en Puerto Rico para

    el ao 1990, podramos buscar el recorrido y la desviacin estndar. El recorrido, es

    decir, la distancia que existe entre el orden de embarazo mayor menos el orden de

    embarazo menor, sera:

    Cuadro 6.1 Nacimientos por Orden de embarazo

    por madres adolescentes Puerto Rico, 1993

    Orden de embarazo

    (x) nacimientos

    ()

    1 8,709

    2 2,958

    3 903

    4 195

    5 37

    6 12

    7+ 6 Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenido del Departamento de Salud de Puerto Rico, 1992. Informe Anual de Estadsticas Vitales de

    Puerto Rico: 1990. Nacimientos Vivos, tabla 15, pg. 68.

    R = Orden de embarazo Orden de embarazo

    mayor menor

    R = 7 1

    R = 6

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    166

    Podemos interpretar que en Puerto Rico para el ao 1993 la distancia

    observada o el recorrido entre el orden de embarazo de los nacimientos de las

    madres adolescentes fue de seis (6).

    Desviacin Estndar Para buscar la desviacin estndar entre el orden de embarazo de los

    nacimientos de las madres adolescentes ocurridos en Puerto Rico para el 1993 es

    preciso elaborar varias columnas adicionales a las establecidas en el cuadro 6.1.

    Como observamos en la figura 6.3, las columnas adicionales para elaborar la

    desviacin estndar son (x) y (x). La columna x se obtiene multiplicando las

    categoras de la variable (x) con su frecuencia () correspondiente. La columna x se

    obtiene multiplicando la columna (x) por la categora (x) correspondiente. Notemos,

    que no estamos elevando al cuadrado la columna (x). De realizar dicho clculo se

    invalida el resultado. La poblacin o universo (N) es obtenido por la suma de la

    columna de la frecuencia ().

    Figura 6.3. Procedimiento para obtener x y x, segn los datos del cuadro 6.1

    Orden de

    embarazo

    x

    1

    2

    3

    4

    5

    6

    7+

    Nacimientos

    8,709

    2,958

    903

    195

    37

    12

    6

    x

    = 8,709

    = 11,832

    8,127

    3,120

    925

    432

    294

    x

    = 8,709

    = 5,916

    = 2,709

    780

    185

    72

    42

    por

    por

    por

    por

    por

    N 12,820 x 18,413 33,439

  • Medidas de Dispersin

    167

    Con la columna establecida (ver figura 6.3) podremos buscar la desviacin

    estndar () de la siguiente manera:

    Podemos concluir que en Puerto Rico para el ao 1990 la desviacin

    estndar entre el orden de embarazo de las madres adolescentes fue de .74

    33,439 (18,413)

    12,820

    12,820

    33,439 26,446.066

    12,820

    6,992.9338

    12,820

    = .5454707

    = .7385599

    = .74

    =

    =

    =

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    168

  • Medidas de Dispersin

    169

    Ejercicios de Dispersin segn datos no agrupados Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

    NOMBRE: FECHA: _______________

    NUMERO DE ESTUDIANTE: SECCION: ___________

    Ejercicio 6.3 Favor de utilizar los datos que reflejan la cantidad menores contra quienes se presentaron querellas por sexo y edad, Puerto Rico, ao fiscal 1991-1992.

    Sexo

    Edad Hombres

    Mujeres

    Ambos

    Sexos

    TOTAL 9 aos

    25

    3

    28

    10 aos

    34

    4

    38

    11 aos

    73

    6

    79

    12 aos

    141

    24

    165

    13 aos

    316

    62

    378

    14 aos

    536

    117

    653

    15 aos

    884

    120

    1,004

    16 aos

    1,160

    134

    1,294

    17 aos

    1,428

    106

    1,534

    18 aos

    144

    18

    162

    TOTAL

    4,741

    594

    5,335

    Fuente: Tribunal Superior de Puerto Rico, Asunto de Menores

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    170

    [6.3.1] Favor de calcular y analizar el recorrido de la edad de las menores (mujeres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.

    [6.3.2] Favor de calcular y analizar la desviacin estndar de la edad de las menores (mujeres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.

  • Medidas de Dispersin

    171

    [6.3.3] Favor de calcular y analizar el recorrido de la edad de los menores (hombres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.

    [6.3.4] Favor de calcular y analizar la desviacin estndar de la edad de los menores (hombres) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    172

    [6.3.5] Favor de calcular y analizar el recorrido de la edad total de los menores (ambos sexos) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992.

    [6.3.6] Favor de calcular y analizar la desviacin estndar de la edad total de los menores (ambos sexos) contra quienes se le presentaron querellas en el Tribunal Superior de Puerto Rico para el ao fiscal 1991-1992. Incluya una tabla con las columnas necesarias para completar el ejercicio.

  • Medidas de Dispersin

    173

    [6.4] Anlisis de Dispersin a partir de los Datos Agrupados

    El Departamento de Salud de Puerto Rico

    inform que para el ao 1993 murieron 1,148

    personas debido al virus de inmunodeficiencia

    humana (SIDA). El cuadro 6.2 refleja las muertes

    ocurridas por SIDA ubicadas por grupos de

    edades. Si usted suma todas las defunciones por

    SIDA ubicadas en grupos de edades notar una

    diferencia de doce (12) casos. Dicha diferencia se

    debe a los casos que no informaron o se

    desconoce la edad. Para este ejercicio se tomar

    en cuenta todos los casos que informaron la edad,

    es decir, 1,139 defunciones. Si su inters como

    investigador es analizar la dispersin o variabilidad

    de la edad de las personas que murieron por SIDA

    en Puerto Rico para el ao 1993, podramos

    buscar el recorrido y la desviacin estndar. Para

    obtener el recorrido y la desviacin estndar segn

    la configuracin de datos agrupados es necesario

    elaborar tres (3) columnas adicionales: (Pt); (x) y

    (x). La columna (Pt) y (x) ya han sido

    explicadas y elaboradas en el captulo 5 (ver tpico

    5.4). La columna x se obtiene mediante la

    multiplicacin de la columna x por la columna Pt.

    Cuadro 6.2

    Frecuencia de muertes

    por SIDA y edad

    Puerto Rico, 1993

    Edad

    (clase)

    x

    0-4 14

    5-9 4

    10-14 0

    15-19 0

    20-24 20

    25-29 118

    30-34 237

    35-39 268

    40-44 214

    45-49 115

    50-54 65

    55-59 32

    60-64 14

    65-69 19

    70-74 6

    75-79 6

    80-84 5

    85-89 2 Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenidos del Departamento de Salud de Puerto Rico, 1995. Informe Anual de Estadsticas Vitales: Puerto Rico, 1993. Mortalidad, tabla 15a: pg. 187; Existen 12 casos sin especificar las edades

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    174

    Recorrido

    El recorrido, es decir la diferencia de la edad mayor vs. la edad menor de las

    personas que murieron por SIDA, debe conseguirse en el punto medio (Pt) de la clase de

    edad mayor vs. la clase de edad menor. Si observamos la figura 6.4 el punto medio de la

    clase mayor (85 - 89) es 87 aos, mientras que el punto medio de la clase menor (0 - 4) es

    2 aos. Con estos elementos el recorrido podr obtenerse de la siguiente forma:

    Figura 6.4 Columnas necesarias como Pt, x y x, segn los datos del cuadro 6.2

    Edades|

    (clases)

    0-4

    5-9

    10-14

    15-19

    20-24

    25-29

    30-34

    35-39

    40-44

    45-49

    50-54

    55-59

    60-64

    65-69

    70-74

    75-79

    80-84

    85-89

    14

    4

    0

    0

    20

    118

    237

    268

    214

    115

    65

    32

    14

    19

    6

    6

    5

    2

    Pt

    x

    2

    7

    12

    17

    22

    27

    32

    37

    42

    47

    52

    57

    62

    67

    72

    77

    82

    87

    x

    28

    28

    0

    0

    440

    3,186

    7,584

    9,916

    8,988

    5,405

    3,380

    1,824

    868

    1,273

    432

    462

    410

    174

    x

    56

    196

    0

    0

    9,680

    86,022

    242,688

    366,892

    377,496

    254,035

    175,760

    103,968

    53,816

    85,291

    31,104

    35,574

    33,620

    15,138

    N= 1,139 x =44,389 x =1,871,336

  • Medidas de Dispersin

    175

    1,871,336 (44,398)

    1,139

    1,139

    1,871,336 1,730,625.5

    1,139

    140,710.54

    1,139

    = 123.53866

    = 11.114795

    = 11.12 aos

    Podemos indicar que el recorrido observado en la edad de las personas que

    murieron por SIDA en Puerto Rico para el ao 1993 fue de 85 aos.

    Desviacin Estndar

    Como hemos establecido, para

    obtener la desviacin estndar segn la

    configuracin de datos agrupados es

    necesario elaborar dos (2) columnas

    adicionales: (x) y (x). La columna x es

    obtenida mediante la multiplicacin de la

    columna frecuencias () por la columna del

    punto medio (Pt). La columna x es

    obtenida mediante la multiplicacin de la

    columna x por la columna Pt. Con estas

    columnas realizadas en la figura 6.4 podemos

    buscar la varianza y luego la desviacin

    estndar.

    Podemos afirmar que en Puerto Rico

    para el ao 1993 la desviacin estndar de

    la edad por defunciones debido al SIDA

    fue de 11.12 aos.

    R = Pt de la Pt de la

    clase mayor clase menor

    R = 87 2

    R = 85 aos

    =

    =

    =

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    176

  • Medidas de Dispersin

    177

    Ejercicios de Dispersin segn datos agrupados Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

    NOMBRE: FECHA: _______________

    NUMERO DE ESTUDIANTE: SECCION: ___________

    Ejercicio 6.4 Favor de utilizar los datos que reflejan la cantidad de defunciones por accidentes de trfico de vehculos de motor por edad, Puerto Rico: 1980, 1985 y 1990.

    Aos naturales

    Grupo de

    edad 1980

    1985

    1990

    5 - 14

    44

    53

    43

    15 - 24

    145

    129

    107

    25 - 34

    97

    110

    84

    35 - 44

    65

    90

    87

    45 - 54

    67

    65

    67

    55 - 64

    47

    55

    62

    65 - 74

    53

    42

    52

    75 - 84

    20

    27

    33

    85 - 94

    10

    5

    8

    Fuente: Departamento de Salud, 1993. Estadsticas Vitales de Puerto Rico: Resumen de una dcada 1980 al 1990. San Juan, P.R.: pg. 108.

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    178

    [6.4.1] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1980.

    [6.4.2] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1980. Incluya una tabla con las columnas necesarias para completar el ejercicio.

  • Medidas de Dispersin

    179

    [6.4.3] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1985.

    [6.4.4] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1985. Incluya una tabla con las columnas necesarias para completar el ejercicio.

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    180

    [6.4.5] Favor de calcular y analizar el recorrido de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1990.

    [6.4.6] Favor de calcular y analizar la desviacin estndar de la edad por defunciones en accidentes de trfico por vehculos en Puerto Rico para el ao 1990. Incluya una tabla con las columnas necesarias para completar el ejercicio.

  • Medidas de Dispersin

    181

    [6.5] Funcin de la Desviacin Estndar

    Una vez obtenida la desviacin estndar, conforme uno de los tres (3) tipos de

    organizacin de datos, la pregunta inminente es qu implicacin o funcin tiene

    dicha medida?. Al principio de este captulo indicamos que el objetivo de las medidas

    de dispersin es indicar el grado en que los sujetos se dispersan (se alejan o se

    acercan) respecto al centro (la media) de una distribucin. La desviacin estndar

    cumple a cabalidad con dichos objetivos. A mayor la desviacin estndar mayor es la

    dispersin o a menor la desviacin estndar menor es la dispersin de los sujetos, con

    respecto a la media. Como funcin de la desviacin estndar podemos encontrar

    cun homogneos, parecidos o estables son los sujetos bajo estudio cuando estos

    son comparados con otro(s) grupo(s) de inters.

    Por ejemplo, en dos (2) secciones del curso de estadstica social la edad media

    fue igual, es decir, 21.4 aos de edad. La desviacin estndar para la seccin 1 fue

    de 10 aos y la desviacin estndar de la seccin 2 fue de 2 aos. Qu podemos

    inferir de las resultados obtenidos tanto de la seccin 1 como de la seccin 2?

    Primeramente, debemos sealar que la comparacin de la desviacin estndar de

    ambas secciones es posible, nica y exclusivamente, porque la media es igual. Al

    comparar la desviacin estndar notamos una diferencia. La desviacin estndar de

    la seccin 1 (10 aos) es mayor que la seccin 2 (2 aos). Esto sugiere que en la

    seccin 2 del curso de estadstica social los estudiantes son ms homogneos

    (parecidos) en la edad que los estudiantes de la seccin 1.

    Otro ejemplo, para visualizar la utilidad de la desviacin estndar es el

    siguiente. Se le someti a dos grupos profesionales una situacin determinada y se le

    tom el tiempo en resolver dicha encomienda. El grupo de criminlogos obtuvo un

    media de 45 minutos, con una desviacin estndar de 3 minutos. El grupo de

    trabajadores sociales obtuvieron una media de 45 minutos con una desviacin

    estndar de 11 minutos. Notemos, que la media es la misma para ambos grupos

    profesionales. No obstante, la desviacin estndar es diferente para ambos grupos.

    Dicha diferencia nos sugiere que el tiempo en terminar de resolver el problema en

    cuestin fue ms homogneo o ms parecido en el grupo de criminlogos que el

    tiempo obtenido en el grupo de trabajadores sociales. Como hemos observado, las

    comparaciones que se han realizado en este tpico son posibles porque la media

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    182

    aritmtica de cada distribucin ha sido igual. Pero, qu pasara si al comparar dos

    distribuciones las medias son diferentes? Sencillamente, no podramos analizar la

    homogeneidad como lo hemos hecho en este tpico. Sin embargo, es posible realizar

    la comparacin utilizando un coeficiente de variacin. En el tpico siguiente se

    desarrollar el coeficiente de variacin.

    [6.6] Coeficiente de Variacin

    La desviacin estndar DE es til como medida de la variacin dentro de un

    conjunto de datos. Mas an, si las medias son iguales se pueden comparar

    directamente las dos DE (Snchez, 1992). Sin embargo, cuando se desea comparar

    la dispersin en dos conjuntos de datos, comparar las DE pueden conducir a

    resultados sin sentido, si las medias difieren o si las unidades de medicin son

    diferentes. Esto es as, puesto que cada DE se obtiene a partir de la media particular

    que corresponde a cada conjunto (Snchez, 1992).

    Lo que se necesita en situaciones como sta es una medida de variacin

    relativa, en lugar de una variacin absoluta (Daniel, 1985). La medida que nos puede

    resolver este problema es el coeficiente de variacin (C.V.), llamado de Pearson, que

    es la relacin entre la DE y la media aritmtica (Elorza, 1987). Se multiplica adems

    por 100, para considerar el resultado en forma de porcentaje. A mayor el porcentaje,

    mayor es la variacin y viceversa. La frmula est dada por:

    s = Desviacin estndar de una muestra

    x = media aritmtica de una muestra

    C.V. = s x (100) donde:

  • Medidas de Dispersin

    183

    = Desviacin estndar de la poblacin

    = Media aritmtica de la poblacin

    Para poder entender el coeficiente de variacin analizaremos la siguiente

    situacin hipottica. Supongamos que la Universidad Pitirre de Puerto Rico en el

    semestre de agosto a diciembre del 2002 se ofrecieron tres (3) curso de estadstica

    social. Una vez finalizado los cursos se pudo obtener la media de notas generales, la

    desviacin estndar de notas generales y la cantidad de estudiantes por cada curso.

    Promedios finales de tres cursos de

    estadstica social, Universidad Pitirre,

    agosto-diciembre del 202 Parmetros

    Sec. 01 Sec. 02 Sec. 03

    Poblacin (N) 25 20 28

    Media () 90 78.2 62.9

    Desviacin Estndar () 12.6 11.2 9.6

    Si nuestro inters es indagar entre las secciones de estadstica social, cul de ellos,

    con respecto a las notas, tiende ha ser ms homognea o ms parecidas, debemos

    incursionar en la dispersiones de las notas. Recuerde que sealamos que a mayor

    dispersin de los valores de una poblacin de estudio, menos se paren los valores

    sugiriendo que hay poca homogeneidad. Lo inverso sugiere que a menor dispersin

    de los valores de una poblacin de estudio, ms se paren los valores sugiriendo que

    hay mucha homogeneidad. Notemos que para establecer la comparacin de

    homogeneidad en el ejercicio que nos compete, la media de las tres (3) secciones de

    estadstica social no son iguales. Este factor es muy importante, previo al manejo de

    la homogeneidad, porque teniendo las medias diferentes, no es posible obtener el

    grado de homogeneidad utilizando como punto de referencia la desviacin estndar.

    C.V. = (100) donde:

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    184

    Por ejemplo, si no tomramos en consideracin la disparidad de las medias y

    analizramos nica y exclusivamente la desviacin estndar para conseguir el grado

    de homogeneidad, podramos concluir, dado que la desviacin estndar es menor en

    la seccin 3 ( =9.6) con respecto a la seccin 2 ( =11.2) y la seccin 1 ( =12.6),

    que las notas de la seccin 3 del curso de estadstica social tienden hacer ms

    parecidas (homogneas) que entre las dems secciones. Sin embargo, esta

    conclusin adolece de veracidad porque cuando las medias en una comparacin no

    son iguales, no se puede utilizar la desviacin estndar para obtener el grado de

    homogeneidad. Para resolver el dilema, sugerimos que se busque el coeficiente de

    variacin en todos los grupos de inters y luego sera posible concluir sobre el grado

    de homogeneidad, veamos:

    Si analizamos los resultados de los coeficiente de variacin nos percataremos que la

    seccin 01 de estadstica social obtuvo el resultado ms bajo (14.00 %) con respecto

    a las otras dos secciones. Recuerde, mientras ms bajo es la dispersin, una vez se

    compara con los dems grupos de inters, el mismo sugiere alto grado de

    homogeneidad. Podemos concluir que las notas entre los estudiantes del curso de

    estadstica social de la seccin 01, tienden a ser ms parecidas (homogneas) que

    entre las secciones 02 y 03 del mismo curso de la Universidad Pitirre de Puerto Rico

    para el semestre de agosto a diciembre del 2002.

    Seccin 01 = 12.6 (100)

    90

    = 14.00 %

    Seccin 02 = 11.2 (100)

    78.2

    = 14.32 %

    Seccin 03 = 9.6 (100)

    62.9

    = 15.26 %

  • Medidas de Dispersin

    185

    Ejercicios Coeficiente de Variacin Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

    NOMBRE: FECHA: _______________

    NUMERO DE ESTUDIANTE: SECCION: ___________ [6.6.1] Favor de buscar la media aritmtica y la desviacin estndar de las edades por suicidio para los aos 1980, 1990 y 2000 segn los datos del cuadro 4.1 de la pgina 105. Luego calcule y analice el coeficiente de variacin para todos los aos.

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    186

    [6.6.2] Favor de buscar la media aritmtica y la desviacin estndar de los ejercicios 5.4.1.a pgina 145 y 5.4.2 de la pgina 147. Luego calcule y analice el coeficiente de variacin.

  • Medidas de Dispersin

    187

    [6.6.3] Favor de buscar la media aritmtica y la desviacin estndar de las edades de los varones y mujeres segn el ejercicio 6.3 de la pgina 169. Luego calcule y analice el coeficiente de variacin.

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    188

    [6.6.4] Favor de buscar la media aritmtica y la desviacin estndar de las edades por defunciones para cada anoo segn el ejercicio 6.4 de la pgina 177. Luego calcule y analice el coeficiente de variacin.

  • Medidas de Dispersin

    189

    [6.7] ndice de Dispersin Cualitativa

    Normalmente en el campo de las ciencias sociales se utilizan o manejan

    muchas variables cualitativas. Se puede observar previamente que dichas variables

    pueden variar de clase o cantidad. La premisa sera cun diferentes son esas

    observaciones. Utilizando el coeficiente de variacin cualitativa o un ndice de

    dispersin podemos encontrar dichas diferencias en las observaciones. El ndice de

    dispersin flucta entre cero (0) y uno (1), donde cero (0) implica homogeneidad

    perfecta y uno (1) representa heterogeneidad perfecta. Si los casos o sujetos estn

    distribuidos entre las categoras de una forma equitativa, es decir, que para cada

    categora de la variable existe la misma cantidad de casos, podemos indicar que

    existe una distribucin heterognea (equitativa) en las categoras de la variable de

    inters. Por el contrario, si todos los casos estn ubicados en una sola categora

    podemos indicar que existe una distribucin homognea (desproporcional). El ndice

    de dispersin cualitativo se expresa de la siguiente manera:

    D = ndice de dispersin cualitativo

    k = nmero de categoras

    = suma de frecuencias cuadradas () de cada categora

    n = total de casos Tomemos dos (2) municipios de Puerto Rico y analicemos la distribucin de

    matrimonios conforme los tipos de celebraciones. Segn el cuadro 6.3 podemos

    observar tanto para el municipio de Loza como para el municipio de Hormigueros la

    cantidad () de matrimonios celebrados segn el tipo de celebrantes.

    k [ (n) () ]

    [ (n) (k-1) ]

    donde:

    D =

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    190

    Para buscar el ndice de dispersin cualitativo necesitamos (ver figura 6.5)

    elevar la frecuencia () de cada categora al cuadrado ().

    Cuadro 6.3

    Cantidad de matrimonios por tipo de celebracin en Loza y

    Hormigueros, Puerto Rico: 1993.

    Celebrantes

    Sacerdotes

    Ministros

    Juez

    TOTAL

    Loza

    8

    122

    11

    141

    Hormiguero

    30

    48

    43

    121

    Fuente: Departamento de Salud de Puerto Rico, 1996. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Matrimonios y Divorcios, tabla 5, pg. 331-334.

    Figura 6.5 Procedimiento para obtener la columna ,segn los datos del cuadro 6.3

    Celebrantes

    Sacerdotes

    Ministros

    Juez

    TOTAL

    8

    122

    11

    141

    64

    14,884

    121

    15,069

    30

    48

    43

    121

    900

    2,304

    1,849

    5,053

    Loza

    Hormiguero

  • Medidas de Dispersin

    191

    Con la columna de () debidamente elaborada (ver figura 6.5) podemos

    calcular el ndice de dispersin cualitativo para los dos (2) municipios.

    Analizando los resultados de los ndices de dispersin para ambos municipios

    podemos inferir lo siguiente:

    _ En Loza, Puerto Rico para el ao 1993 el ndice de dispersin

    cualitativa por tipos de celebraciones fue de .36.

    _ En Hormigueros, Puerto Rico para el ao 1993 el ndice de dispersin

    cualitativa por tipos de celebraciones fue de .98.

    Cuando comparamos los dos (2) municipios observamos que los matrimonios

    ocurridos en Hormigueros tienden a ser ms heterogneos conforme a los tipos de

    celebraciones que los matrimonios ocurridos en el municipio de Loza, Puerto Rico.

    Si analizamos el cuadro 6.3 podemos notar que los matrimonios ocurridos en Loza,

    Loza

    D = 3[ (141) - 15,069 ]

    [ (141) (3-1)]

    = 3[ 19,881 - 15,069 ]

    [ (19,881) (2) ]

    = 3[ 4,812 ]

    39,762

    = 14,436

    39,762

    = .3630602

    = .36

    Hormiguero

    D = 3[ (121) - 5,053 ]

    [ (121) (3-1) ]

    = 3[ 14,641 - 5,053 ]

    [ (14,641) (2) ]

    = 3[ 9,588 ]

    29,282

    = 28,764

    29,282

    = .9823099

    = .98

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    192

    Puerto Rico para el ao 1993 estn mayormente concentrados en el tipo de

    celebracin con ministros. Para el municipio de Hormigueros, Puerto Rico, para el

    ao 1993 los matrimonios tienden a distribuirse casi equitativamente entre los tres (3)

    tipos de celebrantes.

  • Medidas de Dispersin

    193

    Ejercicios de ndice de dispersin cualitativa

    Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

    NOMBRE: FECHA: _______________

    NUMERO DE ESTUDIANTE: SECCION: ___________

    Ejercicio 6.7 Favor de utilizar los datos que reflejan la cantidad de matrimonios por tipo de celebracin en Villalba, Utuado y Ponce Puerto Rico: 1993.

    Celebrantes

    Sacerdotes

    Ministros

    Juez

    TOTAL

    74

    14

    50

    82

    116

    111

    Villalba

    Utuado

    Ponce

    532

    360

    743

    Fuente: Departamento de Salud de Puerto Rico, 1996. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Matrimonios y Divorcios, tabla 5, pg. 331-334.

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    194

    [6.7.1] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Villalba, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.

    [6.7.2] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Utuado, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.

    [6.7.3] Favor de calcular y analizar el ndice de dispersin de los matrimonios ocurridos en el municipio de Ponce, Puerto Rico para el ao 1993 conforme el tipo de celebracin. Desarrolle las columnas necesarias para completar el ejercicio.

  • Medidas de Dispersin

    195

    [6.8] Frmulas

    Recorrido

    Desviacin Estndar para poblacin

    Desviacin Estndar para muestras

    Coeficiente de Variacin

    ndice de dispersin cualitativa

    R = Vmax - Vmin

    () N

    N

    Arreglos de datos

    =

    x (x)

    N

    N

    Datos no agrupados

    Datos agrupados

    =

    ()

    n

    n-1

    Arreglos de datos

    s =

    x (x)

    n

    n-1

    Datos no agrupados

    Datos agrupados

    s =

    C.V. = s x (100)

    muestra

    C.V. = (100)

    poblacion

    k [ (n) () ]

    [ (n) (k-1) ]

    D =

  • Arnaldo Torres Degr y Evelyn Afanador Mejas

    196

    [6.9] Ejercicios Adicionales Arreglo de datos [6.9.1] Favor de buscar y analizar el recorrido y la desviacin estndar de la nota del primer examen de los

    atletas de la Universidad Pitirre para el ao 2004 en el curso de primeros auxilios: datos hipotticos 56; 78; 78; 75; 77; 72; 75; 79; 79; 80; 72; 73; 74; 72; 75; 73; 72; 70; 72; 80; 77; 75; 72; 90; 88; 72; 74; 78; 80; 66; 72; 76; 83; 90; 72; 77; 79.

    [6.9.2] Favor de buscar y analizar el recorrido y la desviacin estndar de la cantidad de horas semanales

    viendo televisin entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 15; 10; 20; 10; 10; 27; 22; 10; 16; 16; 09; 17; 28; 19; 15; 15; 15; 18; 10; 10; 10; 14; 17; 20; 13; 12; 12; 18; 20; 08; 09; 10; 12; 14; 20; 16; 12.

    [6.9.3] Favor de buscar y analizar el recorrido y la desviacin estndar de la cantidad en dlares por concepto

    en compra de libros para estudios entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 95; 76; 50; 88; 50; 89; 74; 90; 56; 86; 89; 90; 69; 150; 120; 120; 90; 96; 89; 100; 89; 58; 90; 60; 100; 58; 88; 79; 90; 100; 120; 90; 99; 87; 90; 99; 130.

    Datos no agrupados [6.9.4] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de las mujeres menores

    quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.

    [6.9.5] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de las varones menores

    quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169..

    [6.9.6] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad de todos los menores

    quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.

    Datos agrupados [6.9.7] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico

    para el ao 1980, segn los datos registrados en el cuadro 4.1 de la pgina 105. [6.9.8] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico

    para el ao 1990, segn los datos registrados en el cuadro 4.1 de la pgina 105. [6.9.9] Favor de buscar y analizar el recorrido y la desviacin estndar de la edad por suicidio en Puerto Rico

    para el ao 2000, segn los datos registrados en el cuadro 4.1 de la pgina 105.