SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06,...

26
SEGUNDA PARTE: ESTADÍSTICA DESCRIPTIVA.

Transcript of SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06,...

Page 1: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

SEGUNDA PARTE: ESTADÍSTICA DESCRIPTIVA.

Page 2: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

6. ESCALA CUALITATIVA La información recabada durante las investigaciones estadísticas proviene de

observaciones individuales, y éstas casi siempre han de ser resumidas de alguna

manera antes de que se les pueda utilizar. Resumir datos cualitativos es relativamente

simple. Sólo hay que contar el número de observaciones según cada característica o

combinación de éstas, y representarlas como proporciones o razones. Los datos

cuantitativos también pueden resumirse mediante este procedimiento, siempre y

cuando se agrupen los valores de la variable en dos o más categorías.

PROPORCIONES Para calcular una proporción se divide la frecuencia absoluta de la categoría que se

está analizando entre el total de individuos identificados con la variable de estudio. Lo

anterior se representa mediante la fórmula:

( ) /p a a b a N= ÷ + = (6,1)

Donde p representa la proporción, a es el número de elementos con la característica

de interés y b el número de elementos sin la característica de interés. Hay que notar

que a + b es el total del universo (N).

Ejemplo explicativo 6-1 ---------------------------------------------------------------------------------- Considérese la serie del cuadro 6-1, en la cual se presentan algunas características de

20 niños de 1 a 4 años que fallecieron ahogados en su hogar en la Zona Metropolitana

de Guadalajara. Esta serie de datos puede resumirse, mediante el uso de proporciones,

tal como se muestra en el cuadro 6-2.

Cuadro 6-1. Características de 20 niños, de 1 a 4 años de edad, ahogados

en su hogar. Zona Metropolitana de Guadalajara. 1991-1993.

i Sexo Depósito i Sexo Depósito

1 Masculino Aljibe 11 Femenino Aljibe

2 Masculino Balde/tina 12 Masculino Olla

3 Masculino Olla 13 Masculino Pozo de agua

4 Femenino Aljibe 14 Masculino Otro

5 Femenino Balde/tina 15 Masculino Aljibe

6 Masculino Aljibe 16 Masculino Aljibe

7 Masculino Pozo de agua 17 Masculino Balde/tina

8 Masculino Aljibe 18 Femenino Aljibe

9 Femenino Aljibe 19 Masculino Otro

10 Masculino Otro 20 Masculino Otro

Con formato: Normal

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Page 3: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuadro 6-2. Características 20 niños, de niños de 1 a 4 años de edad, ahogados

en su hogar. Zona Metropolitana de Guadalajara. 1991-1993.

Variable Frecuencia Proporción

Sexo

Masculino 15 15 ÷ 20 = 0.75

Femenino 5 5 ÷ 20 = 0.25

Depósito

Aljibe 9 9 ÷ 20 = 0.45

Balde/tina 3 3 ÷ 20 = 0.15

Olla 2 2 ÷ 20 = 0.10

Pozo de agua 2 2 ÷ 20 = 0.10

Otro 4 4 ÷ 20 = 0.20

------------------------------------------------------------------------------------------------------------------

La interpretación de las proporciones puede ser un poco confusa para el principiante.

Por ello, se acostumbra multiplicarlas por 100 para expresarlas como porcentaje, y se

especifican mediante el símbolo “%”. Así, para calcular un porcentaje basta dividir el

número de individuos en cada categoría entre el total del grupo y multiplicar el

resultado por 100. En el Ejemplo explicativo 6-1 los porcentajes serían: 0.75 × 100 =

75% varones, 0.25 × 100 = 25% mujeres, 0.45 × 100 = 45% ahogados en aljibes, 0.15 ×

100 = 15% en baldes/tinas, 0.10 × 100 = 10% en ollas, 0.10 × 100 = 10% en pozos de

agua, y 0.20 × 100 = 20% en otros depósitos de agua.

El uso de proporciones tiene varias ventajas. En primer lugar, permiten comparar

con facilidad dos o más series cuyos totales son diferentes, pues éstos quedan

convenientemente reducidos a la unidad (o a 100 en el caso de porcentajes). En

segundo lugar, a través de las proporciones se puede asumir la probabilidad de que un

evento ocurra. En el ejemplo anterior, existe una probabilidad de 0.75 (o 75%) de que

el sexo de un niño ahogado en el hogar sea masculino.

Cómo hacerlo en Epi Info, 6-1. ------------------------------------------------------------------------- Llame el programa Epi Info 7 y haga click en la opción “Classic” de “Analyze Data”

(figura 6-1).

Figura 6-1. Menú de Epi Info 7.

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Normal sangría, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Fuente: +Cuerpo(Calibri), Sin subrayado, Color defuente: Automático

Con formato: Fuente: +Cuerpo(Calibri), Sin subrayado, Color defuente: Automático

Con formato: Fuente: +Cuerpo(Calibri), Sin subrayado, Color defuente: Automático

Con formato: Ejemplo

Page 4: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuando se muestre la ventana de “Analysis” haga click en “Read” (el comando lo podrá

encontrar en el extremo superior de las opciones de comando). El programa le

mostrará la ventana de “Read”. En ella, primero haga click en la opción “Data Type” y

seleccione la opción “Microsoft Access 2002-2003 (.mbd)”*. Luego haga click en “Data

Source” y busque en el disco de datos que acompaña al libro el archivo

“Bioestadistica_3ra.MDB” (en la imagen de este ejemplo la carpeta donde se

encuentra el archivo es “I:\Cursos\Bioestadistica\Libro 3ra Edicion\bases\”, y esto

seguramente será diferente dependiendo de la unidad de memoria y la carpeta en que

guarde el archivo); Cuando lo encuentre selecciónelo. A continuación haga click en

“Bio3_06a”. En ese momento la ventana “Read” se mostrará tal como se aprecia en la

figura 6-2. Continúe haciendo click en el botón “OK”.

Figura 6-2. Pantalla de “Analysis” mostrando la ventana de “Read” con las selecciones

“Microsoft Access 2002-2003 (.mbd)”, “Bioestadistica_3ra.MDB” y “Bio3_06a”.

Notará que en el cuadro de “Epi Info” se apreciará el texto que se muestra en la figura

6-3.

* Para los ejemplos de Epi Info 7 de esta edición hemos preferido utilizar el formato de

datos de Epi Info 2000 de tal manera que los datos puedan ser leídos tanto en la

versión 7 de Epi Info como en la anterior de Epi Info 2000 para Windows.

Page 5: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Figura 6-3. Mensaje que se muestra en la ventana después

de llamar los datos en “Analysis” de Epi Info 7.

Para obtener las frecuencias y los porcentajes correspondientes de una variable haga

click en “Frequencies” (el comando lo podrá encontrar en la mitad de la pantalla en la

lista de comandos), en el apartado “Statistics”]. En la ventana de diálogo que se

despliega seleccione “DEPOSITO” en la opción “Frequency of”. En ese momento la

ventana deberá observarse como en la Figura 6-4.

Figura 6-4. Ventana de diálogo para la frecuencia

de DEPOSITO según la tabla de datos 06a$.

Al hacer click con el ratón en “OK” podrá observar en la ventana de resultados (Figura

6-5) los siguientes elementos:

1. Categorías de la variable DEPOSITO.

2. Frecuencias absolutas de las categorías listadas.

3. Porcentaje de cada categoría en relación al total.

4. Porcentajes acumulados.

5. Gráfica de barras horizontales.

6. Intervalos de confianza del 95% para los porcentajes de la frecuencia de cada

categoría. Este tema será tratado más adelante, el en Capítulo 16.

Figura 6-5. Frecuencias de las categorías de la variable

DEPOSITO, según la tabla de datos 06a$.

------------------------------------------------------------------------------------------------------------------

Uso de las proporciones en Epidemiología Las proporciones son muy utilizadas en la práctica de la epidemiología, de tal manera

que algunos usos específicos de estas tienen nombres propios, como es el caso de la

prevalencia, la incidencia acumulada, la sensibilidad y la especificidad. Estas la

Page 6: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

describiremos más adelante, pero antes de hacerlo es necesario que aclaremos

algunos elementos del proceso salud-enfermedad que se toman en cuenta para la

estimación de la frecuencia de la enfermedad.

La frecuencia de la enfermedad en bioestadística Típicamente la enfermedad es considerada un estado adverso de salud que caracteriza

a un individuo durante un periodo. Ejemplos de enfermedad son: demencia,

tuberculosis, alcoholismo, infección de vías urinarias, Diabetes Mellitus, etc. En la

figura 6-6 esto se presenta de manera gráfica.

Inicia la enfermedad(Evento)

Duración de la enfermedad(Estado)

Figura 6-6. Secuencia salud-enfermedad-salud en un sujeto.

Aunque por lo general se piensa en la enfermedad como un estado, también es posible

concebirla como un evento. El inicio de un estado de enfermedad es un evento que

ocurre en un punto específico del tiempo. Tal es el caso del cambio de sujeto sano a

enfermo de Diabetes Mellitus, hipertensión arterial, cáncer de cérvix, etc.

Prevalencia La prevalencia cuantifica la proporción de individuos en la población que tienen algún

estado de enfermedad en un instante específico del tiempo, y proporciona una

estimación de la probabilidad de que un individuo se encuentre enfermo en algún

punto del tiempo. La fórmula para calcular la prevalencia (p) es:

número de casos con la enfermedad en un punto específico del tiempo

Ptotal de la población en el mismo grupo y punto específico de tiempo

= (6,2)

Este “punto” puede referirse a un día específico en el calendario, a la edad del sujeto

estudiado o a un momento en el curso del tiempo a partir de un evento. Para facilitar

la lectura del cociente anterior, se acostumbra multiplicar el resultado por una

constante que puede ser 100, 1 000, 10 000 u otra cantidad, con la finalidad de no

utilizar fracciones pequeñas al expresar prevalencias.

Ejemplo explicativo 6-2 ---------------------------------------------------------------------------------- Con frecuencia, los servicios de medicina familiar están interesados en conocer la

prevalencia de pacientes enfermos de diabetes en la comunidad donde brindan el

servicio médico. Para obtener esa información, el epidemiólogo ordena a su equipo

que visite y registre toda la población que cubre su unidad. Como resultado de su

investigación encuentra que en una población de 4 550 habitantes se identificaron 228

sujetos diabéticos. Así, la prevalencia de diabetes en esa población es de 228/4 550 =

0.05, o 5.0/100 habitantes.

------------------------------------------------------------------------------------------------------------------

Eliminado: ¶

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Código de campo cambiado

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Título 5, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Page 7: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Incidencia acumulada En contraste con la prevalencia, la incidencia cuantifica el número de eventos de

enfermedad que se desarrollan en la población de individuos en riesgo durante un

intervalo específico de tiempo. La incidencia acumulada (IA) es la proporción de

personas que adquieren la enfermedad durante un periodo específico, y se calcula

como:

número de casos nuevos de enfermedad durante un período de tiempo

IAtotal de la población en riesgo al inicio del período de estudio

= (6,3)

Esta medida de frecuencia proporciona un estimado de la probabilidad de que un

individuo tomado al azar en una población en riesgo (susceptible) desarrolle la

enfermedad durante un periodo específico. A esta probabilidad también se le conoce

como riesgo. El periodo de observación es arbitrario y depende de las características

evolutivas de la enfermedad. Al igual que con la prevalencia, la IA puede multiplicarse

por una constante para facilitar su lectura e interpretación.

Antes de continuar es necesario señalar que una persona se encuentra “en

riesgo” de una enfermedad cuando es biológicamente posible que desarrolle la

enfermedad en un futuro inmediato. “En riesgo” significa que el sujeto es susceptible a

la enfermedad. En otras palabras, que la probabilidad de que desarrolle una

enfermedad no es igual a cero. En términos epidemiológicos, “en riesgo” no significa

“en mayor riesgo” en relación con otra persona. Razones frecuentes de que alguien no

se encuentre en riesgo son:

• La persona tiene la enfermedad. Alguien que sufra de Diabetes Mellitus no se

encuentra en riesgo de desarrollarla nuevamente.

• La persona ha adquirido inmunidad. Un niño que ya enfermó de sarampión no lo

padecerá de nuevo.

• La persona no tiene la capacidad biológica de desarrollar la enfermedad. Los

varones nunca sufrirán cáncer uterino.

• Durante algún tiempo de vida la persona fue susceptible de desarrollar la

enfermedad, pero ésta fue abolida por algún procedimiento particular. La mujer

a la que se le ha practicado histerectomía no puede desarrollar cáncer uterino.

Ejemplo explicativo 6-3 ---------------------------------------------------------------------------------- Si se toma una cohorte de 12 sujetos y se le observa durante cinco años (sin que sus

elementos se pierdan para el estudio y sin que dejen de estar en riesgo durante el

periodo del estudio) y de ellos cinco desarrollan la enfermedad, entonces la IA será

5/12 = 0.42 en cinco años. En otras palabras, si se toma un individuo de los observados

al inicio del estudio, la probabilidad de que en el transcurso de cinco años desarrolle la

enfermedad es de 0.42, o 42/100.

------------------------------------------------------------------------------------------------------------------

La prevalencia y la incidencia son dos aspectos de un mismo fenómeno. Para

entenderlas hay que poner atención a la figura 6-7, en la cual se representa a 13

sujetos en observación durante cinco años. Al inicio del estudio todos los sujetos se

encuentran sanos y todos ellos tienen el riesgo (son susceptibles) de contraer la

enfermedad. Se debe convenir que en esa figura la cruz representa el inicio de la

Con formato: Título 5, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Normal sangría, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Nor 1, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri),Español (España - alfab. tradicional)

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Page 8: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

enfermedad, o “evento”; que la línea gruesa representa el tiempo durante el cual el

sujeto está enfermo, o “estado”; y el cuadro representa el momento en que el sujeto

sale del estudio porque muere. Si se hace un corte después de un año de observación

se encuentra que en ese “punto específico de tiempo” existen dos enfermos entre los

13 sujetos observados. Así, la prevalencia es igual a 2/13 = 0.15, mientras que la

incidencia acumulada desde el inicio del estudio es 2/13 = 0.15 en un año. En este

caso, la prevalencia y la incidencia son semejantes, pero no siempre tiene que ser así,

ya que para el cuarto año han fallecido cuatro sujetos y sólo quedan nueve, de los

cuales tres están enfermos. Por tanto, la prevalencia es de 3/9 = 0.33, mientras que la

incidencia acumulada es de 7/13 = 0.54 en cuatro años.

1

3

5

7

9

11

13

0 1 2 3 4 5

sujeto sano en observación

inicia la enfermedad

sujeto enfermo en observación

defunción

Tiempo de observación del grupo

Sujeto ( )i

Figura 6-7. Eventos y estados de enfermedad en un grupo de sujetos.

Sensibilidad y especificidad La sensibilidad y la especificidad son dos proporciones que nos permiten medir la

validez de un instrumento de medición en relación a un criterio de clasificación, y se

definen de la siguiente manera:

• Sensibilidad.- Es la probabilidad de clasificar correctamente a aquellos que tienen

la característica de interés.

• Especificidad.- Es la probabilidad de clasificar correctamente a aquellos que no

tienen la característica de interés.

Para su cálculo procedemos de la siguiente manera:

Código de campo cambiado

Con formato: Título 5, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Page 9: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

1. Mediante un procedimiento de clasificación “perfecto” (generalmente conocido

como “gold standard” o “estándar de oro”) los sujetos son clasificados según

presenten la característica o no la presenten (en términos clínicos, generalmente

se clasifican como enfermos y no enfermos).

2. Luego, estos mismos sujetos con clasificados mediante un instrumentos menos

perfecto (aunque más sencillo, económico o menos invasivo) en dos grupos

según presenten la característica o no la presenten (en términos clínicos,

generalmente se clasifican como “positivos” o “negativos” a la prueba). Uno

esperaría que todos aquellos que tienen la característica (según se medió con el

“estándar de oro”) resulten “positivos”, y que aquellos que no tienen la

característica (según se midió con el “estándar de oro”) resulten “negativos”

3. Dado que el segundo criterio de clasificación es imperfecto, algunos sujetos que

realmente presentan la característica (según el “estándar de oro”) serán

clasificados incorrectamente como que no la tienen (o “negativos”), mientras

que algunos que realmente no presentan la característica (según el “estándar de

oro”) serán clasificados incorrectamente como que sí la tienen (o “positivos”).

4. Para el cálculo de la sensibilidad y la especificidad, generalmente, acomodamos

los datos según el cuadro 6-3.

Clasificación con el

“estándar de oro”

Prueba alternativa Presente Ausente

Positivo a b

Ausente c d

a + c b + d

Cuadro 6-3. Arreglo de datos para el

cálculo de sensibilidad y especificidad.

5. Concluimos nuestro cálculo con las dos fórmulas que se muestran a

continuación.

Sensibilidad =+

a

a c

Especificidad =+

d

b d

Es necesario notar que cuando la sensibilidad es perfecta, el 100% de los que fueron

clasificados con la característica mediante el “estándar de oro” también son

clasificados mediante el segundo criterio de clasificación. Cuando eso no ocurre la

sensibilidad es menor al 100%. Lo mismo ocurre con la especificidad para los que

fueron clasificados por el “estándar de oro” sin la característica.

Ejemplo explicativo 6-4 ---------------------------------------------------------------------------------- Supongamos que tenemos interés en evaluar la validez de una prueba diagnóstica que

es más rápida y económica que el “estándar de oro”. Para hacerlo seleccionamos dos

grupos: uno de enfermos u otro de no enfermos: ambos clasificados mediante el uso

del “estándar de oro”. Las frecuencias cada categoría se muestran en el cuadro 6-4.

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Page 10: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuadro 6-4. Arreglo de datos ficticios para el

cálculo de sensibilidad y especificidad.

Clasificación con el

“estándar de oro”

Prueba alternativa Enfermo Sano

Positivo 85 10

Negativo 15 190

100 200

Para los datos que se muestran en el cuadro 6-2, la sensibilidad de la prueba

alternativa sería 85/100 = 0.85, o 85%, y la especificidad de la prueba alternativa sería

de 190/200 = 0.95, o 95%. -------------------------------------------------------------------------------

RAZONES Cuando la serie que se está examinando consta sólo de dos categorías, o el interés de

la investigación se dirige únicamente a dos categorías, se pueden utilizar las razones

para resumir la información. Para ello, se divide la totalidad de individuos que tengan

una característica (de preferencia el grupo de mayor tamaño) entre el grupo que tenga

la otra característica. De esta manera, y a diferencia de las proporciones, las lecturas

del numerador no se incluyen en el denominador. Su fórmula es:

R a b= ÷ (6,4)

En la que R representa la razón, a simboliza el número de elementos con la

característica de interés y b el número de elementos con una característica diferente.

Hay que notar que a + b no necesariamente son el total del universo.

Ejemplo explicativo 6-5. --------------------------------------------------------------------------------- Continuando con el Ejemplo explicativo 6-1, la serie de datos puede resumirse,

mediante el uso de razones, de la siguiente manera:

1. Según el sexo del niño (cuadro 6-2), por cada niña que se asfixia por inmersión en

el hogar hay tres niños que sufren ese accidente mortal. En este ejemplo a = 15,

b = 5 y a ÷ b = 3 es la razón.

Cuadro 6-5. Sexo de niños de 1 a 4 años de edad ahogados en su hogar.

Zona Metropolitana de Guadalajara. 1991-1993.

Sexo Frecuencia Razón

Masculino 15 15 ÷ 5 = 3

Femenino 5

2. Según el depósito en que se ahogó (cuadro 6-6), por cada menor que se asfixia

por inmersión en un balde o tina, hay tres que pierden la vida en un aljibe. En

este ejemplo, a = 9, b = 3, a ÷ b = 3 es la razón.

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri),Sin Cursiva, Sin subrayado, Color defuente: Automático, Español (España -alfab. tradicional)

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri),Sin Cursiva, Sin subrayado, Color defuente: Automático, Español (España -alfab. tradicional)

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri),Sin Cursiva, Sin subrayado, Color defuente: Automático, Español (España -alfab. tradicional)

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri),Sin Cursiva, Sin subrayado, Color defuente: Automático, Español (España -alfab. tradicional)

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri), 12pto, Sin subrayado, Color de fuente:Automático, Español (España - alfab.tradicional)

Page 11: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuadro 6-6. Depósito de agua en que niños de 1 a 4 años de edad se ahogaron

en su hogar. Zona Metropolitana de Guadalajara. 1991-1993.

Depósito Frecuencia Razón

Aljibe 9 9 ÷ 3 = 3

Balde/tina 3

------------------------------------------------------------------------------------------------------------------

Densidad de incidencia Para el cálculo de una razón no siempre se utiliza información de dos grupos

diferentes. También podemos utilizar en el numerador y el denominador información

procedente de un mismo grupo, pero de diferente naturaleza. Tal es el caso de la

densidad de incidencia (DI) en la que el numerador es semejante a la incidencia

acumulada pero el denominador es la suma del tiempo que cada individuo ha

permanecido en observación (“tiempo persona”) y en riesgo de enfermar. Su fórmula

está dada por

número de casos nuevos de enfermedad durante un período de tiempo

DI=total de tiempo-persona de observación

(6,5)

Al presentar la densidad de incidencia es esencial que se especifique la unidad de

tiempo; esto es, si la tasa representa el número de casos por día-persona, mes-

persona, año-persona, o alguna otra medida de tiempo-persona. La densidad de

incidencia nos habla del cambio potencial instantáneo del estado de enfermedad de

una población en una unidad de tiempo.

A diferencia de la incidencia acumulada que es una proporción y puede

interpretarse como una probabilidad, la densidad de incidencia dirige su atención al

número de eventos que se presentan en una unidad de tiempo (y de manera inversa al

tiempo que transcurre entre evento y evento). Esto se gráfica en la Figura 6-8, donde

el tiempo persona en riesgo se refiere al tiempo acumulado que tuvieron que

acumular los sujetos en estudio para registrar los eventos de interés.

1

3

5

7

9

11

13

0 1 2 3 4 5

Tiempo de observación del grupo

Sujeto ( )i

Tiempo persona en riesgo

Con formato: Ejem. normal

Con formato: Fuente:(Predeterminado) +Cuerpo (Calibri), 12pto, Español (España - alfab.tradicional)

Con formato: Fuente: +Cuerpo(Calibri), Negrita, Sin Cursiva, Sinsubrayado, Color de fuente:Automático, Español (alfab.internacional)

Con formato: Fuente: +Cuerpo(Calibri), Negrita, Sin Cursiva, Sinsubrayado, Color de fuente:Automático, Español (alfab.internacional)

Con formato: Fuente: +Cuerpo(Calibri), Negrita, Sin Cursiva, Sinsubrayado, Color de fuente:Automático, Español (alfab.internacional)

Con formato: Normal sangría

Código de campo cambiado

Page 12: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Figura 6-8. Tiempo persona de observación correspondiente a población en riesgo.

Ejemplo explicativo 6-6. ---------------------------------------------------------------------------------- En una unidad de terapia intensiva están interesados en conocer la incidencia de

muertes en pacientes que ingresan con infarto de miocardio. Después de 10 días se

han registrado los datos del cuadro 6-7.

Cuadro 6-7. Pacientes con infarto de miocardio observados en terapia intensiva

Paciente i Tiempo de observación en

días a partir del ingreso

hasta la alta de terapia

intensiva

Motivo de egreso

1 9 defunción

2 5 mejoría

3 3 mejoría

4 3 defunción

5 1 defunción

Con los datos anteriores no es posible calcular una incidencia acumulada, ya que los

periodos de observación no son los mismos en todos los sujetos, pero se puede

calcular una densidad de incidencia. Para ello, se toma el total de eventos de interés

observados (tres defunciones) y se les divide entre el tiempo-persona observado

durante el cual se presentaron esos eventos (21 días-persona). Así, la densidad de

incidencia es 3 ÷ 21 = 0.143 días-persona–1

, o 0.143 defunciones por cada día de

estancia acumulada por el grupo. ----------------------------------------------------------------------

LA COMPARACIÓN DE GRUPOS Con frecuencia, en el campo de las ciencias de la salud se tiene la necesidad de

comparar grupos entre sí. Cuando el tamaño de los grupos a comparar es idéntico es

posible valerse de frecuencias absolutas. Sin embargo, lo más frecuente es que los

grupos sean diferentes en cuanto al tamaño del grupo en estudio. En estas ocasiones

el uso de frecuencias relativas (proporciones o razones) facilita la comparación

mediante una simple sustracción. Es preciso notar que cuando las frecuencias relativas

(proporciones o razones) de dos grupos son iguales, la diferencia es de cero, mientras

que cuando son diferentes el resultado es mayor o menor que cero.

Ejemplo explicativo 6-7. --------------------------------------------------------------------------------- Supóngase que se sospecha y existe interés en probar la hipótesis de que en una

escuela secundaria los alumnos varones se lesionan más frecuentemente que sus

compañeras. Para ello, se observa a los estudiantes durante un año escolar y al final de

él se encuentra que el número de lesionados es semejante para ambos grupos: 15

lesionados en el transcurso del año. Estas frecuencias absolutas son de valor, pero

pueden conducir a errores graves de interpretación; por ejemplo, si de 300 alumnos

que estudian en el plantel sólo 100 fueran varones. En este caso, el uso de una

proporción permitirá evaluar la frecuencia con que se presentan las lesiones según el

sexo. De esta manera, la incidencia de lesionados en el grupo de varones es de

15/100 = 0.15, mientras que para las mujeres tan sólo es de 15/200 = 0.08, por lo que

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejem. normal, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Fuente: +Cuerpo(Calibri), 12 pto, Sin subrayado, Colorde fuente: Automático, Español(España - alfab. tradicional),Superíndice

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Page 13: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

la diferencia sería de 0.15 - 0.08 = 0.07. Lo anterior indicaría que en esa escuela los

varones se accidentan más que las mujeres. --------------------------------------------------------

Riesgo Atribuible En epidemiología a esta diferencia se le conoce como riesgo atribuible (RA), y

proporciona información acerca del efecto absoluto de la exposición o exceso de

riesgo de la característica de interés en aquellos que pertenecen a un grupo con una

característica específica (expuestos) en comparación con aquellos que no la tienen (no

expuestos). Ayuda a responder a la pregunta: (si se ha inferido que la exposición causa

la enfermedad) entre las personas expuestas, ¿qué cantidad de la característica de

interés (quizá una enfermedad) se debe a la exposición? Esta medida se define como la

diferencia entre la incidencia de los expuestos y los no expuestos, y se calcula

mediante:

e o

I I− (6,6)

Donde Ie es la incidencia de expuestos (medida como incidencia acumulada o como

densidad de incidencia), mientras que Io es la incidencia de no expuestos (medida

también como incidencia acumulada o como densidad de incidencia). Dos prevalencias

también pueden compararse mediante la sustracción, aunque el resultado se conoce

como diferencia de prevalencias y no como riesgo atribuible.

Riesgo Relativo La razón también es un instrumento útil para comparar dos grupos. Para su

interpretación se debe tomar en cuenta el grupo a comparar (el numerador) en

referencia con el grupo de comparación (el denominador). Cuando ambos grupos son

iguales, el resultado siempre es igual a uno. Así, 9 ÷ 9 = 3 ÷ 3 = 1 indica que el grupo a

comparar es igual al grupo de comparación o referencia. En otras palabras, por cada

elemento en el grupo a comparar existe otro en el grupo de comparación. Cuando el

numerador es mayor que el denominador, como en 9 ÷ 3 = 3, el resultado siempre será

mayor a 1. Si éste es el caso, el resultado indica cuántos elementos (y fracción de ellos)

en el grupo a comparar existen por cada elemento en el grupo de referencia. Por otra

parte, si el numerador es menor que el denominador, 3 ÷ 9 = 0.33, el resultado expresa

qué fracción de un elemento, en el grupo a comparar, existe por cada elemento en el

grupo de comparación. En epidemiología a este cociente se le conoce como riesgo relativo (RR), y estima la magnitud de una asociación entre exposición y enfermedad e

indica la probabilidad del grupo expuesto de desarrollar la enfermedad en relación con

aquellos que no están expuestos. Ayuda a responder a la pregunta: ¿la exposición

causa la enfermedad? Esta medida se define como el cociente de la incidencia de los

expuestos entre la incidencia los no expuestos, y se calcula mediante:

e

o

I

I (6,7)

En la cual Ie es la incidencia de expuestos (medida como incidencia acumulada o como

densidad de incidencia) e Io es la incidencia de no expuestos (medida también como

incidencia acumulada o como densidad de incidencia). Dos prevalencias también

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Título 4, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Con formato: Normal

Page 14: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

pueden compararse mediante una razón, aunque el resultado se conoce como razón de prevalencias y no como riesgo relativo.

Una interpretación alternativa del riesgo relativo consiste en restar 1 al resultado

(cociente) y multiplicarlo por 100. De esta manera, el resultado se interpreta como el

porcentaje que el grupo a comparar se encuentra por arriba o por abajo en relación

con el grupo de referencia. Cuando los grupos son idénticos, el resultado es igual a 0%

[(1 - 1) × 100 = 0%]. Si el numerador es mayor que el denominador, el resultado es

superior a 0% [(3 – 1) × 100 = 200%], mientras que lo contrario resulta en un valor

negativo [(0.33 – 1) × 100 = –67%]. Si se toma al grupo de comparación como 100%, el

resultado mediante el procedimiento anterior indica, de manera porcentual, en qué

magnitud porcentual el grupo a comparar se encuentra por arriba o por abajo del

grupo de referencia.

Ejemplo explicativo 6-8. ---------------------------------------------------------------------------------- La comparación de grupos que realizamos mediante la diferencia de proporciones en

el Ejemplo explicativo 6-7 también puede efectuarse mediante una razón entre

proporciones, donde 0.15 ÷ 0.08 = 1.88 nos indica que existen 1.88 hombres

lesionados por cada mujer lesionada, o también que existen 88% más hombres

lesionados que mujeres lesionadas. -------------------------------------------------------------------

Tablas de contingencia Las tablas de contingencia son arreglos ordenados de frecuencias que se acomodan en

celdas definidas por columnas y renglones. Las frecuencias presentadas de esta

manera facilitan algunos procedimientos estadísticos utilizados frecuentemente, como

son el cálculo de riesgo atribuible, riesgo relativo, chi-cuadrada y prueba exacta de

Fisher, por mencionar cuatro de los más frecuentes.

La tabla de contingencia más utilizada es la conocida como 2 x 2, que consiste en

una tabla con dos hileras y dos columnas donde los sujetos se clasifican según dos

criterios, cada uno de los cuales ocurre en dos niveles. Una tabla de este tipo se

presenta en el Cuadro 6-8.

Cuadro 6-8. Tabla de contingencia 2 x 2.

Criterio de efecto

Si No Total

Criterio de Si a b a + b

exposición No c d c + d

Total a + c b + d a + b + c + d

Ejemplo explicativo 6-9. --------------------------------------------------------------------------------- Las frecuencias del Ejemplo explicativo 6-7 pueden presentarse en una tabla de

contingencia 2 x 2. El cuadro 6-9 nos muestra los datos en una tabla de este tipo.

Cuadro 6-9. Frecuencias observadas según el ejercicio explicativo 6-7.

Lesionados

Si No Total

Hombres 15 85 100

Mujeres 15 185 200

Con formato: Normal sangría, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Título 4

Con formato: Normal sangría

Con formato: Ejemplo

Page 15: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Total 30 300 300

A partir de este arreglo, la incidencia de lesiones en hombres se puede calcular

mediante a/(a+b) = 15/100, mientras que la incidencia de lesiones en mujeres sería

igual c/(c+d) = 15/200. -----------------------------------------------------------------------------------

Odds Ratio El riesgo relativo supone que el muestreo en la población ha sido realizado de manera

aleatoria, y que posteriormente los sujetos han sido clasificados según dos variables

dicotómicas (diseño transversal analítico), o bien que los grupos muestreados han sido

formados atendiendo a su nivel de exposición (diseño de cohortes). En Epidemiología

es frecuente que los grupos a comparar sean formados a partir de la condición de

enfermedad que se desea estudiar (diseño de casos y controles). En estas

circunstancias, no es factible estimar el riesgo relativo de manera directa (para una

explicación más completa consulte algún libro de Epidemiología). No obstante, cuando

se puede mantener el supuesto de que la frecuencia de la enfermedad que se estudia

está por debajo del 10%, se puede utilizar una aproximación al riesgo relativo conocida

como odds ratio. Cuando las frecuencias al comparar dos grupos se presentan en un

cuadro 2 x 2 semejante al mostrado en el cuadro 6-8 el odds ratio se puede calcular

utilizando la fórmula siguiente:

Odds ratio ad

bcϕ= = (6,8)

Ejemplo explicativo 6-10. -------------------------------------------------------------------------------- Al utilizar las frecuencias que se presentan en el cuadro 6-9 el odds ratio será igual a

15 x 185/15 x 85 = 2 775 x 1 275 = 2.18, que nos sugiere que existen 2.18 hombres

lesionados por cada mujer lesionada. El resultado no es igual al calculado con el riesgo

relativo en el Ejemplo explicativo 6-8 (de 1.88), pero es una buena aproximación

cuando el diseño de muestreo no nos permite calcularlo, y los dos resultados se

aproximarán en la medida en que el fenómeno estudiado sea más raro. -------------------

La expresión odds ratio ha sido traducida al español de diferentes formas entre las que

se pueden mencionar “razón de productos cruzados”, “razón de momios”,

“oportunidad relativa” y “razón de posibilidades” sin que se hubiera llegado a definir

un consenso.

Cómo hacerlo en Epi Info, 6-2. ------------------------------------------------------------------------- Epi Info 7 brinda varias alternativas para comparar dos grupos mediante Riesgos

relativos, Riegos atribuibles y Odds Ratio.

1. Cuando estamos interesados en una variable independiente o factor de riesgo y

una variable dependiente, ambas dicotómicas (tabla 2 x 2), utilizamos la orden

Tables” tal como se muestra a continuación. En Epi Info 7 abra el archivo

Bioestadistica_3ra y seleccione la tabla Bio3_06b†. Después de seleccionar la

† Si tiene dificultad para encontrar la tabla de datos Bio3_06b revise la sección “Cómo

hacerlo en Epi Info, 6-1” en este mismo capítulo.

Con formato: Fuente: +Cuerpo(Calibri), Negrita, Sin subrayado, Colorde fuente: Automático

Con formato: Fuente: +Cuerpo(Calibri), Negrita, Sin subrayado, Colorde fuente: Automático

Código de campo cambiado

Con formato: Normal

Page 16: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

tabla de datos haga click en “OK”. Para continuar haga click en “Tables”, en el

apartado “Statistics” de la lista de comandos. En la ventana de diálogo que se

despliega seleccione “H_ARTER” en “Exposure Variable” y “BAJO_PES” en

“Outcome Variable”. En ese momento la ventana deberá observarse como en la

Figura 6-7.

Figura 6-7. Ventana de diálogo para la taba de Hipertensión Arterial (H_ARTERIAL)

y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_06b

Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la ventana de

resultados (Figura 6-8).

1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila

(Row%) y columna (Col%).

2. Un gráfico que muestra visualmente el peso que cada celda tiene en la tabla

2 x 2.

3. Odds Ratio, según dos procedimientos, y sus intervalos de confianza (el tema

de los intervalos de confianza para estimaciones con variables cualitativas

será tratado más adelante, en el Capítulo 16.

4. Razón de Riesgos, o Riego Relativo (Risk Ratio), y sus intervalos de confianza.

5. Diferencia de Riegos (Risk Difference), o Riego Atribuible, y sus intervalos de

confianza.

6. Test estadísticos de Chi cuadrado (tema que será tratado en el Capítulo 15)

7. Cálculos de probabilidad mediante la aproximación a la distribución de la

binomial y la Prueba Exacta de Fisher.

Page 17: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Figura 6-8. Frecuencias para la taba de Hipertensión Arterial (H_ARTERIAL)

y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b

2. Cuando estamos interesados en una variable independiente o factor de riesgo

con más de dos categorías y una variable dependiente dicotómica (tabla r x 2)

también utilizamos la orden “Tables”, pero los resultados que se muestran son

un poco diferentes a los de una tabla 2 x 2 tal como se muestra a continuación.

Utilizando la tabla Bio3_06b, haga click en “Tablas” [“Tables”]. En la ventana de

diálogo “TABAQUISMO” en “Exposure Variable” y “BAJO_PESO” en “Outcome

Variable”. Al hacer click con el ratón en “OK” podrá encontrar lo siguiente en la

ventana de resultados (Figura 6-9).

1. Frecuencias en la tabla de contingencia: absolutas y porcentajes de fila

(Row%) y columna (Col%).

2. No se muestra gráfico.

3. No se muestran estadísticos de riesgo.

4. Test estadístico de Chi cuadrado (tema que será tratado en el Capítulo 15)

Page 18: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Figura 6-9. Frecuencias para la taba de Tabaquismo (TABAQUISMO)

y Bajo Peso al Nacer (BAJO_PESO) según la tabla de datos Bio3_6b

3. Cuando estamos interesados en comparar dos grupos mediante un análisis de

riesgo, y ya tenemos las frecuencias en una tabla de contingencia (como es el

caso de la Figura 6-9) utilizamos la opción “Tables (2 x 2, 2 , n)” que se encuentra

en el menú colgante de StatCalc del menú principal de Epi Info 7 (Figura 6-10). Al

hacer click observará que se abre la ventana que se muestra en la Figura 6-11.

Figura 6-10. Menú colgante que muestra las opciones de Utilidades [“Utilities”]

Page 19: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Figura 6-11. Pantalla de la opción “Tables (2 x 2, 2 x n)” de Statcalc.

Asumamos que en relación a la variable TABAQUISMO, el código “0” corresponde a

“no fumadoras”, el 1 a “fumadoras pasivas” y el código 2 a “fumadoras activas”, y que

tenemos interés en comparar el riesgo de las “fumadoras activas” con el de las “no

fumadoras”. Para realizar los cálculos solamente tecle los números que correspondan

a cada celda, tal como se aprecia en la figura 6-11. Observe que hemos ubicado los

valores del grupo 2 de TABAQUISMO (el de mayor consumo de cigarrillos) en el

renglón de expuestos, y al grupo 0 de TABAQUISMO (el que no consume cigarrillos) en

el renglón de no expuestos. Al completar los números las cuatro celdas podrá

encontrar las estimaciones de Odds Ratio y Riego Relativo (con sus respectivos

intervalos de confianza), tres cálculos de Chi Cuadrado y de la Prueba Exacta de Fisher.

Dependiendo del diseño de muestreo el usuario tendrá de decidir si estos resultados

con adecuados o no para el análisis. StatCalc no proporciona una estimación de Riesgo

Atribuible.

Para estimar el riesgo del siguiente nivel de exposición tecle los números de la

exposición 1 a TABAQUISMO en el renglón de exposición, y los de exposición 0 a

TABACO en el renglón de no expuestos. Los resultados se pueden presentar en forma

tabular, tal como se muestran en el Cuadro 6-10 donde los códigos han sido cambiados

por las categorías correspondientes. Utilizamos los valores de Riesgo Relativo o de

Odds Ratio cuando el diseño de estudio lo permita. Los intervalos de confianza serán

tratados en el Capítulo 16, pero aquí podremos comentar que los mismos se anotan en

la siguiente columna, dejando en blanco el espacio que corresponde al grupo de

referencia (las no fumadoras en este ejemplo)

Cuadro 6-10.

Bajo peso al nacer Riesgo Relativo IC 95%

Tabaquismo Si No

No 26 82 1.0

Si, pasivo 38 92 1.2 0.8 a 1.9

Si, fumadora de cigarrillos 70 92 1.8 1.2 a 2.6

------------------------------------------------------------------------------------------------------------------

Page 20: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

CAMBIO PORCENTUAL El cambio porcentual es un cociente, cuyo numerador se constituye con el cambio

entre dos momentos y el denominador es un periodo base. Su fórmula es:

P A P

A A

cambio porcentual 100 1 100x x x

x x

−= = −

(6,9)

Donde xA representa el valor en el periodo anterior y xP el valor en el periodo posterior.

El cambio porcentual permite expresar numéricamente el cambio cuantitativo

observado entre dos momentos, tomando como referencia el valor observado en el

periodo anterior.

Ejemplo explicativo 6-10. -------------------------------------------------------------------------------- Los datos que se presentan en el Cuadro 6-11 corresponden al número de casos de

hepatitis viral notificados a la Secretaría de Salud; la primera columna corresponde al

año de notificación y la segunda al número de casos notificados. En la tercera columna

se señala el cambio porcentual del número de notificaciones de cada año

comparándolo con el anterior.

Cuadro 6-11. Casos de hepatitis viral notificadas en México, 1994-1997.

Año Casos

reportados

Cambio Porcentual

1994 16 918

1995 7 083 (7,083-16,918)/16,918*100 =-58.13%

1996 14 181 (14,181-7,083)/ 7,083*100 = 100.21%

1997 26 824 (26,824-14,181)/ 14,181*100 = 89.15%

Fuente: Epidemiología, 1996;13(2):3. Epidemiología, 1997;14(2):4.

Epidemiología, 1998;15(2):4.

Si esto se quisiera expresar en palabras, se diría: en 1994 se reportaron 16 918 casos;

para el año siguiente (1995) el número de casos notificados disminuyó en 58.13%; para

1996 se observó un incremento de 100.21% en relación con 1995; y para 1997

nuevamente se observó un incremento, pero sólo de 89.15% en relación con el año

anterior. -----------------------------------------------------------------------------------------------------

DATOS AGRUPADOS Los datos de variables cuantitativas pueden presentarse en forma tabular mediante un

arreglo ordenado donde los valores se agrupan en intervalos de clase que señalan los

valores que deben incluirse en la tabulación, y son definidos por sus límites inferior y

superior de clase. Los intervalos de clase no deben traslaparse y son consecutivos, por

lo que el límite superior de clase de un intervalo es el límite inferior de clase del

siguiente. Para la elaboración de un arreglo ordenado se procede de la siguiente

manera:

1. Definir el número de intervalos de clase. Se recomienda que el número de

intervalos no sea menor de 5, ni mayor de 15. Generalmente, el número de

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Código de campo cambiado

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejemplo, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Ejem. normal, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Con formato: Nor 1, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Page 21: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

observaciones determina el de intervalos: mientras más observaciones más

intervalos. La siguiente fórmula es útil para definirlos

1 3.322(log )n

k = + (6,10)

Donde k corresponde al número de intervalos de clase y n es el número de

observaciones que se quieren agrupar. El resultado es una orientación y el

investigador podrá cambiarlo según convenga a su presentación.

2. Definir la amplitud de cada intervalo de clase. Generalmente todos los intervalos

que se presentan tienen la misma amplitud, aunque no es obligatorio sea así.

Algunas tabulaciones tienen intervalos que muestran amplitudes de diferente

magnitud. Por ejemplo, en el campo de la salud los menores de 10 años suelen

agruparse en menores de 1 año, de 1 a 4 años y de 5 a 10 años. Cuando se desea

que todos los intervalos tengan la misma amplitud, éstos se determinan

dividiendo el rango (valor superior menos valor inferior) entre k, o número de

intervalos de clase. El resultado debe ser tomado como una aproximación y

deberá modificarse en beneficio de la tabulación de datos.

3. Contar el número de observaciones cuyos valores son incluidos en cada intervalo

de clase.

Un cuadro que presenta los intervalos de clase y la frecuencia de observaciones que

corresponde a cada intervalo es conocido como distribución de frecuencia. A partir de

una distribución de frecuencia podemos obtener una distribución de frecuencia acumulada, una distribución de frecuencia relativa o una distribución de frecuencia relativa acumulada.

Ejemplo explicativo 6-11. -------------------------------------------------------------------------------- Cuando el interés se encuentra en describir datos cuantitativos, tales como los

mostrados en el cuadro 6-12 referentes a las tallas de un grupo de niños, podemos

proceder de la siguiente manera: primero se decide cuántos intervalos de clase hemos

de utilizar utilizando la fórmula 6,10, mediante la cual se obtiene k = 1+3.322(log(100))

= 7.644. Optamos por redondear el número de intervalos de clase a siete (pero

también podríamos redondearlo a ocho). A continuación se calcula de qué amplitud

será cada intervalo de clase dividiendo el rango 156-107=49 entre 7 resultando

49/7=7. Para definir los límites inferiores de clase empezamos con 107 al primero, y a

los siguientes les sumamos 7 hasta que superemos el valor máximo de nuestra serie de

datos. El límite superior de cada intervalo de clase debe ser menor al límite inferior de

siguiente intervalo, tal como se muestra en el Cuadro 6-12. A continuación tabulamos

los datos del Cuadro 6-11 y los registramos en el Cuadro 6-12.

Con formato: Nor 1, Ajustar espacioentre texto latino y asiático, Ajustarespacio entre texto asiático y números

Con formato: Justificado,Interlineado: Mínimo 12 pto, Ajustarespacio entre texto latino y asiático,Ajustar espacio entre texto asiático ynúmeros

Page 22: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuadro 6-11. Tallas de un grupo de 100 niños.

i talla i talla i talla i talla i talla

1 107 21 122 41 128 61 133 81 139

2 107 22 123 42 128 62 134 82 139

3 114 23 123 43 128 63 134 83 140

4 116 24 123 44 128 64 134 84 140

5 116 25 123 45 128 65 134 85 140

6 117 26 124 46 129 66 134 86 140

7 117 27 124 47 129 67 135 87 141

8 117 28 124 48 129 68 135 88 142

9 118 29 124 49 129 69 135 89 143

10 119 30 124 50 129 70 136 90 144

11 119 31 125 51 130 71 136 91 146

12 120 32 126 52 130 72 136 92 146

13 120 33 126 53 131 73 136 93 147

14 121 34 126 54 131 74 136 94 147

15 121 35 126 55 131 75 137 95 148

16 121 36 126 56 131 76 137 96 148

17 122 37 127 57 132 77 137 97 148

18 122 38 127 58 132 78 137 98 149

19 122 39 127 59 132 79 138 99 153

20 122 40 128 60 133 80 138 100 156

Para describir mediante frecuencias relativas la serie de datos, solo falta calcular los

porcentajes correspondientes a cada intervalo de clase.

Cuadro 6-12. Distribución de tallas de un grupo de 100 niños.

Intervalo de clase

Límite inferior Límite superior Frecuencia Porcentaje

107 113 2 2.0

114 120 11 11.0

121 127 26 26.0

128 134 27 27.0

135 141 21 21.0

142 148 10 10.0

149 155 2 2.0

156 160 1 1.0

100 100.0

Cómo hacerlo en Epi Info, 6-3. ------------------------------------------------------------------------- En Epi Info para Windows abra el archivo Bioestadistica_3ra y seleccione la tabla

Bio3_06c. Después de seleccionar la tabla de datos haga click en “OK”.

Antes de agrupar los datos primero tiene que definir una nueva variable. Para

hacerlo haga click con el mouse en “Define” (en el bloque de “Variables” de la ventana

de comandos). Cuando aparezca la ventana de diálogo escribimos el nombre de la

variable a definir (“GRUPOS”), y marcamos la opción estándar, tal como se aprecia en

la Figura 6-12. Para ejecutar la orden sólo hacemos click con el mouse en “OK”.

Con formato: Ejemplo

Con formato: Normal sangría

Page 23: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Figura 6-12. Venta de opciones de la orden “Define”.

Continuamos agrupando los datos de la variable talla en la nueva variable (“GRUPOS”)

que hemos definido. Para hacerlo haga click con el mouse en “Recode” (también en el

bloque de “Variables” de la ventana de comandos. En la ventana de diálogo que se

muestra en la Figura 6-14A primero defina la variable de origen, tal como se muestra

en la ventanita “From”. Luego defina la variable destino, como se muestra en la

ventanita “To”. Por último, defina los límites inferiores y superiores de cada intervalo

de clase, así como el código de cada agrupación (evite utilizar el 0 en el valor

recodificado). Para cambiar de celda al definir estos tres valores utilice el mouse

(haciendo “click” en el espacio correspondiente. Al terminar de recodificar la ventana

de diálogo deberá verse como la que se muestra en la Figura 6-14B. Para ejecutar la

orden sólo haga click con el mouse en ““OK”.

A B

Figura 6-12. Ventana de la orden Recodificar [“Recode”]

Para obtener las frecuencias agrupadas sólo haga click en Frequencies” (ver la sección

“Cómo hacerlo en Epi Info, 6-1” al principio de este capítulo), seleccione “GRUPOS” en

“Frequency of” y haga click con el mouse en ““OK” para ejecutar la orden. ----------------

EJERCICIOS

Ejercicio A Observe el cuadro 6-13. Los datos que contiene se refieren a las características de 40

niños recién nacidos y sus madres. Los datos están en la tabla Ejer_06a del archivo

Bioestadistica_3ra.

Con formato: Normal centro

Con formato: Normal centro

Page 24: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuadro 6-13. Características de 40 niños recién nacidos.

i

(identificación

progresiva)

Bajo peso del

niño al nacer

Sexo del

recién nacido

Exposición de la

madre al humo de

tabaco durante el

embarazo

Consumo de

alcohol por la

madre durante

el embarazo

1 no femenino fumadora pasiva no

2 no femenino fumadora pasiva si

3 si femenino fumadora activa no

4 no masculino fumadora pasiva no

5 no femenino fumadora pasiva no

6 no masculino fumadora activa no

7 si femenino fumadora activa no

8 si femenino fumadora pasiva no

9 no masculino fumadora pasiva si

10 no masculino no no

11 no femenino fumadora activa no

12 si femenino fumadora pasiva si

13 no femenino fumadora activa si

14 no masculino no no

15 no femenino no no

16 si masculino fumadora pasiva si

17 no femenino no no

18 no femenino fumadora pasiva si

19 no masculino fumadora activa si

20 no femenino fumadora activa si

21 no masculino no si

22 si masculino fumadora activa si

23 no femenino fumadora pasiva no

24 no masculino fumadora activa no

25 no femenino no no

26 no masculino no si

27 no masculino fumadora pasiva no

28 si masculino fumadora activa no

29 si masculino fumadora activa no

30 no masculino fumadora activa no

31 no masculino fumadora activa no

32 no femenino fumadora pasiva si

33 si femenino no no

34 no femenino fumadora activa si

35 no masculino no no

36 no masculino no si

37 no masculino fumadora activa no

38 no femenino fumadora pasiva si

39 no femenino fumadora activa si

40 si femenino no si

Page 25: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Ejercicio A1.

Suponga que los datos fueron registrados durante todo un año de estancia en una

comunidad del país y le interesa presentarlos ante sus colegas. A partir de esos datos

llene el Cuadro 6-14 considerando los cuarenta registros como el total.

Cuadro 5-14.

Variables Frecuencia Porcentaje

Bajo peso al nacer

Si

No

Sexo del RN

Femenino

Masculino

Exposición al tabaco

Fumadora activa

Fumadora pasiva

No

Consumo de alcohol

Si

No

Ejercicio A2.

Al estar preparando su presentación le surge el interés de explorar la relación que

existe entre tres de las variables (sexo del recién nacido, tabaco y alcohol) con el bajo

peso. Para poder hacerlo presenta los datos en el siguiente Cuadro 6-15.

Cuadro 6-15.

Variables Niños con

bajo peso

% (de

renglón)

Niños sin

bajo peso

% (de

renglón)

Sexo del RN

Femenino

Masculino

Exposición al tabaco

Fumadora activa

Pasiva

No

Consumo de alcohol

Si

No

Ejercicio A3.

A partir del cuadro 6-15 Ud. decide hacer varias comparaciones para identificar las

características asociadas con el bajo peso al nacer. Para hacer las comparaciones llene

el Cuadro 6-16 con los valores de Riesgo Atribuible y Riesgo Relativo considerando las

siguientes categorías como los valores de referencia: sexo masculino, no exposición al

tabaco durante el embarazo y no consumo del alcohol durante el embarazo.

Page 26: SEGUNDA PARTE ESTADÍSTICA DESCRIPTIVAsaludpublica.cucs.udg.mx/Cursos/Bioestadistica/Capitulo 06, 2013.pdf · investigación encuentra que en una población de 4 550 habitantes se

Cuadro 6-16.

Variables Riesgo Atribuible Riesgo Relativo

Sexo del RN

Femenino

Masculino (grupo de referencia) 0.0 1.0

Exposición al tabaco

Fumadora activa

Fumadora pasiva

No (grupo de referencia) 0.0 1.0

Consumo de alcohol

Si

No (grupo de referencia) 0.0 1.0

Ejercicio B El administrador de una clínica de atención médica ha registrado los números de

consultas que se presentan en el Cuadro 6-17. A partir de esos datos ayúdele a calcular

los cambios porcentuales que la clínica ha registrado durante los años señalados, y

preséntelos en el cuadro 6-17.

Cuadro 6-17.

Año Casos

reportados

Cambio Porcentual

1999 10 785

2000 9 279

2001 10 642

2002 15 193

REFERENCIAS Daniel WW: Bioestadística. Base para el análisis en las ciencias de la salud, 3ra.

edición. México: Limusa, Noriega Editores, 1987.

Kleinbaum DG, Kupper LL, Morgenstern H: Epidemiologic Research. 1ra. edición. Van

Nostrand Reinhold. New York, 1982.

Koepsell T, Weill N, Swanson M: Apuntes del curso de Epidemiología 512.

Washington, Universidad de Washington, Seattle, 1991.

Martín-Moreno JM, Banegas JR. Sobre la traducción del término inglés odds ratio

como oportunidad relativa. Salud Pública de México 1997;39:72-74.

Tapia JA, Nieto FJ. Razón de posibilidades: una propuesta de traducción de la

expresión odds ratio. Salud Pública de México 1993;35:419-424.

Tapia-Granados JA. Posibilidades, oportunidades, momios: un comentario sobre la

traducción del término odds. Salud Pública de México 1997;39:69-71.