EPIDEMIOLOGIA ANALITICA

65
EPIDEMIOLOGIA ANALITICA Estudios de cohortes Introducción A lo largo de su desarrollo, la epidemiología se ha preocupado de dos objetivos fundamentales: Probar causalidad e, Identificar riesgo. La preeminencia de cada uno de estos objetivos ha estado determinada por el modelo conceptual de salud-enfermedad imperante. Es así como la causalidad encuentra su mayor protagonismo en las relaciones mórbidas, entre agente y huésped, formuladas en los modelos de las enfermedades infecciosas. El énfasis en el riesgo, en cambio, se desarrolla fuertemente con relación al concepto de enfermedades crónicas. El logro de los dos objetivos señalados ha obligado a la epidemiología a formular diseños de investigación de distinto grado de complejidad. Entre estos diseños el estudio experimental es reconocido como el único capaz de probar causalidad. En cambio una buena aproximación al riesgo puede obtenerse con los estudios observacionales de casos y controles y, más rigurosamente desde el punto de vista conceptual, con los estudios de cohorte.

description

Epidemiologia

Transcript of EPIDEMIOLOGIA ANALITICA

Page 1: EPIDEMIOLOGIA ANALITICA

EPIDEMIOLOGIA ANALITICA

Estudios de cohortesIntroducciónA lo largo de su desarrollo, la epidemiología se ha preocupado de dos objetivos fundamentales:

Probar causalidad e, Identificar riesgo.

La preeminencia de cada uno de estos objetivos ha estado determinada por el modelo conceptual de salud-enfermedad imperante. Es así como la causalidad encuentra su mayor protagonismo en las relaciones mórbidas, entre agente y huésped, formuladas en los modelos de las enfermedades infecciosas.

El énfasis en el riesgo, en cambio, se desarrolla fuertemente con relación al concepto de enfermedades crónicas.

El logro de los dos objetivos señalados ha obligado a la epidemiología a formular diseños de investigación de distinto grado de complejidad. Entre estos diseños el estudio experimental es reconocido como el único capaz de probar causalidad.

En cambio una buena aproximación al riesgo puede obtenerse con los estudios observacionales de casos y controles y, más rigurosamente desde el punto de vista conceptual, con los estudios de cohorte.

Los estudios de cohorte son planteados una vez que se dispone de información acerca de eventuales factores asociados al daño a investigar. Por lo tanto, previamente deben haberse recorrido las etapas propias del ciclo de investigación epidemiológica.

Definición:Los estudios de cohorte 1 consisten en el seguimiento de

Page 2: EPIDEMIOLOGIA ANALITICA

una o más cohortes de individuos sanos que presenta diferentes grados de exposición a un factor de riesgo en quienes se mide la aparición de la enfermedad o condición en estudio.

Estos diseños de investigación se clasifican, según los criterios taxonómicos clásicos, como estudios observacionales, analíticos y longitudinales prospectivos.

La categoría observacional se refiere a la imposibilidad que el investigador tiene de manipular la(s) variable(s) independiente(s), lo cual los distingue de los estudios experimentales. Por tratarse de estudios cuyos resultados permiten un análisis más sofisticado que el de los estudios descriptivos, son considerados estudios analíticos. Por definición, deben permitir la verificación de hipótesis de trabajo.

Finalmente, los estudios de cohorte se basan en un seguimiento en el tiempo de uno o más grupos humanos que difieren entre sí por la presencia de una o más variable(s) independiente(s).

Por esta razón se les denominan estudios prospectivos, concepto incorpora implícitamente el carácter longitudinal de los mismos. Otros estudios longitudinales son los de casos y controles, sin embargo en éstos el sentido de la observación es retrospectivo.

Diseño Los estudios de cohorte tienen un diseño o formato fundamental. Se trata del seguimiento de individuos caracterizados por estar libres del daño en estudio al inicio de la observación.

En estos individuos se observa, a medida que pasa el tiempo, la aparición de casos de enfermedad (outcome) a lo largo del tiempo según posean o no estos un atributo (variable independiente o exposición) que se cree asociado al desenlace (outcome) en estudio.

Sólo en contadas ocasiones la constitución de los grupos considera la exposición como un suceso dicotómico (sí/no o

Page 3: EPIDEMIOLOGIA ANALITICA

expuesto/no-expuesto). Por su estructura y complejidad el investigador aprovecha este diseño para evaluar con mayor detalle el resultado de una exposición, lo que supera las limitaciones de exposiciones dicotómicas del tipo Expuesto/no expuesto.

Lo habitual es que el estudio permita la subdivisión de la cohorte expuesta según diferentes niveles de exposición (ejemplo de exposición : tabaquismo, el que puede ser categorizado en diferentes niveles de consumo o tiempo de exposición; exposición laboral a elementos tóxicos, que pueden categorizarse en magnitud y tiempo de exposición)

Para estos efectos los individuos son agrupados de tal manera que los grupos tengan el máximo de características similares entre y puedan ser comparables y así difieran, idealmente, sólo en la variable independiente en estudio. (Figura 1).

Figura 1. Esquema básico de estudios de cohorte

Lo habitual en un estudio de cohorte es que el investigador sea contemporáneo con el inicio del seguimiento de los grupos, vale decir, asista a la agrupación de los individuos sanos. En este caso se acuña el término de estudio concurrente.

Por el contrario, si el investigador no participa en forma contemporánea de la formación de las cohortes y ésta se formó en el pasado pero es susceptible de ser seguida en el tiempo, se habla de un estudio no concurrente (Historical cohort studies) (figura 2).

Figura 2. Esquemas de estudios prospectivos no-concurrente y concurrente

Page 4: EPIDEMIOLOGIA ANALITICA

Los elementos básicos de un estudio de cohorte pueden resumirse en el siguiente listado:

Formulación clara de una hipótesis de trabajo a investigar

Identificación de los grupos a ser estudiados Definición de la exposición y de la forma en que ésta

será medida Definición y medición de las posibles variables

confundentes involucradas Definición de la(s) variable(s) dependiente(s)

(outcomes), así como de la forma en que será(n) medida(s)

Análisis de datos Interpretación de resultados

Estructura adoptada por los estudios de cohortes Los estudios de cohorte pueden adoptar algunas variaciones en su diseño básico, dependiendo del número de cohortes involucradas y su origen. Se reconocen en general las siguientes variaciones:

1. Cohorte única (antes y después): el ejemplo más citado para ilustrar esta variante lo constituye el estudio de incidencia (casos nuevos) de leucemia linfática aguda en la población Japonesa residente en Hiroshima después de la explosión nuclear. La frecuencia de casos nuevos se comparó con la existente en el mismo grupo de personas antes de ocurrida la explosión y posterior exposición masiva a

Page 5: EPIDEMIOLOGIA ANALITICA

radiación. Como se advierte en el ejemplo, la cohorte única corresponde a un grupo de individuos que comparten (o compartieron) una misma condición (exposición) en los cuales se mide la presencia de una variable dependiente predefinida (outcome). En este caso se compara la incidencia (casos nuevos) de la enfermedad en los mismos individuos antes y después de ocurrida la exposición a la variable independiente.

2. Dos cohortes: corresponde al formato clásico ya descrito en el cual se seleccionan dos grupos de individuos sanos que sólo difieren en que uno presenta el factor de exposición (cohorte expuesta) y el otro no lo presenta (cohorte no expuesta).

3. Cohortes múltiples: en este caso se trata de generar múltiples grupos, de individuos sanos, con diferentes grados de exposición al factor de riesgo. En este caso se compara la incidencia de enfermedad de cada grupo en relación a una cohorte de control, de preferencia la de menor o con nula exposición al factor de riesgo. Son útiles en la evaluación de relaciones de dosis-respuesta.

4. Estudio de casos y controles anidados (nested case control studies). Los estudios de cohorte permiten la identificación de un pool de sujetos enfermos concluido el periodo de observación o seguimiento (follow- up). El investigador conoce detalladamente las características más relevantes de este grupo de personas en cuanto a eventuales exposiciones y otras covariables. Aprovechando este hecho, es posible constituir un esquema de diseño de casos y controles seleccionando aleatoriamente controles entre el grupo de sujetos no afectados después del periodo de seguimiento (Figura 3). Tiene especial aplicación en aquellas situaciones en que los procedimientos diagnósticos para detectar casos son de elevado costo, en particular en el estudio de enfermedades ocupacionales. Este diseño híbrido contribuye al control de sesgos, particularmente los vinculados con medición,

Page 6: EPIDEMIOLOGIA ANALITICA

problema frecuente de los estudios de caso y controles.

Figura 3. Esquema de un estudio de casos y controles anidados (nested case control studies)

Principales usos de los estudios de cohorte

Ensayar hipótesis de causalidad y de riesgo: los estudios de cohorte son, entre los diseños observacionales, los que proveen la más rigurosa información en favor de la causalidad y del riesgo. Como ya se ha mencionado, la certeza absoluta del proceso causal sólo es capaz de proporcionarla el diseño experimental. Tienen la ventaja adicional de seguir el mismo sentido de la lógica del pensamiento clínico (la exposición precede al desenlace).

Medir la incidencia de una enfermedad o condición: uno de los productos de mayor interés en un estudio de cohorte es la obtención de tasas de incidencia de la enfermedad o condición en estudio. La tasa de incidencia de una enfermedad corresponde al total de casos nuevos de enfermedad que se presentan en un grupo de individuos en un período de tiempo determinado. Dado que una condición indispensable en estos diseños es que las cohortes estén constituidas por individuos sanos, en la práctica un estudio de esta naturaleza permite medir tres tipos de tasas de incidencia : tasa de incidencia de la enfermedad para la cohorte expuesta al factor de riesgo, para la cohorte no expuesta y para ambos grupos en conjunto.

Page 7: EPIDEMIOLOGIA ANALITICA

Permiten la cuantificación del riesgo: la relación entre tasa de incidencia de sujetos expuestos con relación a la de los no expuestos da origen al llamado riego relativo que permite establecer la magnitud de riesgo asociado a la exposición analizada.

Estudiar la historia natural de la enfermedad: los estudios de cohorte permiten realizar un seguimiento de individuos sanos con criterios y métodos diagnósticos estandarizados. De ésta manera es posible reconocer precozmente los elementos característicos de una enfermedad, así como también factores asociados a sus etapas más tempranas.

Explorar el efecto de exposiciones de baja frecuencia poblacional: en el campo de enfermedades ocupacionales, es posible observar el comportamiento de cohortes de sujetas sometidos a exposiciones de rara ocurrencia en la población general.

Estudiar mas de una consecuencia para la salud derivado de exposiciones: en un estudio de cohorte el investigador puede definir mas de un outcome de interés. Por ejemplo, en la determinación del efecto de un factor de riesgo se puede emplear medidas de incidencia o de mortalidad. En estudios prospectivos destinados a evaluar el rol de parámetros antropométricos al nacer y asma bronquial, pueden utilizarse diferentes formas (fenotipos) para evaluar dicho outcome (sibilancias, sibilancias nocturnas, valores espirométricos o combinaciones entre éstos).

Algunas limitaciones propias de estos diseños

No prueban necesariamente causalidad (recordar que la exposición no es asignada aleatoriamente en la(s) cohorte(s) estudiadas).

Pueden requerir de un largo período de seguimiento de la(s) cohorte(s). Esto conspira contra la integridad del estudio pues durante el seguimiento individuos pueden perderse y/o puede alterarse su condición de exposición (el sujeto que no fumaba al inicio del seguimiento, comenzó a hacerlo posteriormente).

Page 8: EPIDEMIOLOGIA ANALITICA

Tienen utilidad limitada en el estudio de enfermedades de baja prevalencia o de prolongado período de incubación pues el seguimiento debe ser más prolongado.

Son generalmente estudios de mayor complejidad (en cuanto a diseño, costo y análisis) comparados con otros estudios analíticos.

Pueden ser negativamente afectados por la pérdida de sujetos en el seguimiento. Además de la reducción en la potencia del estudio, si la pérdida de sujetos afecta heterogéneamente a las cohortes, puede generarse sesgo de selección.

Pueden ser afectados por otras exposiciones, eventualmente no consideradas en el diseño que puedan influir en un mayor o menor riesgo de presentación del desenlace u outcome.

1. Palabra derivada del Latín, referida a una de las 10 divisiones de las antiguas legiones Romanas.| Volver al texto |

Estudios de cohortes IIMedidas a las que dan origen los estudios de cohorteUn estudio de cohorte permite obtener información sobre incidencia y a partir de ésta, indicadores de riesgos absoluto y relativo.

Tipos de cohorteSe denomina cohorte cerrada a aquella cuyos miembros son reclutados en el mismo periodo de tiempo y a la cual no ingresan personas durante el periodo de seguimiento. En consecuencia, en esta modalidad el total de miembros de la cohorte tiene períodos de seguimiento que comienzan al mismo tiempo. Cohorte abierta o dinámica es aquella en la cual sus integrantes pueden ingresar a seguimiento en diferente momento durante el periodo que este dure. Por tanto, los

Page 9: EPIDEMIOLOGIA ANALITICA

miembros de esta cohorte pueden tener tiempos de exposición heterogéneos.

IncidenciaEl seguimiento de individuos sanos por un período determinado de tiempo permite medir el n�mero de casos de una enfermedad que aparecen en dicho período. Esta cifra constituye la tasa de incidencia de la enfermedad en estudio que puede ser medida para la cohorte expuesta (Ti exp), la no expuesta (Ti noexp) y para ambas en conjunto (Ti.).

La incidencia acumulada se calcula considerando todos los sujetos que presentaron el outcome en estudio independientemente del momento en el cual lo presentaron (cumulative risk). Su cálculo aplica cuando se trate de una cohorte cerrada.

Para el caso particular de un diseño de cohorte en que se permita eliminar o ingresar individuos a las cohortes después de haber iniciado el seguimiento (cohortes abiertas) seguimiento), se prefiere el término densidad de incidencia. (incidence rate)

La densidad de incidencia suma todos los tiempos con que efectivamente contribuyeron los individuos estudiados. El indicador se construye dividiendo el total de enfermos encontrados a lo largo del estudio por el total del tiempo de seguimiento (tiempo -persona) y amplificando seg�n corresponda.

RiesgoEl cálculo de incidencia de la enfermedad en expuestos y no expuestos permite evaluar riesgo asociado a la condición de exposición. La relación matemática que se establezca entre estas dos medidas permite el cálculo de a lo menos seis expresiones de riesgo:

Riesgo Relativo (en la literatura anglosajona el término Risk Ratio corresponde al cálculo utilizando incidencia acumulada)

Page 10: EPIDEMIOLOGIA ANALITICA

El término Rate ratio se utiliza cuando se utiliza densidad de incidencia en el cálculo,

Riesgo Atribuible, Riesgo Atribuible Porcentual (fracción etiológica) Riesgo Atribuible Poblacional. Riesgo Atribuible Poblacional Porcentual

Para explicar el sentido de cada una de estas medidas se puede recurrir a la tabla tetracórica o de doble entrada, en este caso, utilizando incidencia acumulada como medida de riesgo:

  enfermos sanos  expuestos A B A+B

no expuestos C D C+DA+C B+D A+B+C+D

Observe que en este diseño el sentido de lectura de esta tabla de 2 x 2 es horizontal (filas), a diferencia del diseño de casos y controles, que en este caso sería vertical (columnas).

Se debe notar que a diferencia de los estudios de caso y controles, el investigador fija el total de ambas filas, (A + B) y (C + D) respectivamente)

Celda A: expuestos que desarrollan la enfermedad (outcome positivo)

Celda B: expuestos que no desarrollan la enfermedad (outcome negativo)

Celda C: no expuestos que desarrollan la enfermedad (outcome positivo)

Celda D: no expuestos que no desarrollan la enfermedad (outcome negativo)

- Tasa de incidencia en expuestos: Casos nuevos detectados en el seguimiento en la cohorte de personas expuestas.

Page 11: EPIDEMIOLOGIA ANALITICA

T I Exp = A / A + B

- Tasa de incidencia en no expuestos. Corresponde al cuociente entre el total de casos detectado en relación en la cohorte no expuesta a. factor.

T I No Exp = C / C + D

- Riesgo Relativo: Es el cuociente entre la tasa de incidencia de la enfermedad en expuestos y la incidencia en no expuestos. Permite conocer la magnitud de riesgo o protección asociada a la exposición estudiada. Carece de unidades de medida.

RR=  (A /A+B)

          (C /C+D )

Cálculo del Intervalo de confianza para el valor del Riesgo Relativo:

- Riesgo Atribuible (RA): Es la diferencia aritmética entre la incidencia de la enfermedad en expuestos y la incidencia en no expuestos. Expresa la magnitud de la tasa de incidencia en los expuestos que es atribuible sólo al factor en estudio. Tiene unidades de medidas.

RA = ( A / A +B ) - ( C / C + D )

- Riesgo Atribuible Porcentual o fracción etiológica:(RA%): es el cuociente entre el Riesgo Atribuible y la incidencia de la enfermedad en expuestos, amplificado por 100. Expresa el porcentaje que representa el Riesgo Atribuible respecto de la incidencia de enfermedad en expuestos.

             RA% = (( A / A+B ) - ( C / C+D )) X 100

                                          ( A / A+B )

Page 12: EPIDEMIOLOGIA ANALITICA

O bien:

RA% = RA / ( A/ A+B)

- Riesgo Atribuible Poblacional (RAP): es la diferencia aritmética entre la incidencia de la enfermedad en la población general y la incidencia en la población no expuesta al factor de riesgo. Expresa el valor teórico de incidencia imputable al factor de riesgo en la población.

R.A.P.= ( A+C / A+B+C+D ) - ( C / C+D )

- Riesgo Atribuible Poblacional Porcentual: Es el cuociente entre el Riesgo Atribuible Poblacional (RAP) y la incidencia de la enfermedad en la población total, amplificado por 100. Expresa el porcentaje que representa el Riesgo Atribuible Poblacional respecto de la incidencia de la enfermedad en el total de individuos.

          RAP%= ( A + C / A+B+C+D ) - ( C / C+D ) X 100

                                        A+C / A+B+C+D

Ejemplo:Un Estudio de cohorte diseñado para estudiar en 200 sujetos el riesgo de desarrollo de cáncer del pulmón seg�n el hábito de fumar de ellos, arrojó los siguientes resultados después del seguimiento:

  cáncer sanos  Exposición + 20 80 100Exposición - 5 95 100  25 175 200

De acuerdo a estos valores se obtienen los siguientes resultados:

• Riesgo Relativo= 20/100 = 4                  

       5/100

Page 13: EPIDEMIOLOGIA ANALITICA

Observe una salida del programa Epi-Info con los valores de intervalo de confianza calculados con un 95% de confianza.

• Riesgo atribuible = (20/100) - (5/100)                             = 15 casos por cada 100 personas

• Riesgo Atribuible porcentual (RA%)

                          RA% = (20/100) - (5/100) = 0,75 (75%)

                  20/100

• Riesgo Atribuible Poblacional (RAP)

RA = (25/200) - (5/100) = 0,075

• Riesgo atribuible poblacional porcentual (RAP%)

                          RAP% = (25/200) - (5/100) = 0,60 (60%)

                 (25/200)

Observe una salida del programa Epi-Info calculando los valores anteriores.

Page 14: EPIDEMIOLOGIA ANALITICA

Si se utiliza en el seguimiento de los individuos el concepto de tiempo-persona, se puede calcular densidad de incidencia para los grupos expuestos y no expuestos respectivamente. La estructura de la tabla tetracórica adopta una forma diferente a la del caso de incidencia acumulada.

  Casos Total tiempo-persona seguimiento

Exposición + A T1Exposición - B T2

En este caso el cálculo de densidad de incidencia corresponde a:

Densidad de incidencia en expuestos = a/ T1Densidad de incidencia en no expuestos = b/ T2

Rate Ratio = a/T1              

         b/T2  

Otra forma de presentar los resultados de un estudio de cohortes es mediante la utilización de la razón de mortalidad estandarizada (RME).

La RME compara el n�mero de casos o de muertes por enfermedad con una población de referencia o estándar y representa la razón entre el n�mero de casos observados respecto del n�mero de casos esperados de tener la población estudiada el mismo riesgo de morbilidad o mortalidad de la población de referencia.

A modo de ejemplo, en el siguiente hipotético ejemplo se tiene la información acerca de las tasas de incidencia, medidas en tiempo-persona de trabajadores expuestos a un determinado agente ambiental, seg�n tres categorías de edad:

Tabla 1. Casos observados después de un periodo t de seguimiento en trabajadores varones, seg�n grupo de edad

Page 15: EPIDEMIOLOGIA ANALITICA

Grupos de edad

Muertes observadas

Años-persona de seguimiento

30 a 39 6 10,00040 a 49 12 10,00050 a 59 35 10,000Total 53  

Si se utiliza una población de referencia, por ejemplo, proveniente de la población general, de la cual se conoce las tasas de incidencia, es posible estimar el n�mero esperado de muertes en la población estudiada (Tabla 2)

Tabla 2. Casos esperados de enfermedad de acuerdo a tasas de incidencia de población de referencia, seg�n grupo de edad

Grupos de edad

Muertes observadas

(A)

Años-persona de seguimiento

(B)

Tasa mortalidad poblaciónref ( 10 )

(C)

Muertes esperadas

(C x B)/1000

30 a 39 6 10,000 0,5 540 a 49 12 10,000 1,0 1050 a 59 35 10,000 2,5 25Total 53     40

Para este ejemplo, la RME corresponderá a:

              RME = 53 x 100 = 132,5

    40

En este caso, en comparación con la población de referencia, la población estudiada presenta un exceso de riesgo de 32,5%, controlado el efecto de la edad en esta comparación

Estudios de Casos y controles

Page 16: EPIDEMIOLOGIA ANALITICA

Diseños de investigación casos y controlesSinónimos: estudios retrospectivos, casos y controles, casos y testigos, casos no casos.

Este tipo de diseño de investigación epidemiológica se inscribe dentro de la vertiente epidemiológica analítica, vale decir, plantean una hipótesis de estudio explícita que el investigador desea poner a prueba.

Se trata de un diseño observacional, pasivo en cuanto a la participación del investigador, el que ordena la información habiendo ya ocurrido los hechos que le dieron origen.

Se requiere previamente que se hayan cumplido los pasos propios de una investigación epidemiológica. Esto es; a la luz de los hallazgos de la descripción epidemiológica deberían haber surgido hipótesis de trabajo. Es posible también que un estudio descriptivo previo permita caracterizar adecuadamente el problema de acuerdo a las variables epidemiológicas clásicas (tiempo, lugar y persona). La(s) hipótesis de trabajo debe ser claramente definida en las etapas tempranas del diseño del estudio.Los estudio de casos y controles son de máxima utilidad para el estudio de enfermedades de baja frecuencia poblacional y entregan como medida epidemiológica específica un estimador de riesgo 1 , denominado odds ratio o razón de chances.

Estructura básica de los estudios de casos y controles Este esquema analítico se inicia a partir de un grupo, denominado "casos", constituido por un grupo de sujetos (u otras entidades) caracterizados por presentar el desenlace, enfermedad o variable dependiente que se desea estudiar. Se entiende que el carácter probatorio de esta condición debe ser de la máxima rigurosidad, utilizándose para tales efectos, diferentes métodos diagnósticos, que pueden ir desde mediciones de cierta simplicidad (peso, talla, presión arterial,), hasta sofisticados exámenes o tests diagnósticos.El sujeto "caso" puede ser un individuo portador de una enfermedad o incluso una persona que haya fallecido por tal condición. Si se trata de sujetos fallecidos, se pueden

Page 17: EPIDEMIOLOGIA ANALITICA

utilizar como fuentes de información la mejor evidencia clínica o anatomo-patológica de la enfermedad en estudio.

Entre estos sujetos "casos" el investigador explora el antecedente de presencia (o exposición) en el pasado a una o más variables relacionadas con la variable dependiente en estudio.

Este diseño busca determinar la frecuencia de exposición a la(s) variable(s) independientes(s) entre individuos afectados, la que se comparará con similar frecuencia entre un grupo de individuos libres de la presencia de enfermedad, grupo que denominaremos "controles" (Figura 1)

Figura 1. Estructura básica de un estudio de casos y controles

La medición retrospectiva de la exposición expone a estos estudios a ocurrencia de sesgos de diferente naturaleza (Ver error y sesgo).

Si la variable independiente está relacionada con la enfermedad, esto podría evaluarse mediante la siguiente formulación de hipótesis:

H0: Tasa Exposición en casos = Tasa Exposición en controles H1: Tasa Exposición en casos Tasa Exposición en controles

Relaciones de temporalidad entre las variables estudiadas El sentido de la evaluación a la exposición entre los casos y los controles es retrospectivo 2 . Esto significa indagar entre los sujetos por el antecedente de exposición previo a la aparición del desenlace. El establecimiento de un orden

Page 18: EPIDEMIOLOGIA ANALITICA

cronológico entre la presencia de eventuales factores causales y desenlace pareciera ser intuitivamente sencillo mediante esta aproximación metodológica, sin embargo ello no es así.

En primer lugar, el conocimiento de las condiciones y características en las cuales se produjo la eventual exposición son habitualmente desconocidas por el investigador, dado que no ejerció ningún control o manipulación sobre la ocurrencia de las variables (estudio observacional). No es posible, por tanto, aseverar categóricamente que la exposición en estudio precede realmente al efecto o desenlace estudiado, y, aún si esto fuera conocido, este hecho por sí sólo no necesariamente lo explicaría 3 .

Utilidad de los estudios de casos y controles Algunas situaciones se prestan mejor que otras para ser estudiadas con esta metodología. Se ha hecho mención ya que estos estudios requieren de fundamento teórico que permita su sustentación como alternativas de investigación.

Entre las ventajas de estos estudios se alude con frecuencia a su simplicidad. Sin embargo un estudio de casos y controles puede alcanzar ribetes de alta complejidad dependiendo del problema estudiado y del grado de control que el investigador desee tener sobre las fuentes de error y sesgo que suelen amenazar estos diseños. El análisis de un estudio de casos y controles es también un elemento de complejidad variable en el que se puede requerir de técnicas de cierta sofisticación para extraer el máximo de información.. El trabajo de terreno de estos estudios puede ser extremadamente difícil, particularmente por la dificultad de encontrar o seleccionar sujetos "control" adecuados para el estudio.

En términos generales, estos estudios son de utilidad en las siguientes circunstancias:

Estudio de enfermedades de baja frecuencia poblacional (tanto en términos de incidencia como prevalencia),

Page 19: EPIDEMIOLOGIA ANALITICA

Cuando se requiere un estimador de riesgo como Riesgo Relativo riesgo previo al desarrollo de un estudio prospectivo,

Estudio de enfermedades con mas de un agente etiológico,

Evaluación de procedimientos o intervenciones de base poblacional (programas de screening, inmunizaciones),

Problemas de salud que requieren un abordaje relativamente rápido.

Identificación de casos y selección de controles La definición de casos es esencial para todos los diseños de investigación epidemiológica pero lo es en particular para los estudios de casos y controles puesto que es éste su punto de partida. Pueden ser identificados y seleccionados de series clínicas o de registros. Dichos registros facilitan la tarea del investigador en el sentido de reunir o concentrar a los sujetos en estudio y explican la tendencia observada de utilizar centros de atención de salud como fuente habitual de provisión de casos.

En oportunidades, sin embargo, puede existir dificultad para reunir el número mínimo de sujetos con determinada enfermedad 4 . El investigador debe incluir en el estudio sujetos que tengan la condición (evitando la ocurrencia de falsos positivos), considerando la fase y severidad de la enfermedad que los sujetos tienen al ingresar al estudio.

La inclusión de sujetos en diferentes etapas de la historia natural de la enfermedad aumenta la probabilidad incluir sujetos con grados de exposición heterogéneo exponiéndose a la ocurrencia de sesgo de selección.

Selección de los casos

Deben representar adecuadamente la historia natural de la enfermedad,

Idealmente, seleccionar todos los casos de una población determinada,

Page 20: EPIDEMIOLOGIA ANALITICA

Todos los sujetos portadores de la enfermedad deben tener igual probabilidad de ser escogido.

Fuente de obtención de casos: se pueden utilizar diversos registros médicos, como ser:

Historias clínicas Egresos hospitalarios Estadísticas de morbilidad Registros médicos especiales (cáncer, otras

enfermedades crónicas) Registros de sistemas de vigilancia epidemiológica Certificados de defunción o equivalente

Pueden usarse otras fuentes cuando no hay registros disponibles y se conoce la existencia de casos en la comunidad. Tal fue el caso de un estudio de casos y controles destinado a establecer las eficacia de una nueva técnica diagnóstica en la detección de trastornos extrapiramidales asociado a alta exposición a manganeso en mineros del norte de Chile.Ante la inexistencia de casos nuevos (incidentes) por las actuales medidas de control ambiental, los casos debieron ser rastreados en la comunidad en sujetos de avanzada edad aún vivos.Ocasionalmente la enfermedad a estudiar tiene muy baja incidencia y sólo puede ser estudiada en cohortes 5 de individuos que deben ser identificadas en la comunidad.

En la literatura anglosajona, los estudios que utilizan casos obtenidos a partir de registros médicos de pacientes hospitalizados o relacionados con la internación de pacientes son conocidos como hospital-based studies y aquellos que identifican casos a partir de la población a estudiar se denominan population or community-based studies.

Casos prevalentes y casos incidentesLos casos obtenidos a partir de registros habituales y que ya han sido detectados corresponden a los casos prevalentes pudiendo ser muy variable entre los enfermos

Page 21: EPIDEMIOLOGIA ANALITICA

el tiempo transcurrido entre el diagnóstico de la condición. Alternativamente, los casos pueden ser obtenidos a partir de los nuevos casos que son detectados a partir del momento en que se inicia la investigación (casos incidentes).

Si se trabaja con casos prevalentes, debe tomarse en cuenta que los sujetos casos podrían haber modificado sus hábitos o estilos de vida, algunos de los cuales pueden ser importantes en términos de exposición generando sesgo (ej. Sujetos con cáncer de pulmón, en tratamiento, que dejan de fumar o cambian su lugar de residencia). En este caso, no debiera llamar la atención una muy baja tasa de tabaquismo actual en sujetos con cáncer del pulmón, producto de la modificación del hábito derivada del diagnóstico.

Selección de controlesLas condiciones generales mas relevantes para la selección de los controles son las siguientes:

Deben provenir de la misma población de la cual fueron seleccionados los casos,

Con la misma probabilidad de exposición que la de los sujetos casos,

Exposición comparable en relación con otros atributos generales de la población control (sexo, edad, por ejemplo),

Mas de un sujeto control puede ser escogido con relación a cada caso.

Un sujeto es elegible como control cuando ha tenido la misma probabilidad de exposición a la variable independiente en estudio que la experimentada por el caso, tanto en cantidad como en oportunidad. Por ejemplo, si se estudia la relación existente entre diabetes (variable dependiente) y embarazo (variable independiente), los sujetos controles (mujeres, no diabéticas), deben tener o haber tenido la misma probabilidad de embarazarse que las mujeres-casos.

Page 22: EPIDEMIOLOGIA ANALITICA

Número de controles Habitualmente un control es seleccionado por cada caso, definiendo una relación 1:1. Así, ambos grupos estarán constituidos por un número equivalente de individuos. Sin embargo, es posible incorporar un número mayor de controles por cada caso, lo que redunda en beneficios estadísticos (potencia) 6 . Sin embargo, la complejidad del estudio, su duración y su costo se ven incrementados por esta decisión si la relación casos- controles es 1:2, 1:3 o mayor. También puede darse el caso de encontrar relaciones del orden de 1:1,5 o 1:2 ,3 entre casos y controles. También pueden utilizarse más de un tipo de controles, generando grupos de referencia representativos de diferentes poblaciones, lo que permite analizar gradientes de riesgo.

El investigador debe seleccionar basándose en estas premisas, un número mínimo de controles por cada caso, los que deben ser lo más parecidos en cuanto a compartir atributos comunes como sexo, edad, residencia o lugar geográfico de vida común o grupo étnico.

1. Este indicador es un buen estimador del Riesgo Relativo, La mayor parte de los textos de epidemiología señalan que esta estimación es más precisa cuando el outcome o enfermedad estudiada es de "baja frecuencia" poblacional. Sin embargo no indican cual es el punto de corte adecuado. Como orientación es de utilidad considerar como de "baja frecuencia" eventos de frecuencia menor o igual a 20% en la población en estudio. | Volver al texto |

2. Retrospectivo : relativo a tiempo pasado. | Volver al texto |

3. Para mayor comprensión de esta terminología revisar el concepto de Causalidad en epidemiología. | Volver al texto |

4. En estricto rigor, esta situación es de frecuente ocurrencia en estos estudios puesto que metodológicamente ellos tienen especial aplicación en

Page 23: EPIDEMIOLOGIA ANALITICA

el estudio de enfermedades o condiciones de baja frecuencia poblacional. | Volver al texto |

5. Grupos que comparten características comunes, como ser, haber nacido en un mismo periodo o haber tenido exposición en un periodo de tiempo similar | Volver al texto |

6. El incremento del número de controles aumenta la potencia del estudio.Una razón de 1 : 4 (4 controles por cada caso) produce la máxima ganancia en cuanto a potencia. (Ver: Epidemiological Reviews 1994 16(1) y Journal of Chronical Diseases 1976, 29:723-731). | Volver al texto |

Estudios de Casos y controles IIComparabilidad de gruposLa comparabilidad de estas características en ambos grupos puede ser dejada al azar, asumiendo el riesgo de que ambos grupos puedan no ser enteramente comparables 1 . En el caso de que los grupos difieran respecto a algunas de estas variables, es posible controlar este efecto a posteriori mediante un procedimiento de ajuste o estandarización.

Pareamiento o matching    Otra opción metodológica para el control a priori del efecto de variables de confusión lo constituye el pareamiento o matching 2 . Este procedimiento consiste en igualar ambos grupos con relación a alguna(s) característica(s), haciéndola homogénea en ambos grupos (como ser por ejemplo sexo, edad, su lugar de vivienda o el n�mero de hijos).

Así, si se encuentra una asociación positiva entre un outcome y una variable de exposición, se descarta de esta forma que tal asociación pueda explicarse, por ejemplo, por una diferente conformación de los grupos respecto a sexo, edad u ocupación.

Un efecto importante del matching es el aumento en la eficiencia del estudio, ya que permite circunscribir la

Page 24: EPIDEMIOLOGIA ANALITICA

población a estudiar a aquella en la cual la exposición es más representativa.

Por ejemplo, en el estudio de accidentes vasculares y uso de anticonceptivos orales, el matching por edad podría restringir el ingreso de un control de edad avanzada (65 años), en el cual la probabilidad de exposición a anticonceptivos orales es baja o cero.

Conceptualmente el matching corresponde a un procedimiento empleado a priori, en la fase de diseño del estudio. Ocasionalmente se puede efectuar pareamiento a posteriori, cuando el investigador decide parear observaciones una vez recogidos los datos, a partir de un conjunto de individuos controles que previamente no fueron sometidos a matching. Sin embargo se prefiere reservar el término matching para aquellos casos en que el procedimiento se emplea a priori.

El matching se usa también cuando se trabaja con variables confundentes de difícil definición o medición, como ser por ejemplo, las de tipo genético, psicosocial o relacionada a comportamientos humanos. En estos casos, los investigadores suelen utilizar "pares" de sujetos (hermanos, gemelos, miembros de una familia o grupo social específico), con la finalidad de poder estudiar aisladamente el efecto de la variable de interés habiendo controlado la influencia de las variables sometidas a pareamiento, las que se asumen comunes.

Los tipos de variables sometidas a matching pueden ser variados, y dependerán lógicamente del problema a investigar. Entre las más frecuentes controladas mediante este procedimiento las siguientes:

Sexo Edad Lugar de residencia Nivel socioeconómico Ocupación Sistemas de atención de salud

Page 25: EPIDEMIOLOGIA ANALITICA

Antecedentes familiares

Modalidades de matching Existen varias modalidades de pareamiento o matching. Dos de las más utilizadas, dependiendo si este procedimiento se aplica colectivamente o a observaciones específicas, son el matching de grupos o de frecuencia y el matching individual

Figura 1. Modalidades de matching o pareamiento en estudios de casos y controles

En la modalidad de matching de grupo o de frecuencia se restringe a priori el ingreso de sujetos en ambos grupos buscando estudiar a sujetos que representen adecuadamente tanto la exposición como el outcome en estudio (criterios de inclusión).

Así, el ingreso al estudio puede estar regulado por características tales como sexo, grupo de edad, ocupación, lugar de residencia o modalidad de cuidados médicos. La contribución de los grupos en cuanto a eventuales factores confundentes tiende a ser homogénea en casos y controles, lo que incrementa la potencia del estudio.

En el matching individual, la(s) característica(s) a parear se definen específicamente para cada caso y cada control simultáneamente. Se podrá apreciar que el efecto de este procedimiento tiene implicancias directas en:

La modalidad de análisis de la información: en este caso el análisis se efect�a por "pares"o "tríos"de observaciones, a diferencia de la modalidad de

Page 26: EPIDEMIOLOGIA ANALITICA

matching por grupos o de frecuencia, en la que se comparan grupos.

La factibilidad de encontrar adecuados sujetos controles que ajusten a los requerimientos exigidos en el matching. A mayor cantidad de variables a "parear", mayor dificultad de encontrar controles adecuados

En ambos casos, el matching puede considerar mas de un control por cada caso

Desventajas del matching o pareamientoEste procedimiento involucra dificultades técnicas y teóricas en el desarrollo del estudio. El investigador se expone a encontrar dificultades para encontrar controles adecuados y en muchos casos debe descartar controles con el consiguiente riesgo de sesgar las mediciones en el caso de que la(s) variable(s) a parear no sean de valor epidemiológico.

El investigador puede verse enfrentado a la realidad de encontrar en su base de una alta frecuencia de valores missing 3, debiendo descartar dichas observaciones o aplicar procedimientos de estimación de ellos usando procedimientos de poca aceptación epidemiológica. El estudio se hace también más largo y por ende, de mayor costo.

El término de overmatching o matching innecesario (sobrepareamiento) se refiere al uso de esta técnica incluyendo innecesariamente variables que pueden no ser necesariamente variables confundentes.

Por definición una variable confundente debe estar relacionada simultáneamente con el outcome y la exposición. Si este requisito n o se cumple se puede afectar la eficiencia para detectar diferencias entre ambos grupos (error de tipo II o ß).

Supongamos que en un estudio se efect�a matching por una variable que está relacionada con la exposición pero no con el outcome o desenlace. En estricto rigor, no cumple con los requisitos para ser considerada como variable confundente.(Figura 2)

Page 27: EPIDEMIOLOGIA ANALITICA

Figura 2: Variable de tipo no confundente

El efecto de este matching será la observación de una mayor tendencia a encontrar pares de casos y controles concordantes para la exposición en estudio. Ya que la variable V pareada no se relaciona con el outcome, el resultado subestimará el efecto real de exposición, ya que habrá un menor n�mero de pares de sujetos que contribuirán positivamente a identificar la asociación.

El pareamiento de variables debe efectuarse cuando se conoce o sospecha de su relación con la exposición (aumenta la validez de los hallazgos). Ejemplo; edad y cáncer del pulmón, al estudiar la exposición a asbesto. En este caso la variable exposición está vinculada con la edad del sujeto. Simultáneamente la variable cáncer pulmonar también se relaciona con la edad (Figura 3).

Figura 3. Efecto de confusión

El control a priori de este tipo de variables de pareo no es la �nica opción metodológica de controlar su efecto. Se puede efectuar a posteriori, un análisis estratificado o estandarizar o ajustar la información, utilizar metodología de análisis estadístico multivariado.

1. En estudios experimentales, la randomización o asignación aleatoria de los sujetos a los grupos control o experimental es otro procedimiento que se utiliza para neutralizar el efecto de potenciales variables

Page 28: EPIDEMIOLOGIA ANALITICA

confundentes.| Volver al texto |

2. John Last; matching: "proceso de hacer un grupo en estudio comparable con otro, con respecto a factores extraños".| Volver al texto |

3. Missing values: valores perdidos. Corresponden a sujetos de los que no se tiene información acerca de determinada variable, debiendo esperarse respuesta. Cuando no se cuanta con respuesta a una variable porque no corresponde tenerla (embarazos, en el sexo masculino o años de consumo de cigarrillos en sujetos no fumadores), la categoría de respuesta existe y puede ser tratada en forma específica en el análisis. | Volver al texto |

Estudios de Casos y controles IIIEstructura y análisis de la información en los estudios de casos y controlesLa lógica de este diseño consiste en comparar la frecuencia de exposición a la(s) variable(s) independiente(s) estudiadas en casos y controles. Esta comparación, apoyada por la hipótesis de trabajo, busca encontrar evidencia de una mayor tasa de exposición entre los sujetos casos en comparación con los controles si el factor estudiado se comporta como un "factor de riesgo" 1

Si la presencia del factor de exposición reduce el riesgo (factor protector), la frecuencia de exposición entre los controles debiera ser mayor que la encontrada entre los casos.

El análisis dependerá de la existencia de matching en el diseño. En el caso no pareado, la unidad de análisis corresponde a cada individuo en ambos grupos y la comparación de individuos de uno y otro grupo se efect�a libremente.

Page 29: EPIDEMIOLOGIA ANALITICA

Si hay matching la comparación de las unidades de análisis se establece entre pares de observaciones (un caso, un control), tríos si la relación entre casos y controles es 1:2 ( un caso, dos controles) y así sucesivamente.

El esquema general de análisis en una tabla tetracórica en un estudio de casos y controles es el siguiente

Esquema básico de información en un estudio de casos y controles

Variableindependiente

Variable dependiente  

  Presente Ausente TOTALPresente a b F1 (a+b)Ausente c d F2 (c+d)Total C1 (a+c) C2 (b+d) n

En este caso, cada celda corresponde a:

Celda a: Sujetos enfermos con antecedente de exposición Celda b: Sujetos sanos con antecedente de exposición Celda c: Sujetos enfermos sin antecedente de exposición Celda d: Sujetos sanos sin antecedente de exposición. Celda C1: Total de casos Celda C2: Total de controles Celda F1 : Total de sujetos expuestos Celda F2 : Total de sujetos no expuestos.

Nótese que el n�mero total de sujetos en ambos grupos (Casos y Controles) son fijados a priori por el investigador (C1 y C2).

Un primer análisis de esta tabla, considerando la hipótesis de trabajo, permite una rápida evaluación de la tendencia de los resultados. Si la exposición estudiada confiere riesgo, se espera encontrar una concentración de individuos en la celda a (expuestos y enfermos) y celda d (no expuestos y sanos).

Page 30: EPIDEMIOLOGIA ANALITICA

En estas celdas se produce concordancia con la hipótesis de trabajo (exposición/daño, no exposición/no daño).

Caso no pareado: estructura de la tabla tetracórica En este caso, la comparación de individuos se realiza libremente, comparando la totalidad de los casos con la totalidad de los controles. Esto es válido independientemente del n�mero de controles seleccionados por cada caso. Veamos la estructura de los datos en situaciones hipotéticas de estudios con relación 1:1 y 1:2 entre casos y controles respectivamente:

Caso no pareado, relación 1:1 entre casos y controles.

  Casos Controles1 E N2 E N3 N N4 N N5 E E6 E N7 E N8 E N9 N E10 N E

(E = expuesto N = No expuesto)

Exposición Casos Controles  Positiva 6 3 9Negativa 4 7 11  10 10 20

Caso no pareado, relación 1:2 entre casos y controles.

Casos Controles1 E 1-N 11-N

Page 31: EPIDEMIOLOGIA ANALITICA

2 E 2-N 12-E3 N 3-N 13-E4 N 4-N 14-N5 E 5-E 15-N6 E 6-N 16-N7 E 7-N 17-E8 E 8-N 18-N9 N 9-N 19-N

10 N 10-E 20-N

Exposición Casos Controles  Positiva 6 5 11Negativa 4 15 19  10 20 30

En la situación de pareamiento o matching, cambia: la estructura de la base de datos, las tablas de distribución de frecuencias, así como las tablas de contingencia (que sólo es de 2 x 2 para el caso de matching 1 : 1), varían en su estructura general. Se presentan figuras con la apariencia en casos de matching 1 : 1 y más de un control por cada caso:

Caso pareado, relación 1:1 casos-controles

Casos-Controles1 E-N (Caso Expuesto; Control No

expuesto)2 E-N3 N-N (Caso y control No expuestos)4 N-N5 E-E (Caso y Control expuestos)6 E-N7 E-N8 E-N9 N-N

10 N-E

Page 32: EPIDEMIOLOGIA ANALITICA

Originando la siguiente tabla tetracórica:

  Controles    Exp + Exp -  Casos Exp + 1 5 6  Exp - 1 3 4  2 8 10*

(*): 10 pares de comparaciones, equivalentes a 20 sujetos

Caso pareado, relación 1:2 entre casos y controles.

Casos-Controles1 E-N-N2 E-N-E3 N-N-N4 N-N-N5 E-E-E6 E-N-N7 E-N-N8 E-N-N9 N-N-E10 N-E-N

Distribuyéndose de esta manera en la tabla de contingencia

  Controles expuestos  0 indiv 1 indiv 2 indiv TotalCasos Exp

+ 4 1 1 6

  Exp - 2 2 0 4

  6 3 1 10*

(*): 10 tríos de observaciones (30 observaciones)

Page 33: EPIDEMIOLOGIA ANALITICA

Cálculo de la tasa de exposiciónEl primer cálculo a desarrollar es el de las tasas de exposición entre los sujetos casos y los controles, de acuerdo al siguiente planteamiento:

Esquema básico de información en un estudio de casos y controles

Variableindependiente

Variable dependiente  

  Presente Ausente TOTALPresente a b F1 (a+b)Ausente c d F2 (c+d)Total C1 (a+c) C2 (b+d) N

Tasa Exposición en casos = a / C1 x 100 o bien = a/(a+c)Tasa Exposición en controles = b / C2 x 100 o bien = b/ (b+d)

La valoración estadística de las tasas de exposición encontradas puede efectuarse mediante la aplicación de un test de comparación de proporciones, la que determinará si la diferencia existente puede o no se explicada por el azar (H0) o por la presencia de la variable independiente en estudio (H1).

Establecimiento de asociación entre las variables en estudio Luego del paso anterior se procede a establecer la existencia de asociación utilizando el test de de Mantel - Haenszel, con su correspondiente corrección de continuidad de Yates si fuera el caso 2 .

= (| ad * bc| � n)       

        C1 C2  F1  F2

El valor obtenido tiene un grado de libertad:

( gl = [columnas - 1] x [filas - 1])

Page 34: EPIDEMIOLOGIA ANALITICA

Teniendo como punto de corte 5,991 para este valor, con un 95% de confianza. Vale decir, si el valor de Chi cuadrado calculado excede este valor, se está en condiciones de poder rechazar la hipótesis de nulidad H0 (falta de asociación) en favor de H1 (asociación), con 95% de confianza.

Habitualmente en todo caso, la hipótesis de asociación suele haber sido comprobada previamente al desarrollo del protocolo. El paso siguiente es el cálculo del odds ratio. El odds ratio tiene la característica de cuantificar la magnitud de riesgo.

Cálculo de la razón de chances u Odds Ratio (OR)En la literatura epidemiológica esta medida de riesgo es reconocida con las siguientes denominaciones: odds ratio, razón de disparidad, razón de desigualdades, razón de productos cruzados, riesgo relativo estimado, desigualdad relativa, razón de momios y otras más 3 .

- Elaboración de los componentes de esta razón:

- La "chance" (odds) de tener la enfermedad (Odds1), seg�n se esté o no expuesto al factor corresponde a:

Odds1 = a/C1 (enfermos expuestos en relación con el total de enfermos)                     c/C1 (enfermos no expuestos en relación con el total de enfermos)

Lo que equivale a :

Odds1 = a/ ( a+c )

               c/ ( a+c )

- Equivalentemente la "chance" de no tener la enfermedad, seg�n se esté o no expuesto al factor (Odds2) corresponde a :

Odds1 = b/ C2 (sanos expuestos en relación con el total de sanos).

Page 35: EPIDEMIOLOGIA ANALITICA

              d/ C2 (sanos no expuestos en relación con el total de sanos)

Equivalente a:

Odds2 = b/ (b+d )

              d/ ( b+d )

- Por tanto, el valor del odds ratio, que corresponde al cuociente (razón ) entre estas dos "chances (u Odds), corresponde a:

OR = a x d

          a x c

Este indicador de riesgo es llamado también "razón de productos cruzados", aludiendo así a la distribución que adoptan en la tabla 2 x 2 los términos del numerador y denominador 4 . El valor calculado carece de unidades de medidas.

Interpretación del valor de OR calculadoEstrictamente hablando el odds ratio indica la magnitud de asociación entre exposición y outcome (en otras palabras, el riesgo de haber estado expuesto dada la enfermedad). Esta interpretación es compleja y difícil de entender, por lo que se permite su interpretación considerando el riesgo asociado o no a la exposición.Como el odds ratio es un buen estimador del riesgo relativo (calculado en estudios prospectivos), se utiliza esta propiedad para facilitar la comprensión del indicador.

Si el cuociente calculado determina un valor de 1, esto significa que no hay asociación entre las variables

Page 36: EPIDEMIOLOGIA ANALITICA

analizadas (la exposición positiva o negativa no hace diferencia respecto al riesgo de enfermar).

Un valor mayor que 1 indica una mayor frecuencia de exposición de la variable independiente entre los enfermos (casos). Por tanto, el factor act�a asociándose con un mayor riesgo de enfermar.

Finalmente, si el valor del OR calculado es inferior a 1, esto indica mayor frecuencia de exposición entre los sujetos sanos (controles). En este caso, la presencia del factor se asocia reduce el riesgo de enfermar (actuando como un factor de protección).

La valoración estadística de las asociaciones encontradas debe realizarse mediante el cálculo de los correspondientes intervalos de confianza.

De acuerdo con esto, la interpretación final del OR queda dada por el siguiente esquema:

- Interpretación del valor de odds ratio

Valor odds ratio

Intervalo de confianza Tipo de asociaciónInferior Superior

1     No evidencia de asociación

Mayor de 1 >1 >1 Significativa, riesgo

Mayor de 1 < 1 > 1 No significativa

Menor de 1 < de 1 < de 1 Significativa, protección

Menor de 1 < de 1 > de 1 No significativa

Para el cálculo del intervalo de confianza se recurre a diferentes métodos. Uno de los más utilizado es el Woolf que utiliza la siguiente fórmula;

IC OR = (Ln OR) ± Z 1/a+1/b+1/c+1/d

Page 37: EPIDEMIOLOGIA ANALITICA

Ejemplo: Contreras 5 y colaboradores estudian y difunden el resultado de una investigación destinada a valorar el nivel de protección conferido por la vacuna antisarampión utilizando un diseño de estudio de casos y controles. Para ello, los autores identifican a 48 niños con el antecedente de sarampión y 48 controles, en quienes indagan por el antecedente de vacunación previa, obteniendo los siguientes resultados:

- Asociación sarampión con antecedente de vacunación: casos y controles

Exposición Sarampión    SI NO  Vacunación

+ 34 46 80Vacunación

- 14 2 1648 48 96

En este caso, la "tasa de exposición a la vacuna" equivale a:

- Entre los casos : ( 34/48) * 100 = 71% - Entre los controles : (46/48) * 100 = 96%

El cálculo del valor de odds ratio (OR) para este caso en particular está dado por la expresión:

OR = a x d

          b x c

vale decir = 34 x 2  =  68 = 0,10   

          46 x 14    644

O bien: Odds Exposición en Enfermos : 34/48 / 14/48 = 2,42 Odds Exposición entre Controles : 46/48 / 46/48 = 23

OR = 0,10

Page 38: EPIDEMIOLOGIA ANALITICA

-Cálculo del intervalo de confianza para el OR calculado. Ln OR : -2.30

Error standard : Ln OR = 1/a+1/b+1/c+1/d

(ES) = 0.62         = 0.789

Intervalo de confianza calculado al 95%, equivale a:

IC OR = (Ln OR) ± Z Ln ES IC OR = (Ln OR) ± 1,96 (0,789)IC OR = (Ln OR) ± 1,55             = -2.30 ± 1,55

IC OR = IC OR = 0,021- 0,47

Luego el intervalo en el cual se mueve el valor de OR calculado fluct�a entre 0,021 y 0,47, ambos valores inferiores a 1, con un 95% de confianza.

Por tanto la asociación encontrada es de carácter significativo y su lectura correspondería a una disminución significativa del riesgo de contraer sarampión en presencia del factor "vacunación" antisarampionosa.

El test de Chi cuadrado ( ),efectuado entre la variable vacunación y sarampión (medidas dicotómicamente ambas) arroja un valor de p 0,002 (valor de 10,8, con un grado de libertad), lo que permite rechazar H0 (variables no asociadas) en favor de H1 (las variables están asociadas).

Finalmente, si quisiéramos calcular el nivel de protección conferido por esta vacuna en la población estudiada, ésta estaría dada por la siguiente expresión:

Porcentaje de protección = 1 - OR,

- siendo el valor 1 el valor basal asumiendo que la vacuna no ejerce ning�n tipo de protección. En nuestro caso, se obtiene un valor de 0,9 equivalente a un 90% de protección entre los niños estudiados en presencia del antecedente de

Page 39: EPIDEMIOLOGIA ANALITICA

vacunación. Los límites del intervalo de confianza corresponderían a:

Límite inferior: 1 - 0,47 = 53% de protecciónLímite superior: 1 - 0,021 = 97,9% de protección

En términos de notación, este resultado se expresa en términos de nivel de protección, como 90% (Intervalo de confianza al 95%: entre: 53% - 97,9%)

Direccionalidad de la asociación estudiada Dado que este diseño se inicia a partir de la variable dependiente y explora retrospectivamente en el tiempo la presencia o ausencia de exposición en ambos grupos, no es posible conocer entre los casos la tasa de incidencia de la enfermedad o daño en cuestión 6 . Para conocer el n�mero de casos nuevos de la enfermedad o condición en estudio en un período de tiempo determinado se requiere iniciar un seguimiento de individuos sanos o libres de la condición en estudio, observando la aparición de eventos a lo largo de un período de tiempo preestablecido.

En el diseño de casos y controles, el estudio se inicia a partir de un n�mero fijo de sujetos enfermos o portadores de la condición a estudiar, ignorándose el momento en el cual apareció la enfermedad.Por tanto, por definición, dada la direccionalidad del estudio (retrospectiva), no es posible el cálculo de tasas de incidencia.

Consideración de variables de confusión. Siendo el objetivo de este diseño establecer la existencia de asociaciones entre variables, es de suma importancia descartar que las asociaciones evaluadas no estén dadas por variables independientes que participan indirectamente en la cadena causal pero que en �ltimo tiempo, no la explican.

Nos referimos específicamente a aquellas variables que se encuentran vinculadas simultáneamente con la variable dependiente e independiente en estudio. Estas variables de confusión pueden dar origen al establecimiento de

Page 40: EPIDEMIOLOGIA ANALITICA

asociaciones sp�reas, derivadas del efecto de estas variables. Para su control, se puede recurrir a:

Control a priori de las variables, en la etapa de diseño del estudio (matching)

Análisis de la exposición y el outcome de acuerdo a los niveles o estratos que adopte la variable de confusión (análisis estratificado),

Ajustando los datos, a posteriori utilizando ajuste directo o indirecto,

Utilizando técnicas de multivariadas (análisi multivariado),

En diseños experimentales, asignando aleatoriamente la exposición entre los sujetos participantes.

Análisis de datos en estudios casos y controles con matching Si el estudio ha incorporado la modalidad de matching de frecuencia, es decir, el ingreso al estudio de los controles estuvo condicionado por algunas restricciones generales previas (igual sexo, similar grupo etario, vecindario com�n u otras), se puede aplicar el mismo procedimiento utilizado en la modalidad no pareada o sin matching.

En el caso de matching individual utilizando un control por cada caso, la información se distribuye de acuerdo a pares de observaciones seg�n el esquema previamente comentado.

  Controles      Expuestos No

expuestos 

CasosExpuestos 1 (n11) 5 (n10) 6

  No expuestos 1 (n01) 3(n00) 4

    2 8 10*

(*): 10 pares de comparaciones, equivalentes a 20 sujetos

Page 41: EPIDEMIOLOGIA ANALITICA

Correspondiendo cada celda a:

Celda n11: caso y control expuestos Celda n10: Controles no expuestos, casos sí. Celda n01: caso no expuesto, control sí. Celda n00 : Caso no expuesto, control no expuesto

En esta modalidad se asume que las celdas que muestran concordancia no aportan información respecto al estudio de asociación, por lo que se utilizan solamente las celdas n10 y n01.

OR = n10 / n01 = 5/1

Si la información no es correctamente distribuida en las correspondientes celdas, la tabla tetracórica presentaría la siguiente conformación:

  Casos ControlesExp + 6 2  Exp - 4 8  

  10 10  

Originando un valor erróneo de odds ratio dado por:

      OR = 6 x 8    = 6

       2 x 4

Test de para el caso pareadoSu cálculo corresponde a la siguiente expresión:

= ( n10 - n01)

        (n10 + n01)

Cuando el n�mero de estratos es mayor a uno, los cálculos se hacen de mayor complejidad, siendo conveniente la utilización de software específico.

Page 42: EPIDEMIOLOGIA ANALITICA

Cálculo del intervalo de confianzaExisten diversos métodos para su cálculo. Se presentan a continuación otros métodos corrientemente utilizados:

a) ICOR = ( 1 ± 1,96/ )

b) ICOR = e (OR ± 1,96 x varianza)

La varianza se calcula de acuerdo a :

Varianza OR = (1/ n10 + 1/ n01 )

1. Factor de riesgo: atributo o característica de un sujeto o un grupo de ellos que les confiere un mayor riesgo particular de adquirir una determinada enfermedad o condición. | Volver al texto |

2. El test de chi cuadrado tiene algunas restricciones para el caso de variables categóricas. La corrección de continuidad de Yates se usa en el caso de tablas de contingencia en las que se encuentran celdas con bajo n�mero de observaciones.| Volver al texto |

3. A�n cuando la acepción más correcta es "Razón de Chances" puesto que establece la diferencia entre probabilidad y "chance", se usará la denominación OR, por su frecuente utilización en literatura biomédica.| Volver al texto |

4. Esta medida de riesgo puede también calcularse en estudios prospectivos y su derivación es simple | Volver al texto |

5. Contreras R y cols. Efectividad de la vacuna antisarampión en el terreno: un estudio de casos y controles. Rev. Chil. Pediatría;61(1):3-7, 1990. | Volver al texto |

6. De hecho, se ignora cuando los casos portadores de la enfermedad o condición en estudio aparecieron y, por cierto, las poblaciones a partir de las cuales pudiera calcularse una tasa de incidencia| Volver al texto |

Page 43: EPIDEMIOLOGIA ANALITICA

Variables confundentesParte crucial de la etapa de interpretación de los resultados y de evaluación de los hallazgos es analizar críticamente la posibilidad de que eventuales factores pudieran estar invalidando metodológicamente los resultados. El investigador debe ser consciente de que los resultados obtenidos pueden deberse a otros factores que no corresponden a la intervención en estudio y que de no ser consideradas pudieran llevar a conclusiones equivocadas.

En términos generales, frente a los resultados obtenidos el investigador debe estar en condiciones de poder evaluar si los resultados pueden ser originados por:

1. Simple azar o chance 2. Ocurrencia de error sistemático 3. Presencia de variables confundentes 4. Fenómenos de interacción entre variables estudiadas. 5. Asociaciones causales

1. Simple azar o chanceEstadísticamente es posible conocer y controlar la probabilidad de ocurrencia de error en la investigación desde fases tan tempranas en la investigación como puede ser la etapa de muestreo. Subsecuentemente, la revisión y análisis preliminar de la información permite verificar la magnitud real de error proveniente de los datos recogidos. Aunque el error aleatorio es imposible de eliminar, el conocimiento de su cuantía permite emitir juicios considerando su magnitud al evaluar los resultados de la investigación. Dependiendo del problema en cuestión y el nivel de conocimientos imperantes el investigador debe decidir cuál es el nivel máximo de error tolerable para, por ejemplo, implementar una medida preventiva o una de control en una población.

2. Ocurrencia de error sistemáticoLa participación del sesgo en los resultados obtenidos en una investigación puede ser muchas veces abortada sometiendo a una cuidadosa revisión y análisis las

Page 44: EPIDEMIOLOGIA ANALITICA

características del diseño de la investigación, en particular aquellos aspectos referidos a la medición de las principales variables independientes del estudio (variables de exposición y covariables). Es esencial además minimizar la probabilidad de existencia de errores sistemáticos derivados de la aplicación de instrumentos de medición optimizando las condiciones de aplicación de dichos instrumentos mediante su evaluación previa y su control permanente durante la fase de trabajo de terreno y recolección de información.

3. Presencia de variables confundentes e interacción entre variables estudiadas.Un capítulo importante en la investigación epidemiológica corresponde al análisis de resultados considerando la participación de variables que pudieran ejercer algún efecto sobre la relación encontrada. Esto podría manifestarse a través de una distorsión del efecto observado respecto al efecto real debido a una desigual distribución de una variable extraña en los grupos estudiados (efecto de confusión). También es posible la obtención de un efecto no esperado, pero real, producto de la interrelación simultánea de dos o más factores participantes en el efecto estudiado (interacción).

4. Asociaciones causalesEn el análisis de relaciones de causalidad, el investigador debe tener la certeza absoluta acerca de la direccionalidad de las asociaciones observadas (prospectiva o no) y considerar que la exposición estudiada pudiera corresponder en realidad a un outcome o variable dependiente al estudiar una cadena causal.

Variables confundentes

El efecto de confusión se produce cuando en el análisis de una relación, existe distorsión en el efecto estimado, el que es producido por la presencia de una variable extraña en el estudio de la asociación.

El efecto que puede tener la presencia de esta variable extraña en el resultado puede ser diverso: en ocasiones

Page 45: EPIDEMIOLOGIA ANALITICA

determina la existencia de asociaciones positivas, las que en la práctica no son reales (error de tipo I o ) o bien, pueden esconder asociaciones reales, las que en presencia de esta variable extraña, quedan enmascaradas (error de tipo II o ß).

El concepto de confusión es crítico en el análisis epidemiológico, siendo más importante en el terreno de la investigación epidemiológica observacional o no experimental que en el campo experimental. Esto se debe a que los estudios experimentales permiten un mejor control de este efecto por características inherentes a su tipo de diseño (randomización, control a priori de eventuales variables confundentes o el uso de matching o pareamiento de variables).

Conceptualmente deben cumplirse algunos requisitos para considerar a una variable como potencialmente confundente:

La variable incriminada debe estar simultáneamente asociada con la enfermedad (variable dependiente) en estudio y con la exposición,

Por tanto, debe ser un factor de riesgo para la enfermedad estudiada,

El factor extraño si bien es cierto debe estar asociado con la exposición (o variable independiente), no debe ser consecuencia de ésta última.

Gráficamente lo anterior corresponde a la siguiente representación:

Figura 1:Variables confundentes.

Page 46: EPIDEMIOLOGIA ANALITICA

Por ejemplo, en el análisis del efecto protector del Beta Caroteno en relación con el cáncer del sistema digestivo, se encuentra evidencia favorable acerca del consumo de vegetales en la reducción del riesgo del cáncer, concluyéndose que el consumo de Beta Caroteno en la dieta rica en vegetales es una medida específica de protección contra el cáncer.

Sin embargo, en este ejemplo pueden existir al menos dos posibles variables confundentes a considerar. La primera, es la edad, variable que se asocia con la incidencia de cáncer, y que podría asociarse con el nivel de consumo de verduras y hortalizas, lo que podría verificarse si en el estudio se contara con información acerca de la constitución por edad de los sujetos estudiados.Otra variable confundente podría ser el consumo de fibra en la dieta. En este caso, el nivel de consumo y tipo de fibra está relacionada simultáneamente con la variable “consumo de vegetales” y con la variable cáncer. Para ambos ejemplos de posibles variables confundentes, se cumplen las condiciones previamente señaladas para poder considerarlas como tales. De no considerarse en el análisis la presencia de ellas pudiera concluirse una recomendación errónea basándose en una relación espúrea o ficticia.

Para mayor claridad respecto a las características de las variables confundentes se plantearán tres situaciones hipotéticas (Figura 2):

Figura 2. Ejemplos de posible variables confundentes

Page 47: EPIDEMIOLOGIA ANALITICA

1. En este caso, el tabaquismo se relaciona simultáneamente con la exposición y con el desenlace u outcome. Corresponde realmente a una variable confundente.

2. En esta situación, el nivel de colesterol sérico corresponde a una variable “intermedia”, vale decir, en la cadena causal precede al daño y es consecuencia de la exposición principal en estudio. En este caso, la variable no corresponde a una variable confundente.

3. Finalmente se da acá el caso en que la variable de exposición (tabaquismo) está asociada con una tercera variable (consumo de alcohol). Si embargo, esta última, no corresponde a una variable confundente, puesto que sólo se asocia con la exposición y no con el desenlace.

No siempre es fácil saber si se cumplen los requisitos para que una variable sea considerada confundente. Por ejemplo, ¿cómo saber si una variable es factor de riesgo para el desenlace estudiado si se desconocen antecedentes al respecto?

Para tales efectos, es posible que en el análisis se pueda obtener información desagregando la información recogida.

Page 48: EPIDEMIOLOGIA ANALITICA

En un hipotético ejemplo de estudio de casos (enfermos) y controles (sanos) destinados a establecer la existencia de asociación entre la exposición al consumo de café y el riesgo de cáncer del páncreas, se estudian 100 casos y 100 controles, con el siguiente resultado:

Tabla 1. Ejemplo: Consumo de café y cáncer de páncreas

Consumo de café

Pacientes con cáncer Sujetos sanos

Exposición + 30 18Exposición - 70 82

Total 100 100

El valor de Odds ratio correspondiente es:

OR = 30 x 82 = 1.95     

18 x 70

Con lo cual se concluye que el consumo de café esta asociado con un mayor riesgo de padecer de cáncer del páncreas.

Una posible variable de confusión en este estudio pudiera estar dada por la edad de los sujetos participantes en el estudio. Si así fuera, primeramente se debería estudiar si se cumplen los requisitos para considerar a esta variable como una variable de confusión:

En primer lugar se analizará la relación existente entre la variable edad y la variable dependiente en estudio (cáncer de páncreas), utilizando para ello información desagregada

Page 49: EPIDEMIOLOGIA ANALITICA

de la edad, considerada ésta dicotómicamente en menores o mayores de 40 años de edad:

Tabla 2.Ej. Consumo de café y cáncer del páncreas: casos y controles según grupo de edad

Edad (años) Pacientes con cáncer Sujetos sanosMenos de 40 50 80Más de 40 50 20

Total 100 100

Luego, el porcentaje de sujetos mayores de 40 años con cáncer es claramente superior (50%) al de sujetos sanos (20%). Esto se puede validar mediante un test de chi cuadrado( =19,78 , p < 0.0001)

En una segunda etapa, se estudiará la asociación entre esta variable (edad) con la variable “exposición”.

Tabla 3.Ej. Antecedente de exposición de acuerdo a categoría de edad, casos y controles

Consumo de CaféEdad (años) Expuestos No expuestos Total % Expuesto

Menores de 40 13 117 130 10Mayores de 40 35 35 70 50

Se aprecia que la frecuencia de exposición no es uniforme en los estratos de edad, teniendo los mayores de 40 años un mayor porcentaje de exposición. Evaluado esto mediante un test de chi cuadrado, se tiene =39.91, p < 0.0001

Finalmente, está claro que la edad de los sujetos, así categorizada, no es consecuencia del consumo de café, con lo cual se establece el cumplimiento de los requisitos para que la variable edad pueda considerarse como eventualmente confundente

Page 50: EPIDEMIOLOGIA ANALITICA

Análisis estratificadoEn el tema anterior hemos visto que los resultados obtenidos en un estudio pueden deberse a factores extraños y no necesariamente a la variable de interés. Si bien este tipo de problema es más importante en los estudios observacionales, los experimentales no se encuentran, de ninguna manera, exentos de este tipo de factores.

Continuando con el análisis de variables confundentes

Análisis por estratosUna manera de poder superar la heterogeneidad en la distribución de una variable extraña en el estudio de la asociación es el análisis considerando los diferentes estratos en los que esta variable está categorizada. Obviamente, si en la investigación esta variable no fue contemplada en el diseño del estudio, no se podrá contar con esta información. (En este caso, la variable edad es una característica raramente omitida en la investigación epidemiológica, pero pudiera ser el caso de otra variable confundente no tan conocida). En el análisis estratificado se calculan las medidas de riesgo de acuerdo con los estratos, comparando el resultado con el análisis no estratificado (crudo). Para nuestro ejemplo, se tiene:

Tabla 4.Ej. Creación de estratos de acuerdo a grupo de edad

  Cáncer de páncreas Controles Odds ratio

Menores de 40      Exposición + 5 8 (5 x 72)     

 =1, 0 (8 x45)      Exposición - 45 72

Total 50 80  Mayores de 40      Exposición + 25 10 (25 x 10)    

    =1, 0Exposición - 25 10

Page 51: EPIDEMIOLOGIA ANALITICA

(10 x 25)    Total 50 20  

Se aprecia que el valor de odds ratio en el análisis de ambos estratos arroja el mismo resultado, lo que está indicando que el efecto de la variable edad, en relación con el estudio de la asociación exposición a café y cáncer del páncreas, ejercía un efecto distorsionador con respecto al odds ratio originalmente calculado (crudo) que era de 1.95.

Análisis estratificado utilizando el procedimiento de Mantel-Haenszel

En el caso anterior, es posible obtener una medida de riesgo, en este caso odds ratio, considerando simultáneamente la variable independiente de interés (exposición) y la variable potencialmente confundente. A diferencia del análisis estratificado anterior, este procedimiento permite el cálculo de un sólo valor de odds ratio, ajustado por la variable confundente. El elemento básico para poder efectuar el procedimiento de Mantel-Haenszel es conocer la distribución de esta variable de acuerdo a los estratos de la variable “exposición”.

La formulación general del procedimiento es la siguiente:

Cada estrato esta representado por la letra subíndice “i” en esta fórmula.Para el ejemplo anteriormente desarrollado, el procedimiento se establece basándose en la información de la siguiente tabla:

Tabla 5. Ej. Tabla Análisis estratificado

  Cáncer de páncreas Controles Odds ratio

Menores de 40      

Page 52: EPIDEMIOLOGIA ANALITICA

Exposición + 5 8 13 Exposición - 45 72 117Total 50 80 130Mayores de 40      Exposición + 25 10 35 Exposición - 25 10 35Total 50 20 70

Es posible calcular el correspondiente valor de chi cuadrado considerando la distribución de la variable confundente en los diferentes estratos, para lo cual se recurre a la siguiente fórmula general:

Siendo ni1 y ni2 el total de ambas columnas respectivamente.ymi1 y mi2 los totales de ambas filas.