Lectura crítica de estudios de pronóstico. Estudios de...

16
CAPÍTULO © 2015. Elsevier España, S.L.U. Reservados todos los derechos 7 Lectura crítica de estudios de pronóstico. Estudios de cohortes Víctor Abraira, Alfonso Muriel García y María Luisa Montes Ramírez INTRODUCCIÓN En medicina, el pronóstico se refiere a la estimación del riesgo de futuros acontecimientos en personas con una enfermedad o condición de salud determinada, y su relación con determinadas características actuales (1). Realizar apreciaciones pronósticas que informen al paciente y a su entorno sobre la evolución más probable de la enfermedad y ayuden a la toma de decisiones sobre la realización de las distintas intervenciones posibles es una de las funciones básicas de la medicina y de los médicos. Las inter- venciones terapéuticas se encaminan, precisamente, a modificar el pronós- tico espontáneo o historia natural de la enfermedad, transformándolo en un sentido positivo. Sin duda, la primera preocupación de una persona enferma es conocer en qué medida la enfermedad puede interferir su expectativa de vida; por tanto, el estudio de la mortalidad y del tiempo que transcurre entre el comienzo de la enfermedad o su diagnóstico y/o la instauración del tratamiento y la muerte, o tiempo de supervivencia, constituyen la prioridad para cualquier estudio de pronóstico. Pero también OBJETIVOS DEL CAPÍTULO Describir y clasificar los tipos de estudios de pronóstico. Tratar los aspectos clave de la evaluación de la validez de los estudios de pronóstico. Reflexionar acerca de la importancia de los estudios de pronóstico para justificar las decisiones sobre el manejo del paciente.

Transcript of Lectura crítica de estudios de pronóstico. Estudios de...

C A P Í T U L O

© 2015. Elsevier España, S.L.U. Reservados todos los derechos

7Lectura crítica de estudios

de pronóstico. Estudios de cohortesVíctor Abraira, Alfonso Muriel García

y María Luisa Montes Ramírez

INTRODUCCIÓN

En medicina, el pronóstico se refiere a la estimación del riesgo de futuros acontecimientos en personas con una enfermedad o condición de salud determinada, y su relación con determinadas características actuales (1). Realizar apreciaciones pronósticas que informen al paciente y a su entorno sobre la evolución más probable de la enfermedad y ayuden a la toma de decisiones sobre la realización de las distintas intervenciones posibles es una de las funciones básicas de la medicina y de los médicos. Las inter-venciones terapéuticas se encaminan, precisamente, a modificar el pronós-tico espontáneo o historia natural de la enfermedad, transformándolo en un sentido positivo. Sin duda, la primera preocupación de una persona enferma es conocer en qué medida la enfermedad puede interferir su expectativa de vida; por tanto, el estudio de la mortalidad y del tiempo que transcurre entre el comienzo de la enfermedad o su diagnóstico y/o la instauración del tratamiento y la muerte, o tiempo de supervivencia, constituyen la prioridad para cualquier estudio de pronóstico. Pero también

OBJETIVOS DEL CAPÍTULO

• Describir y clasificar los tipos de estudios de pronóstico.

• Tratar los aspectos clave de la evaluación de la validez de los estudios de pronóstico.

• Reflexionar acerca de la importancia de los estudios de pronóstico para justificar las decisiones sobre el manejo del paciente.

102 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

forman parte del mismo otras consecuencias de la enfermedad (remisión, recidiva, complicaciones, secuelas, etc.) que interesan al paciente y forman parte del proceso de toma de decisiones del médico.

Con muchos puntos en común con el pronóstico, está el problema de los factores de riesgo para enfermar, en el que también se trata de estimar el riesgo de un acontecimiento futuro, aunque en este caso el acontecimiento de interés es enfermar entre personas de la población general, o de un cierto subgrupo de ella, en lugar de muerte o complicaciones en personas enfermas. Por lo tanto, los estudios para estimar factores de riesgo y factores pronósticos tienen muchas similitudes. En ambos casos, el diseño óptimo es un estudio de cohortes, es decir, un estudio en el que se selecciona un grupo de individuos, bien definido, representativo de la población de estudio, al que se sigue durante un tiempo suficientemente prolongado para observar el evento de interés. Idealmente son estudios prospectivos, aunque a veces son retrospectivos o mixtos. En ocasiones, en lugar de un único grupo se seleccionan grupos con distintos niveles del factor, sobre todo en el estudio de los factores de riesgo, debido a que se trata de predecir enfermedades, en general con baja probabilidad, mientras que los factores pronósticos predicen eventos, en general de mayor probabilidad.

Recientemente se ha propuesto una clasificación de los estudios de pronóstico en cuatro categorías distintas, aunque interrelacionadas (1):

• Investigación fundamental en pronóstico, en la que se trata de estudiar el curso natural, o con el cuidado habitual, de la enfermedad y sus variaciones. El resultado de esta investigación se expresa como riesgo (o frecuencia) absoluto de uno, o más eventos, entre las personas que comparten características demográficas y clínicas; es, por lo tanto, el pronóstico promedio de un determinado grupo de interés, también llamado riesgo basal. Esta investigación proporciona respuestas iniciales a la pregunta «¿cuál es el pronóstico de las personas con una determinada enfermedad?». Por ejemplo, en promedio, cerca del 15% de las personas de 65 años de edad o más, ingresadas en 2006 en EE. UU., murieron con un ataque al corazón dentro de los 30 días siguientes al de su ingreso en el hospital, en comparación con un promedio del 19% en 1995 (2).

• Investigación en factores pronósticos, en la que se trata de identificar factores específicos (como biomarcadores, fármacos, otras enfermedades, signos, etc.) asociados con el pronóstico. El resultado de esta investigación se puede expresar bien como RR de sufrir el evento de los pacientes con un nivel del factor respecto al que se toma como referencia —p. ej., en pacientes con linfoma esplénico de la zona marginal, los que presentan adenopatía extrahiliar tienen un riesgo de muerte por la enfermedad 2,1 veces mayor que los que no la presentan (3)—, bien en términos absolutos mostrando los riesgos,

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 103©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

o más frecuentemente las curvas de supervivencia, para los pacientes con distintos valores del factor. En el artículo que se usará para hacer la lectura crítica (4) se usan ambas presentaciones.

• Investigación sobre modelos pronósticos, que trata de desarrollar, validar y evaluar el impacto de modelos estadísticos para predecir el riesgo individual de un futuro evento. Es importante enfatizar la necesidad de validación y evaluación del impacto, porque, aunque se han propuesto muchos modelos pronósticos, relativamente pocos son validados externamente y muy pocos evalúan el impacto de su uso (5). El resultado de esta investigación se puede presentar en forma de una fórmula, o gráfica (nomograma) (6), que permite calcular la probabilidad futura del evento para un individuo en función de los valores observados de los factores, o bien como una puntuación obtenida de la fórmula, con sus puntos de corte para generar grupos de riesgo (7). El uso de los modelos pronósticos para hacer predicciones individuales es más preciso y, en general, preferible a la creación de grupos de riesgo, aunque los grupos de riesgo pueden informar para opciones de tratamiento y permitir la estratificación por riesgo de gravedad en los EC (5). Este tipo de investigación es tratada en el capítulo 8 dedicado a las reglas de predicción clínica.

• Investigación sobre medicina estratificada. La medicina estratificada pretende seleccionar tratamientos en función de características de los pacientes que predigan la respuesta. La investigación en pronóstico es un componente principal de esta medicina (8).

ESCENARIO

Carmen es una mujer de 60 años a la que se le acaba de diagnosticar un adenocarcinoma de estómago en estadio T2 N0 M0. Su oncóloga le ha expli-cado que el primer paso del tratamiento es la cirugía de resección del tumor y después es posible que se requiera quimioterapia adyuvante. Carmen quiere saber con más exactitud si será preciso recibir quimioterapia adyuvante, con todo lo que ello conlleva, pues tiene un pequeño negocio familiar que lleva ella directamente y necesita decidir qué hacer con él. La oncóloga le explica que esto depende de la verdadera extensión del adenocarcinoma y que antes de la operación es muy difícil de determinar. Carmen insiste en saber si no existen otros datos, en la tomografía computarizada o los análisis, que puedan ayudar a predecir mejor su pronóstico; necesita organizarse y tomar decisiones importantes sobre su situación laboral desde el principio y no esperar a después de la cirugía. Su oncóloga le dice que va a revisar estudios recientes, pues recuerda haber leído algo sobre un marcador en sangre.

En una búsqueda en PubMed encuentra un artículo reciente sobre el valor pronóstico del dímero-D en pacientes con cáncer gástrico antes de la

104 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

cirugía. Tras hacer una lectura crítica, lo comenta con Carmen y, dado que es una prueba sencilla y barata, deciden hacerla; el resultado es de 1,15 mg/ml.

• ¿Crees que la determinación del dímero-D puede ayudar a predecir el pronóstico de los pacientes con carcinoma gástrico?

• En el caso de Carmen, ¿crees que es aplicables esta prueba? ¿Puede ayudarla a clarificar su pronóstico y tomar las decisiones personales que necesita?

PUNTOS CLAVE DE LA LECTURA CRÍTICA DE ESTUDIOS DE FACTORES PRONÓSTICOS

EN EL DISEÑO

Como se ha dicho en la introducción, y señalando en negrita los puntos clave para la evaluación crítica de artículos de este tipo, el diseño óptimo para establecer factores pronósticos es un estudio de cohortes, es decir, un estudio en el que se selecciona un grupo de pacientes bien definido, representativo de la población de estudio, en un momento homogéneo de la enfermedad, al que se sigue en el tiempo para observar el evento o eventos de interés durante un tiempo suficientemente prolongado.

Que un grupo de pacientes esté bien definido y sea representativo de la población de interés depende de la pregunta de investigación. Por ejem-plo, para responder a la pregunta de si el uso de antipsicóticos atípicos aumenta el riesgo (es factor pronóstico) de padecer fractura de cadera en ancianos, se debe comparar la frecuencia de fracturas en un grupo de ancianos que toman antipsicóticos atípicos con la de otro grupo que no los toma; ahora bien, este grupo puede estar formado por ancianos que no tomen antipsicóticos o por ancianos que tomen otro tipo de antipsicóticos. Es representativo, según el caso, un grupo de ancianos de la población general o de ancianos con demencia (9).

Otro elemento clave para la validez de estos estudios es que, en el comienzo del seguimiento, los pacientes se encuentren en un momento homogéneo de la enfermedad. Es fácil de entender que si, por ejemplo, se quieren estudiar factores pronósticos para pacientes infectados por el VIH, daría lugar a errores (efecto cohorte) introducir en la cohorte pacientes naïve (que no han recibido ningún tratamiento antirretroviral) junto con pacientes multitratados.

El elemento clave más relevante de estos estudios, que condiciona to-dos los demás, es la elección del evento. Como ya se ha mencionado, con frecuencia es la muerte, pero también hay otros eventos de interés, como remisión, recidiva, rechazo del trasplante, aparición de la enfermedad, por ejemplo, en pacientes con VIH, etc. El artículo debe tener una definición clara y precisa del evento, o eventos, de interés (p. ej., si fuera muerte, es-pecificar si es por todas las causas o por alguna causa específica o, si fuera

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 105©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

recidiva, cómo se determina, si clínica, radiológica o histológicamente). El lector crítico debe considerar la pertinencia y relevancia de estas definicio-nes. Véanse, por ejemplo, las definiciones de evento recomendadas por la agencia gubernamental norteamericana FDA para tratamientos oncológicos (10). Otro elemento clave en relación con el diseño del estudio es la forma en que se han recogido las variables, con procedimientos homogéneos y estandarizados (muy relevante en estudios retrospectivos y multicéntricos), sobre todo en aquellas que tengan elementos subjetivos (dolor, calidad de vida, etc.), necesiten interpretación (pruebas de imagen) o tengan com-plejidades técnicas (pruebas de laboratorio). Estos procedimientos deben garantizar la independencia (ceguera) respecto al evento y al factor.

El tiempo de seguimiento debe ser suficiente para que se pueda observar el número de eventos necesario de acuerdo con la potencia estadística prees-tablecida. Esto depende, naturalmente, de la naturaleza de la enfermedad y la frecuencia del evento estudiado. Por ejemplo, un período de seguimiento de 5 años puede ser apropiado para el estudio de la supervivencia en muchas variedades de cáncer, sin embargo, es un tiempo claramente insuficiente para valorar la supervivencia de enfermos en tratamiento sustitutivo por insuficiencia renal. Por el contrario, un seguimiento de 30 días es adecuado para estudiar la supervivencia a un episodio agudo de tromboembolismo pulmonar. En aquellos estudios que precisen un tiempo de seguimiento largo, hay que prestar atención a la posible pérdida de pacientes y sus causas, sobre todo a aquellas relacionadas con el evento o el factor. Sería deseable, para ayudar a evaluar su validez, que todo artículo de pronóstico cuantificara las pérdidas en el seguimiento, describiera las situaciones que las provocan (abandono del estudio u ocurrencia de alguna otra circunstancia que impide la observación del evento) y las características de los pacientes afectados (11).

EN LOS RESULTADOS

En cuanto a los resultados de estos estudios, como se dijo en el apartado «Introducción» se pueden expresar de varias maneras: como riesgo (o frecuencia) absoluto de sufrir el evento en la población de interés, mostran-do la evolución del riesgo o la supervivencia (curvas de supervivencia) a lo largo del tiempo, o como RR de los pacientes de un nivel del factor respecto al que se toma como referencia. Para estimar el riesgo absoluto se suelen usar dos índices: incidencia acumulada y densidad (o tasa) de incidencia. La incidencia acumulada es la proporción de individuos que desarrollan el evento durante el período de seguimiento. Como proporción no tiene dimensiones y su valor oscila entre 0 y 1, aunque también se suele expresar como porcentaje. Depende del tiempo de seguimiento, que se debe hacer explícito. El resultado del ejemplo citado en el apartado «Introducción» (el 15% de las personas ≥ 65 años de edad ingresadas en 2006 en EE. UU. murieron con un ataque al corazón dentro de los 30 días siguientes al de su ingreso) es una incidencia acumulada. La principal limitación de este índice

106 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

proviene del llamado efecto de cohorte fija: presenta cierta indeterminación si hay pérdidas en el seguimiento. Para evitar esta limitación se puede usar otro índice: la densidad, o tasa, de incidencia, que es el cociente entre el número de eventos ocurridos durante el período de seguimiento y la suma de todos los tiempos de observación. Tiene dimensión de inversa del tiempo, un rango ilimitado a partir de 0, y no depende del tiempo de seguimiento, asumiendo estacionariedad, es decir, riesgo constante a lo largo del tiempo. Esta asunción no siempre es razonable.

Sin embargo, en general, el resultado de interés no es la frecuencia de ocurrencia de los eventos, sino el tiempo hasta que ocurren. En este caso, los resultados se suelen expresar, generalmente en forma gráfica, mediante la denominada función de supervivencia, que da, para cada tiempo t, la probabilidad de que el evento ocurra (el paciente sobreviva, si el evento es muerte) en un tiempo igual o mayor que t. La figura 4 del artículo que se propone como ejemplo (4) muestra curvas de supervivencia de pacientes con cáncer gástrico estratificados por diseminación peritoneal y valores del dímero-D. La principal dificultad para estudiar el tiempo hasta la ocurrencia de un evento es que, en general, al final del período de seguimiento siempre hay individuos en los que no se ha podido observar el evento y, por lo tanto, se desconoce el tiempo transcurrido hasta su ocurrencia, si bien se tiene una información parcial sobre él (si es mayor o igual que el tiempo observado). A este fenómeno se le denomina censura. La función de supervivencia se suele estimar por el método de Kaplan-Meier, que tiene en cuenta la información contenida en las censuras, asumiendo, y es importante resaltarlo porque es un punto crítico para la validez de la estimación, que las censuras son no informa-tivas o, dicho de otro modo, que los individuos censurados tienen el mismo riesgo de ocurrencia del evento que los que siguen en observación más allá de ese tiempo. La importancia de esta asunción es tanto mayor cuanto mayor sea el número de censuras. Nótese que esta asunción no es trivial y se violaría, por ejemplo, si los pacientes que abandonan el estudio están más graves, o menos, que los que continúan o, en otro ejemplo, si el evento fuera progresión de la enfermedad; la muerte sin progresión seguramente no cumple con esa asunción. Aunque excede los objetivos de este texto profundizar en ello, hay que distinguir entre censura (circunstancia que impide la observación del evento, pero se supone que este ocurrirá en el futuro) y evento competitivo (circunstancia que impide que el evento ocurra), que requiere un tratamiento estadístico distinto. La muerte sin progresión en el ejemplo anterior sería mejor considerarla un evento competitivo que una censura.

La otra forma de expresar el resultado de un estudio sobre factores pro-nósticos es mediante el RR, HR en inglés, de los pacientes de un nivel del factor respecto al que se toma como referencia. Es un cociente entre dos riesgos, por lo tanto, es igual a 1 si en ambos niveles del factor los pacientes tuvieran el mismo riesgo, es decir, si el factor estudiado no fuera un factor de riesgo, mayor que 1 si fuera factor de riesgo y menor que 1 si fuera factor

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 107©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

de protección. El riesgo, en estos análisis, se define como la probabilidad por unidad de tiempo (tasa instantánea de eventos) de que un individuo que está en observación en el tiempo t tenga el evento justo en ese tiempo, condicionado a que el evento no ocurrió antes. Puede ser, y de hecho suele serlo, variable en el tiempo. Sin embargo, el modelo de regresión de Cox, que es el método usado casi en exclusiva en la investigación clínica (11) para estimar el RR, asume que, aunque el riesgo pueda variar, el RR es constante. Esta asunción no siempre se cumple, no se cumpliría, por ejemplo, en un es-tudio en el que al final del seguimiento a todos los pacientes les haya ocurrido el evento. Es, por lo tanto, necesario evaluarla. Hay distintos procedimientos gráficos y estadísticos para hacerlo, pero el más sencillo es la inspección visual de las curvas de supervivencia. Si se cumple la asunción de RR constante, las curvas se separan según avanza el tiempo; que las curvas converjan o, en el caso extremo, se corten es un indicador de que la asunción no se cumple. En la figura 7-1 se muestran curvas que cumplen la asunción, y en la figura 7-2 curvas que no la cumplen.

PRECISIÓN

Es importante destacar también que los índices citados en el apartado ante-rior se calculan a partir de muestras, es decir, un subconjunto de los pacientes de interés en lugar de todos ellos; por tanto, presentan una imprecisión que se debe cuantificar por el intervalo de confianza (intervalo dentro del cual se

FIGURA 7-1 Curvas de supervivencia en las que se cumple la asunción de riesgo relativo constante, o riesgo proporcional. Obsérvese cómo se separan según avanza el tiempo.

108 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

puede asegurar, con una probabilidad determinada, habitualmente el 95%, que se encontraría el índice si se hubieran estudiado todos los pacientes, asu-miendo que el estudio sea válido). En el caso de las curvas de supervivencia, la anchura del intervalo de confianza aumenta según avanza el tiempo como consecuencia de la disminución del número de pacientes. En algunos estudios, la anchura al final del tiempo de seguimiento es tan grande, aunque con de-masiada frecuencia no mostrada (11), que se hace difícil la interpretación de la curva. Una de las razones por las que no siempre se muestran los intervalos de confianza es que, cuando se presentan varias curvas en la misma gráfica, esta puede llegar a ser engorrosa. Un modo alternativo de presentar la precisión en estos casos es incluir debajo del eje del tiempo el número de pacientes que permanecen en el estudio en cada tiempo. Como ayuda a la interpretación de cómo afecta este número a la precisión, se puede usar la recomendación de Pocock et al. (12) de que cuando en cada rama quedan menos del 10-20% de los pacientes que empezaron el estudio, la precisión de la estimación ya no es buena. En la figura 7-3 se muestran dos curvas con sus IC 95% y se observa este aumento de la anchura del intervalo según avanza el tiempo. También se presenta el número de pacientes que permanece en el estudio.

FIGURA 7-2 Curvas de supervivencia en las que no se cumple la asunción de riesgo relativo constante. Este sería un caso extremo en el que las curvas llegan a cruzarse, por lo que, para tiempos menores del punto en el que se cruzan (150 meses), el riesgo de evento para los pacientes sin ganglios (línea negra) es menor (supervivencia mayor) que para los pacientes con ganglios (línea naranja); por lo tanto, el riesgo relativo es menor que 1 y, sin embargo, para tiempos mayores que 150, la relación se invierte y el riesgo relativo es mayor que 1, es decir, no es constante.

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 109©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

CONFUSIÓN E INTERACCIÓN

La mayor amenaza para el estudio de asociaciones entre variables me-diante estudios observacionales es la confusión. Existe confusión cuando la asociación entre dos variables difiere según que se considere, o no, otra variable. A esta última variable se le denomina variable de confusión. Para que una variable sea de confusión debe de estar asociada al factor y a la va-riable evento. Por ejemplo, en el estudio para la estratificación pronóstica de pacientes con linfoma esplénico de la zona marginal (3), se encontró que los pacientes con concentración sérica elevada de la lactato deshidrogenasa (LDH) tienen un riesgo de muerte por la enfermedad 3,38 veces mayor que los que no la tienen. Sin embargo, como la supervivencia puede depender no solo de la LDH, sino también de otras variables, como la edad, o los niveles de otros componentes sanguíneos, podría ocurrir que, si los pacientes con niveles altos de LDH fueran también diferentes respecto a esas otras varia-bles, esa estimación del RR esté equivocada (confundida). En efecto, cuando se consideran otras variables, el RR de la LDH cambia a 2,47. La manera más usada y sencilla de controlar la confusión es, como se hizo en ese estudio,

FIGURA 7-3 Curvas de supervivencia con sus intervalos de confianza al 95% (IC 95%), en los que se observa el aumento de anchura según avanza el tiempo.

110 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

mediante modelos de regresión, en los que se incluyen la variable de interés y las variables de confusión que se quieran considerar. Una medida habitual para evaluar la confusión es comparar los efectos crudo (sin considerar otras variables) y ajustado (considerándolas); diferencias mayores del 10% indican presencia de confusión. Hay que resaltar que la confusión es un problema crucial cuando se estudian asociaciones causales; por ello, el diseño óptimo para evaluar el efecto de un tratamiento es el EC, en el que la asignación aleatoria del tratamiento a los pacientes trata justamente de evitar su asociación con cualquier otra variable para impedir la confusión; y se han desarrollado complejos sistemas de análisis (13) para controlar la confusión en los diseños observacionales de evaluación de efectos de los tratamientos. Sin embargo, no es tan crítico en estudios de pronóstico, por ejemplo, cuando se encuentra que el estado civil es un factor pronós-tico para la supervivencia al cáncer de mama (14) probablemente no se ha encontrado una asociación causal y hay algún factor, o varios (sicológicos, de comportamiento…), distinto entre las mujeres casadas y no casadas que es el causante de la diferencia en mortalidad y que, por lo tanto, sería un factor de confusión para esa asociación. A pesar de estar probablemente confundida, la información pronóstica que ofrece ese hallazgo es útil tanto para informar a los pacientes, como para generar ideas sobre los factores causales.

Otra dificultad que se puede presentar con los resultados de un estudio de pronóstico es la existencia de interacción o modificación del efecto. Existe interacción cuando la asociación entre dos variables, en este caso factor y evento, varía según los diferentes niveles de otra u otras variables. El aná-lisis más sencillo de interacción se hace mediante el análisis de subgrupos creados según los niveles de la variable modificadora de efecto. Para ello hay que evaluar el efecto del factor en las distintas categorías de la variable modificadora de efecto; por ejemplo, el efecto de la diabetes mellitus (DM) sobre eventos cardiovasculares puede ser distinto si el paciente ha tenido o no enfermedad cardiovascular previa (ECV). Si fuera así, el efecto de la DM debería ser mostrado no como un RR, sino como dos: uno para los pacientes con ECV previa y otro para los pacientes sin ECV previa (15). Se dice que hay interacción entre la DM y la ECV, o que la ECV modifica el efecto de la DM. Esta manera de analizarlo, muy utilizada en EC, presenta dos dificultades: está restringida a variables modificadoras categóricas, es decir, no es posible realizarla para variables continuas y no cuantifica es-tadísticamente si los efectos son distintos. Para evaluar estadísticamente la interacción entre un factor y una variable modificadora del efecto se suelen usar modelos de regresión en los que se incluyen como variables independientes el factor, la variable modificadora y el producto de las dos anteriores. La significación obtenida para este producto contrasta estadís-ticamente la interacción entre el factor y la variable. Si existe interacción, el efecto del factor no es único, sino que será distinto según los valores de la variable considerada, análogo a la consideración realizada anteriormente en el caso de análisis de subgrupos. Si la interacción se realiza con una

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 111©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

variable continua, el efecto será distinto según cada valor de la variable. Una alternativa de presentación podría ser mostrar el efecto del factor mediante un gráfico en el que en el eje de abscisas se muestre la variable modificadora y en el eje de ordenadas, el efecto.

UTILIDAD DEL PRONÓSTICO

Como ya se ha señalado, el objetivo de la investigación en factores pronós-ticos es obtener información que permita informar al paciente y a su entorno sobre la evolución más probable de la enfermedad y que ayude a la toma de decisiones sobre la realización de las distintas intervenciones posibles; también es útil para estratificar pacientes en los EC según su pronóstico inicial. Por ello, y como también se ha señalado, no es tan crítico como en los estudios de tratamiento obtener estimadores exentos de confusión, aunque sí es conveniente controlar por factores pronósticos ya conocidos. En el artículo citado sobre estado marital y cáncer de mama (14), el RR que se comunica está ajustado por factores demográficos, de tumor y de tratamiento, para asegurar que su valor pronóstico se añade al de los otros factores.

Con las técnicas genéticas, se está proponiendo una gran cantidad de nuevos marcadores pronósticos, de los que conviene evaluar si añaden, y cuánto, valor pronóstico a los anteriores. Además de la estimación ajustada por los factores conocidos, se han desarrollado técnicas específicas para hacer esa evaluación. Una de ellas es el índice de mejoría neta de la reclasificación (NRI) (16), propuesto para la situación en que a un modelo pronóstico existente se le añade una nueva variable, pero que no hay inconveniente en aplicarlo a la comparación de dos modelos distintos, siempre que se puedan aplicar los dos a los mismos pacientes. Sin entrar en demasiados detalles, el NRI exige estimar las probabilidades de evento predichas por ambos modelos y clasificar con ellas a los sujetos en categorías de riesgo. El NRI se define como la diferencia de las proporciones de sujetos con evento que «suben» de categoría con el nuevo modelo (el nuevo modelo les asigna una categoría de mayor riesgo que el viejo) y los que «bajan» (pasan a una categoría de menor riesgo con el nuevo modelo), menos esa misma diferencia en los sujetos sin evento. Es decir, el NRI cuantifica lo que mejora la clasificación para los eventos, descontando lo que empeora para los no eventos. Es, por tanto, un índice muy intuitivo de la mejora que el nuevo marcador supone respecto al anterior.

ARTÍCULO

Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-Dimer Levels Correlate with Long Term Survival of Gastric Cancer Patients. PLoS ONE. 2014; 9:e90547. Disponible en: http://dx.plos.org/10.1371/journal.pone.0090547.

112 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

PLANTILLA CASPE CONTESTADA PARA ESTE ARTÍCULO CONCRETO

En el cuadro 7-1 se muestra la plantilla CASPe contestada para este artículo concreto.

CUADRO 7-1

E VA L U A C I Ó N C R Í T I C A D E L A RT Í C U L O P R O P U E S T O ( P L A N T I L L A C A S P E )

A) ¿Son válidos los resultados?Preguntas de eliminación

1. ¿Fue una muestra representativa y bien definida de pacientes en un momento similar en el curso de la enfermedad?

PISTAS:– ¿De qué ámbito son los

pacientes: atención primaria o especializada?

– ¿En qué punto de su curso clínico se incluyen en el estudio?

Sí ✓ No sé NoSon 247 pacientes con cáncer gástrico probado patológicamente y sin terapia paliativa previa atendidos en un hospital de Shanghái entre 2002 y 2004. Se permitió quimioterapia adyuvante si habían pasado más de 6 meses.

De ellos, 237 recibieron algún tratamiento quirúrgico (168 gastrectomía radical, 46 gastrectomía paliativa y 23 laparotomía exploratoria). Después de la cirugía, 50 pacientes fueron confirmados como diseminación peritoneal

2. ¿Fue el seguimiento lo suficientemente prolongado y completo?

PISTAS:– El intervalo temporal entre un

factor pronóstico y un resultado es variable y puede ser muy largo

– ¿Se pierden pacientes? ¿Se investigan sus características?

Sí ✓ No sé NoSiguen a los pacientes mediante la historia del hospital, el Registro de Cáncer de Shanghái o el contacto con los familiares.

El tiempo fue definido como el intervalo entre la fecha de cirugía y el último seguimiento o muerte debido a cáncer gástrico. Los pacientes fueron observados hasta el 31/12/2010En resultados dicen que la mediana de seguimiento fue 37 meses (1-48)

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 113©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

Preguntas detalladas

3. ¿Se utilizaron criterios objetivos y no sesgados para los resultados?

PISTA: los resultados a veces son objetivos (p. ej., muerte), otras no tanto (p. ej., calidad de vida). ¿Se valoraron de modo «ciego»?

Sí ✓ No sé NoLos niveles de dímero-D fueron obtenidos 2 días antes de la cirugía con un método de ensayo de fluorescencia ligado a enzimas.

Se considera normal valores de dímero-D menores de 0,5.

El evento principal es muerte relacionada con el cáncer gástrico.

No evalúan el riesgo competitivo de muerte, lo definen como censura.

Se considera más robusto utilizar muerte por cualquier causa.

El punto de corte óptimo, un valor de 1.465, fue calculado basado en la curva ROC. No se dice qué método se ha utilizado para decir que es mejor (maximizar sensibilidad, especificidad, la suma…)

4. ¿Se hizo un ajuste por los factores pronósticos importantes?

PISTA: en muchos estudios de pronóstico el grupo de pacientes se divide en subgrupos de factores pronósticos (o tratamientos) sospechados. Si se hizo esto, ¿se controlaron por otros factores?

Sí No sé No ✓No dan detalle de qué variables analizaron.

En la tabla 5 del artículo original se muestra el resultado de los factores pronósticos univariables, pero no nos dicen si fueron evaluadas otras variables.

El modelo final lo componen el estadio (T1, T2, T3, T4), las metástasis de nodos linfáticos, el tamaño del tumor (< o > 5 cm), la diseminación peritoneal y el dímero-D con el punto de corte de 1.465.

Nota que todas las variables son significativas y que no hacen mención a la posible existencia de interacción o confusión, aunque en el texto dicen, en la página 6, que el HR es 3,86 al comienzo del párrafo y después dicen 2,28, que coincide con el HR del modelo multivariable

CUADRO 7-1 (cont.)

(Continúa)

114 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

B) ¿Cuáles son los resultados?

5. ¿Cuál es la probabilidad del(los) evento(s) en un período de tiempo determinado?

PISTAS:– La probabilidad varía

en el tiempo– ¿Se presentan

«curvas de supervivencia»?

– ¿Se presentan para los distintos factores pronósticos?

Se presenta mediante curva de supervivencia por el método de Kaplan-Meier y nos dan la mediana de supervivencia.

En los pacientes con niveles de dímero-D bajos, la mediana es 48,02 (43,8; 52,3) frente a 22,9 (17,5; 28,4) en pacientes con dímero-D > 1.465En términos de HR, es 2,28 (1,36; 3,81)

6. ¿Cuán precisas son las estimaciones?

PISTA: ¿se dan los intervalos de confianza?

(v. pregunta 5.)Se debería añadir el intervalo de confianza de las curvas o individuos en riesgo en los gráficos de la figura 4 del artículo original

C) ¿Son los resultados aplicables en tu medio?

7. ¿Son los pacientes del estudio similares a los míos?

PISTA: considera si:– Los pacientes del

estudio pueden ser suficientemente diferentes de los de tu área

– Tu medio parece ser muy diferente al del estudio

Sí No sé ✓ NoCarmen es mujer (representan el 33%), con una edad media similar a la del estudio y con un estadiaje inicial de la enfermedad bien representado entre los sujetos del estudio. Sin embargo, es importante destacar que el estudio está realizado en sujetos asiáticos y no se sabe bien si podría existir alguna variabilidad genética en la síntesis de dímero-D relacionada con la raza

CUADRO 7-1 (cont.)

7. LECTURA CRÍTICA DE EsTUDIos DE pRoNósTICo. EsTUDIos DE CohoRTEs 115©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

Bibliografía 1. Hemingway H, Croft P, Perel P, Hayden JA, Abrams K, Timmis A, et al. Prognosis re-

search strategy (PROGRESS) 1: A framework for researching clinical outcomes. BMJ. 2013;346:e5595.

2. Krumholz HMM, Wang YP, Chen JM, Drye EEMS, Spertus JAM, Ross JSMM, et al. Re-duction in Acute Myocardial Infarction Mortality in the United States: Risk-Standardized Mortality Rates From 1995-2006. JAMA. 2009;302:767-773.

3. Montalbán C, Abraira V, Arcaini L, Domingo-Domenech E, Guisado-Vasco P, Iannito E, et al. Risk stratification for Splenic Marginal Zone Lymphoma based on haemoglobin concentration, platelet count, high lactate dehydrogenase level and extrahilar lymphade-nopathy: development and validation on 593 cases. Br J Haematol. 2012;159:164-171.

4. Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-Dimer Levels Co-rrelate with Long Term Survival of Gastric Cancer Patients. PLoS ONE. 2014;9:e90547.

5. Steyerberg EW, Moons KG, van der Windt DA, Hayden JA, Perel P, Schroter S, et al. Prognosis Research Strategy (PROGRESS) 3: Prognostic model research. PLoS Med. 2013;10:e1001381.

6. Semeraro F, Parrinello G, Cancarini A, Pasquini L, Zarra E, Cimino A, et al. Predicting the risk of diabetic retinopathy in type 2 diabetic patients. J Diabetes Complications. 2011;25:292-297.

7. Chen H, Bai M, Qi X, Liu L, He C, Yin Z, et al. Child-Na score: a predictive model for survival in cirrhotic patients with symptomatic portal hypertension treated with TIPS. PLoS ONE. 2013;8:e79637.

CUADRO 7-1 (cont.)

8. ¿Conducen los resultados a seleccionar o a evitar un tratamiento?

Sí ✓ No sé NoLos autores sugieren que podría ser de gran ayuda para predecir la diseminación y la supervivencia a medio plazo. En el caso de Carmen, si decidimos que el factor racial no supone una enorme diferencia, podría ayudarla a contemplar un tratamiento menos agresivo y con menos probabilidad de muerte a 4 años

9. ¿Son útiles los resultados para tranquilizar o aconsejar a los pacientes?

Sí ✓ NoEn el caso de Carmen, aunque no determinante, permite predecir una probabilidad de supervivencia aproximada (a partir de la gráfica, teniendo solo en cuenta el resultado de la prueba) a 1 año del 90% y a 2 del 70%, y esta información podría ayuda a Carmen a decidir mejor sobre su futuro próximo y el de su negocio

HR, hazard ratio; ROC, receiver operador characteristic.

116 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

8. Hingorani AD, Windt DA, Riley RD, Abrams K, Moons KG, Steyerberg EW, et al. Prognosis research strategy (PROGRESS) 4: Stratified medicine research. BMJ. 2013;346:e5793.

9. Paula AR, Jerry HG, Kathy S, Muhammad M, David LS, Susan G, et al. Reader’s guide to critical appraisal of cohort studies: 1. Role and design. BMJ. 2005;330:895-897.

10. U.S. Department of Health and Human Services Food and Drug Administration. Guidance for Industry. Clinical Trail Endpoints for the Approval of Cancer Drugs and Biologics. 2007 [Visitado el 08/09/2014]. Disponible en: http://www.fda.gov/downloads/drugs-GuidanceComplianceRegulatoyInformation/Guidance/UCM071590.pdf.

11. Abraira V, Muriel A, Emparanza JI, Pijoán JI, Royuela A, Plana MN, et al. Reporting quality of survival analyses in medical journals still needs improvement. A minimal requirements proposal. J Clin Epidemiol. 2013;66:1340-1346.

12. Pocock SJ, Clayton TC, Altman DG. Survival plots of time-to-event outcomes in clinical trials: good practice and pitfalls. Lancet. 2002;359:1686-1689.

13. Muriel A, Hernández D, Abraira V. Modelos estructurales marginales: una herramienta útil que proporciona evidencia a los estudios observacionales. Nefrología. 2011;2(Supl Ext):7-13.

14. Aizer AA, Chen MH, McCarthy EP, Mendu ML, Koo S, Wilhite TJ, et al. Marital status and survival in patients with cancer. J Clin Oncol. 2013;31:3869-3876.

15. Becker A, Bos Gt, de Vegt F, Kostense PJ, Dekker JM, Nijpels G, et al. Cardiovascu-lar events in type 2 diabetes: comparison with nondiabetic individuals without and with prior cardiovascular disease: 10-year follow-up of the Hoorn Study. Eur Heart J. 2003;24:1406-1413.

16. Pencina MJ, D’Agostino RB, Steyerberg EW. Extensions of net reclassification improvement calculations to measure usefulness of new biomarkers. Stat Med. 2011;30:11-21.

Cómo citar este capítulo:Abraira V, Muriel A, Montes ML. Lectura crítica de estudios de pronóstico: estudios de cohortes. En: Cabello Juan B, editor. Lectura crítica de la evidencia clínica. Barcelona: Elsevier; 2015. p. 101-116.