ANÁLISIS DE SUPERVIVENCIA - USC · La supervivencia viene a ser una medida del tiempo que...

31
ANÁLISIS DE SUPERVIVENCIA TEMA VI

Transcript of ANÁLISIS DE SUPERVIVENCIA - USC · La supervivencia viene a ser una medida del tiempo que...

  • ANÁLISIS DE SUPERVIVENCIA

    TEMA VI

  • Modelos Multivariantes 2

    Análisis de Supervivencia. En Rial, A. y Varela, J. (2008). Estadística

    Práctica para la Investigación en Ciencias de la Salud. Coruña:

    Netbiblo. Páginas 247-273.

    LECTURA OBLIGATORIA

  • Modelos Multivariantes 3

    TÉRMINOS QUE DEBES DOMINAR

    Estudios de mortalidad/seguimiento

    Período de Seguimiento

    Tablas Kaplan-Meier

    Probabilidad de Supervivencia

    Media y Mediana de Supervivencia

    Curva de Supervivencia

    Función de Supervivencia

    Test Log Rank

    Regresión de Cox

    Hazard

    Hazard Ratio

  • Modelos Multivariantes 4

    Orígenes en el ámbito médico, en los llamados estudios de mortalidad, cuyo

    objetivo era predecir el tiempo que un paciente con una enfermedad terminal

    podría mantenerse con vida, pudiendo estudiarse también el posible efecto de

    distintos tratamientos.

    Hoy en día se utiliza en contextos tan variados como el militar, la ingeniería, la

    industria, la psicología o la economía.

    Gracias a su utilización los investigadores pueden estimar para intervalos de

    tiempo determinados la probabilidad que tiene un paciente de recaer de una

    determinada patología, de que se produzca el alta médica o el tiempo que va a

    tardar en ser eficaz un tratamiento…; cualquier evento que nos interese

    modelizar y/o pronosticar.

    pon EJEMPLOS

    ¿En qué consiste?

  • Modelos Multivariantes 5

    La supervivencia viene a ser una medida del tiempo que transcurre hasta una

    respuesta de interés: recaída, alta médica, manifestación de los primeros

    síntomas de una determinada enfermedad, etc.

    Cuando se trata de enfermedades graves, el análisis de supervivencia deriva

    en la estimación de probabilidades de mantenerse con vida durante

    determinados períodos de tiempo, informando así del grado de severidad de la

    enfermedad, algo que menudo se desconoce.

    ESTUDIOS DE SEGUIMIENTO. Muchas veces el investigador no puede

    manipular, ni controlar las variables objeto de estudio, ni tampoco a los sujetos

    que participan en él, sino que dispone de información relativa a sus

    “pacientes” a lo largo de un determinado período de tiempo, que ni siquiera es

    el mismo para todos.

    ¿En qué consiste?

  • Modelos Multivariantes 6

    Trabajamos en una UAD y a lo largo de dos años hemos seguido a 100 sujetos, de

    los cuales sabemos que algunos han llegado a abandonar su adicción, mientras que

    otros no lo han hecho o bien desconocemos qué ha sucedido con ellos realmente,

    bien porque han traslado su residencia o porque han dejado de venir a la consulta.

    Si el período de registro comprende un total de 24 meses, es probable que

    dispongamos de datos “incompletos” para alguno de los sujetos, bien porque

    causan baja o bien se incorporan más tarde. Como consecuencia, cada sujeto

    posee un tiempo de registro o seguimiento particular y una información específica

    respecto a la variable de interés (si ha abandonado su adicción o no, o si ni siquiera

    lo sabemos.

    Durante el período de registro es probable que algunos sujetos no hayan sufrido el

    evento de interés, mientras que otros sí, y es probable también que a algunos

    sujetos le hayamos perdido la pista.

    EJEMPLO

  • Modelos Multivariantes 7

    ESQUEMA GENERAL

    El análisis trabaja con información parcial (casos “censurados”)

    1

    2

    ..

    .

    n

    Período de estudio

    evento

    evento

    evento

    sale (censurado)

    muere por otra causa (censurado)

    evento

    Fin

    ESQUEMA GENERAL

    Paciente

    Inicio

  • Modelos Multivariantes 8

    VARIABLES

    EXPLICATIVAS

    TTiieemmppoo hasta que ocurre un evento

    RESPUESTA DE CENSURA

    Para indicar si se ha producido o no el evento (incluidos aquellos casos que han salido del estudio en el transcurso de éste)

    Cuya influencia sobre la Respuesta se desea estudiar

    • Tiempo desde la intervención hasta la muerte

    • Tiempo libre de enfermedad o hasta recaída

    • Sesiones de terapia hasta el alta

    • Tiempo hasta acción del fármaco, rehabilitación, etc.

    • Tiempo hasta desarrollo de una enfermedad

    •Incumplimiento terapéutico •Pérdida del seguimiento •Efectos secundarios •Violaciones al protocolo

    •Diagnóstico al inicio •Tipo de tratamiento •Dosis •Sexo •Edad •Nivel de deterioro •Adherencia •Apoyo familiar

    VARIABLES IMPLICADAS

  • Modelos Multivariantes 9

    Lo verdaderamente interesante es que podemos aprovechar la información

    disponible de cada sujeto para estimar una función de supervivencia global que

    se derive en la elaboración de:

    1. Tablas de Supervivencia, en las que se recoja la probabilidad de supervivencia

    para diferentes momentos.

    2. Gráficos o Curvas de Supervivencia, donde se puede ver cómo evoluciona la

    probabilidad de supervivencia a lo largo del tiempo

    3. Descriptivos de supervivencia (media, mediana y cuartiles).

    4. Contrastes de supervivencia, para probar el posible efecto modulador de una VI.

    5. Modelos de supervivencia, poniendo a prueba el efecto conjunto de varias VI o

    variables explicativas, identificando factores de riesgo y de protección.

    POTENCIAL

  • Modelos Multivariantes 10

    Se trata más bien de supuestos teóricos y no tanto estadísticos.

    SUPUESTOS de partida

    DOS SUPUESTOS FUNDAMENTALES:

    1. La censura debe tener un carácter aleatorio; no debe ser una censura

    informativa. Los datos censurados deben ser representativos de los datos

    no censurados. No debe existir relación entre las posibles fuentes de

    censura y las diferentes VI a considerar en el análisis.

    2. Proporcionalidad. Los efectos de las VI deben ser constantes a lo largo del

    tiempo, sin mediar interacción alguna. Ello se traduce en que a nivel

    gráfico las funciones deben transcurrir paralelas.

  • Modelos Multivariantes 11

    Una vez garantizado el cumplimiento de dichas supuestos se procede al análisis,

    que comienzan por la elaboración de las denominadas tablas de supervivencia y

    las correspondientes curvas de supervivencia, junto con el cálculo de

    descriptivos.

    La función de supervivencia estimada para dos grupos (p.ej.: con y sin

    tratamiento) puede ser comparada a través de un contraste estadístico (Log-Rank)

    También puede ser modelizada, poniendo a prueba el posible efecto de distintas VI

    (Regresión de Cox).

    La interpretación de los resultados consiste en conocer la probabilidad de

    supervivencia de un paciente en un momento o intervalo determinado, su tiempo

    de supervivencia medio, así como la ventaja o desventaja de poseer una

    característica o de haber sido sometido a un tratamiento.

    ANÁLISIS de datos

  • Modelos Multivariantes 12

    Para elaborar las tablas de supervivencia y las curvas de supervivencia se

    suele recurrir al MÉTODO DE KAPLAN-MEIER.

    Dicho método calcula la supervivencia cada vez que un paciente

    experimenta el evento, generando las probabilidades en cada momento.

    Las probabilidades de supervivencia se calculan a partir del número de

    pacientes en riesgo justo en el momento de producirse el evento.

    P7, por ejemplo, sería la probabilidad condicional de supervivencia en el

    séptimo mes, habiendo sobrevivido los 6 anteriores.

    TABLAS DE SUPERVIVENCIA

  • Modelos Multivariantes 13

    Tenemos que:

    Pk es la probabilidad de sobrevivir el k-ésimo mes

    rk es el número de casos en riesgo, es decir, que aun no han

    recaído justo antes del k-ésimo mes

    fk es el número de eventos registrados el día k

    Por lo que se podría estimar Pk a partir de la siguiente FÓRMULA:

    Pk = Pk-1 [(rk - fk)/ rk]

    EL CÁLCULO DE PROBABILIDADES

  • Modelos Multivariantes 14

    Para cada momento la Prob. de supervivencia se calcula multiplicando la

    supervivencia en el momento anterior por la tasa de supervivencia en dicho

    momento.

    En el denominador tendríamos el nº de pacientes que continuaban en el

    estudio en el momento anterior (casos expuestos a riesgo) y en el

    numerador ese mismo valor menos el nº de pacientes que sufren el evento

    en ese momento.

    Los valores de supervivencia se calculan sólo para aquellos momentos en los que algún sujeto sufre el evento. En el resto de momentos se asume que

    la Prob. de supervivencia es la misma que en el momento inmediatamente

    anterior.

    EL CÁLCULO DE PROBABILIDADES

  • Modelos Multivariantes 15

    EJEMPLO

    Nº SUJETO TIEMPO DE SUPERVIVENCIA (MESES) RECAÍDA (0: NO - 1: SÍ) 1 8 1

    2 5 0

    3 10 1

    4 7 1

    5 24 0

    6 8 1

    7 24 0

    8 24 0

    9 8 1

    10 12 0

    11 22 1

    12 14 1

    13 2 1

    14 3 1

    15 24 1

    16 7 0

    17 14 1

    18 2 1

    19 3 1

    20 16 1

    21 9 1

    22 12 1

    23 9 0

    24 6 1

  • Modelos Multivariantes 16

    SE ORDENAN LOS DATOS SEGÚN EL TIEMPO

    TIEMPO DE SUPERVIVENCIA (MESES)

    RECAÍDA (0: NO - 1: SÍ)

    PROB SUPERVIVENCIA

    2 1 0.916

    2 1 0.916

    3 1 0.833

    3 1 0.833

    5 0 0.833

    6 1 0.789

    7 0 0.745

    7 1 0.745

    8 1 0.605

    8 1 0.605

    8 1 0.605

    9 1 0.559

    9 0 0.559

    10 1 0.508

    12 0 0.457

    12 1 0.457

    14 1 0.343

    14 1 0.343

    16 1 0.286

    22 1 0.228

    24 1 0.171

    24 0 0.171

    24 0 0.171

    24 0 0.171

  • Modelos Multivariantes 17

    PRIMERO: ordenar los sujetos en función del tiempo de supervivencia de

    cada uno.

    SEGUNDO: calcular la probabilidad de supervivencia utilizando la fórmula

    Pk = Pk-1 [(rk - fk)/ rk]

    Los dos primeros sujetos que sufren el evento (recaída), lo hacen a los

    dos meses, por lo que la probabilidad de supervivencia para el segundo

    mes se puede calcular de manera muy sencilla:

    P2 = 1 (24 - 2)/ 24 = 0.916

    EL CÁLCULO DE PROBABILIDADES

  • Modelos Multivariantes 18

    El cálculo del siguiente valor se hará de forma condicional, calculando

    una nueva proporción y multiplicándola por la probabilidad del momento

    anterior.

    El cálculo de probabilidades para 3 y 6 meses sería:

    P3 = 0.916 (22 - 2)/ 22 = 0.833

    P6 = 0.833 (19 - 1)/ 19 = 0.789

    NOTA: sólo es posible realizar los cálculos para aquellos momentos en los que

    se ha registrado la presencia del evento (2, 3, 6, 7 meses…). En aquellos

    momentos en los que no se haya registrado (5, 11 meses,…) se asume

    que la Prob. de supervivencia es la misma que en el momento anterior.

    EL CÁLCULO DE PROBABILIDADES

  • Modelos Multivariantes 19

    Lo que se calcula de este modo es una función de probabilidad, que se

    materializa en una probabilidad condicional en diferentes momentos o

    períodos de tiempo.

    La información puede recogerse en una Tabla Kaplan-Meier e ilustrarse en

    un gráfico o Curva de Supervivencia.

    Se puede calcular también la Media, la Mediana y los cuartiles de

    Supervivencia .

    EL CÁLCULO DE PROBABILIDADES

  • Modelos Multivariantes 20

    TABLA KAPLAN-MEIER

  • Modelos Multivariantes 21

    CURVA DE SUPERVIVENCIA

  • Modelos Multivariantes 22

    Más que los valores concretos de probabilidad, lo que debe centrar el

    interés del investigador a la hora de interpretar los resultados es la

    TENDENCIA OBSERVADA EN LA CURVA Y SU INCLINACIÓN, que informa

    de la aceleración que experimenta el tiempo con relación a la probabilidad

    de supervivencia del paciente.

    EVOLUCIÓN de una enfermedad

    ¡El tiempo corre demasiado de prisa en algunas enfermedades!

    CURVA DE SUPERVIVENCIA

  • Modelos Multivariantes 23

    También es posible realizar los cálculos para diferentes grupos, explorando

    así el efecto de una VI. Tendríamos tantas tablas y curvas de supervivencia

    como grupos se estableciesen en la VI.

    Las media y medianas de supervivencia de cada uno de ellos podrían ser

    comparadas, al igual que las pendientes de las curvas, evaluando con ello su

    comportamiento diferencial.

    A nivel estadístico, podríamos acudir a la prueba Log-Rank, para contrastar la

    hipótesis de igualdad de las funciones.

    Si no se cumple el supuesto de PROPORCIONALIDAD: Breslow o Tarone-Ware

    ANÁLISIS POR GRUPOS

  • Modelos Multivariantes 24

    ANÁLISIS POR GRUPOS

    Tiem po Probabilidad de

    Supervivencia

    1

    2

    .... 5

    6

    0,70

    0,50

    .... 0,34

    0,27

    5

    6

    7 ....

    12

    0,66

    0,89

    0,78 ....

    0,16

    A

    B

    Permite comparar las curvas de supervivencia para distintos grupos

    Tiempo (t)

    Pro

    b.

    su

    pe

    rv

    ive

    nc

    ia,

    S(t)

    1

    Tablas y Gráficos Kaplan-M eier

    0

  • Modelos Multivariantes 25

    ANÁLISIS POR GRUPOS

  • Modelos Multivariantes 26

    ANÁLISIS POR GRUPOS

    Sin Cirugía (1)

    Con Cirugía (0)

  • Modelos Multivariantes 27

    EL TEST LOG-RANK

  • Modelos Multivariantes 28

    En la Regresión de Cox se intenta modelizar una Función de Riesgo o

    (Hazard) que se suele representar como t y que vendría a ser el riesgo de

    fallecer (recaer, …) en el momento “t”, obtenida a partir del seguimiento

    de un grupo de sujetos.

    El modelo general podría ser expresado del siguiente modo:

    REGRESIÓN DE COX

    nnt XXXLn ...2211

  • Modelos Multivariantes 29

    donde,

    t es la función de riesgo o Hazard

    es el valor de una constante que especifica el riesgo basal, en

    ausencia de cualquier factor o variable explicativa

    Xn son las diferentes variables explicativas cuyo efecto pretende

    probarse

    n son los pesos o coeficientes de regresión estimados para cada

    variable explicativa

    REGRESIÓN DE COX

  • Modelos Multivariantes 30

    VIs

    MÁXIMA VEROSIMILITUD

    CHI-CUADRADO

    CONTRASTE DE WALD

    MÉTODO DE PASOS

    -2LL

    No hay R2

    ¿SIMILAR A LA REGRESIÓN LOGÍSTICA?

  • Modelos Multivariantes 31

    El signo de los “B”

    ¿Aumenta ó disminuye el riesgo de que se produzca el evento (muerte,

    recaída, alta, etc.) bajo determinadas condiciones o niveles de la VI?.

    Hazard Ratio (HR). SPSS los designa como Exp (B). Es un cociente (ODD)

    entre la Tasa de Riesgo (o Riesgo Relativo) para un sujeto bajo una

    determinada condición (tratamiento “A”), frente a otra (tratamiento “B”), con

    el que se intenta representar el efecto de cada VI.

    Interpretación del HR: Valores próximos a “1” indican que dicha VI no implica

    un cambio en la Tasa de Riesgo (numerador y denominador serían iguales).

    Valores inferiores a “1” implican una disminución del riesgo y, por lo tanto,

    un aumento de la probabilidad de supervivencia, correspondiéndose con

    factores de protección y coeficientes B negativos. Valores superiores a “1”

    se corresponderían con factores de riesgo y coeficientes B positivos.

    INTERPRETACIÒN