19. Regresión Logística

Post on 19-Jan-2017

519 views 4 download

Transcript of 19. Regresión Logística

19. Regresión logística INVESTIGACIÓN CLÍNICAUNIVERSIDAD AUTÓNOMA DE CIUDAD JUÁREZ

Regresión Logística

La variable dependiente (Y) tiene 2 valores (dicotómica) Ausencia / presencia Mutuamente excluyente

Las variables independientes (X) o predictoras son: Continuas (edad) Ordinales (estadios) Dicotómicas (si/no)

Este modelo busca explicar o predecir la probabilidad de que ocurra o no un evento

Modelo multivariado

Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7

Regresión Logística

Condiciones

Las variables no aleatorias X (fijas) son posibles predictoras de Y

La relación de las variables debe ser clara y permitir que se establezcan los factores de riesgo

Es importante que no se deben utilizar variables en los casos en los que no se conoce su relación con la enfermedad

Los valores de X (variables fijas) son independientes

A La variable dependiente (Y) se le codifica como 0 o 1

Odds Ratio . Razón de Momios Es el logaritmo de la probabilidad de

que el evento suceda entre la probabilidad de que no suceda

Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7

Condiciones Se puede hacer

inicialmente un análisis BIVARIADO para observar las relaciones significativas

El modelo final puede incluir todas las variables que demostraron relación con el resultado (Y)

Es deseable que cada variable en el modelo cuente con un mínimo de 10-20 casos por cada evento

Ej., Si tenemos 47 casos de neumonía en 121 pacientes, no deberíamos incluir en nuestro modelo más de 4 variables (47/10 = 4.7)

Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7

Condiciones

Lo anterior se llama eventos por variable

Sirve para estabilizar los datos

En caso de incluir más variables, los datos pueden volverse inestables y dar resultados falsos

Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7

Pasos

1er paso – hacer una análisis bivariado con cada una de las posibles variables involucradas

Las variables dicotómicas se contrastan con Chi cuadrada

Las variables continuas se contrastan con t de Student

La medida de asociación es OR (Exp[β])

IC 95% (valor mínimo y máximo)

Una vez identificadas las variables que se asocian, haremos el modelo multivariado (preselección)

Eliminando las variables sin relación

Eliminando las variables con mayor p-valor

Se recomienda no eliminar variables que tengan lógica biológica (ej., edad) con el fin de ajustar el modelo

Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7

Berea-Baltierra et al., Rev Med Inst Mex Seguro Soc. 2014;52(2):192-7