Salvador Peiró Centro Superior de Investigación - … · Unidades monetarias, proxys de costes...

58
Salvador Peiró Centro Superior de Investigación en Salud Pública (CSISP- FISABIO), Valencia.

Transcript of Salvador Peiró Centro Superior de Investigación - … · Unidades monetarias, proxys de costes...

Salvador Peiró Centro Superior de Investigación en Salud Pública (CSISP-FISABIO), Valencia.

2 de cada 5 partos finalizan en

Cesarea 2 de cada 20

partos finalizan en Cesarea

Variaciones sistemáticas (no aleatorias) en la utilización de un procedimiento (médico, quirúrgico, preventivo, diagnóstico, …), o en resultados de salud (de pacientes o poblaciones), una vez se descarta que esta variabilidad se deba a diferencias entre las poblaciones o los pacientes cuya utilización o resultados se compara.

“Tasa” de cesáreas en 130 hospitales del SNS 2003-2005 (n=690.457 partos). Cada punto representa la tasa en un hospital. Tasa de cesáreas cruda y en diferentes estratos de riesgo.

Doble de riesgo de cesárea que en el promedio de

hospitales La mitad de riesgo de cesárea

que en el conjunto de hospitales

Variaciones sistemáticas, no debidas al azar

Razón estandarizada de riesgo de cesárea en 130 hospitales del SNS 2003-2005 (n=690.457 partos).

Tasas estandarizadas de ingresos hospitalarios en personas de 80+ años por 1.000 habitantes, por área de salud y CC.AA. (SNS, 2006)

115/1000h/año

Variaciones en… medidas de utilización: tasas de frecuentación hospitalaria

565/1000h/año

35 < que promedio

65% > que promedio

Adherencia a tratamientos índice (antiagregantes, IECA ó ARA, betabloqueantes y estatinas) tras alta por IAM por Departamentos de Salud (Comunidad Valenciana 2009-2010). Adherencia: toma de al menos 3 de los 4 fármacos durante >75% del tiempo de seguimiento (9 meses)

Variaciones en… medidas de proceso: adherencia a tratamientos

16 semanas

5 semanas

Tiempo (en semanas) desde el diagnóstico de sospecha de cáncer de mama en pruebas de cribado hasta el inicio del tratamiento. Departamentos de Salud de la Comunidad Valenciana 2006-2007.

Variaciones en… medidas de proceso: tiempo de espera

6,8 días

4,3 días

Estancia media hospitalaria (en días) en los hospitales de agudos de la Agencia Valenciana de Salud (2005-2007). Buen control: PA sistólica >140 y PA diastólica <90

Variaciones en… medidas de productividad (eficiencia técnica): duración de la estancia hospitalaria.

27%

14%

Porcentaje de hipertensos (>14 años; no diabéticos no renales) con “buen control”. Departamentos de Salud Comunidad Valenciana 2006-2007. Buen control: PA sistólica >140 y PA diastólica <90

Variaciones en… medidas de resultado: control de hipertensos.

Variaciones en… medidas de resultado: mortalidad a los 30 días del ingreso en UCI

Casi doble riesgo de muerte que el promedio hospitales

La mitad de riesgo de muerte en UCI que en promedio

hospitales

El numerador de las VPM Medidas de utilización/procesos Medidas de productividad Medidas de resultado clínico

Los denominadores de las VPM: Población general (o subgrupos) Poblaciones que utilizan los servicios o cumplen determinadas condiciones

Las unidades de análisis: Áreas de servicio (geográficas) Centros o proveedores sanitarios

VPM poblacionales

VPM de base individual

Tiempo Periodo temporal que se valora y/o ventana temporal para la identificación del numerador.

Numerador (evento que se desea medir) Unidades monetarias, proxys de costes (estancia media), servicios utilizados, procesos de cuidados o resultados de la atención. Denominador (Población de interés en relación al suceso) Definida en función del centro de atención, la localización geográfica, alguna característica específica (diabéticos, hipertensos, etc.) o un mayor riesgo respecto a un suceso de interés (intervenidos de cirugía mayor). Proveedores o unidades organizativas a valorar Hospitales, servicios específicos, médicos individuales, zonas de salud, áreas sanitarias, …

Medidas de adecuación/inadecuación (hacer lo que hay que hacer) Antiagregantes en el IAM, … UCI para quienes “necesiten” la UCI, …

Medidas de productividad Estancia media, índice de rotación, ocupación, … Coste por ingreso, coste por día, … GRD: coste por GDR, estancias evitables, índice casemix, …

Medidas de utilización Tasas de ingresos hospitalarios, de visitas a urgencias, de intervenciones quirúrgicas, de pruebas diagnósticas, …

Reducción de mortalidad/incremento de supervivencia Intrahospitalaria, en UCI, a los n días del episodio o ingreso o alta o intervención, supervivencia a los n años del diagnóstico, libre de enfermedad, de progresión, mortalidad por causas específicas, … Reducción de morbilidad De la morbilidad específica que la intervención intenta reducir (ej: eventos coronarios)

Reducción de sucesos adversos Reingresos no programados, infecciones nosocomiales, patología iatrogéna, reacciones adversas a fármacos, complicaciones post-quirúrgicas u otras, reintervenciones, recidivas, … Mejora o normalización de parámetros fisiológicos (Surrogate

endpoints) Signos clínicos (pulso, temperatura, presión arterial, …), parámetros bioquímicos (Hto, Hb, Hb1Ac, colesterolemía, …), marcadores, parámetros anatómicos (diámetro arterial,

Satisfacción con la atención Encuestas de satisfacción y otros instrumentos

Función física Capacidad para el esfuerzo; capacidad para las actividades de la vida diaria; capacidades específicas: visuales, movilidad y otras similares; normalización/mejora en pruebas funcionales (FEV1, ergometría, audiometría, …)

Función psicosocial Estado cognitivo, ansiedad, depresión, estrés, …

Calidad de vida relacionada con la salud (general, específica) Impacto de la enfermedad (y su tratamiento) sobre el conjunto de la vida del paciente. A diferencia de la función, perspectiva subjetiva del paciente.

88

Participantes

criterios exclusión (3) 85

83 pendientes seguimiento

(15) 70

ALEATORIZADOS

POBL. INICIAL

DIA 1

DIA 2

DIA 3

DIA 7

DIA 15

DIA 30

DIA 90

DIA 365

84

83

81

83

84

85

Por datos perdidos (1-4)

Cirugía abierta vs. laparoscópica en la hernia incisional (ensayo aleatorizado)

88 Pacientes 3 Hospitales comarcales

Asignación aleatoria 47% laparotomías vs.

53% laparoscopias Hernias >5 & <15 cm Ø

Endpoint primario: calidad de vida a las 90

días.

Cirugía abierta vs. laparoscópica en la hernia incisional (ensayo aleatorizado)

Tiempo operatorio, duración de la

estancia, complicaciones y

recidivas.

Cirugía abierta vs. laparoscópica en la hernia incisional (ensayo aleatorizado)

Calidad de vida (EuroQol - EVA) tras

cirugía de hernia incisional

Cirugía abierta vs. laparoscópica en la hernia incisional (ensayo aleatorizado)

0 5

10 15 20 25 30

0

10

20

30

40

50

60

70

Edad % hombres IMC ASA Diabetes

OCFA Dicum. Op. Prev.

EM preop. Ø cm

Laparoscopia Laparotomía

p<0,05

Neo.

CARACTERISTICAS BASALES DE LOS GRUPOS LAPAROTOMIA Y LAPAROSCOPIA

Tasa de cesáreas y factores de riesgo en los hospitales públicos de la Comunidad Valenciana (2005-2010)

Diferencias en uso de procedimientos y mortalidad en los pacientes atendidos en hospitales con y sin UCI (Estudio IBERICA, 2000)

Diferencias en el tipo de pacientes atendidos en diferentes tipos de hospital (Estudio IBERICA, 2000)

Mortalidad intrahospitalaria en hospitalizaciones por AVC. Hospitales públicos de la Comunidad Valenciana 1993-1995.

Peiró S, Librero J. Evaluación de calidad a partir

del conjunto mínimo de

datos básicos al alta

hospitalaria. Rev Neurol.

1999; 29: 651-661

Los resultados no dependen exclusivamente de la eficacia de la tecnología o de la calidad del centro sanitario, sino también de la gravedad del paciente respecto al resultado de interés.

Gravedad (severity): Probabilidad (riesgo) previa de cada paciente, antes de ser tratado mediante una tecnología o por un proveedor concreto, de obtener un determinado resultado: morir, reingresar, complicarse, costes, estar más tiempo en el hospital, etc.

RESULTADO

CALIDAD EFICIENCIA

AZAR

GRAVEDAD

Mortalidad, Reingresos, Complicaciones, Recidivas, Calidad de vida, EM por proceso, Coste por proceso, … Edad, Sexo, Dx principal, Gravedad Dx principal, Comorbilidad, Complicaciones, Estabilidad clínica, Estado funcional, Estado cognitivo, Socio-culturales, Calidad vida previa, Actitudes paciente

Las comparaciones directas entre organizaciones sanitarias que tratan diferentes tipos de pacientes NO son válidas... Sin embargo, es posible utilizar métodos epidemiológicos que tradicionalmente se usan en los estudios observacionales (estratificación, estandarización, ajuste de riesgos multivariable, …) para “controlar” el efecto de las diferencias de riesgo entre pacientes. Este método, y hasta cierto punto, permite simular centros sanitarios que tratan pacientes “hipotéticos” con valores medios en todos los factores de riesgo incluidos y, en este supuesto, se esperarían resultados similares entre centros (de existir diferencias podrían atribuirse a problemas de calidad o eficiencia, o a variables no controladas). Sistemas de clasificación de pacientes, de ajuste de riesgos, de estratificación, instrumentos predictivos: sistemas/instrumentos que cuantifican el riesgo (la gravedad) para los pacientes de obtener un determinado resultado.

Rue Monne M et al. Utilización del Mortality Probability Models (MPM II) en la evaluación de la efectividad de la atención a pacientes críticos. Med Clin (Barc) 1996; 106: 565-570

Variables, coeficientes logit y Odds Ratio del MPM-II24

Rue Monne M et al. Utilización del Mortality Probability Models (MPM II) en la evaluación de la efectividad de la atención a pacientes críticos. Med Clin (Barc) 1996; 106: 565-570

Paciente de 67 años, no quirúrgico (médico), que tras 24h del ingreso en UCI presenta una

infección confirmada y esta

ventilado, sin otras alteraciones en

variables del MPM-II24 p(muerte)= e-1,3164 /1+e-1,3164 = 0,21

De cada 100 pacientes con éstas características se espera que 79 vivan y 21 mueran.

Riesgo de muerte a los 30 días (predicción) de un paciente en la UCI usando el MPM-II24.

UCI1: 37/35,7=1,04; Mortalidad un 4% mayor que la esperada

UCI2: 37/26,3=1,41; Mortalidad un 41% mayor que la esperada

Comparación de 2 UCI ajustando la mortalidad por la gravedad de los pacientes a las 24h del ingreso usando el MPM-II24.

OJO! Un exceso de mortalidad (o un resultado excelente) pueden ser debidos al azar si el número de casos es pequeño.

Marco para la comparación de utilización, procesos o resultados entre unidades organizativas asistenciales.

Inferencia sobre la calidad o eficiencia relativa de las UCI

¿Hay diferencias en un

proceso/resultado entre 2 ó más UCI

¿Las diferencias se deben a diferencias en el tipo de

pacientes o en calidad/eficiencia de los servicios?

Ajuste del resultado por el “peso” del sistema de ajuste utilizado

¿Las diferencias ajustadas son estadísticamente

significativas?

SISTEMAS DE PREDICCIÓN DE MORTALIDAD GENÉRICOS APACHE II [1985, USA] APACHE III [1993, USA] SAPS II [1993, EUROPA & USA] MPM II0, MPM II24 [1993, USA] SAPS III [2005, VARIOS CONTINENTES] APACHE IV [2006, USA] MPM III0 [2007, USA]

SISTEMAS DE PREDICCIÓN DE MORTALIDAD ESPECÍFICOS Child–Pugh (CP): Insuficiencia hepática [1964, 1973; USA, UK ] Ranson score: Pancreatitis [1974; USA] Escala de Coma de Glasgow (GCS): pacientes inconscientes [1975; UK] Quality Measurement and Management Initiative (QMMI) Score: cirugía coronaria [USA;2001] Risk, injury, failure, loss and end-stage kidney (RIFLE) classification: Insuficiencia renal aguda [AUSTR, 2004] European System for Cardiac Operative Risk Evaluation (EuroSCORE): cirugía cardiada [EUROPE,1999]

SISTEMAS ENFOCADOS AL FALLO ORGÁNICO Sepsis-Related Organ Failure Score (SOFA) [1996; EUROPE ] Multiple-Organ Dysfunction Score (MODS) [1995; USA] Logistic Organ Dysfunction System (LODS) [1996; EUROPE] Organ Dysfunctions and / or Infection (ODIN) [1993]

Los GDR son un sistema de clasificación de episodios de hospitalización en grupos en los que se espera un consumo similar de recursos hospitalarios (grupos isoconsumo). Los GDR son asignados por un programa informático (agrupador; grouper) usando una base de datos al alta común para todos los hospitales (Conjunto Mínimo de Datos Básicos; CMBD) a partir de los diagnósticos y procedimientos que recibe el paciente (clasificados conforme a la Clasificación Internacional de9ª revisión Modificación Clínica; CIE9MC), la edad y el sexo. Cada GDR tiene asociado un peso relativo de consumo de recursos con 4 decimales en el que la unidad (1,0000) se supone igual al coste promedio de un ingreso (en Medicare, ya que se emplean los pesos calculados por esta aseguradora pública estadounidense). Un peso de 1,5000 implica que ese GDR tiene un coste un 50% mayor al coste medio de los ingresos hospitalarios. Este peso es el utilizado para el reembolso y para los indicadores comparativos de la eficiencia hospitalaria.

VERSIONES CMS-DRG (GDR, GDR Medicare) versión utilizada por los Centers for Medicare and Medicaid Services para el pago de las hospitalizaciones en Estados Unidos) Refined DRGs (R-DRG), All Patient DRGs (AP-DRG), 3M Severity DRGs (S-DRG), All Patient Refined DRGs (APR-DRG) 3M International-Refined DRGs (IR-DRG).

USOS EN EL SNS Ajustar la comparación de la estancia media (EM) entre hospitales ponderando la duración de la estancia por el peso de cada GRD atendido y construir indicadores de productividad. Reembolso de los flujos cruzados entre hospitales o áreas de salud que se financian capitativamente. Tarifas de precios a terceros En Cataluña se han usado parcialmente como numerario de pago a los hospitales de la XHUP.

Para muchos de estos usos se utiliza un “estándar” que, típicamente, está conformado por un conjunto de casos de varios hospitales (los que contratan al mismo proveedor de análisis de datos, una Comunidad Autónoma, u otros).

INDICADORES DERIVADOS DE LOS GDR: PESO MEDIO del “proveedor” en relación al del “estándar”.

Para el servicio de cirugía, el peso medio del estándar (1,3015) es mayor que el del servicio (1,2170), indicando que sus pacientes son menos complejos que los del estándar (el conjunto de hospitales).

INDICADORES DERIVADOS DE LOS GDR: ESTANCIA MEDIA AJUSTADA POR CASUÍSTICA (EMAC): la EM que hubiera tenido el servicio tratando los pacientes del estándar con su propia EM en cada GRD

La EMAC es de 6,0 días frente a los 6,2 del estándar, indicando que el servicio hubiera consumido 0,2 días menos de estancia que el estándar si hubieran tratado pacientes similares.

Mayor eficiencia si EMAC < EMESTÁNDAR

INDICADORES DERIVADOS DE LOS GDR: ESTANCIA MEDIA AJUSTADA POR FUNCIONAMIENTO (EMAF). La EM que habría tenido el servicio si hubiera tratado sus propios pacientes con la EM del estándar.

El hospital tiene una EM de 5,6 días, 0,3 días menos que el EMAF, indicando una mayor eficiencia técnica.

Mayor eficiencia si EMAF < EMESTÁNDAR

INDICADORES DERIVADOS DE LOS GDR: INDICE DE CASUÍSTICA (o de complejidad o de case-mix; Razón entre la EMAF y la EM del estándar).

ICASEMIX = (EMAF=5,9) / (EMESTANDAR=6,2)/= 0,9472 El servicio atiende una casuística aprox. un 5% menos compleja que

el estándar.

Mayor complejidad si IC > 1

INDICADORES DERIVADOS DE LOS GDR: RAZÓN DE FUNCIONAMIENTO ESTANDAR (Razón entre la EM del servicio y la EMAF).

IEMA = (EMHOSPITAL=5,6)/(EMAF=5,9) = 0,9485 El hospital tiene una casuística aprox. un 5% menos compleja que el estándar.

Mayor eficiencia si IEMA > 1

INDICADORES DERIVADOS DE LOS GDR Diferencia de EM debida a casuística (EMAF – EMESTANDAR) Diferencia de EM debida a funcionamiento (EMAF – EMHOSPITAL) Estancias evitables (o exceso de estancias). Diferencia de EM debida a funcionamiento * número de altas. Ingresos potenciales (Estancias evitables / EMAF).

Clasificación no excluyente, en función de la intensidad diagnóstica Ausencia de definiciones operativas Orientación mono-axial por aparatos y sistemas. Artefactos derivados del uso de guías de codificación para mejorar la fiabilidad

Posibilidad de clasificación de pacientes similares en diferentes grupos de riesgo con diferente peso de reembolso.

Ventana temporal (duración estancia) variable. Limitación del número de Dx secundarios Registro retrospectivo Toma de datos retrospectiva

Ventana temporal (duración estancia) variable y discharge bias Limitación del número de Dx secundarios Registro retrospectivo Toma de datos retrospectiva

LEAD TIME BIAS Inexactitud de la estimación del riesgo (predicción) debida a los tratamientos y medidas estabilizadoras iniciadas antes de la llegada del paciente al hospital o al servicio. las diferencias en mortalidad ajustada se deberían, también, a la calidad del manejo previo (no sólo en el hospital). Boyd & Ground effect. Referido al tiempo desde el ingreso a las 24h en los sistemas que evaluan a las 24h.

Limitaciones para diferenciar comorbilidad de complicaciones.

Sesgos de información

172 mujeres (1993-1995) con un parto por cesárea seguido de un segundo parto

Sólo en 92 (53,5%) constaba el antecedente de “cesárea previa”

El 59,3% de los segundos embarazos concluyeron mediante cesárea

46,2% en los casos sin antecedentes El 70,7% cuando

constaba el antecedente de cesárea

Sub-registro de la información sobre antecedentes y sobre-estimación de la tasa de cesáreas en los

casos con cesárea previa

Sesgos de información

SELECTION BIAS Los sistemas de ajuste de riesgo estiman el peso de cada factor conforme al patrón de riesgos de la base de desarrollo y, en consecuencia, no funcionan correctamente en entornos con patrones de riesgos diferentes. Como norma, predecirán un exceso de muertes en entornos con pacientes menos graves que los de la base desarrollo, y una mortalidad menor en entornos con pacientes mucho graves. Este aspecto es especialmente importante cuando se usan sistemas desarrollados en entornos que combinan pacientes médicos (mayor riesgo) y quirúrgicos (menor riesgo) y no incluyen coronarios (un % importante de pacientes en muchas UCI en nuestro entorno). Existe la posibilidad de recalibrar los sistemas usando pesos locales, pero, como norma, los ajustes funcionarán mal si se comparan UCI con patrones de ingresos muy diferenciados.

VALIDEZ ATRIBUCIONAL

6.000.000 altas 150.000 muertes intrahospitalarias (3%) ¿Unas 27.000 personas al año no morirían (nunca?) si hubieran ingresado en hospitales top-20?

En muchos casos no se presentan los IC95% En otros (top 20) se agrupan hospitales que no son diferentes en función de su posición en el propio ranking, para obtener diferencias estadísticamente significativas.

ENGLAND

WirralCamden and Islington

WalsallIsle of Wight

North and East DevonNewcastle and North Tyneside

West SurreyLambeth Southwark and Lewisham

North EssexNorth Nottinghamshire

East Sussex Brighton and HoveKingston and Richmond

LincolnshireShropshire

East SurreyWolverhampton

CoventryHillingdon

NorthamptonshireAvonTees

Bexley and GreenwichEast Kent

South StaffordshireBromley

South CheshireGateshead and South Tyneside

SunderlandLeeds

BarnetSouth Humber

Bury and RochdaleSuffolk

North CheshireManchester

NorfolkSolihull

BedfordshirePortsmouth and South East Hampshire

WorcestershireEnfield and Haringey

WiltshireBuckinghamshire

BerkshireBirmingham

Morecambe BayWest Sussex

DorsetBarnsley

Kensington Chelsea and Westminster

0 4000 8000 12000 16000 20000

Age and sex standardised rate per 100,000 and 95% confidence interval

6xiv (CI 2): Deaths in hospital within 30 days of emergency admission with a hip fracture (ages 65+) by Health Authority, England 1998-99

These are detailed graphs for England showing how death rates vary between Health Authorities.

Page 1 of 2

z En nuestro entorno, tanto las bases de datos como las metodologías de tratamiento son susceptibles de grandes mejoras.

z Sopesar que acciones pueden estar razonablemente fundadas en la información disponible a partir del CMBD/GRD

z La evaluación de resultados a partir del CMBD no sustituye las revisiones de historias clínicas (audit médico, revisión de la adecuación) y los métodos tradicionales de garantía de calidad.

El CMBD/GRD no es la única herramienta

Cierta prudencia

Hay que mejorar la calidad los SIS

z Pese al uso de las estrategias de “ajuste de riesgos” y los sistemas de clasificación de pacientes no debería inferirse desde un diseño observacional retrospectivo con la misma solidez que desde un diseño prospectivo con aleatorización.

Graduar la solidez de las inferencias

Centro Superior de Investigación en Salud Pública Área de investigación en Servicios de Salud Salvador Peiró [email protected]