1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

46
7 Cuestiones estadísticas básicas. Domingo Pérez Flores 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN MEDICINA. 2. LA ESTADÍSTICA EN LA LECTURA CRÍTICA DE LA LITERATURA. 3.INTERVALO DE CONFIANZA. 4.SIGNIFICACIÓN ESTADÍSTICA. 5.MEDIDAS DEL EFECTO DEL TRATAMIENTO. 6.BIBLIOGRAFÍA. 2.1.Muestreo. 5.1. Reducción absoluta del riesgo. 5.2. Riesgo relativo. 5.3. Reducción relativa del riesgo. 5.4. Número necesario de pacientes para tratar. 5.5. Número necesario de pacientes para perjudicar. 5.6. Odds ratio. 181

Transcript of 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Page 1: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

7 Cuestiones estadísticas básicas.

Domingo Pérez Flores

1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN MEDICINA.

2. LA ESTADÍSTICA EN LA LECTURA CRÍTICA DE LA LITERATURA.

3.INTERVALO DE CONFIANZA.

4.SIGNIFICACIÓN ESTADÍSTICA.

5.MEDIDAS DEL EFECTO DEL TRATAMIENTO.

6.BIBLIOGRAFÍA.

2.1.Muestreo.

5.1. Reducción absoluta del riesgo.5.2. Riesgo relativo.5.3. Reducción relativa del riesgo.5.4. Número necesario de pacientes para tratar.5.5. Número necesario de pacientes para perjudicar.5.6. Odds ratio.

181

Page 2: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN MEDICINA

En las últimas décadas ha habido un fuerte y creciente interés por la Estadística en el campo médico.La Medicina es un área de la Ciencia donde los principios y métodos estadísticos han tenido un éxitoespecialmente consistente y continúan teniéndolo, y ello es debido, fundamentalmente, al importantepapel que dichos procedimientos juegan en todos sus ámbitos, tanto para una mejor investigación ycomprensión de todos las Ciencias Biomédicas como para una práctica eficaz de cualquiera de lasprofesiones sanitarias. Es más, en algunos aspectos de la Medicina como, por ejemplo, laEpidemiología, la Salud Pública, los Ensayos Clínicos ó la Medicina Basada en la Evidencia, losprocedimientos estadísticos no son sólo necesarios, sino centrales. La visión médica del mundo tienefuertes aspectos estadísticos : a preguntas frecuentes en el campo médico del tipo ¿cómo defrecuente es la enfermedad?, ¿quién es especialmente propenso a contraerla?, ¿cuáles son lasposibilidades de recuperación ó de supervivencia?, se responde con procedimientos estadísticos.

Por otra parte, los conocimientos de Estadística le proporcionan al médico una buena capacidad derazonamiento y de criterio tanto en la aplicación del conocimiento al análisis e interpretación de losdatos y signos clínicos, como en la definición de la naturaleza de los problemas y la planificación y laejecución de una estrategia para resolverlo, y, por otra parte, una comprensión de la contribución de lametodología de la investigación y una aptitud para interpretar y aplicar la investigación de otros en sulabor diaria.

Pero ¿qué fenómeno hace que la Estadística tenga esta importancia en el desarrollo de la Medicinaactual?. Sin duda, el hecho de que en la Medicina, y en las Ciencias de la Vida en general, se da unfenómeno característico, como es la presencia intrínseca y continua de la variabilidad en los seresvivos, que hace que, en su ámbito, se están tomando continuamente decisiones en ambiente deincertidumbre y, como consecuencia, que la Medicina sea, en sí misma, de naturaleza probabilística.

La Medicina, como disciplina, trata con individuos que presentan variaciones en sus diferentescaracterísticas, que constituyen un fenómeno que se conoce como variabilidad. Estas variaciones sonde distintos tipos y dependen de factores biológicos como la edad, el sexo, la constitución genética,etc.., de factores ambientales como, por ejemplo, la dieta, el estrés, el esfuerzo, el estilo de vida,etc.., y de la disponibilidad de recursos sanitarios.

Por una parte, todos los seres vivos muestran variación en sus caracteres y medidas. Casi todas lascaracterísticas encontradas en las Ciencias de la Salud, bien sean ambientales, fisiológicas,bioquímicas ó inmunológicas, etc.., presentan variación. Cada ser humano es único y cada reacción decada ser humano a cada estímulo ambiental ó a un tratamiento es diferente. Los principios y métodosestadísticos nos permiten medir, describir y analizar esta variabilidad.

1

71

182

Page 3: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Por otra parte, la prestación de la asistencia sanitaria se basa bastante, hoy en día, en los datosclínicos y en las pruebas de laboratorio, características del ser humano que en muchos casospresentan una enorme variabilidad y para las que una función importante de la Medicina es definir loslímites normales de esa variación. Es fundamental una base sólida en métodos estadísticos para elanálisis de los datos clínicos recogidos y para comprender las posibles falacias en la interpretación delos mismos. El médico debe saber medir e interpretar la sensibilidad y especificidad de los tests delaboratorio que utiliza, así como su repetibilidad, y también tiene que saber como descubrir y controlarlas fuentes de variación (intra e inter observador). El conocimiento y la consideración de la variabilidadfisiológica y patológica del dato clínico a que se refiere un informe del laboratorio tienen uncomponente estadístico que es de gran ayuda tanto para el diagnóstico como para la evaluación de larespuesta al tratamiento. Estos parámetros estadísticos observados tanto en los datos clínicos comoen las pruebas de laboratorio son, pues, esenciales para la toma de decisiones racionales en lapráctica clínica.

Teniendo en cuenta esta variabilidad del ser humano, las decisiones en la prestación de la atenciónsanitaria se basan en la experiencia previa con otros pacientes ó con otras comunidades decaracterísticas biológicas y sociales parecidas. Debido a esta variabilidad, los resultados de esasdecisiones no se pueden predecir con exactitud, es decir, estos resultados siempre estaránacompañados por la incertidumbre. Por ello, dado que la Estadística es la herramienta fundamentalpara tratar con la variabilidad y la incertidumbre, su uso es esencial en la toma de decisiones juiciosas,basadas en criterios racionales, para la prestación de la atención sanitaria.

Vemos, pues, que una de las claves de la Medicina es la toma de decisiones en ambiente deincertidumbre, tanto a nivel de pacientes individuales como a nivel de comunidad. En las tresactividades fundamentales del clínico, como son diagnosticar correctamente las afecciones de suspacientes, evaluar la gravedad y el desenlace probable de la enfermedad e influir en el curso de ésta dela manera más eficaz y humana posible, es decir, en el diagnóstico, el pronóstico y el tratamiento, laincertidumbre no deja de estar presente y como tal, son actividades con componente estadístico.

En el diagnóstico, el médico ha de decidir a qué categoría pertenece la enfermedad de su paciente.Sea ó no sea él consciente de ello, esta decisión se basa en dos procesos: en primer lugar, definir lacategoría de diagnóstico, entendiéndose como tal cuando determinada combinación de síntomas ysignos aparece conjuntamente con mucha mayor frecuencia de la que permite la simple coincidencia ycuando esa agrupación estadística, repetible y válida, facilita una base para el pronóstico ó eltratamiento y puede interpretarse en el marco general de los conocimientos existente en cadamomento, en materia de ciencias médicas. En segundo lugar, la asignación de la enfermedad delpaciente a una categoría determinada, lo que implícito cierto riesgo de error dad que ese paciente notendrá, probablemente, todos y cada uno de los síntomas y signos que se describen como típicos deesa categoría de diagnóstico y sí puede presentar algunos síntomas que tradicionalmente no seasocian con la enfermedad cuya existencia se sospecha. Los procedimientos probabilísticos,estadísticos y de inducción lógica permiten medir el grado de certidumbre de un diagnóstico, mejorarcualitativamente la toma de una decisión sobre un diagnóstico en función de los síntomas y optimizar,en algunos casos, el procedimiento diagnóstico relativo a los síntomas observados y a los costes.

Cuestiones estadísticas básicas.

183

Page 4: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

En el pronóstico, el médico debe hacer la valoración ó predicción del posible resultado de un programade intervención en una comunidad ó de un tratamiento en la enfermedad de un paciente, a la vista delos signos, síntomas y circunstancias. La estimación del riesgo que la enfermedad entraña para la vidaó para el estado de salud ulterior no deja de ir acompañada de incertidumbre y sólo se puede hacerbasándose en la experiencia de muchos casos de la misma enfermedad.

En cuanto al tratamiento, la elección del programa de intervención comunitaria adecuado ó deltratamiento apropiado para un paciente se basa, ó debería basarse, en procedimientos estadísticos,pues es una decisión en la que subyace, de nuevo, la incertidumbre, ya que un médico raramente sabecon exactitud como responderá un paciente a un tratamiento determinado, pues siempre hayvariaciones en las reacciones de pacientes diferentes y fluctuaciones imprevisibles en el procesomismo de la enfermedad. El médico elige una intervención ó un tratamiento específicos sobre la basede su propia experiencia, de los resultados obtenidos en pacientes ó comunidades similares que hanrecibido esa intervención y en el examen de publicaciones sobre los distintos tipos de tratamiento enensayos clínicos controlados.

En los inicios de la Medicina, las decisiones sobre métodos de diagnóstico y sobre tratamientosestaban basadas en la autoridad, donde la opinión de un eminente profesional, basada en suexperiencia y en la autoridad previa de otros profesionales, era la fuente principal de información. Conel paso del tiempo, conforme la Medicina se hacía más científica, la experiencia se fue formalizandocada vez más en forma de experimentos controlados y estudios más planificados, llegándose a lasituación actual en la que la fuente principal para la toma de decisiones del médico sobre métodos dediagnóstico ó de tratamiento es el uso de los datos científicos publicados, es decir, estamos en la erade la Medicina basada en la evidencia. Se ha producido, pues, un cambio cualitativo importante en elparadigma de la Medicina: se ha pasado de la práctica médica basada en la autoridad a la prácticabasada en la evidencia, donde la revisión sistemática y la interpretación de toda la evidencia publicadason aceptadas como la base del enfoque actual de la atención sanitaria. El mismo proceso estáocurriendo en otros campos de las Ciencias de la Salud, hablándose en la actualidad de Enfermeríabasada en la evidencia, Fisioterapia basada en la evidencia, etc..

El profesional sanitario puede enfocar su inspección de la evidencia en varios niveles. El nivel básico yfundamental es la revisión de un artículo científico en el que se informa de los resultados de un estudioconcreto y que es importante para estudios relacionados con la propia actividad de este profesional. Elsiguiente nivel es el artículo de revisión, donde están recogidos conjuntamente la evidencia y la opiniónsobre un asunto. Un tercer nivel es el meta-análisis, que combina todos los estudios disponibles sobreun tema, dando una estimación conjunta de algún parámetro de interés, como por ejemplo, el efectode un tratamiento, etc.. El último nivel serían los proyectos de ámbito mundial, como la CochraneCollaboration, que proporcionan meta-análisis de todos los tratamientos conocidos, bajo todo tipo decondiciones, los actualiza de forma regular y los distribuye a la comunidad científica. En todos estosniveles es necesario que el profesional sanitario inspeccione los informes aportados en las revistas

LA ESTADÍSTICA EN LA LECTURA CRÍTICA DE LA LITERATURA7

2

184

Page 5: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

médicas, para cuya comprensión necesita dos cosas: una es un conocimiento del tema que se estáinvestigando, como la enfermedad que se intenta tratar, los fármacos que se están prescribiendo, lasdistintas posibilidades de tratamiento, etc..,. La otra es una familiarización con los métodos deinvestigación que se están usando, particularmente los referidos al diseño del estudio y a lainformación estadística recogida en el artículo, en términos de resumen de datos y análisis einterpretación de resultados, lo que muestra la importancia de los métodos estadísticos en la prácticamédica basada en la evidencia.

La decisión sobre qué tratamiento aplicar a un paciente se basa, fundamentalmente, en la observaciónde la eficacia relativa de las diferentes formas de terapia. En el proceso mediante el que se llega a ladecisión interviene, de manera esencial, la evaluación estadística de la información numérica recogidaen la literatura existente. En este aspecto, en cualquiera de los cuatro niveles referidos anteriormente,el clínico debe ser capaz, no sólo de comprender los resultados publicados sobre las distintasterapias, sino también de evaluar críticamente su validez, sabiendo detectar cualesquiera razonesestadísticas que haya para dudar de las conclusiones. Altman señala entre estas razones, comomás importantes, las siguientes:

Uso de porcentajes muestrales como poblacionales.Uso de muestras demasiado pequeñas.Elección de grupos de comparación inadecuados y grupos control que no lo son en el sentidoestadístico.Mezcla de pacientes no comparables (hombres y mujeres, jóvenes y ancianos, etc.,.).Naturaleza sesgada de la muestra de pacientes que recibe el tratamiento.Violación de condiciones del análisis, problemas de apareamiento y técnicas demasiado simples.Constatación de diferencias ó asociaciones muy débiles como si fueran mucho mayores.Mala interpretación del grado de significación P en los tests y confusión entre significaciónestadística e importancia clínica

No estamos hablando de una cuestión insignificante, pues las consecuencias del mal uso de laEstadística y de los errores en los principios y métodos estadísticos utilizados en la literatura médicason incalculables desde varios puntos de vista como, por ejemplo:

Los individuos utilizados en la investigación habrán sufrido riesgos ó molestias sin beneficioalguno.Los recursos humanos y materiales y el tiempo dedicado al estudio podrían haberse utilizado deforma más productiva en otro proyecto ó en una mejor planificación del mismo.A partir de los supuestos hallazgos del estudio, otros pacientes podrían recibir un deficientetratamiento en el futuro ó sufrir diagnósticos erróneos con riesgos evidentes para su salud.El trabajo de otros investigadores se vería afectado al tratar éstos de profundizar en líneas inútilesó abandonar otras más fértiles.Y, lo que es potencialmente más grave, el investigador ó equipo implicado en el trabajo erróneopodría continuar usando metodología estadística inadecuada en el futuro e incitar a otros ahacerlo.

2,3,4

5,6,7

Cuestiones estadísticas básicas.

185

Page 6: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Todo esto refleja la importancia de que el clínico posea los suficientes conocimientos de metodologíaestadística para desarrollar la facultad crítica y deductiva que necesita para pensar científica, lógica ycríticamente sobre los problemas de salud y para comprender la información suministrada por laliteratura médica. Todo ello le ayudará en la toma de decisiones racionales relacionadas con la prácticade la asistencia sanitaria y le permitirá leer con espíritu crítico dicha literatura a fin de descubrir si lametodología utilizada puede producir una información útil y detectar tanto afirmaciones erróneascomo conclusiones y decisiones que no se deriven de los resultados de un estudio y que carezcan deuna base lógica y científica.

Las técnicas y procedimientos estadísticos que pueden haber sido utilizados en cualquier artículopublicado en la literatura médica forman un espectro muy amplio y son de una extensa variedad encuanto a dificultad y complejidad. No es objetivo de este capítulo, como se comprenderá, hacer unaexposición exhaustiva de ellos ni pretender que el lector, al finalizar su lectura, sea un experto en losmismos, sino exponer, de manera breve y concisa, algunos procedimientos estadísticos básicos degran importancia en la Medicina Basada en la Evidencia y de uso frecuente en la toma de decisiones enla práctica clínica, así como despertar el interés del clínico para que acuda a textos apropiados paraaprender ó ampliar sus conocimientos sobre los mismos.

Generalmente, las investigaciones clínicas tratan de sacar conclusiones sobre la efectividad de untratamiento ó de un procedimiento de diagnóstico, para la generalidad de individuos con unasdeterminadas características, habitualmente pacientes con una enfermedad concreta, queconstituyen lo que, en terminología estadística, se conoce como población. Como es imposibleexperimentar un nuevo tratamiento en toda esa población de pacientes, se selecciona un grupo deellos, denominado muestra, en los que se realiza el estudio, para después obtener conclusiones sobredicho tratamiento para la población origen de esa muestra. El interés de un estudio radica, pues, en lageneralización de los resultados: no se está tan interesado en lo que ocurre con los individuosparticulares que participan en la investigación como en predecir lo que pueda ocurrir en el futuro conotros individuos similares.

Este proceso, conocido como inferencia estadística, presenta diversos problemas. Uno es el delsesgo de selección , es decir, hasta qué punto los pacientes incluidos en el estudio son similares aaquellos a quienes se quieren aplicar los resultados del estudio o, dicho de otra manera, hasta quépunto son tan distintos como para que los resultados del estudio no sean útiles para tomar decisionessobre éstos. Realizando la selección de pacientes con las técnicas de muestreo adecuadas , seobtiene una muestra representativa de la población, lo que nos permite garantizar la validez de lainducción de los resultados hacia ésta.

8

9

Por otra parte, si las conclusiones que se obtienen para la población se basan en los datos obtenidosen una muestra de la misma, es lógico pensar que, para que esas conclusiones sean fiables, lo primeroque hay que exigir es que esa muestra contenga suficiente información de la población. En estesentido, el tamaño de la muestra es uno de los aspectos más importantes de un estudio. Actualmente,no es admisible presentar un protocolo de una investigación médica ó los resultados de la misma,

2.1. MUESTREO.

186

Page 7: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

indicando que se ha usado un número de pacientes concreto sin justificarlo. Es conocido que la calidadcientífica de los resultados de un estudio, la fiabilidad de las conclusiones ó la representatividad de losparámetros obtenidos están en estrecha relación con el tamaño de las muestras utilizadas. Comonorma general, el tamaño de muestra en una investigación debe ser el mínimo necesario, pero a su vezsuficiente para proporcionar una respuesta fiable al objetivo final del estudio. La determinación dedicho tamaño mínimo es de naturaleza estadística y depende de varios factores como el tipo deestudio, el tipo de variable utilizada, los riesgos de error que se está dispuesto a asumir, la precisiónque se desea obtener, etc..,.

Otro problema es que al estar la muestra de pacientes seleccionada con procedimientos basados en elazar, éste hace que los resultados obtenidos en la misma no coincidan exactamente con los quehubiéramos obtenido si hubiéramos incluido a toda la población de pacientes en el estudio. Seproduce, pues, una diferencia entre el valor obtenido para un parámetro en la muestra y el verdaderovalor de ese parámetro en la población, un error debido al muestreo. Esta situación provoca que lasconclusiones de cualquier estudio para la población no sean fiables al 100%, generándose unosriesgos de error que deben tenerse en cuenta a la hora de la toma de decisiones. Procedimientosestadísticos como la estimación por intervalo de confianza o las pruebas de significación estadísticamanejan estos inconvenientes y proporcionan soluciones para los mismos.

Aunque existen otros tipos de métodos para la estimación de un parámetro en la población, losprocedimientos de estimación por intervalo de confianza son los más utilizados en la literatura médicadebido, básicamente, a su fácil interpretación.

Un intervalo de confianza se construye alrededor del valor del parámetro obtenido en la muestra y esun rango de valores, consistente con los datos muestrales, en el que se encuentra, con una ciertaseguridad (llamada nivel de confianza), el verdadero valor del parámetro en la población. El nivel deconfianza se expresa en términos probabilísticos y se interpreta como la probabilidad de que elverdadero parámetro poblacional esté dentro del intervalo de confianza. La amplitud del intervalo nosinforma sobre la precisión de la estimación, comprobándose, por una parte, que cuanto mayor es lamuestra y cuanto menor es la dispersión de los datos, más estrecho es el intervalo y, en consecuencia,más precisa es una estimación, y por otra que, cuanto mayor sea el nivel de confianza que utilicemos,peor es la precisión de la estimación. En la investigación médica se utiliza, habitualmente, el nivel deconfianza del 95% porque proporciona una suficiente seguridad y no se amplía demasiado el intervalode confianza. Quizás, una visión frecuentista del nivel de confianza sea más intuitiva para el lector: unnivel de confianza del 95% se puede interpretar como que de cada 100 muestras del mismo tamañoque obtengamos aleatoriamente de la población y para las que calculamos los respectivos intervalosde confianza, es de esperar que en 95 de ellos esté incluido el verdadero valor del parámetropoblacional.

INTERVALO DE CONFIANZA.7

3

Cuestiones estadísticas básicas.

187

Page 8: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Los métodos estadísticos nos permiten obtener intervalos de confianza para cualesquiera de losparámetros que se usan en la literatura médica (media, proporción, coeficientes de correlación y deregresión, diferencia de proporciones, medidas del efecto de un tratamiento, etc..), pudiendoconsultarse en cualquier texto de Bioestadística .

Un ensayo clínico es de naturaleza básicamente comparativa y, en su versión más simple, consiste enla comparación de un grupo de pacientes a los que se administra un tratamiento experimental (grupotratamiento), con otro grupo al que se administra un tratamiento control, generalmente un tratamientoestándar ó un placebo (grupo control). Los resultados de uno y otro grupo, lógicamente, no seránexactamente iguales. Se observan, pues, diferencias entre los dos grupos, de mayor ó menormagnitud, que puede ser debidas a algunas de las siguientes causas:

Los individuos de uno y otro grupo difieren de manera sistemática al inicio del ensayo en factoresque pueden influir en el resultado del tratamiento. Se trataría, pues, de grupos no comparablesantes de empezar el estudio.Los pacientes de los dos grupos difieren durante el desarrollo del ensayo en cuanto a la forma deadministración de los tratamientos, manipulación de los pacientes, criterios de valoración, etc..,no manteniéndose, pues, la comparabilidad a lo largo del estudio.El azar del muestreo al seleccionar los pacientes.El verdadero efecto diferente de los dos tratamientos.

La metodología de los ensayos clínicos controlados , que está muy protocolizada, nos permite, enteoría, suprimir las dos primeras causas: mediante la aleatorización ó randomización, asignación alazar de los individuos que participan en el ensayo a los grupos de tratamiento, logramos eliminar lasdiferencias sistemáticas inherentes entre los individuos del grupo experimental y del grupo control alcomienzo del estudio y, como consecuencia, se consigue la comparabilidad de los mismos; utilizandoprocedimientos de enmascaramiento (blinding) como los ensayos a ciego ó a doble ciego,conseguimos mantener la comparabilidad entre los grupos durante el estudio, sobre todo en relación ala administración de los tratamientos, la evolución y seguimiento de los pacientes y la valoración delresultado del tratamiento. Por lo tanto, una vez descartadas las dos primeras causas de esasdiferencias observadas, si pudiéramos afirmar sólidamente que es poco probable que las mismassean explicadas por el azar del muestreo, se podría concluir que las diferencias observadas entre losdos tratamientos son debidas a que uno es más efectivo que el otro.

Las herramientas estadísticas que nos permiten valorar hasta qué punto estas diferencias son debidasal azar de muestreo son las pruebas ó tests de significación estadística, también llamadas contrastesde hipótesis. Son las técnicas estadísticas usadas con más frecuencia en la literatura clínica yepidemiológica y, a menudo, son mal entendidas y erróneamente interpretadas . Se utilizan en todoslos campos de la Ciencia, pero de una manera más formal, y en el ámbito particular de un ensayoclínico, en un test de significación estadística se confronta la hipótesis de que los dos tratamientos sonigualmente efectivos, llamada hipótesis nula (H0), contra la hipótesis de que tienen distinta efectividad,hipótesis alternativa (H1), y se decide una de las hipótesis mediante la evaluación de la consistencia delos datos obtenidos con la hipótesis nula.

10, 11

12

13

14 15

SIGNIFICACIÓN ESTADÍSTICA.7

4

188

Page 9: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

El procedimiento utiliza propiedades estadísticas teóricas (el lector puede consultarlo en cualquierlibro de Bioestadística ) para obtener un valor p, llamado grado de significación, muy utilizado en laliteratura médica, que se interpreta como la probabilidad de equivocarnos si decidiéramos la hipótesisalternativa, o lo que es lo mismo, la probabilidad de que las diferencias observadas entre los dostratamientos sean debidas sólo al azar del muestreo. De esta manera, el valor p mide la fuerzaprobatoria de los datos observados contra la hipótesis nula de igual efectividad de los tratamientos, enel sentido de que cuanto menor sea P, mayor es la evidencia contra H0. Hoy en día, en la literaturamédica, se usa de manera extendida el valor de 0,05 como punto de corte conveniente para la toma dela decisión sobre una u otra hipótesis, aunque la interpretación última la debe hacer el investigador. Asípues, si p<0.05 se entiende que es suficientemente improbable que las diferencias sean debidas sóloal azar, que es poco probable que nos equivoquemos si decidimos H1, por lo que existe suficienteevidencia contra la hipótesis nula y, en consecuencia, aceptaremos la hipótesis alternativa de que untratamiento es más efectivo que otro con ese riesgo p de error; en este caso se dice que la diferenciaentre los tratamientos es estadísticamente significativa. Por el contrario, si p>0.05 se considera queya es demasiado probable que las diferencias sean debidas al azar del muestreo, existe demasiadaprobabilidad de equivocarse si decidimos H1, con lo que la evidencia contra la hipótesis nula es débil ylos datos son consistentes con la misma; en esta situación decidiremos la hipótesis nula y diremos quela diferencia entre los tratamientos no es significativa. Se debe tener cuidado cuando se decide que ladiferencia no es significativa pues, en ese caso, debemos entender que no hemos podido demostrarque haya diferencia entre los tratamientos en la población en cuanto a su efectividad, pero no hemosprobado que sean iguales; dicha diferencia aún puede existir y puede haber ocurrido que la muestra nohaya sido lo suficientemente grande como para detectarla.

Existen muchos tipos de contrastes de hipótesis para comparar dos tratamientos que van desdelos tests t de Student de comparación de medias y los tests no paramétricos si el criterio de valoracióndel resultado del tratamiento es cuantitativo, a los tests ji-cuadrado de comparación de proporcionessi dicho criterio es cualitativo, pasando por los tests referidos a las medidas del efecto de lostratamientos que veremos más adelante.

Uno de los aspectos más importantes que debe tener en cuenta el médico a la hora de la toma dedecisiones clínicas a partir de los resultados publicados en la literatura médica, es no confundirsignificación estadística con significación clínica . Mientras que la significación estadística, comohemos dicho, evalúa hasta qué punto los datos sugieren que las diferencias observadas entre losefectos de los tratamientos pueden ser explicadas ó no por la casualidad, la significación clínica serefiere a la magnitud y la importancia de esas diferencias en la práctica clínica La interpretación delos resultados de un estudio no debe basarse solamente en el valor del grado de significación p, ya queno mide la importancia clínica de la diferencia observada y, sin embargo, se ve muy influido por eltamaño muestral . De hecho, puede ocurrir que una diferencia muy pequeña, sin relevancia clínica,puede haberse detectado como significativa debido a que se ha estudiado un elevado número depacientes. Y viceversa, una diferencia grande entre los grupos, que parece clínicamente importante,puede que no se detecte como significativa por disponer de pocos pacientes en el estudio ó por existiruna gran dispersión en los datos de los pacientes.

10, 11

10,11

16

17.

18

4.1. SIGNIFICACIÓN ESTADÍSTICA Y SIGNIFICACIÓN CLÍNICA.

Cuestiones estadísticas básicas.

189

Page 10: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Una manera de considerar la significación clínica de la diferencia del efecto de los tratamientos a lahora de realizar un test de significación estadística, ya que éste no nos informa sobre cuanto mejor esun tratamiento que otro, podría ser combinarlo con el intervalo de confianza de dicha diferencia. Losintervalos de confianza identifican el rango donde puede estar, con alta probabilidad, el verdaderoefecto del tratamiento. De hecho, hay autores que piensan que, en la toma de decisiones en laclínica, los intervalos de confianza son más útiles para los clínicos que los tests de significaciónestadística, proponiendo realizar éstos últimos mediante la utilización, de forma complementaria, delos intervalos de confianza, de manera que si el valor de la hipótesis nula (que suele ser diferencia ceroentre medias ó entre proporciones) no está incluido en el intervalo de confianza al nivel de confianza del95%, se rechaza la hipótesis nula y se deciden diferencias significativas al nivel de significación del 5%.No obstante, en este procedimiento existe el inconveniente de que no se puede calcular el verdaderogrado de significación p pero, sin embargo, nos permite disponer adicionalmente de un rango devalores del efecto del tratamiento.

El énfasis que se viene haciendo en la importancia de incorporar de forma crítica los resultados de lainvestigación científica en la práctica médica habitual, conlleva la necesidad de expresar los resultadosde forma clara, inteligible y fácilmente trasladable a las situaciones que el médico encuentra en suactividad diaria. En este sentido, para los clínicos que buscan aplicar los resultados de los ensayosclínicos ó de las revisiones sistemáticas a la atención sanitaria de sus pacientes, es importante valorarde forma adecuada la significación clínica de la diferencia del efecto de dos tratamientos, sea ésta ó noestadísticamente significativa, utilizando medidas específicas del efecto que cuantifiquen la mejoría deun tratamiento sobre el otro y que sean más cercanas al tipo de razonamiento que se usa en la toma dedecisiones clínicas.

En la literatura clínica y epidemiológica se usan, para ello, distintos índices y algunos trabajos indicanque, dependiendo de qué medidas del efecto se empleen en un determinado estudio, el impacto deuna intervención ó un tratamiento puede parecer grande ó pequeño ó que el grado en el que losmédicos están dispuestos a prescribir un tratamiento depende, en gran medida, de qué índice se usepara representar su eficacia . Todos esos índices son correctos y legítimos para presentar losresultados, informando de facetas diversas del efecto de los tratamientos, por lo que conviene aquídefinir y comentar brevemente los más utilizados.

Las medidas del efecto del tratamiento que estudiaremos tienen un elemento de partida común: elcriterio de valoración del resultado del tratamiento en cada paciente es una variable binaria (variabledel tipo sí o no) que representa un evento que puede ocurrir o no ocurrir como, por ejemplo, muerte,curación, recidiva, mejoría, ocurrencia de una enfermedad, etc.. Cuando ese resultado es una variablecuantitativa, generalmente continua, como por ejemplo, tensión arterial, glucemia, etc.., lo habitual estransformarlas en binarias: hipertensión o normotensión, hiperglucemia o normoglucemia, etc.

19,20

21

22

23,24

MEDIDAS DEL EFECTO DEL TRATAMIENTO.7

5

190

Page 11: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

En un ensayo clínico, el resultado observable en cada paciente es que dicho paciente presente ó no elevento en estudio; el resultado para un grupo de pacientes se resume mediante la proporción depacientes en los que el evento ocurre. Esta proporción estima la probabilidad o “riesgo” del evento enese grupo. Este último término es el utilizado de manera habitual, aunque genera cierta confusiónterminológica porque, en ensayos clínicos, se puede estudiar unas veces eventos adversos (muerte,enfermedad, efectos secundarios, etc,..) y otras veces eventos beneficiosos (supervivencia, curación,mejoría, etc,..) y para ambos se usa el término “riesgo”, que hace pensar sólo en eventos adversos.

En cualquier ensayo clínico, los resultados del mismo se pueden expresar en una tabla como lasiguiente:

En esta situación, la estimación de los riesgos en el grupo tratamiento (Rt) y en el grupo control (Rc)sería:

A partir de aquí, para evaluar el efecto de un tratamiento hay que comparar el riesgo en el grupotratamiento con el riesgo en el grupo control; las distintas formas de compararlos originan las diversasmedidas del efecto del tratamiento que vamos a considerar.

La manera más sencilla de comparar dos riesgos, en definitiva dos números, es hallando su diferencia.La reducción absoluta del riesgo (RAR) se define como la diferencia del riesgo del grupo tratamiento yel riesgo del grupo control:

5.1. REDUCCIÓN ABSOLUTA DEL RIESGO.

Cuestiones estadísticas básicas.

191

Page 12: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Como ejemplo, consideremos la siguiente situación en la que el evento de interés es la muerte:

Los riesgos en los grupos tratamiento y control serían

Y la reducción absoluta del riesgo

La RAR se interpreta como el porcentaje de pacientes que han evitado el evento adverso comoconsecuencia de recibir el tratamiento experimental en lugar del control. En nuestro ejemplo, el RARindica que el tratamiento experimental reduce el riesgo de muerte en 0,1649 o un 16.49%. Dicho deotra manera, por cada 100 pacientes que sigan el tratamiento experimental se evitarán entre 16 y 17muertes respecto a las que se hubieran producido si se hubiera empleado el tratamiento control. Portanto, es un índice que expresa las consecuencias de dar el tratamiento, por ello a veces se ledenomina también “reducción atribuible del riesgo”, o abreviadamente “riesgo atribuible”. También sepuede expresar como “diferencia absoluta de riesgo”. Su principal inconveniente es que se expresacon un número pequeño, que quizás explique por qué es el índice con el que los médicos perciben queel efecto es menor .

La ausencia total de efecto del tratamiento sería una RAR = 0, por lo que se puede realizar un test designificación estadística para la reducción absoluta del riesgo contrastando la hipótesis nula H0: RAR= 0 contra la hipótesis alternativa H1: RAR 0.

Se puede obtener el intervalo de confianza para la RAR teniendo en cuenta que ésta no es más que unadiferencia de riesgos que se estiman mediante proporciones. De este modo, cuando las muestras sonsuficientemente grandes, el intervalo de confianza de la reducción absoluta del riesgo, al nivel deconfianza del 95%, se puede calcular a través de la expresión

22

=

192

Page 13: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

siendo nt y nc el número de pacientes de los grupos tratamiento y control respectivamente.

Otra forma de comparar dos riesgos es a través de su cociente. El riesgo relativo (RR) es el cocienteentre el riesgo del grupo tratamiento y el riesgo del grupo control:

Observando esta definición, el riesgo relativo se puede interpretar como el número de veces que esmás probable que presente el evento un paciente del grupo tratamiento que otro del grupo control y sededuce que si RR < 1 el tratamiento experimental protege de la aparición del evento, si RR = 1 resultaindiferente y si RR > 1 favorece la aparición del mismo.

En nuestro ejemplo, el riesgo relativo sería

por lo que podemos decir que el riesgo en el grupo tratamiento es 0.63 veces el riesgo en el grupocontrol, es decir, un 63% del mismo.

Para obtener el intervalo de confianza para el riesgo relativo, dado que éste tiene una distribución muyasimétrica, se debe utilizar el ln(RR), que sigue aproximadamente una distribución normal,obteniéndose la siguiente expresión como intervalo de confianza para el riesgo relativo RR al nivel deconfianza del 95%:

En nuestro ejemplo,

5.2. RIESGO RELATIVO.

Cuestiones estadísticas básicas.

193

Page 14: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

lo que da un intervalo de confianza para el riesgo relativo de (0.39 ; 1.01)

Como hemos visto, cuando los tratamientos experimental y control tengan el mismo efecto, el riesgorelativo sería RR = 1, por lo que un test de significación estadística para el riesgo relativo consistiría enel contraste de la hipótesis nula H0: RR = 1 contra la hipótesis alternativa H1: RR 1. Aunque existenotras formas de llevarlo a cabo, dicho test se podría realizar al nivel de significación del 5%, tal y comose ha señalado con anterioridad en este capítulo, comprobando si el valor de esta hipótesis, es decir,RR = 1, está ó no dentro de este intervalo de confianza.

La reducción relativa del riesgo (RRR) se define como el cociente entre la reducción absoluta del riesgoRAR y el riesgo en el grupo control Rc .

Considerando el riesgo en el grupo control como riesgo basal, es decir, riesgo sin tratamiento ó con eltratamiento estándar, la reducción relativa del riesgo se interpreta como la proporción ó el porcentajedel riesgo basal que es eliminado como consecuencia de la nueva terapia.

Si el evento de interés es un evento adverso, el riesgo relativo será mayor que 1 y la reducción relativadel riesgo se puede expresar como

mientras que si es un evento beneficioso, el riesgo relativo es menor que 1 y la reducción relativa delriesgo sería

observándose que la RRR es la parte del riesgo relativo que falta para 1 ó que excede de 1,respectivamente.

En nuestro ejemplo,

5.3. REDUCCIÓN RELATIVA DEL RIESGO.

194

Page 15: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

es decir, la administración del nuevo tratamiento supone una reducción del 36.96% del riesgo delgrupo control.

A la reducción relativa del riesgo se le llama también “fracción atribuible” ó “diferencia relativa delriesgo” e ilustra el beneficio del tratamiento en términos relativos. Esto es una ventaja pero también uninconveniente, pues al dejar de considerar la magnitud del riesgo en el grupo control (riesgo basal) sepueden obtener sobrestimaciones o subestimaciones del impacto del tratamiento si el riesgo controlfuera muy bajo o muy alto, respectivamente. Así, por ejemplo, si el riesgo de eventos adversos sintratamiento es bajo en un determinado grupo de pacientes al comienzo del estudio, una pequeñareducción de ese riesgo en términos absolutos da lugar a la misma RRR que una reducción mayor en ungrupo de pacientes que tienen un riesgo basal también mayor. Es más, existe fundada evidencia deque mientras la reducción absoluta del riesgo (RAR) disminuye cuanto menor es el riesgo basal, lareducción relativa del riesgo, a menudo, permanece constante.

El número necesario de pacientes para tratar (NNT) se define como número de pacientes que seestima que es necesario que reciban el tratamiento experimental en lugar del control para que unpaciente adicional evite el evento adverso (u obtenga el beneficio si se trata de un evento beneficioso).

Para deducir la expresión para su cálculo, utilicemos nuestro ejemplo: en el apartado 5.1 obtuvimosuna reducción absoluta del riesgo de RAR = 0.1649 (16.49%), lo que quiere decir que por cada 100pacientes que sigan el tratamiento experimental en lugar del control, se evitarán 16.49 muertes.Entonces, para evitar una muerte, y mediante una sencilla regla de tres, se necesitará tratar un númerode pacientes

es decir, que se espera que se evite una muerte por cada, aproximadamente, 6 pacientes tratados conla nueva terapia.

Así pues, el número necesario de pacientes para tratar NNT se puede calcular mediante del inverso dela reducción absoluta del riesgo RAR, es decir,

según que la RAR esté expresada en tanto por uno ó en tanto por ciento respectivamente.

Evidentemente, cuanto menor sea el NNT más importante es el efecto del tratamiento y viceversa, a unmenor efecto del tratamiento le corresponde un mayor NNT, llegando a la teórica situación límite deque cuando el efecto del tratamiento es nulo (RAR=0), el NNT tendría valor infinito.

25,26

5.4. NÚMERO NECESARIO DE PACIENTES PARA TRATAR.

Cuestiones estadísticas básicas.

195

Page 16: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

El NNT se ha popularizado bastante en los últimos años a raíz del auge de la Medicina basada en laevidencia, ya que es una medida clínica muy útil de las consecuencias de un nuevo tratamiento, puesexpresa el efecto del mismo en unos términos intuitivos, más próximos a su significado clínico, quepermiten fácilmente comparar las ventajas del tratamiento con sus inconvenientes, acercándose,pues, al modo de razonamiento que se usa en la toma de decisiones clínicas. Es una medida concisa,fácil de calcular, fácil de comprender y tiene la ventaja de que no sólo proporciona informaciónestadística, sino también información clínica. Ha sido considerado como la medida del efecto másrepresentativa de la significación clínica .

El NNT es un parámetro eficaz por su capacidad para comunicar y presentar el impacto de untratamiento o de una intervención, pero por ello mismo, debido a su capacidad de simplificación, hayque ser cautos a la hora de utilizarlo e interpretarlo, teniendo en cuenta que existen otras alternativas.En este sentido, como cualquier resultado estadístico, el NNT se puede acompañar con su intervalo deconfianza, aunque el cálculo de éste es un poco problemático y su interpretación resulta un tantoconfusa si no hay un efecto claro del tratamiento, es decir, si el tratamiento experimental no essignificativamente más eficaz ó, incluso, si es menos beneficioso que el control .

Por último, como consecuencia de su reciente popularidad, el NNT también se tiende a utilizarlo, demanera indiscriminada, como medida global en los meta-análisis de ensayos clínicos. Pero hay quetener mucha precaución a la hora de interpretar los NNT obtenidos a partir de un meta-análisis , puesse debe siempre analizar el riesgo base en cada uno de los estudios individuales, ya que si hayheterogeneidad en dichos riesgos basales, es decir, si éstos son diferentes, su utilidad es más quedudosa y el NNT global puede resultar poco informativo. En esos casos es preferible utilizar un índicerelativo como el riesgo relativo ó el odds ratio, pues, aunque no nos den una medida del impacto realdel tratamiento como el RAR y el NNT, se ha evidenciado que los índices relativos tienden a ser máshomogéneos entre diferentes ensayos del mismo tratamiento y están menos influenciados por elriesgo basal .

De igual modo que el NNT, se puede usar el número necesario para perjudicar para evaluar efectosadversos del tratamiento. Este índice, representado por las siglas de su nombre en inglés NNH(number needed to harm), se define como el número de pacientes que deberían recibir el tratamientoexperimental en lugar del control para que un paciente adicional obtenga el perjuicio. Sólo tienesentido emplearlo cuando el riesgo del evento perjudicial sea mayor en el grupo tratamiento que en elgrupo control, como, por ejemplo, cuando los efectos secundarios son más frecuentes en eltratamiento experimental que en el control.

Su cálculo es similar al del NNT, es decir,

27

28,29

30

31

5.5. NÚMERO NECESARIO DE PACIENTES PARA PERJUDICAR.

196

Page 17: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

y todas las demás consideraciones realizadas para aquél en el apartado anterior son válidas para elNNH, con la única diferencia, como hemos indicado, de que estamos tratando con efectos adversosdel tratamiento.

La toma en consideración del NNT y del NNH conjuntamente permite al médico tener en cuenta, almismo tiempo, las ventajas e inconvenientes de un tratamiento, tal y como se hace en la prácticaclínica, ayudándole en la toma de decisiones con argumentos más sólidos.

Esta es una medida de asociación entre variables binarias de uso bastante frecuente en la literaturaclínica y epidemiológica que, bajo ciertas condiciones, también se utiliza como medida del efecto deun tratamiento.

El odds es un término para el que en castellano no existe una traducción comúnmente aceptada,empleándose con cierta frecuencia las palabras “posibilidad” ó “ventaja”. En el ámbito estadístico, esotra forma de presentar un riesgo, un poco distinta a la proporción ó al porcentaje que hemos vistoanteriormente. El odds es el cociente entre la probabilidad de que el episodio de interés ocurra y laprobabilidad de que no ocurra y, habitualmente, se estima por el cociente entre el número de vecesque ha ocurrido el evento y el número de veces que no ha ocurrido, midiendo, por tanto, las veces quees más probable que ocurra el evento que las que no ocurra. Así, un odds de 4 indica que por cada 4pacientes que presenten el evento, habrá 1 que no lo presentará.

Con nuestra notación, los odds en uno y otro tratamiento se obtendrían como

En nuestro ejemplo, el odds en el grupo tratamiento sería 18/46 mientras que en el grupo control29/36; ambos son menores que 1, lo que quiere decir que, en ambos grupos, es menos frecuente lamuerte del paciente que la supervivencia.

Si queremos comparar esta medida especial del riesgo en cada grupo, el odds, entre los dostratamientos, podemos calcular el cociente entre ambos odds obteniendo, así, el conocido odds ratio(OR)

5.6. ODDS RATIO.

Cuestiones estadísticas básicas.

197

Page 18: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

En caso de que no haya efecto del tratamiento, el riesgo ó probabilidad de que ocurra el evento es elmismo para ambos grupos, por lo que los odds también coincidirán y, por tanto, el odds ratio será OR= 1. Por otra parte, si el OR > 1 se interpretará como que el tratamiento experimental favorece laaparición del evento pues su odds es mayor que el del control y viceversa, si el OR < 1 diremos queprotege de la aparición del mismo. Además, cuanto mayor sea el efecto del tratamiento, en uno u otrosentido, más distintos son los odds y, por tanto, más se alejará el OR de 1 (en el sentido de mayor omenor que 1). En este aspecto, el odss ratio tiene un comportamiento similar al riesgo relativo.

Con los datos de nuestro ejemplo, el odds ratio sería

lo que quiere decir que, en nuestros datos, el tratamiento experimental reduce la aparición del eventomuerte respecto al control.

Al igual que con el riesgo relativo, se podría obtener el intervalo de confianza para el odds ratioutilizando su logaritmo, pues el OR tiene una distribución muy asimétrica y el ln(OR) sigueaproximadamente una distribución normal, obteniéndose la siguiente expresión como intervalo deconfianza para el odds ratio OR al nivel de confianza del 95%:

En nuestro ejemplo, este intervalo de confianza sería

lo que da un intervalo de confianza para el odds ratio de (0.23 ; 1.01)

Por otra parte, al igual que con el riesgo relativo, como cuando los tratamientos experimental y controltienen el mismo efecto, el odds ratio es OR = 1, se podría realizar un test de significación estadísticapara el odds ratio que consistiría en el contraste de la hipótesis nula H0: OR = 1 contra la hipótesisalternativa H1: OR 1. Del mismo modo, dicho test se podría realizar al nivel de significación del 5%,comprobando si el valor de la hipótesis nula OR = 1 está ó no dentro de este intervalo de confianza.

Hemos visto, pues, que el odds ratio se comporta de manera parecida al riesgo relativo, sin embargotiene una interpretación mucho menos intuitiva que éste, por lo que el OR ha recibido frecuentescríticas por lo proclive que resulta a interpretaciones erróneas . Pero a pesar de ser más simple el RRque el OR, ¿cuáles son las razones por las que es tan popular éste último y se usa con tanta frecuenciaen la literatura médica?.

32

198

Page 19: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

En primer lugar, porque se puede usar en cualquier tipo de estudio que genere una tabla , como losestudios observacionales prospectivos, retrospectivos ó transversales, ó los estudiosexperimentales, como los ensayos clínicos. En particular, en los estudios de casos y controles,mientras que sí se puede utilizar el OR para analizar la asociación entre la exposición a un factor y unevento determinado, no es posible estimar el RR ya que, en este tipo de estudios, la distribución decasos y controles en la muestra se elige a conveniencia en el diseño del estudio, por lo que norepresenta la distribución de la población y, en consecuencia, no se pueden conocer los riesgos enexpuestos y no expuestos en la población.

Por otra parte, cuando el riesgo, ó el odds, es muy pequeño en ambos grupos (hecho muy frecuente enestudios observacionales pero no en ensayos clínicos), el OR y el RR son muy parecidos, pudiendoconsiderarse el primero como una buena aproximación del segundo. Así, en aquellos ensayos clínicosque presenten riesgos suficientemente bajos, por ejemplo, inferiores al 20%, el OR se interpretaríaigual que el riego relativo, es decir, número de veces que es más probable que presente el evento unpaciente del grupo tratamiento que otro del control, debiendo evitarse el uso del OR cuando los riesgosno son demasiado bajos .

Otras razones son de tipo matemático: el odds ratio no varía aunque se cambie el orden de lascategorías en cualquiera de las variables, lo que no ocurre con el riesgo relativo. Por otra parte, en unanálisis de regresión logística, el OR permite examinar el efecto que otras variables pueden causar enuna asociación (como podrían ser por ejemplo la edad, el sexo, etc..), ajustando la relación en estudiopor el efecto de dichas variables, interpretándose la exponencial de un coeficiente del modelo deregresión logística como el odds ratio de la variable correspondiente.

22

33

Cuestiones estadísticas básicas.

199

Page 20: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

BIBLIOGRAFÍA

1. Aalen OO. Medical Statistics: no time for complacency. Statistical Methods in Medical Research2000; 9: 31-40.

2. Altman DG. Statistics in Medical Journals. Statistics in Medicine 1982; 1: 59-71.

3. Altman DG. Statistics in medical journals: development in the 1980's. Statistics in Medicine 1991;10: 1897-1913.

4. Altman DG, Bland JM. Improving doctors' understanding of statistics (with discussion). Journal of theRoyal Statistical Society A 1991; 154: 223-267.

5. Altman DG. The scandal of poor medical research. British Medical Journal 1994; 308: 283-284.

6. Altman DG. Statistical reviews for medical journals. Statistics in Medicine 1998; 17: 2661-2674.

7. Altman DG. Statistics in medical journals: some recent trends. Statistics in Medicine 2000; 19:3257-3289.

8. Ellenberg JH. Selection bias in observational and experimental studies. Statistics in Medicine1994;13:557-67.

9. Silva Ayçaguer LC. Muestreo para la investigación en ciencias de la salud. Madrid: Díaz de Santos,D.L., 1993.

10. Martín Andrés A, Luna del Castillo JD. Bioestadística para las Ciencias de la Salud. 4ª ed. Madrid:Ed. Norma; 1994.

11. Armitage P, Berry G. Estadística para la Investigación Biomédica. Barcelona: Doyma; 1992.

12. Jadad AR. Randomised controlled trials. London: BM J Books, 1998.

13. Guyatt G, Jaeschke R, Heddle N, Cook D, Shannon H, Wermuth L. Basic statistics for clinicians: 1.Hypothesis testing. CMAJ 1995; 152: 27-32.

76

200

Page 21: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

14. Poole C. Low P-values or narrow confidence intervals: which are more durable?. Epidemiology2001; 12: 291-4.

15. Sterne JAC, Smith GD. Sifting the evidence - what's wrong with significance tests? British MedicalJournal 2001; 322: 226-31.

16. Porta M, Plasencia A, Sanz F. La calidad de la información clínica (III): ¿estadísticamentesignificativo o clínicamente importante?. Medicina Clínica 1988; 90: 463-68.

17. Leung WC. Balancing statistical and clinical significance in evaluating treatment effects. PostgradMed J 2001; 77: 201-204.

18. Goodman SN. Toward evidence-based medical statistics. 1: The P value fallacy. Ann Intern Med1999; 130:995-1004.

19. Montori VM, Kleinbart J, Newman TB, Keitz S, et al. Tips for learners of evidence-based medicine:2. Measures of precision (confidence intervals). CMAJ 2004; 171(6): 611-615.

20. Feinstein AR. P-val20ues and confidence intervals: two sides of the same unsatisfactory coin. J ClinEpidemiol 1998; 51:355-60.

21. Fahey T, Griffiths S, Peters TJ. Evidence based purchasing: understanding results of clinical trialsand systematic reviews. British Medical Journal 1995; 311: 1056-1060.

22. Naylor CD, Chen E, Strauss B. Measured enthusiasm: does the method of reporting trial resultsalter perceptions of therapeutic effectiveness?. Ann Intern Med 1992; 117: 916-921.

23. Bobbio M, Demichelis B, Giustetto G. Completeness of reporting trial results: effect on physicians'willingness to prescribe. Lancet 1994; 343: 1209-1211.

24. Meneu Ricardo R, Peiró S, Márquez Calderón S. Influencia de la presentación de los resultados delos ensayos clínicos en la intención de prescribir: relativizando el riesgo relativo. Aten Primaria 1998;21: 446-450.

25. Barratt A, Wyer PC, Hatala R, McGinn T, Dans AL, Keitz S, et al. Tips for learners of evidence-basedmedicine: 1. Relative risk reduction, absolute risk reduction and number needed to treat. CMAJ2004;171(4): 353-358.

Cuestiones estadísticas básicas.

201

Page 22: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

26. Schmid CH, Lau J, McIntosh MW, Cappelleri JC. An empirical study of the effect of the control rateas a predictor of treatment efficacy in meta-analysis of clinical trials. Statistics in Medicine1998;17:1923-42.

27. Cook RJ, Sackett DL. The number needed to treat: a clinically useful measure of treatment effect.British Medical Journal 1995; 310: 452-454.

28. Altman DG. Confidence intervals for the number needed to treat. British Medical Journal 1998;317: 1309-1312.

29. Walter SD. Number needed to treat (NNT): estimation of a measure of clinical benefit. Statistics inMedicine 2001; 20(24): 3947-3962.

30. Smeeth L, Haines A, Ebrahim S. Numbers needed to treat derived from meta-analyses-sometimesinformative, usually misleading. British Medical Journal 1999; 318: 1548-1551.

31. Deeks JJ, Altman DG, Dooley G, Sackett DL. Choosing an appropriate dichotomous effect measurefor meta-analysis: empirical evidence of the appropriateness of the odds ratio and relative risk.Controled Clinical Trials 1997; 18: S84-S85.

32. Sackett DL, Deeks JJ, Altman DG. Down with odds ratios!. Evidence-Based Med 1996; 1: 164-166.

33. Altman DG, Deeks JJ, Sackett DL. Odds ratios should be avoided when events are common [letter].British Medical Journal 1998; 317: 1318.

202

Page 23: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Acotado Automático de Términos:

Aleatorización:

Alertas:

Análisis coste/beneficio:

Análisis coste/efectividad:

Análisis coste-utilidad:

Brevemente, consiste en el enlace automático de una palabra ofrase (que no es un término MeSH) al término MeSH que mejor lo describe. Una descripción máscompleta en el apartado correspondiente. Sinónimos (Sin): Automatic Term Mapping, ATM, Mapeoautomático de términos.

En un estudio en el que se comparan dos o más modalidades de tratamiento, esconveniente que los grupos formados sean parecidos en todas las características pronósticasexcepto en el tratamiento recibido, de modo que cualquier deferencia en el curso clínico que seregistre podrá ser atribuida a los diferentes tratamientos administrados (y sólo a ellos). La asignaciónaleatoria consiste en distribuir a cada participante de uno de los grupos de tratamiento por un métododisciplinado de azar, de modo que cada sujeto tenga exactamente las mismas probabilidades deformar parte de uno u otro grupo de tratamiento. Sin: Randomización.

Método usado para la difusión de información mediante mensajes electrónicos aordenadores, agendas electrónicas e incluso teléfonos móviles. Representa una forma deactualización rápida y eficaz.

Medición de los costes y beneficios de una intervención en términoscomensurables, generalmente monetarios. Permite determinar en primar lugar si una intervenciónconcreta ofrece un beneficio global neto de bienestar, y en segundo lugar cómo se compara laganancia de bienestar obtenida con esta intervención, con la obtenida con intervenciones alternativas.Al valorar todos los costes y beneficios en las mismas unidades, el análisis coste-beneficio comparadiversas intervenciones con el criterio del beneficio neto (véase). Análisis económico en el que seconsideran los costes de la asistencia sanitaria y la pérdida de ganancias netas debida a muerte oincapacidad, traduciendo todos los costes y beneficios a unidades monetarias.

Modalidad de estudio económico en la que las consecuencias de diferentesintervenciones pueden ser diferentes pero pueden ser medidas en unidades naturales idénticas, Midelos beneficios sanitarios en términos de unidades naturales, como años de vida salvados o mejoríasdel estado funcional. Dado que los costes no se expresan en las mismas unidades que los beneficios,su razón (ratio coste-efectividad) constituye una herramienta que permite valorar la eficiencia relativa.Análisis económico que compara los costes médicos incrementales y los resultados sobre la salud deprogramas sanitarios alternativos. Al contrario que el análisis de coste beneficio, los efectos sobre lasalud se expresan en diversas unidades, como vida-años ganados, días libres de síntomas, casosevitados, etc., en lugar de en unidades monetarias

Adaptación del análisis coste-efectividad que mide el efecto de una intervencióna la vez sobre los aspectos cuantitativos y cualitativos de la salud, mediante el uso de una variabledenominada AVAC -Años de Vida Ajustados por Calidad- o QALYs . También evalúa la eficiencia relativacon una razón incremental, que en este caso se denomina ratio coste-utilidad.

Acotado Automático de Términos:

Aleatorización:

Alertas:

Análisis coste/beneficio:

Análisis coste/efectividad:

Análisis coste-utilidad:

19 Glosario General

MªCarmen Sánchez López

555

Page 24: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Análisis de decisiones (AD):

Análisis de minimización de costes:

Análisis de sensibilidad:

Análisis de regresión:

Análisis de la varianza (ANOVA):

Análisis estratificado:

Análisis factorial:

Análisis multivariante:

Análisis por intención de tratar:

Árbol de decisiones:

Artículo científico:

Es la aplicación de métodos explícitos y cuantitativos que cuantifican eintegran los efectos del tratamiento, el pronóstico y los valores del paciente para analizar una decisiónen condiciones de incertidumbre.

Modalidad de análisis coste-efectividad donde los resultados obeneficios de las alternativas se considera que son equivalentes o intercambiables para el mimo tipode pacientes. A igualdad de resultados, la atención de los investigadores se centra en la diferencia decostes asociados.

En economía de la salud, técnica por la que se repiten las comparacionesentre recursos necesarios y resultados, pero con sucesivas modificaciones de las suposiciones en lasque se basan los cálculos. De este modo, el análisis de sensibilidad pone a prueba la robustez de lasconclusiones mediante variaciones de los ingredientes sobre los que existe incertidumbre.

En un conjunto de datos sobre la variable dependiente y y sobre una o másvariables independientes, x1, x2,…xi, consiste en determinar el modelo matemático más ajustado quedescriba y como una función de las x o para predecir y a partir de las x. Término general para losmétodos de análisis que se ocupan de estimar los parámetros de alguna posible relación entre unavariables respuesta y una o más variables explicativas

Conjunto de técnicas estadísticas para conocer el modo en que elvalor medio de una variable es afectado por diferentes tipos de clasificaciones de los datos. Con elanálisis de la varianza se pueden ajustar las estimaciones del efecto de un tratamiento según otrosfactores como sexo, edad, gravedad, etc.

Análisis de los resultados de un ensayo clínico o un estudio observacional, con elfin de examinar si hay diferencias de respuestas asociadas a alguna característica (por ej., edad osexo).

Procedimiento estadístico empleado para la validación de constructo que permiteidentificar grupos o conglomerados de variables relacionadas.

Cualquier método analítico que permite el estudio simultáneo de dos o másvariables dependientes. Término genérico para los métodos que están diseñados para determinarlas contribuciones relativas de diferentes causas a un solo suceso o resultado

En un ensayo clínico, análisis de los datos según el tratamientoasignado inicialmente por distribución aleatoria, independientemente de que el paciente no recibieradespués este tratamiento.

Expresión grafica de un análisis de decisiones.

informe escrito que comunica por primera vez los resultados de una investigación.Los artículos científicos publicados en miles de revistas científicas componen la literatura primaria dela ciencia

Análisis de decisiones (AD):

Análisis de minimización de costes:

Análisis de sensibilidad:

Análisis de regresión:

Análisis de la varianza (ANOVA):

Análisis estratificado:

Análisis factorial:

Análisis multivariante:

Análisis por intención de tratar:

Árbol de decisiones:

Artículo científico:

556

Page 25: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Artículo de revisión:

Asiento:

ATM:

Atributos:

Auditoria:

Automatic explosion:

Automatic Term Mapping:

AVAC:

Azar:

Base de datos:

Beneficio neto:

Bioestadística:

Blinding:

Buscadores:

artículos de síntesis que resumen el conocimiento de un tema determinado ydurante un periodo de tiempo definido. Junto con los libros, los artículos de revisión constituyen laliteratura científica secundaria.

Conjunto de información que, en una base de datos, se refiere a un mismo elemento. En Basesde Datos de bibliografía, es el conjunto de información que se refiere a una misma publicación. Sin:Registro, Record.

Ver Acotado Automático de Términos.

Propiedades o características del instrumento que merecen consideraciones separadas eindependientes en la evaluación.

Examen o estudio que evalúa e informa sobre la medida en que una condición, proceso odesempeño se ajusta a estándares o criterios predeterminados.

Ver Explode.

Ver Acotado Automático de Términos.

Índice que combina la supervivencia con la calidad de vida. La medida de la calidad de vida noestá estandarizada y suele variar de un estudio a otro, según la enfermedad, el tratamiento evaluado ylas preferencias de los autores. Para calcular un AVAC se multiplica la duración del estado de salud (enaños) por un factor que representa la calidad (“utilidad”) de este estado de salud. Sin: QALY (QualityAdjusted Life Years).

Se denomina así al proceso que ocurre debido a la casualidad, de forma imprevisible, sinplaneamiento ni influencia consciente.

Conjunto de datos homogéneos y ordenados, que se presentan normalmente, deforma legible, por ordenador y que se refieren a una materia determinada. Colección estructurada dedatos que está organizada de tal manera que se puede acceder a ella con una amplia variedad deprogramas de aplicación.

Diferencia entres los costes y los beneficios de una intervención.

Aplicación de la teoría y los métodos de la estadística a las ciencia biológicas. Ensentido estricto, rama de la ciencia que aplica los métodos estadísticos a los problemas biológicos,aunque ahora se utiliza la mayoría de las veces para referirse a la estadística aplicada a la medicina ylas ciencias de la salud.

Ver Enmascaramiento.

Motores de búsqueda de información en Internet que identifican la información contenidaen bases de datos formadas a partir de publicaciones previamente indexada. Ver Indización.

Artículo de revisión:

Asiento:

ATM:

Atributos:

Auditoria:

Automatic explosion:

Automatic Term Mapping:

AVAC:

Azar:

Base de datos:

Beneficio neto:

Bioestadística:

Blinding:

Buscadores:

Glosario General

557

Page 26: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Calidad de Vida Relacionada con la Salud (CVRS):

Campo:

Carga de administración:

Carga de respuestas:

CAT:

Causalidad:

Cociente de probabilidad:

Coeficiente de correlación:

Coeficiente kappa:

Confusión:

Consentimiento informado:

Impacto que una enfermedad y el tratamientoconsiguiente tienen sobre la percepción del paciente de su satisfacción y bienestar físico, psíquico,social y espiritual.

Cada una de las unidades de información en que se divide un asiento. Sin: Field.

Se define como le grado de trabajo y esfuerzo que deben realizar quienesadministran un instrumento de medida (cuestionario), y depende del tiempo precisado para suadministración, formación requerida del entrevistador y recursos necesarios para su aplicación ypuntuación.

Se entiende como el tiempo, esfuerzo y otros aspectos que se exigen a quienesse les administran un instrumento de medida (cuestionario).

Herramienta de lectura crítica consistente en un resumen breve de las pruebas científicas másrelevantes en respuesta a una pregunta clínica concreta.

Indica que las asociaciones encontradas entre las exposiciones y los efectos sonrealmente de tipo causal y no consecuencia de sesgos ni del efecto de factores de confusión.

Véase Razón de probabilidad.

Índice que cuantifica la relación lineal entre un par de variables. Medida deasociación que indica el grado en el que dos variables continuas x e y poseen un a relación lineal (y = a+ bx). Su valor puede situarse entre -1 y +1. Cuando su valor es 0 no existe ningún grado decorrelación. El coeficiente de este tipo que más se utiliza es el de Pearson

Fórmula utilizada para la comprobación de la consistencia interna de un testque presupone que si varios ítems están midiendo el mismo atributo o dimensión, estos ítems deberíanestar intercorrelacionados. Esta correlación la mediremos mediante el coeficiente alfa de Cronbach.

índice corregido por el azar de la concordancia entre, por ejemplo, juicios odiagnósticos que hacen 2 ó más observadores. El coeficiente adopta desde el valor 1 (cuando hay unaconcordancia perfecta) hasta el valor 0 cuando la concordancia observada es igual a la debida al azar.

Situación en la que la estimación del resultado estudiado esta sesgada por algún factorrelacionado con la exposición y el resultado.

Procedimiento formal para aplicar el principio de autonomía. Debe reunirpor lo menos tres elementos: voluntariedad, información y comprensión. La voluntariedad implica quelos sujetos puedan decidir libremente si quieren participar en un estudio, sin que haya persuasión,manipulación ni coerción. La información debe ser comprensible y debe incluir el objetivo del estudio ysu procedimiento, los beneficios y riesgos potenciales, las posibles incomodidades derivadas de laparticipación y la posibilidad de retirarse del estudio en cualquier momento sin que ello de lugar aperjuicio, en este contexto es básica la comprensión de la información, que no sólo depende de esta,sino también de la competencia de quien la recibe, es decir de su capacidad para comprender.

Coeficiente de Cronbach:

Calidad de Vida Relacionada con la Salud (CVRS):

Campo:

Carga de administración:

Carga de respuestas:

CAT:

Causalidad:

Cociente de probabilidad:

Coeficiente de correlación:

Coeficiente kappa:

Confusión:

Consentimiento informado:

Coeficiente de Cronbach:

558

Page 27: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Consistencia interna:

Constructo:

Correlación ítem-total:

Coste:

Coste oportunidad:

Criterios:

Criterios de selección:

Curva de Gauss:

Curvas ROC:

Delimitador de campo:

DeCS - Descriptores en Ciencias de la Salud:

Descriptor:

Grado en que los ítems de una dimensión se correlacionan entre ellos mismos.Ver: Coeficiente

En psicometría, concepto abstracto no medible directamente que se quiere convertir envariable operativa medible. Generalmente, se utiliza para un concepto que existe en teoría, pero que nose puede observar directamente. Esencialmente, es una variable latente.

(Correlación total de las preguntas): Verifica la homogeneidad. Procesomediante el cual comprobamos si cada ítem mide lo mismo que los demás y por lo tanto es sumable enuna puntuación total que supuestamente mide el rasgo y que es la que después interpretamos yutilizamos.

Es el resultado del productos de la cantidad total del recurso consumido y el valor monetario dela unidad de dicho recurso.

En economía de la salud, valor de las oportunidades perdidas por usar recursos enun servicio. Generalmente es cuantificado considerando el beneficio que se obtendría invirtiendo losmismos recursos en la mejor alternativa posible.

Condiciones utilizadas como un estándar para juzgar los atributos.

Características sociodemográficas, clínicas, etc. que determina que lospacientes puedan ser o no incluidos en un estudio. Nos van a servir para definir la población de estudio.

En matemáticas, la campana o curva de Gauss es la representación gráfica de laecuación matemática que corresponde a una Distribución normal. Tiene forma de campana y debe sunombre al matemático alemán Carl Friedrich Gauss.

Representación gráfica completa de la capacidad de una prueba para discriminar lonormal de lo que no lo es.

Ver Etiqueta.

Tesauro que puede considerarse, hasta cierto punto,como una versión en español del MeSH - Medical Subject Headings de la U.S. National Library ofMedicine. Fue desarrollado a partir de él con el objetivo de permitir el uso de terminología común parabúsqueda en tres idiomas (español, inglés y portugués), proporcionando un medio consistente y únicopara la recuperación de la información independientemente del idioma. Además de los términosmédicos originales del MeSH contiene áreas específicas de Salud Pública y Homeopatía.

Término del lenguaje documental, carente de variabilidad, sinonimia y polisemia, escogidopara representar el contenido de un documento, que puede ser utilizado en el análisis y recuperaciónde la información. Relacionado con Palabra clave.

de Cronbach.Consistencia interna:

Constructo:

Correlación ítem-total:

Coste:

Coste oportunidad:

Criterios:

Criterios de selección:

Curva de Gauss:

Curvas ROC:

Delimitador de campo:

DeCS - Descriptores en Ciencias de la Salud:

Descriptor:

Glosario General

559

Page 28: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Descriptor mayor:

Descriptores en Ciencias de la Salud:

Dimensiones:

Diseño:

Docencia virtual (“on-line” o “e-learning”):

Eficacia:

Eficiencia:

Encabezamientos de Materias Médicas:

Enmascaramiento:

Ver Mayor Topic.

Ver DeCS

Descuento: Procedimiento para calcular los costes o beneficios que ocurren en diferentes fechas a suvalor en el momento presente, llamado valor actual.

Aspectos relevantes que engloba el constructo o concepto que se mide a través delcuestionario.

Conjunto de estrategias y procedimientos que se seguirán para dar respuestas al problema ycomprobar la hipótesis. Engloba al selección del tipo de estudio, la población a estudiar, la definiciónde las variables y escalas de medición y los métodos de recogida, procesado y análisis de los datos.

Definida como la utilización de las nuevas tecnologíasmultimedia y de internet para mejorar la calidad del aprendizaje, facilitando el acceso de recursos yservicios; así como los intercambios y la colaboración a distancia.

Dosis Diaria Definida (DDD): Dosis de mantenimiento promedio en la principal indicación de un fármacoen pacientes adultos. Se usa para cuantificar el consumo de medicamentos, sobre todo cuando secompara el consumo de diversos fármacos de un mismo grupo, o cuando se realizan comparacionesinternacionales. No se ve afectada por diferencias de precios o de tamaño de las presentaciones. Elconsumo se suele expresar en número de DDD por 1.000 habitantes y por día, y esta medida da unaidea del número promedio de personas tratadas diariamente con un fármaco o grupo de fármacos enuna región o país.

Efectividad: Grado en que una determinada intervención origina un resultado beneficioso en lascondiciones de la práctica clínica habitual, sobre una población determinada.

Efecto indeseado: Ver Reacción Adversa.

Grado en que una determinada intervención origina un resultado beneficioso en condicionesideales de aplicación.

Relación entre los efectos o resultados finales que se alcanzan con una intervención y costeque supone la misma (recursos humanos, materiales y de tiempo).

Ver MeSH.

Procedimiento por el que se asegura que los sujetos participantes en un ensayoclínico, los observadores o ambos, no conocen el tratamiento u otra característica que pudiera sesgarlos resultados. Se denomina simple ciego cuando el sujeto, pero no el observador ignora cuál de losposibles tratamientos recibe; doble ciego es cuando sujeto y observador ignoran el tratamientorecibido; y triple ciego es cuando el sujeto participante, el investigador observador y el investigadorque analiza los datos ignoran el tratamiento recibido.

Descriptor mayor:

Descriptores en Ciencias de la Salud:

Dimensiones:

Diseño:

Docencia virtual (“on-line” o “e-learning”):

Eficacia:

Eficiencia:

Encabezamientos de Materias Médicas:

Enmascaramiento:

560

Page 29: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Ensayo clínico:

Ensayo clínico controlado:

Entry Term:

Epidemiología:

Epistemología:

Equivalencia:

Error aleatorio:

Escala tipo Likert:

Especificidad:

Estabilidad:

Estabilidad del test:

Estadística:

“Toda investigación efectuada en seres humanos para determinar o confirmar losefectos clínicos, farmacológicos y/o demás efectos farmacodinámicos, y/o de detectar lasreacciones adversas, y/o de estudiar la absorción, distribución, metabolismo y excreción de uno ovarios medicamentos en investigación con el fin de determinar su seguridad y/o su eficacia” (RealDecreto de 16 de febrero de 2004).

Ensayo clínico en el que los sujetos son asignados a dos grupos: uno (grupoexperimental) recibe el tratamiento que se está probando y el otro (grupo de comparación o control)recibe un tratamiento alternativo. En el ensayo clínico controlado aleatorizado la asignación a untratamiento experimental o control se realiza al azar de forma que ni el sujeto ni el investigadorresponsable de su selección o tratamiento puedan influir en su asignación.

Relacionado con Palabra clave (véase).

Estudio de la distribución y los determinantes de los estados o acontecimientosrelacionados con la salud de poblaciones. Ciencia que investiga las causas y la historia de lasenfermedades y el desarrollo de éstas en relación con determinadas intervenciones o exposiciones.

Doctrina de los fundamentos y métodos del método científico. La función de laestadística en el modelo empírico analítico.

capacidad del instrumento de proporcionar los mismos valores en las mismascondiciones clínicas cuando las mediciones las hacen distintas personas.

Las diferencias de medidas entre la realidad y nuestra muestra y son debidas al azar.

La respuesta del individuo se da mediante una escala numérica, a la cual se leatribuyen las propiedades de las escalas de intervalo, permitiendo por tanto la realización de análisisestadísticos más complejos. Escalas que se utilizan con frecuencia en estudios de actitudes en los quelas puntuaciones crudas se basan en respuestas alternativas graduadas a cada una de una serie depreguntas.

Referida a una prueba diagnóstica, es la proporción de personas verdaderamente noenfermas que son catalogadas como tales por medio de la prueba.

Ver Reproducibilidad.

Véase Método test-retest.

Recopilación y organización de hechos o datos numéricos, sobre todo cuando haymuchos. Conjunto de métodos que ayudan a la toma de decisiones frente a la incertidumbre. Laestadística no ofrece pruebas ni certidumbre, sino probabilidades.

Ensayo clínico:

Ensayo clínico controlado:

Entry Term:

Epidemiología:

Epistemología:

Equivalencia:

Error aleatorio:

Escala tipo Likert:

Especificidad:

Estabilidad:

Estabilidad del test:

Estadística:

Glosario General

561

Page 30: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Estadístico:

Estadístico kappa:

Estudios ambispectivos:

Estudios analíticos:

Estudios de caso-control:

Estudios de cohortes:

Estudio descriptivo:

Estudio experimental:

Estudios de incidencia:

Estudios longitudinales:

Estudios observacionales:

Estudios pragmáticos:

Estudios pre y post-intervención:

Medida estadística (media, mediana, etc...) calculada sobre los datos de una muestra.

Medida del acuerdo, corregida por el azar, aplicada a datos binarios u ordinales. Secalcula como la proporción de acuerdo, aparte del que ya sería de esperar por azar, que ha sidoobservado entre dos repeticiones del mismo instrumento.

Estudios que se inician como los retrospectivos (Ver: Estudiosretrospectivos) para el análisis de un fenómeno ya ocurrido y, posteriormente, continuamos con unseguimiento prospectivo hasta la aparición de un efecto a largo plazo (Ver: Estudios prospectivos).

Estudios diseñados para examinar asociaciones, cuyo objeto final suele seridentificar o medir los efectos de factores de riesgo o de intervenciones específicas sobre la salud.

Estudios en los que la selección de la población a estudiar se hace en funciónde la presencia o ausencia de una enfermedad o efecto, eligiéndose un grupo de individuos que tienenla enfermedad o efecto (casos), y otro que no los presenta (controles).

Tipo de estudios en los que los sujetos del estudio se seleccionan a partirpresencia o ausencia de la exposición que se trata de analizar y de la que se sospecha es responsabledel efecto observado.

Estudio cuyo objetivo es constatar hechos, observar lo que ocurre en nuestrapoblación. Permiten generar hipótesis.

Estudio en el que el investigador asigna y controla el factor de estudio.

Tipo de estudios en los que seguimos a una población determinada a lo largodel tiempo para analizar la aparición o no de un fenómeno de interés. La unidad de análisis es elindividuo.

Estudios en los que la recogida de los datos de interés hace referencia a dosmomentos separados en el tiempo (se analizan los sujetos en varios momentos a lo largo del tiempo).

Estudios en los que el investigador no participa directamente en laintervención o exposición (factor de estudio), se limita a observar (registrar) lo que ocurre en larealidad.

Estudios cuyo objetivo principal es la evaluación de la adecuación de la prácticaasistencial en condiciones normales.

Estudios en los que se registran la situación basal de la muestra y loscambios que experimenta tras su exposición a una determinada intervención.

Estadístico:

Estadístico kappa:

Estudios ambispectivos:

Estudios analíticos:

Estudios de caso-control:

Estudios de cohortes:

Estudio descriptivo:

Estudio experimental:

Estudios de incidencia:

Estudios longitudinales:

Estudios observacionales:

Estudios pragmáticos:

Estudios pre y post-intervención:

562

Page 31: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Estudios de prevalencia:

Estudios prospectivos:

Estudio retrospectivo:

Estudio transversal:

Etiqueta:

Evaluación crítica:

Evaluación económica:

Evaluación de tecnologías sanitarias:

Explode:

Exploding:

Exploración complementaria:

Explosión:

Explosión automática:

Factibilidad:

Estudios en los que se describe una serie de variables en una poblacióndeterminada y en un momento determinado. La unidad de análisis es el individuo.

Tipo de estudios en los que los hechos a estudiar no han tenido lugar aun y lossujetos son seguidos hasta obtener el resultado.

Estudio en el cual los hechos a estudiar ya han tenido lugar al iniciar el estudio.

Tipo de estudio en el que se estudia la exposición y el desenlace al mismo tiempo.

Abreviatura del nombre de un campo que puede utilizarse en su lugar para dirigir la búsquedade información. Sin: Tag, Delimitador de campo.

Véase Lectura crítica.

Análisis comparativo de opciones alternativas en términos de sus costes yconsecuencias. Los estudios de evaluación económica pueden ser parciales, cuando sólo sedescriben los costes, los resultados o ambos a la vez pero de una única opción o que comparan dos omás alternativas pero sólo en función de sus costes o de sus consecuencias sin valorar ambos a la vez,o completos, cuando se analizan comparativamente dos o más alternativas mediante la valoración delos costes y de las consecuencias de cada una de ellas.

Proceso de análisis e investigación dirigido a estimar el valora ycontribución relativos de cada tecnología sanitaria (véase) en la mejora de la salud individual ycolectiva, teniendo en cuenta su impacto económico, social e, incluso, implicaciones éticas.

Obtención de las referencias que contienen el descriptor especificado o cualquiera de losdescriptores de su mismo campo semántico pero de significado más restringido. Sin: Automaticexplosion, Exploding, Explosion, Explosión, Explosión automática.

Ver Explode.

Conjunto de pruebas diagnosticas realizadas con la finalidad deconfirmar una hipótesis diagnostica o hacer el seguimiento de la patología de un paciente.

Ver Explode.

Ver Explode.

Indica las posibilidades reales y práctica de que un instrumento de medida pueda sercontestado, completado y analizado. Está relacionad con el nivel de aceptabilidad del instrumento y serefleja en la proporción de rechazos, no respuesta y datos perdidos.

Estudios de prevalencia:

Estudios prospectivos:

Estudio retrospectivo:

Estudio transversal:

Etiqueta:

Evaluación crítica:

Evaluación económica:

Evaluación de tecnologías sanitarias:

Explode:

Exploding:

Exploración complementaria:

Explosión:

Explosión automática:

Factibilidad:

Glosario General

563

Page 32: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Factor de confusión:

Factor de impacto:

Factor de riesgo:

Falso negativo:

Falso positivo:

Farmacovigilancia:

Fiabilidad:

Fiabilidad inter-observador (inter-ratio):

Field:

Filtros metodológicos:

Forest/ Forest Plot:

Generabilidad:

Variable que está simultánea e independientemente asociada al factor de riesgoestudiado y a la enfermedad estudiada, que puede modificar el resultado del estudio. Tal variable debeser identificada y se debe evitar su influencia antes de la recogida de datos (mediante elemparejamiento o la restricción) o bien en la fase de análisis, mediante el análisis estratificado y laregresión múltiple.

Indicador bibliométrico, elaborado por el ISI (véase) y publicado en el JournalCitation Reports, que mide el uso de las revistas. Suele calcularse dividiendo el número de veces queson citados los artículos publicados en una revista durante un plazo de tiempo (habitualmente dosaños), entre el número de artículos publicados por esa misma revista y en ese mismo plazo de tiempo.Puede modificarse para calcular el impacto de autores, instituciones... Sin: Impact Factor.

Factor relacionado con el riesgo de que ocurra un suceso (p. ej. enfermar).

Referido a una prueba diagnóstica, número de enfermos en que el resultado serianegativo.

Referido a una prueba diagnóstica, número de sanos en que el resultado seria positivo.

Programas que proporcionan de forma continuada una evaluación sobre laseguridad de los fármacos. El factor clave en este sistema son los profesionales sanitarios queparticipan el en programa de notificación espontánea de reacciones adversas.

Grado de consistencia con que mide el atributo para el que está diseñado. La consistenciaimplica la ausencia de variabilidad o desacuerdo en repetidas observaciones o mediciones. Grado enque las mismas mediciones de los individuaos que se obtienen en diferentes condiciones danresultados similares.

Mide la variación que ocurre entre diferentes observadores almedir a un mismo individuo con un mismo instrumento .

Ver Campo.

Son estrategias de búsqueda que nos ayudan a encontrar, en bases de datoscomo Medline, diferentes tipos de estudio sobre tratamiento, diagnosis, etiología o pronóstico. EnPubmed se denominan "Clinical Queries". Para aplicar uno de estos filtros sólo tenemos que combinarnuestra búsqueda con AND al filtro que nos interesa.

Tipo de gráfico ampliamente utilizado para representar los resultados de losdiversos estudios seleccionados para una revisión sistemática. El Forest Plot ayuda a decidir si losresultados de los estudios individuales son suficientemente similares para poder ser combinados enuna sola estimación.

Véase Validez externa.

Factor de confusión:

Factor de impacto:

Factor de riesgo:

Falso negativo:

Falso positivo:

Farmacovigilancia:

Fiabilidad:

Fiabilidad inter-observador (inter-ratio):

Field:

Filtros metodológicos:

Forest/ Forest Plot:

Generabilidad:

564

Page 33: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Gold Standard:

Grado o nivel de significación:

Grupo de comparación:

Grupo control:

Guía farmacoterapeútica:

Guía de practica clínica:

Hipótesis:

History:

Holística:

Impact Factor:

Incremento absoluto del riesgo (IAR):

Incremento relativo del riesgo (IRR):

Indicador de adhesión a la Guía Farmacoterapéutica:

Es el criterio que define quién tiene "realmente" la enfermedad (o condición) en estudio.

En las pruebas de significación estadística, es el valor de p, el cual, ensentido estricto, en un ensayo clínico debe ser preespecificado en la fase de diseño, el nivel aceptadocon mayor frecuencia es de 0.05. Ver: P (probabilidad), Significación clínica y Significación estadística.

distintos grupos que intentamos comparar en un estudio analítico, ya seanestudios caso-control, estudios de cohortes o ensayos clínicos.

En un ensayo clínico, el grupo que recibe placebo o bien un tratamiento activo yaconocido, aceptado y establecido. Sin: Grupo de referencia.Grupo intervención: En un ensayo clínico, el grupo que recibe el tratamiento que se desea evaluar.

Documento que contiene una relación limitada de medicamentosrecomendados para la prescripción en un ámbito determinado, seleccionada a partir de la ofertafarmacéutica en función de unos criterios previamente establecidos, con la participación y el consensode los profesionales a los que va destinada.

Conjunto de recomendaciones diseñadas para ayudar a los profesionalessanitarios y a los usuarios a seleccionar las opciones diagnósticas y/o terapéuticas más adecuada enel abordaje de una condición clínica específica.

Suposición, fundada en observaciones o reflexiones, que puede conducir a prediccionesrefutables. También, conjetura elaborada de forma que pueda ser comprobada y refutada.

Archivo de todas las consultas bibliograficas realizadas a lo largo de una sesión en PubMed.También designa al subgrupo de registros que provienen de artículos sobre historia de la medicina.

Relativa al “holismo” que es la doctrina que propugna la concepción de cada realidad comoun todo distinto de la suma de las partes que lo componen.

Ver Factor de impacto.

Cuando el tratamiento experimental aumenta la probabilidad deun acontecimiento adverso, diferencia absoluta entre las tasas de acontecimientos adversos.

Cuando el tratamiento experimental aumenta la probabilidad de unacontecimiento adverso, aumento proporcional de la tasas de acontecimientos adversos en el grupoexperimental relativa a la tasa en el grupo de referencia.

Indicador genérico de prescripción que indica elporcentaje de Dosis Diaria Definida (DDD, véase) de medicamentos prescritos incluidos en la GuíaFarmacoterapéutica respecto del total de DDD de medicamentos prescritos.

Gold Standard:

Grado o nivel de significación:

Grupo de comparación:

Grupo control:

Guía farmacoterapeútica:

Guía de practica clínica:

Hipótesis:

History:

Holística:

Impact Factor:

Incremento absoluto del riesgo (IAR):

Incremento relativo del riesgo (IRR):

Indicador de adhesión a la Guía Farmacoterapéutica:

Glosario General

565

Page 34: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Índice Bibliográfico Español en Ciencias de la Salud (IBECS):

Índice Médico Español (IME):

Indización:

Index:

Indexar:

Ineficiencia:

Inferencia:

Instrumentos de medida de CVRS específicos:

Interpretabilidad:

Intervalo de confianza:

Intervención:

Base de Datos de la Biblioteca Nacional deCiencias de la Salud (BNCS) del Instituto de Salud Carlos III (ISCIII), contiene referencias de artículos derevistas científico sanitarias editadas en España e incluye contenidos de las diferentes ramas de lasciencias de la salud tales como Medicina (incluyendo Salud Pública, Epidemiología y AdministraciónSanitaria), Farmacia, Veterinaria, Psicología, Odontología y Enfermería.

Base de datos referencial bibliográfica, creada y gestionada por elInstituto de Historia de la Ciencia y Documentación (IHCD), centro mixto de la Universidad de Valencia ydel Consejo Superior de Investigaciones Científicas (CSIC). Cubre 321 publicaciones periódicaseditadas en España especializadas en Biomedicina (Administración sanitaria, Farmacia clínica,Medicina experimental, Microbiología, Psiquiatría, Salud pública).

Proceso por el que el documentalista asigna unos descriptores que describen el contenidoconceptual de documento con el fin de facilitar su recuperación

Listado de todos los términos (unitérminos o compuestos) con significado que están incluidosen la Base de Datos. Esta opción permite hacer una búsqueda seleccionando los términosdirectamente del listado.

Ver indización.

Situación en la cual los recursos no son empleados de la forma en que se incrementaríanlos beneficios producidos.

Proceso de pasar de las observaciones y axiomas a la generalizaciones. En estadística,desarrollo de la generalización a partir de los datos de la muestra, generalmente con un margen deincertidumbre.

Los instrumentos específicos incluyen dimensiones dela CVRS de una determinada afección que se quiere estudiar, capacidad funcional, o de undeterminado grupo de pacientes.

Instrumentos de medida de CVRS genéricos: Los instrumentos de calidad de vida genéricos no estánrelacionados con ningún tipo de enfermedad o especialidad en particular. Son aplicables tanto a lapoblación general como a grupos específicos de pacientes.

grado en el que uno puede asignar un significado comprensible a las puntuacionescuantitativas del instrumento.

Margen o recorrido comprendidos entre dos valores extremos (el límite inferiory el superior), entre los que cabe esperar el valor medio real de la población con un margen gradoprefijado de seguridad. Ver: Nivel de confianza.

Cualquier acción (preventiva, diagnóstica, sintomática o curativa) aplicada con el fin demodificar el curso de la situación previa. Cualquier tratamiento o actuación sanitaria que queramosevaluar

Índice Bibliográfico Español en Ciencias de la Salud (IBECS):

Índice Médico Español (IME):

Indización:

Index:

Indexar:

Ineficiencia:

Inferencia:

Instrumentos de medida de CVRS específicos:

Interpretabilidad:

Intervalo de confianza:

Intervención:

566

Page 35: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

ISI:

ISSN:

Ítem:

Key word:

Lectura crítica:

Lenguaje documental:

Lenguaje natural:

Límites:

Likehood Ratio:

Literatura inédita:

Mapeo Automático de Términos:

Mayor Topic:

Médical Subject Headings:

Medicina Basada en la Evidencia (MBE):

El Institute for Scientific Information fue creado por Eugene Garfield en 1958 con el objeto depublicar el primer Current Contents que cubría unas 200 revistas. En 1971, cubría más de 4000revistas, publicaba más de 650 páginas de contenidos a la semana, y era consultado por más de unmillón de científicos. En 2001, se desarrolló el ISI Web of KnowledgeSM, que integra literaturacientífica, tanto revistas (journals) como actas (proceedings), patentes, compuestos químicos, y hastasecuencias genómicas. El ISI fue adquirido por The Thomson Corporation, que lo convirtió en elThomson Institute for Scientific Information. Es, por tanto, una institución privada que producediversas Bases de Datos de primer orden en calidad y utilidad en la investigación científica, pero quesobre todo ha obtenido un notable éxito por la difusión de lo que se conoce como Impact Factor oFactor de Impacto.

International Standard Serial Number, número internación único que identifica de manerainequívoca cada revista.

Cada uno de los elementos, preguntas o cuestiones que constituyen un test.

Ver Palabra clave.

Es el proceso de evaluar e interpretar la evidencia aportada por la literatura científica,considerando sistemáticamente los resultados que se presenten, su validez y su relevancia para eltrabajo propio. Sin: Evaluación crítica.

Lenguaje artificial creado específicamente para el análisis y recuperación de lainformación. Contrapuesto al Lenguaje natural, se diferencia de este especialmente por carecer devariabilidad, sinonimia y polisemia.

Expresión de ideas o de conceptos con los términos y con las reglas propios de unidioma o de un grupo especial de hablantes (p.e. sanitarios). Se contrapone a Lenguaje artificial y,específicamente en documentación, a Lenguaje documental.

Opción que ofrecen varias bases de datos, como Medline, que permite limitar/restringir unabúsqueda de acuerdo a unas características como p.ej. artículos publicados en un idiomadeterminado, tipo de publicación (revisión, ensayo clínico), o grupo de edad, sexo, etc.

Véase Razón de probabilidad.

Literatura que no ha sido publicada.

Ver Acotado Automático de Términos.

Materia principal de un artículo. Sin: Descriptor mayor.

Ver MeSH

Práctica de la medicina basada en la integración de la maestríaclínica de cada médico (es decir, el dominio del conocimiento y el juicio adquirido por la experiencia)con las mejores pruebas clínica externas disponibles. También ha sido definida como la utilizaciónconsciente y juiciosa de las mejores demostraciones provenientes de la investigación clínica para latoma de decisiones en el cuidado de cada paciente.

ISI:

ISSN:

Ítem:

Key word:

Lectura crítica:

Lenguaje documental:

Lenguaje natural:

Límites:

Likehood Ratio:

Literatura inédita:

Mapeo Automático de Términos:

Mayor Topic:

Médical Subject Headings:

Medicina Basada en la Evidencia (MBE):

Glosario General

567

Page 36: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Medicamentos genéricos (Especialidad Farmacéutica Genérica, EFG):

Medicamentos huérfanos:

MeSH (Médical Subject Headings, Encabezamientos de Materias Médicas):

MeSH Subheading:

MeSH Term:

Meta-análisis:

Método matricial multirasgo-multimetodo (multitrait-multimethod matriz method, MTMM):

Método test-retest:

Modelo de medida:

Muestra:

Muestreo:

NEAR:

Especialidad con la mismaforma farmacéutica e igual composición cualitativa y cuantitativa en sustancias medicinales que otraespecialidad de referencia, cuyo perfil de eficacia y seguridad está suficientemente establecido por sucontinuado uso clínico. La EFG debe demostrar la equivalencia terapéutica con la especialidad dereferencia mediante los correspondientes estudios de bioequivalencia.

Cuando un fármaco no es desarrollado porque el detentador de la patenteconsidera que no recuperará los costes de este desarrollo (en el caso de enfermedades raras y otrasenfermedades no raras pero que ocurren en países pobres en los que no existe un “mercado”potencial), se lo denomina medicamento huérfano.

Tesauro (diccionario quepermite conocer la equivalencia entre los términos del lenguaje natural y los del lenguaje documental)de Medline y de PubMed.

Subencabezamiento propio de MeSH.

Descriptor propio de MeSH.

Integración estructurada y sistemática de la información obtenida en diferentes estudiossobre un problema determinado. Consiste en identificar y revisar los estudios controlados sobre undeterminado problema, con el fin de dar una estimación cuantitativa sintética de todos los estudiosdisponibles.

procedimiento empleado para la validación de constructo aplicando para ello los conceptos deconvergencia (validez convergente) y discriminabilidad (validez discriminante).

Método utilizado para la comprobación de la fiabilidad de un test. Correlación entrela puntuación de dos administraciones de una prueba a los mismos individuos. De esta manera se mideuno de los conceptos incluidos en la fiabilidad: la estabilidad del test.

Se refiere a las escalas y subescalas de un cuestionario y a los procedimientosseguidos para crear las puntuaciones.

Fracción seleccionada de una población determinada, idealmente representativa de lapoblación de referencia y de tamaño suficiente.

Selección de los sujetos de una población que tomarán parte en un estudio. El muestreoaleatorio implica que cada participante potencial de la población estudiada tiene las mismasprobabilidades de ser incluido en la muestra.

Operador booleano utilizado en las búsquedas en Librería Cochrane Plus. Buscará documentosdonde las dos palabras que enlaza NEAR estén separadas entre sí por un máximo de seis palabras encualquier orden.

Medicamentos genéricos (Especialidad Farmacéutica Genérica, EFG):

Medicamentos huérfanos:

MeSH (Médical Subject Headings, Encabezamientos de Materias Médicas):

MeSH Subheading:

MeSH Term:

Meta-análisis:

Método matricial multirasgo-multimetodo (multitrait-multimethod matriz method, MTMM):

Método test-retest:

Modelo de medida:

Muestra:

Muestreo:

NEAR:

568

Page 37: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

NEXT: Operador booleano utilizado en las búsquedas en Librería Cochrane Plus. Recuperadocumentos donde las dos palabras están juntas en ese orden.

Nivel de confianza: Se expresa en términos probabilísticos y se interpreta como la probabilidad de queel verdadero parámetro poblacional esté dentro del intervalo de confianza. Ver: Intervalo de confianza.

Normograma de Fagan: Método de cálculo de la probabilidad postest mediante la representacióngráfica de una tabla. Permite conocer la probabilidad postest mediante el trazo de una línea que una laprobabilidad pretest y la razón de probabilidad, el siguiente punto de intersección con la línea situada ala derecha, señala la probabilidad postest.

Número necesario para dañar (number needed to harm, NNH): Número de pacientes que deben tomarel tratamiento experimental para que se produzca un caso adicional de un determinadoacontecimiento adverso, en comparación con los pacientes que reciben el tratamiento de referencia.

Número necesario para tratar (NNT): Es una medida de la eficacia de un tratamiento. Cuando eltratamiento experimental incrementa la probabilidad de un acontecimiento favorable (o cuandodisminuye la de un acontecimiento adverso), número de pacientes que hay que tratar para dar lugar aun paciente más con mejoría (o para prevenir un acontecimiento adverso adicional). Se calcula como1/RAR.

Odds: Se llama odds a la razón en la que el numerador es la probabilidad de que ocurra un suceso y eldenominador es la probabilidad de que tal suceso no ocurra.

Odds post-test: Equivale a los odds (proporción) de que un paciente tenga le enfermedad una vez quese ha realizado el test diagnóstico.

Odds pre-test: Definida como los odds (proporción) de que un paciente tenga la enfermedad antes deque el test diagnóstico se efectúe.

Odds ratio (OR): Resultado de dividir la odds del grupo de interés (expuesto) por la odds del grupo dereferencia (control). Si el OR = 1 el riesgo o probabilidad de que ocurra el evento es el mismo paraambos grupos (el efecto el tratamiento experimental es el mismo que el del tratamiento control); si elRO > 1 se interpretará como que el tratamiento experimental favorece la aparición del evento y si el OR< 1 diremos que protege de la aparición del mismo.

Operadores booleanos: Partículas habitualmente expresadas en inglés (AND, OR, NOT) que indicanoperaciones lógicas entre conceptos. Las operaciones son las de intersección (AND = recupera losdocumentos que contengan ambos términos), adición (OR = recupera los documentos que contengantanto un término como otro, o la suma de los dos) o exclusión (NOT = sirve para excluir documentosque tienen un determinado término).

P: Seguida de la abreviatura n.s. (no significativa) o del símbolo < o una cifra decimal, indica laprobabilidad de que la diferencia observada en una muestra haya ocurrido puramente por azar siendolos grupos comparados realmente semejantes, es decir bajo la hipótesis nula.

Glosario General

569

Page 38: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Palabra clave:

Palabra de texto:

Perdidas de seguimiento:

Población:

Positivismo lógico:

Pretest cognitivo:

Prevalencia:

Prevalencia del test:

Probabilidad:

Probabilidad pretest o preprueba:

Probabilidad postest o posprueba:

Término propio del lenguaje natural, sin otras normas que las del habla de la cualprocede, que puede utilizarse en la búsqueda de información. Con frecuencia se utiliza como sinónimode Descriptor, pero este uso no es correcto y conviene evitarlo. En MeSH las palabras clave son elequivalente a los términos de entrada (Entry Terms) de un diccionario de idiomas. Sin: Key word.

PubMed considera “palabras de texto” a todos los números y términos consignificado que aparecen, entre otros menos importantes, en los campos título (title [TI]), resumen(abstract [AB]), descriptores (MeSH terms [MH]), subencabezamientos (MeSH Subheadings [SH]), asícomo los nombres de sustancias químicas (Substance Name [NM]) y los nombres de personas(Personal Name [PS]) cuando unas y otras son la materia del artículo. Sin: Text Word.

Panel de expertos: Reunión de un grupo de profesionales de prestigio en una determinada materia queabordan, exponen, contrastan ... sus opiniones y experiencias sobre la actuación en un temapreocupante de interés para el que se busca la mayor uniformidad de criterios que no es posibleobtener por otro tipo de estudios más eficientes.

Aquellos pacientes que son perdidos durante el estudio y en los cuales nopodemos valorar los resultados finales.

Grupo individuos, objetos, mediciones, etc., con determinadas característicasdemográficas, de donde se obtiene la muestra y a la que se quiere hacer inferencia de los resultadosde un estudio.

También denominado neopositivismo. Movimiento filosófico contemporáneo quedestaca en filosofía la importancia del análisis del lenguaje y de la metodología científica.

Conjunto de estrategias y procedimientos que se utilizan para determinar si elcuestionario funciona tal y como lo ha concebido el investigador. Debe reproducir exactamente lascondiciones en las que se responderá el cuestionario definitivo y, por tanto, tiene que realizarse con elcuestionario terminado y empleando el mismo procedimiento de recogida de información, puesto quela única diferencia entre el pretest y el trabajo de campo es el número de cuestionarios contestados.

Número de casos de una enfermedad en una población y en un momento dados.

Número total de positivos obtenidos al realizar una prueba diagnóstica en relaciónal total de sujetos que componen la muestra estudiada.

Es el cociente entre los casos posibles de que ocurra un hecho dividido por el total decasos.

Proporción de pacientes que tienen la enfermedad en la muestraestudiada, y cuyo diagnóstico es fehacientemente establecido por un estándar de referencia. Es laprevalencia de la enfermedad.

Probabilidad de tener una enfermedad tras la realización de unaprueba diagnóstica.

Palabra clave:

Palabra de texto:

Perdidas de seguimiento:

Población:

Positivismo lógico:

Pretest cognitivo:

Prevalencia:

Prevalencia del test:

Probabilidad:

Probabilidad pretest o preprueba:

Probabilidad postest o posprueba:

570

Page 39: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

PubMed:

Randomización:

Razón de probabilidad:

Reacciones adversas a medicamentos (RAM):

Record:

Reducción absoluta del riesgo (RAR):

Reducción relativa del riesgo (RRR):

Registro:

Regresión logística:

Repetibilidad:

Reproducibilidad:

Retroalimentación:

Reunión educacional:

Base de datos de bibliografía sobre ciencias de la salud. Puede obtenerse de ella informaciónacerca de publicaciones de carácter científico y de contenido médico (en su sentido más amplio,incluyendo enfermería, odontología, veterinaria...).

Ver Aleatorización.

Probabilidad de un resultado en los enfermos dividido por la probabilidad deese mismo resultado en no enfermos. Sin: Cociente de probabilidad, Likehood Ratio.

Según la OMS, “reacción nociva y no deseada que sepresenta tras la administración de un fármaco, a dosis utilizadas habitualmente en la especie humana,para prevenir, diagnosticar o tratar una enfermedad, o para modificar cualquier función biológica”. Lasreacciones adversas se clasifican en dos grandes grupos: RAM tipo A, de tipo cuantitativo opredecibles, y RAM tipo B, de tipo cualitativo o no predecibles. Sin: Efecto indeseado.

Ver Asiento.

Diferencia aritmética absoluta entre la tasa de acontecimientos(riesgo) en el grupo experimental y la tasa de acontecimientos (riesgo) en el grupo control. También sepuede denominar: Diferencia de riesgos.

Cociente entre la reducción absoluta del riesgo (RAR) y el riesgo enel grupo control. A la reducción relativa del riesgo se le llama también “fracción atribuible” o “diferenciarelativa del riesgo”.

Ver Asiento.

Tipo de análisis de regresión (véase) en el que la variable dependiente sólo puedetomar dos valores. En el análisis de regresión la variable dependiente puede ser o bien categórica obien continua (véase).

Referida a una prueba, es el grado en que los resultados son idénticos o estrechamentesemejantes cada vez que aquella se lleva a cabo por los mismos profesionales y los mismosemplazamientos.

Grado en que los resultados son idénticos o estrechamente semejantes cada vezque una prueba se lleva a cabo por distintos profesionales y es distintos ámbitos. Sin. Estabilidad.

Método para mantener la acción o eficacia de un sistema mediante la continuarevisión de los elementos del proceso y de sus resultados con el fin de realizar las modificacionesnecesarias.

Visita individualizada de un educador a un profesional de la salud en su ámbitode trabajo; en ella se suelen combinar técnicas de auditoria y retroalimentación.

PubMed:

Randomización:

Razón de probabilidad:

Reacciones adversas a medicamentos (RAM):

Record:

Reducción absoluta del riesgo (RAR):

Reducción relativa del riesgo (RRR):

Registro:

Regresión logística:

Repetibilidad:

Reproducibilidad:

Retroalimentación:

Reunión educacional:

Glosario General

571

Page 40: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Revisión:

Revisión bibliográfica:

Revisiones narrativas:

Revisiones sistemáticas:

Riesgo:

Riesgo relativo (RR):

Seguimiento:

Sensibilidad:

Sensibilidad al cambio (de un instrumento):

Series de casos:

Sesgo:

Sesgo de desgaste:

Sesgo de información:

Se denomina así a todo intento que sintetice los resultados y las conclusiones de dos o máspublicaciones relacionadas con un tema dado.

recopilación de literatura realizada sobre un tema concreto en un intervalo detiempo concreto del que se realiza un resumen y en el que no quedan explícitos los criterios debúsqueda y se destacan las conclusiones a criterio del autor.

Se basan en el análisis que hace un experto de los estudios originales existentessobre un determinado tema o problema para posteriormente subrayar aquellos resultados queconsidera más importantes.

Revisión en las que la evidencia sobre un tema ha sido sistemáticamenteidentificada, criticada y resumida de acuerdo a unos criterios predeterminados.

Resultado predecible o incierto desfavorable de una actividad, intervención o exposición.Probabilidad de que ocurra un determinado fenómeno adverso.

Cociente entre el riesgo de padecer un acontecimiento entre los individuosexpuestos a un factor de riesgo determinado y el riesgo de padecerlo entre los no expuestos.También se puede denominar: Cociente de riesgos.

Periodo de duración de un estudio durante el cual se mantienen contactos periódicoscon los participantes en el mismo con el fin de evaluar las variables de estudio.

Referida a una prueba diagnóstica, es la proporción de personas verdaderamenteenfermas que ha sido catalogadas como tales mediante dicha prueba.

se refiere a la medida en que detecta y mide de manerafiable las variaciones más pequeñas de un atributo, rasgo, dimensión o constructo.

Tipo de estudio que describe una serie de características poco conocidas de unproceso o tratamiento y facilitan el conocimiento del mismo y su evolución en el tiempo.

Error sistemático producido en la estimación de los resultados, a causa de defectos en eldiseño del estudio, recogida de datos o seguimiento.

Diferencias sistemáticas que se producen entre los grupos de un ensayo clínicopor la pérdida de participantes durante el estudio.

Sesgo relacionado con la forma en la que se obtuvieron los datos. Entre ellos seincluyen los errores cometidos en la valoración del estado de los pacientes al inicio, durante o al finaldel estudio; también los que ocurren cuando los datos se obtienen de fuentes sin que se conozca lacalidad de las mismas. Algunos de los sesgos de información serían: el sesgo del recuerdo o dememoria, sesgo de sospecha diagnóstica, sesgo del entrevistador…

Revisión:

Revisión bibliográfica:

Revisiones narrativas:

Revisiones sistemáticas:

Riesgo:

Riesgo relativo (RR):

Seguimiento:

Sensibilidad:

Sensibilidad al cambio (de un instrumento):

Series de casos:

Sesgo:

Sesgo de desgaste:

Sesgo de información:

572

Page 41: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Sesgo de interpretación de las pruebas:

Sesgo de publicación:

Sesgo de selección:

Sesgo de sospecha diagnóstica:

Sesgo de reproducibilidad:

Sesgo de resultados no interpretables:

Sesgo de verificación o de confirmación diagnóstica:

Sesgo en el espectro de la enfermedad:

Sesión bibliográfica:

Significación clínica:

Significación estadística:

Sinopsis:

Síntesis:

Error sistemático que surge debido a la realización de laspruebas de forma no independiente y a ciegas con la consecuencia de que el conocer los resultados deuna prueba influye en los de la otra.

Sesgo que surge debido a la tendencia a publicar sólo estudios con resultadospositivos.

Error sistemático consecuencia de que las características de los sujetosincluidos en un estudio son diferentes de las características de los no incluidos, de modo que lamuestra no es representativa de la población de referencia. Se incluyen en este grupo el sesgo de losvoluntarios, el de prevalencia-incidencia, el de los emigrantes, el de selección no aleatorizada, el deBerkson, el de pertenencia a grupo, el del trabajador sano…

Sesgo que ocurre cuando la interpretación de una prueba se hagaconociendo el resultado de otra.

Sesgo debido a la ausencia de información detallada de loas condicionesen que se ha aplicado la prueba, así como las definiciones de los resultados positivos y negativos.

Error sistemático consecuencia de no incluir pacientes endiferentes estadios de la enfermedad.

Sesgo que ocurre cuando el estudio se limita aindividuos sobre los que se realizó con anterioridad la prueba “gold Standard”, que suelen ser los demayor probabilidad de padecer enfermedad.

¿

Sesgo por ausencia de “gold Standard”: Error sistemático que se produce cuando entre los criteriosde referencia que se emplean en la comparación de la utilidad de una prueba diagnóstica (en ausenciade “gold Standard”) se incluye la prueba de estudio.

Herramienta docente consistente en reuniones entre profesionales que realizanuna lectura critica de un artículo científico.

Probabilidad de que una diferencia observada tenga una repercusión sobre elcurso del problema o enfermedad tratados que sea relevante para un paciente dado o para un conjuntode pacientes.

Probabilidad de que una diferencia observada sea resultado de la casualidady no de los determinantes causales en un estudio. El hallazgo de una significación estadística noimplica necesariamente significación clínica.

Fuentes de información que recogen resúmenes estructurados de revisiones sistemáticasde alta calidad o de artículos originales.

Fuentes de información que incluyen revisiones sistemáticas de alta calidad metodológica.

Sesgo de interpretación de las pruebas:

Sesgo de publicación:

Sesgo de selección:

Sesgo de sospecha diagnóstica:

Sesgo de reproducibilidad:

Sesgo de resultados no interpretables:

Sesgo de verificación o de confirmación diagnóstica:

Sesgo en el espectro de la enfermedad:

Sesión bibliográfica:

Significación clínica:

Significación estadística:

Sinopsis:

Síntesis:

Glosario General

573

Page 42: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Sistema:

Subencabezamiento:

Subheading:

Tag:

Tamaño de la muestra:

Técnica de grupos conocidos:

Tecnología sanitaria:

Teoría estadística de Bayes o Teorema de Bayes:

Término MeSH:

Término de entrada:

Tesauro:

Test Chi cuadrado (2):

Fuente de información que se caracteriza por abarcar una gran variedad de temas,proporcionar un resumen de los resultados de revisiones de alta calidad y ser actualizado confrecuencia.

Término que delimita el significado del descriptor al que acompaña. P.e. “Drugtherapy” (tratamiento farmacológico) como subencabezamiento unido al descriptor Hypertension nosinformaría que un artículo trata, entre todos los aspectos posibles de la hipertensión, su tratamientofarmacológico.Sin: Subheading.

Ver subencabezamiento.

Ver Etiqueta.

Número mínimo necesario de sujetos que participan en un estudio, pero a suvez suficiente para proporcionar una respuesta fiable al objetivo final de dicho estudio. Ladeterminación de dicho tamaño mínimo es de naturaleza estadística y depende de varios factores.

Procedimiento utilizado para la validación de constructo según la cual elinstrumento se aplica a los grupos que, según se presume, diferirán respecto del atributo crítico acausa de una característica conocida.

Conjunto de medicamentos, aparatos, procedimientos médicos y quirúrgicosusados en la atención médicos y los sistemas organizativos y de soporte con los que se presta laatención sanitaria.

Establecimiento inductiva de la probabilidad de unahipótesis a partir de algunas observaciones. Según el teorema de Bayes, la probabilidad posterior (o aposteriori) de una hipótesis es igual a una constante, multiplicada por la verosimilitud o posibilidad de lahipótesis (definida como la probabilidad de observar unos acontecimientos determinados si lahipótesis considerada fuera de hecho cierta) y por la probabilidad anterior de la hipótesis.

Ver MeSH Term

Relacionado con Palabra clave (véase).

Es un repertorio de términos con expresión de las relaciones semánticas que los unen.Habitualmente consta de dos partes, una sección categorizada, que expresa las relacionesjerárquicas, genérico-específicas, entre los términos normalizados (descriptores), lo que nos permiteconocer el campo semántico (significado) que abarcan los distintos términos. La sección alfabética esuna ordenación de todos los términos, normalizados (descriptores) o no normalizados (palabrasclave), que de forma similar a un diccionario de idiomas, permite conocer las relaciones deequivalencia entre unos y otros términos. Sin: Thesaurus.

Prueba estadística utilizada para determinar el grado de asociación entrevariables categóricas (véase).

Sistema:

Subencabezamiento:

Subheading:

Tag:

Tamaño de la muestra:

Técnica de grupos conocidos:

Tecnología sanitaria:

Teoría estadística de Bayes o Teorema de Bayes:

Término MeSH:

Término de entrada:

Tesauro:

Test Chi cuadrado (2):

574

Page 43: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Test de McNemar:

Test T de Student:

Test U de Mann-Whitney:

Test de Wilcoxon:

Text Word:

Thesaurus:

Transferabilidad:

Triangulación:

Truncado:

Umbral de decisión:

Validez:

Validez aparente o facial:

Validez concurrente:

Validez convergente:

Prueba de significación estadística para probar la hipótesis nula de inexistencia decambios en la proporción de sujetos que experimentan un acontecimiento, cuando cada individuo esevaluado dos veces (en condiciones diferentes) y los datos están emparejados.

Prueba de significación estadística paramétrica (véase) para contrastar la hipótesisnula respecto a la diferencia entre dos medias.

Prueba de significación estadística no paramétrica (véase) para probar lahipótesis nula de que el parámetro de localización (generalmente la mediana) es el mismo cuando secomparan dos grupos independientes, cualquiera que sea el tipo de distribución de la variable(distribución normal o de otro tipo).

El contraste de Wilcoxon es la técnica no paramétrica paralela al test T de Studentpara muestras apareadas.

Ver Palabra de texto.

Ver Tesauro.

Término acuñado en investigación cualitativa sugiere que en la medida en que elinvestigador ha respetado el criterio de maximizar la diversidad en la obtención de la muestra y realiceuna detallada descripción del contexto y participantes, los hallazgos pueden ser aplicables encontextos similares.

Técnica empleada en investigación cualitativa para controlar sesgos. Consiste enobtener distintas perspectivas del fenómeno estudiado utilizando diferentes métodos de investigación(cualitativos y cuantitativos. La triangulación puede ser simultánea o secuencial.

El término truncar significa en español “cortar el extremo de una cosa”. Aplicado a untérmino de búsqueda consiste en separar del término su terminación y sustituirla por un símbolocomodín (en PubMed es un asterisco -*-). El resultado es la selección de todos los términos quecontienen la raíz superviviente.

Nivel de probabilidad a partir del cual el beneficio previsible de toma una decisiónde intervenir iguala o mejora al beneficio de no tomarla

Capacidad de un instrumento para medir aquello para lo que ha sido diseñado, denota el gradoen que el instrumento mide lo que se supone que debe medir.

Forma especial de la validez de contenido que se refiere al hecho de que elinstrumento parezca, de la impresión a las personas evaluadas, de que es adecuado para medir lo quese pretende medir.

Denota la capacidad de un instrumento de distinguir a los individuos que difierenen su condición actual respecto de un criterio.

Aspecto de la validez de constructo que se refiere al grado en que diferentesformas de medir el mismo constructo (o dimensiones de un constructo) se correlacionan la una con laotra.

Test de McNemar:

Test T de Student:

Test U de Mann-Whitney:

Test de Wilcoxon:

Text Word:

Thesaurus:

Transferabilidad:

Triangulación:

Truncado:

Umbral de decisión:

Validez:

Validez aparente o facial:

Validez concurrente:

Validez convergente:

Glosario General

575

Page 44: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Validez de constructo:

Validez de contenido:

Validez de criterio:

Validez discriminante o divergente:

Validez externa:

Validez interna:

Validez predictiva:

Valor global de un test:

Valor predictivo negativo:

Valor predictivo positivo:

Variabilidad:

Variable:

Variable categórica:

Variable continua:

Grado en que una prueba o instrumento mide un determinado rasgo,característica o constructo.

Determina si el instrumento contiene ítems representativos de todas lasdimensiones que forman la definición del concepto o constructo en estudio.

Concordancia entre los resultados de la medida del instrumento y los resultados dela medida realizada mediante un criterio o patrón de referencia (gold standard) de lo que se quieremedir.

Aspecto de la validez de constructo que demuestra que unamedida no se correlaciona con otras medidas cuya finalidad es medir rasgos, dimensiones oconstructos diferentes a los que ella mide.

Grado en que las conclusiones obtenidas con la muestra de población que participa enun estudio pueden ser generalizadas a su población de referencia o a otras poblaciones, lugares,momentos e investigaciones.

Grado en que los resultados de un estudio miden la realidad para la muestra depoblación que participa en un estudio. Grado en que un estudio esta libre de sesgos.

Se refiere a la idoneidad de un instrumento para diferenciar entre el desempeño olas conductas de los individuos respecto de un criterio futuro.

Proporción de sujetos correctamente clasificados por el test en relación al totalde sujetos que componen la muestra estudiada.

Referido a una prueba diagnóstica, la probabilidad de que una persona conun resultado negativo sea un verdadero negativo.

Referido a una prueba diagnóstica, la probabilidad de que una persona con unresultado positivo sea un verdadero positivo.

Variación entre individuos debido a determinantes genéticos, ambientales,patológicos...(variabilidad interindividual) u oscilación de variables biológicas en un mismo individualsegún las circunstancias (variabilidad intraindividual).

Cualquier atributo, fenómeno o hecho que pueda tener diferentes valores.

Se dice de la variable que presenta interrupciones. Una variable es categórica si,entre varios valores potencialmente observables, hay un valor que no puede ser observado. Ejemplo:variables binarias.

Se dice de la variable que no presenta interrupciones. Una variable es continua si,entre dos valores observables, siempre existe la posibilidad de que haya otro valor observable.Ejemplos: edad, peso, altura.

Validez de constructo:

Validez de contenido:

Validez de criterio:

Validez discriminante o divergente:

Validez externa:

Validez interna:

Validez predictiva:

Valor global de un test:

Valor predictivo negativo:

Valor predictivo positivo:

Variabilidad:

Variable:

Variable categórica:

Variable continua:

576

Page 45: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

Verbatim: Su significado es:

Verdaderos negativos:

Verdaderos positivos:

Literalmente, o palabra por palabra. Anglicismo utilizado en investigacióncualitativa para denominar a la transcripción exacta, en la fase de exposición de resultados, de lasexpresiones surgidas durante el grupo de discusión de los participantes, es decir conservado laexpresión literal grabada.

Grupo de pacientes sanos en los que el test es negativo.

Grupo de pacientes con enfermedad y que además son detectados por el test.

Verbatim: Su significado es:

Verdaderos negativos:

Verdaderos positivos:

Glosario General

577

Page 46: 1. LA INCERTIDUMBRE EN LA TOMA DE DECISIONES EN …

578