El paradigma bayesiando: una alternativa al enfoque frecuentista Luis Carlos Silva Ayçaguer...

Post on 01-Mar-2015

6 views 0 download

Transcript of El paradigma bayesiando: una alternativa al enfoque frecuentista Luis Carlos Silva Ayçaguer...

El paradigma bayesiando: una alternativa al enfoque frecuentista

Luis Carlos Silva AyçaguerLuis Carlos Silva Ayçaguer

Vicerrectoría de Investigaciones Vicerrectoría de Investigaciones

ISCM de La HabanaISCM de La Habana

Valoración crítica de los valores “p” y las

pruebas de significación

INFERENCIA ESTADÍSTICA

A principios de siglo los anécdotas clínicas poblaban las revistas médicas

¿Qué significaban los resultados?EDITORES

¿Cómo cuantificar la evidenciay complementar los razonamientos

verbales?

INFERENCIA ESTADÍSTICA

Fisher (década de los 20) Ho: d=0

Se observa 0d

Medida de la discrepancia de los datos con la hipótesis, llamada a tener un papel informal (no especificado), junto con el resto de la información, en el flujo inferencial

)( 00 HddPp

Interpretación comprensible pero completamente errónea :

Muchos investigadores y lectores piensan que un valor p de 0.04 significa que: la hipótesis nula tiene una probabilidad de sólo un 4% de ser cierta.

Ante una simple afirmación resumen de un estudio que produjo un resultado inesperado con una p=0.05, una abrumadora mayoría dirá, confiadamente, que:

la probabilidad de que la hipótesis nula sea incorrecta es 95% o más

p se calcula bajo el supuesto de que la hipótesis nula es verdadera.

No puede ser una medida directa de la probabilidad de que la hipótesis nula sea falsa.

Primera crítica para los valores p:

d granden pequeña

d pequeñan grande

)( 00 HddPp

)( 00 HddPp

)( 00 HddPp

Sacket (1979)

Las muestras demasiado pequeñas pueden servir para no probar nada, las muestras demasiado grandes pueden servir para no probar nada.

INFERENCIA ESTADÍSTICA

Neyman y Pearson (década de los 30)

Ho: d=0

Se observa 0d

H1: d0

Se fijan y

cierta) HHP(rech o0falsa) HH P(acep 00

tasas de error

Y se adopta una decisión

tasa de falsospositivos

tasa de falsosnegativos

INFERENCIA ESTADÍSTICA

Se observa 0d

Y se adopta una decisión

pSi se rechaza Ho: d=0

)( 00 HddPp se computa

pSi se acepta Ho: d=0

y

Silva LC, Muñoz A (2000)Silva LC, Muñoz A (2000) Debate sobre métodos Debate sobre métodos frecuentistas vs frecuentistas vs bayesianosbayesianos. . Gaceta Sanitaria Gaceta Sanitaria 1414(6): 482-494(6): 482-494..

El Comité Internacional de Directores de Revistas Médicas

Describa los métodos estadísticos con el suficiente detalle para permitir, que un lector versado en el tema con acceso a los datos originales, pueda verificar los resultados publicados. En la medida de lo posible, cuantifique los hallazgos y presente los mismos con los indicadores apropiados de error o de incertidumbre de la medición (como los intervalos de confianza). Se evitará la dependencia exclusiva de las pruebas estadísticas de verificación de hipótesis, tal como el uso de los valores P, que no aportan ninguna información cuantitativa importante.

Grupo de Vancouver (2001)Grupo de Vancouver (2001)

Resulta preferible omitir los valores p de los informes sobre estudios epidemiológicos puesto que pueden emplearse las estimaciones puntuales y los intervalos de confianza (además de otras alternativas)

Keneth Rothman Writing for epidemiology Mayo, 1998 EPIDEMIOLOGY Vol.9, Nº3: 98-104

•Hay motivos teóricos e indicios empíricos nacidos del trabajo de enfermería que hacen pensar que los pacientes afectados por quemaduras se recuperan más rápidamente cuando el tratamiento combina cierta crema antiséptica con un apósito hidrocoloide que cuando se utiliza la crema antiséptica solamente.

•Se diseña un experimento con la esperanza de rechazar la hipótesis nula que afirma que el tratamiento simple es tan efectivo como el combinado.

Poblaciónde quemados

Muestra

C+A

C

No mej

Mejoran

No mej

Mejoran

tiempo

Ensayo controlado aleatorizadoEnsayo controlado aleatorizado

azar

80

40

40

Si No TotalTratamiento Experimental

30 10 40

Tratamiento Convencional

24 16 40

Total 54 26 80

Recuperación

Supongamos que el 75% (p1=0,75) de los pacientes bajo el tratamiento experimental mejora apreciablemente a los 5 días, mientras que para los pacientes tratados de manera convencional esta tasa de recuperación fue del 60% (p2=0,60)

05 . 22

obs

p=0,15

Si No TotalTratamiento Experimental

150 50 200

Tratamiento Convencional

120 80 200

Total 270 130 400

Recuperación

26 , 102

obs

p=0,001

Si No TotalTratamiento Experimental

44400 29600 74000

Tratamiento Convencional

44030 29970 74000

Total 44430 59570 148000

Recuperación

85 , 32

obs

p=0,0498

(pc=59,5%) (pe=60%)

Si No TotalTratamiento Experimental

103 97 200

Tratamiento Convencional

120 80 200

Total 223 177 400

Recuperación

93 , 22

obs

p=0,09

Si la verdadera diferencia que se está evaluando no es nula (que es lo que debe ocurrir, pues si los tratamientos son diferentes no hay razón alguna para esperar que tengan efectos EXACTAMENTE iguales), por muy pequeña que sea esa diferencia, siempre se podrá rechazar la hipótesis de nulidad si se trabaja con una muestra suficientemente grande. Las pruebas de significación constituyen supuestamente un proceso de decisión sobre una hipótesis (que se ha de aceptar o no); pero el pensamiento científico no discurre así realmente.

La información anterior a los datos, proveniente de estudios previos o de la experiencia empírica informalmente acumulada (que siempre se tiene sobre el problema que se examina) no interviene en el modelo estadístico de las pruebas de hipótesis. El investigador se resiste a desdeñar totalmente el resultado (que es lo que en rigor tendría que hacer de acuerdo con las reglas del método que emplea); se rebela ante la idea de actuar como si la diferencia observada estuviera diciendo lo mismo que una diferencia nula o mínima

Es natural que se aspire a contar con un procedimiento inferencial que tenga los siguientes rasgos (ninguno de los cuales, como se ha dicho, está presente en la teoría frecuentista de las pruebas de hipótesis):

Que cuanto mayor sea el tamaño muestral, con más elementos se cuente para valorar adecuadamente la realidad que esa muestra representa.

Que valore la credibilidad o verosimilitud de las hipótesis en lugar de obligarnos a adoptar decisiones dicotómicas sobre ellas.

Que no parta de una supuesta orfandad total de información; que el modelo de análisis contemple de manera formal el conocimiento previo y la experiencia precedente

Que no desdeñe nunca el resultado de un estudio y otorgue a los datos la importancia que tienen, ni más ni menos, pero que en ningún caso conduzca a actuar como si no se hubiera hecho el experimento o la observación.

•Probabilidad frecuentista

•Probabilidad subjetiva•Límite de una frecuencia

•Probabilidad de que se desate una guerra

Teorema de BayesTeorema de Bayes

(Valoración priori acerca de si la hipótesis es verdadera antes de ver los datos)

X

(Factor de Bayes)

(Valoración a posteriori- de que la hipótesis nula sea verdadera)

Componente subjetivo

X

Componentede los datos (evidencia)

Probabilidad de la veracidad

Tasa de asmaticosTasa de asmaticos4 posibilidades (modelos): 5% 7% 10% 15%

Modelos 5% 7% 10% 15%

Probabilidad a priori

atribuidas a los modelos 0,1 0,4 0,4 0,1

Se hace una encuesta sobre 200 sujetos elegidos al azar y se observa que 11 de ellos son asmáticos (5,5%)

¿CUÁL ES LA PROBABILIDAD DE CADA MODELO?

Probab a priori Productoprob (5,5%|5%)= 0,117 0,100 0,012 prob (5%|5,5%)= 0,238prob (5,5%|7%)= 0,085 0,400 0,034 prob (7%|5,5%)= 0,691

prob (5,5%|10%)= 0,009 0,400 0,003 prob (10%|5,5%)= 0,071prob (5,5%|15%)= 0,000 0,100 0,000 prob (15%|5,5%)= 0,000

Probabilidad de datos dado el modelo Probab a posteriori

238,0)1,0)(000,0()4,0)(009,0()4,0)(085,0()1,0)(0117,0(

)1,0)(117,0(

%)15(%)15|(%)10(%)10|(%)7(%)7|(%)5(%)5|(

%)5(%)5|(

PPPPPPPP

PP

datosdatosdatosdatos

datos

238,0)1,0)(000,0()4,0)(009,0()4,0)(085,0()1,0)(0117,0(

)1,0)(117,0(

%)15(%)15|(%)10(%)10|(%)7(%)7|(%)5(%)5|(

%)5(%)5|(

PPPPPPPP

PP

datosdatosdatosdatos

datos

Probabilidad de que valga el modelo 5% supuesto que se ha observado una tasa de 5,5%:

Infinitos modelosInfinitos modelosAquí la suma de barras en todo un intervalo es un área bajo la curva

curva 1 : a=4 y b=4 curva 2: a=4 y b=1 curva 3: a=22 y b=4 curva 4. a=1 y b=4

El enfoque bayesiano: otra manera de inferir

Dr. Luis Carlos Silva AyçaguerInvestigador Titular, Vicerrectoría de Investigación y Posgrado, ISCM/H. Edificio Ramón Paz, 6º piso, Calle G y 25, Plaza,

Dra. Alina Benavides RodríguezEspecialista de Primer Grado de Bioestadística, Dirección Provincial de Salud, Villa Clara.

a=57 b=38

a=72 b=18

Archives of Internal Medicine 1999, Vol 159: 2273-2278

Percentiles relevantes Area Percentil__________ __________ 0,025 0,745 0,050 0,751 0,100 0,757 0,250 0,767 0,500 0,778 0,750 0,790 0,900 0,800 0,950 0,806 0,975 0,811

Luis Carlos Silva AyçaguerLuis Carlos Silva AyçaguerInvestigador TitularInvestigador Titular

Instituto Superior de Ciencias MédicasInstituto Superior de Ciencias Médicas

Vicerrectoría de Investigaciones y PosgradoVicerrectoría de Investigaciones y Posgrado

Ave. de los Presidentes y 25, 6º pisoAve. de los Presidentes y 25, 6º piso

Municipio Plaza, Ciudad de la HabanaMunicipio Plaza, Ciudad de la Habana

lcsilva@infomed.sld.cu: