CONTRASTE DE HIPÓTESIS alfa y beta media P-valor...

14
Medicina – BEIR 2018/19 1 B. Campos - UB Grado de Medicina Universidad de Barcelona Bioestadística básica, Epidemiologia e Introducción a la Investigación (2018/19) Begoña Campos Departamento de Fundamentos Clínicos CONTRASTE DE HIPÓTESIS Planteamiento general: hipótesis nula y alternativa, errores tipo I y II, estadístico de contraste y región crítica. Riesgos alfa y beta. Tipos de contrastes. Prueba para la proporción de una población. Prueba para la media de una población. Potencia de un contraste. Grado de significación (P-valor). INTRODUCCIÓN “Hypothesis testing provides an objective frame work for making decisions using probabilistic methods, rather than relying on subjective impressions” – B Rosner, Fundamentals of Biostatistics, Brooks/Cole 2006 (6ªed) A. Definiciones (Diccionario de la Lengua Española – R.A.E.) 1 • Contrastar. Del lat. tardío contrastāre 'oponerse'. 3. tr. Comprobar la exactitud o autenticidad de algo. Hipótesis. Del gr. πόθεσις hypóthesis. 1. f. Suposición de algo posible o imposible para sacar de ello una consecuencia. Hipótesis de trabajo. Hipótesis que se establece provisionalmente como base de una investigación que puede confirmar o negar la validez de aquella. Refutar. Del lat. refutāre. 1. tr. Contradecir o impugnar con argumentos o razones lo que otros dicen. B. La medicina basada en la evidencia aboga para que la decisión de aplicar un tratamiento a un paciente demande que sus beneficios hayan sido contrastados en una investigación científica 2 . C. El método científico como combinación de razonamiento y observación hace uso de la lógica inductiva para extraer conclusiones de resultados experimentales. En particular se aplica la regla de inferencia lógica modus tollendo tollens. Por ejemplo 3 : Si PQ Si el agua hierve, entonces soltará vapor. noQ: No suelta vapor. noP Por lo tanto, no está hirviendo el agua. D. En el contexto de la investigación médica la inferencia estadística aporta la 1 <http://dle.rae.es/>; acceso 19/10/2017 2 Sackett DL et al. Evidence based medicine: what it is and what it isn't. BMJ 1996;312:71. 3 <https://es.wikipedia.org/wiki/Modus_tollendo_tollens>; acceso 27/10/2017

Transcript of CONTRASTE DE HIPÓTESIS alfa y beta media P-valor...

Medicina BEIR 2018/19 1 B. Campos - UB

Grado de Medicina Universidad de Barcelona Bioestadstica bsica, Epidemiologia e Introduccin a la Investigacin (2018/19)

Begoa Campos Departamento de Fundamentos Clnicos

CONTRASTE DE HIPTESIS

Planteamiento general: hiptesis nula y alternativa, errores tipo I y II, estadstico de contraste y regin crtica. Riesgos alfa y beta. Tipos de contrastes. Prueba para la proporcin de una poblacin. Prueba para la media de una poblacin. Potencia de un contraste. Grado de significacin (P-valor).

INTRODUCCIN Hypothesis testing provides an objective frame work for making decisions using probabilistic methods, rather than relying on subjective impressions B Rosner, Fundamentals of Biostatistics, Brooks/Cole 2006 (6ed) A. Definiciones (Diccionario de la Lengua Espaola R.A.E.)1 Contrastar. Del lat. tardo contrastre 'oponerse'.

3. tr. Comprobar la exactitud o autenticidad de algo. Hiptesis. Del gr. hypthesis.

1. f. Suposicin de algo posible o imposible para sacar de ello una consecuencia.

Hiptesis de trabajo. Hiptesis que se establece provisionalmente como base de una investigacin que puede confirmar o negar la validez de aquella.

Refutar. Del lat. refutre. 1. tr. Contradecir o impugnar con argumentos o razones lo que otros dicen.

B. La medicina basada en la evidencia aboga para que la decisin de aplicar un tratamiento a un paciente demande que sus beneficios hayan sido contrastados en una investigacin cientfica2. C. El mtodo cientfico como combinacin de razonamiento y observacin hace uso de la lgica inductiva para extraer conclusiones de resultados experimentales. En particular se aplica la regla de inferencia lgica modus tollendo tollens. Por ejemplo3:

Si PQ Si el agua hierve, entonces soltar vapor. noQ: No suelta vapor. noP Por lo tanto, no est hirviendo el agua.

D. En el contexto de la investigacin mdica la inferencia estadstica aporta la

1 ; acceso 19/10/2017 2 Sackett DL et al. Evidence based medicine: what it is and what it isn't. BMJ 1996;312:71. 3 ; acceso 27/10/2017

Medicina BEIR 2018/19 2 B. Campos - UB

tecnologa para evaluar las conclusiones en trminos de probabilidad4. E. La teora de decisin estadstica es the theory of choosing an optimal non-deterministic behaviour in incompletely known situations5. PLANTEAMIENTO GENERAL

A. Un CONTRASTE de hiptesis es un conjunto de reglas para tomar una decisin acerca de una hiptesis, falsa o no falsa, en base a una probabilidad.

B. Las etapas a seguir son: Plantear una hiptesis y utilizarla como premisa Deducir de lo anterior una situacin esperable Usar lo observado en los datos como prueba

Cuantificar la discrepancia entre lo observado y lo esperado: Obs vs Esp Tomar una decisin a favor o en contra de la hiptesis

C. El punto de partida es plantear la HIPTESIS sobre la que se tomar la decisin. Ser una afirmacin acerca de una caracterstica de la poblacin de estudio. Generalmente una hiptesis estadstica hace referencia a un parmetro. Ejemplos: H: La altura media de la poblacin de jvenes espaoles es de 174 cm H: La proporcin de curaciones usando T en una poblacin de pacientes es del 40% H: La prevalencia de caries en nios de ciudad es igual a la de nios rurales D. La DECISIN sobre la hiptesis slo puede ser de dos tipos: se rechaza la hiptesis nula o no se rechaza. Se basa en evaluar los datos de la muestra seleccionada de la poblacin de estudio. Si la informacin de los datos es compatible con lo planteado en la hiptesis, entonces sta no se puede rechazar. Sin embargo, la hiptesis quedar refutada, si la informacin apunta a otra idea. E. La hiptesis sobre la que se decide ha de ser una hiptesis NULA, en el sentido de que no hay cambio o efecto respecto a una situacin aceptada. Un aforismo del derecho dice: lo normal se entiende que est probado, lo anormal se prueba6 . En el mundo acadmico se prueba lo anormal refutando la hiptesis nula. Por eso, si se pone en duda el comportamiento de una moneda, la hiptesis nula ha de afirmar que la moneda no est trucada. F. Acompaando a la hiptesis nula tambin se define una hiptesis ALTERNATIVA. Ser la afirmacin que se adoptar en caso de rechazar la nula. En el ejemplo de la moneda sera declarar la moneda est trucada.

4 Wassertheil-Smoller S. (1990). Ver en bibliografa. 5 ;acceso: 26/10/17 6 ; acceso: 27/10/2017

Medicina BEIR 2018/19 3 B. Campos - UB

Generalmente es de tipo compuesto, pues ser un conjunto de posibilidades no incluidas en la hiptesis nula. Por ejemplo: Ha: La altura media de la poblacin de jvenes espaoles es < > 174 cm Se dice que un contraste es BILATERAL cuando la hiptesis alternativa incluye cualquier sentido, como en el ejemplo anterior, mientras que se dice que UNILATERAL si la afirmacin es en sentido nico. Por ejemplo: Ha: La altura media de la poblacin de jvenes espaoles es > 174 cm G. La informacin se extraer de los datos aplicando el ESTADSTICO adecuado a cada caso. Ejemplos: La media aritmtica de una muestra de 56 jvenes es de 173,5 cm La frecuencia relativa de curaciones en la muestra de 120 pacientes es de 0,45 H. Puesto que los datos de la muestra se obtienen por un proceso aleatorio, las estimaciones estarn afectadas de incertidumbre, es decir, error de muestreo. Es por ello que, aun siendo verdadera la hiptesis, la realidad observada no se ajustar perfectamente a lo esperado. En el ejemplo de la moneda sospechosa los datos se obtendrn de repetir varias veces el lanzamiento de la moneda y difcilmente lo observado ser mitad caras y mitad cruces por muy perfecta que sea la moneda. Lo esperado ser 50 caras en 100 lanzamientos, pero 45 caras tambin sera aceptable. I. La discrepancia entre lo esperado y lo observado se medir en trminos de PROBABILIDAD. Los datos se considerarn incompatibles con la hiptesis slo si la probabilidad es baja. Por ejemplo la probabilidad de 28 caras o menos en 100 lanzamientos de una moneda no trucada vale 0,00000629, lo cual es demasiado baja para seguir apoyando la idea de que no hay truco. Sin embargo la probabilidad de 46 o menos en 100 lanzamientos es de 0,24205921, por lo que no se puede rechazar la hiptesis inicial. J. El clculo de la probabilidad se hace utilizando la DISTRIBUCIN MUESTRAL del estadstico asumiendo que la hiptesis nula es cierta. Esto significa que los parmetros de la distribucin quedan marcados por lo declarado en la hiptesis nula y que la probabilidad est condicionada a ella. K. La regla de decisin se construir fijando a priori un nivel de probabilidad. Si la probabilidad calculada es menor, entonces se rechazar la hiptesis nula. Habitualmente la probabilidad se expresa por sus correspondientes percentiles que se establecen como VALORES CRTICOS (V.C.). Su funcin es marcar lo mximo que puede diferir lo observado en la muestra con lo esperado bajo la hiptesis nula.

En un contraste bilateral habr dos valores crticos, uno para detectar que lo observado es menor que lo esperado y otro para detectar la situacin contraria. Siguiendo con el ejemplo de la moneda significara delimitar cuntas caras por debajo o por encima de 50 es razonable esperar de una moneda no trucada. En contraste

Medicina BEIR 2018/19 4 B. Campos - UB

unilateral slo habr un valor crtico que se situar en el lado que indique la hiptesis alternativa. L. Se denonima REGIN CRTICA al conjunto de valores que estn ms all de los valores crticos. Corresponde con los resultados muy poco probables en caso de que la hiptesis nula fuera cierta. El tamao de la regin crtica viene impuesto por el nivel de probabilidad prefijado, que se denomina NIVEL DE SIGNIFICACIN o ALFA. Lgicamente la regin crtica ocupa las colas de la distribucin muestral del estadstico usado en el contraste. Si es de tipo bilateral, el valor de alfa se reparte entre los dos extremos, pero si es unilateral entonces se concentra en el lado que indique la hiptesis alternativa.

M. La decisin consiste en seleccionar una opcin de dos que son contrapuestas. Cualquiera que sea la decisin, la opcin elegida puede ser correcta o no, ya que se basa en probabilidad. As por ejemplo, si la moneda es perfecta, el resultado de 28 caras en 100 lanzamientos es posible, aunque con una probabilidad muy pequea. Se distinguen dos tipos de ERROR:

Error de tipo I. Rechazar una hiptesis nula que es verdadera Error de tipo II: No rechazar una hiptesis nula que no es verdadera

Estos dos errores no pueden ocurrir simultneamente, pues estn condicionados a decisiones distintas. La situacin general se puede ilustrar con un diagrama de rbol de cuatro ramas, pero normalmente se presenta en forma de tabla como la siguiente.

DECISIN Ho Verdadera Ho No-Verdadera

Se rechaza Ho Error de tipo I = Pr(Error I) OK

No se rechaza Ho OK Error tipo II

= Pr(Error II) N. A pesar de que siempre existir el RIESGO de tomar la decisin errnea, el contraste se ha de construir para que esta probabilidad sea mnima. Se trata de que el error ocurra el menor nmero de veces posibles. Hay que distinguir dos tipos de riesgo:

Riesgo alfa. Probabilidad del error tipo I. |

Riesgo beta. Probabilidad del error de tipo II. |

El riesgo alfa se fija antes del contraste y determina el tamao de la regin crtica, por eso tambin se denomina nivel de significacin. Si se adopta un alfa grande, los valores crticos se acercarn al centro reduciendo la zona de no rechazo. En consecuencia se favorece el rechazo de la hiptesis. Por el mismo razonamiento, un alfa pequeo provocar que los valores crticos se desplacen hacia los extremos y dificultar el rechazo de la hiptesis. Esto posibilita el error de tipo II y aumenta el riesgo beta. Los riesgos alfa y beta estn relacionados, aunque no son complementarios.

Medicina BEIR 2018/19 5 B. Campos - UB

TIPOS DE CONTRASTES A. Los distintos contrastes de hiptesis suelen clasificarse en tres grandes tipos:

CONFORMIDAD (one-sample inference7 ). La hiptesis hace una afirmacin sobre una caracterstica de una poblacin y se contrasta con una muestra de datos obtenida de ella.

H: La altura media de la poblacin de jvenes espaoles es de 174 cm HOMOGENEIDAD (two-sample inference). La hiptesis hace una afirmacin

comparando una caracterstica entre dos o ms poblaciones y se contrasta comparando sendas muestras obtenidas de ellas.

H: La prevalencia de caries en nios de ciudad es igual a la de nios rurales INDEPENDENCIA. La hiptesis afirma que dos variables estudiadas en una

misma poblacin no estn asociadas entre ellas y se contrasta con una muestra obtenida de ella. H: Las notas de Anatoma son independientes de las notas de Bioqumica en la poblacin de alumnos de primero

B. Para resolver un contraste de hiptesis hay cuatro pasos bsicos a seguir:

1) Definir las hiptesis. Esto implica entender bien el tipo de datos para identificar el parmetro en cuestin, el nmero de poblaciones y muestras estudiadas y si el contraste ha de ser unilateral o bilateral. Al final se formularn las hiptesis nula y alternativa correspondientes.

2) Estadstico de contraste. Para cuantificar la diferencia entre lo establecido en la hiptesis y lo observado en la muestra se escoger el estadstico adecuado al tipo de datos a analizar. Para asignar probabilidad a la diferencia encontrada se usar la distribucin muestral del estadstico, segn lo indicado en la hiptesis nula, siempre cuando se cumplan las condiciones de aplicacin. La regin crtica se situar en las colas de la distribucin y su tamao depender de alfa. Con esto quedar constituida la regla de decisin que se aplicar ms tarde.

3) Clculos. La ejecucin de los clculos para obtener el estadstico de contraste podr hacerse a mano o con programas informticos. Para valorar el resultado se consultarn las tablas para encontrar los valores crticos, o de forma alternativa se usar el P-valor calculado por el programa informtico.

4) Decisin y Conclusin. En primer lugar hay que decidir si se rechaza o no la hiptesis nula en coherencia con la regla de decisin anterior. Adems habr que considerar el posible error asociado. Despus se concluye con las consecuencias que se derivan de la decisin, que tienen ms que ver con el contexto que con la estadstica.

7 Rosner B. (2011). Ver bibliografa.

Medicina BEIR 2018/19 6 B. Campos - UB

CONFORMIDAD DE UNA PROPORCIN A. Objetivo. Comprobar si los datos aportan o no evidencia para responder a:

Est usted conforme en afirmar que la proporcin poblacional vale .? B. La hiptesis nula de una conformidad de proporcin tiene la forma:

Ho : =nmero p.ej. Ho: =0,4 C. El parmetro proporcin poblacional () se interpreta como una probabilidad de xito en experiencias con resultados dicotmicos Ejemplos:

E= lanzar al aire una moneda y observar el resultado X= {cara: 1, cruz: 0} = Pr(cara)

E= seleccionar al azar un individuo de la poblacin y observar el resultado X= {diabtico: 1, no-diabtico: 0} = Pr(diabtico) D. Se supone que los datos se obtienen seleccionando n individuos de la poblacin por muestreo aleatorio simple. En cada uno de ellos se mide la presencia o ausencia del atributo que se define como xito. Las observaciones formarn una coleccin de ceros y unos. E. El mejor estimador de la proporcin poblacional es la frecuencia relativa de xitos en la muestra (F.R.), tambin conocida como proporcin muestral:

#

F. La distribucin muestral de FR depende principalmente del numerador, frecuencia absoluta, ya que el denominador es el tamao de la muestra y es una constante.

#~ !", En muestras grandes el modelo Binomial se puede aproximar por una Normal.

# $%&'$()*++++++,~-!" .,/1 1 Por tanto, la distribucin de FR en muestras grandes, y probabilidad de xito no extrema, es:

$%&'$()*++++++,~-!" .,/21 41

G. La distribucin muestral de FR bajo Ho, es decir, asumiendo cierto lo que en ella se afirma, aparece al sustituir el parmetro por lo declarado en la hiptesis:

: 0,4$%&'$()*++++++,~-!" .0,4,/20,4 0,6 41

H. Para trabajar con probabilidades de una Normal lo ms cmodo es tipificar el estadstico para convertirlo en una Zeta:

/21 4

Medicina BEIR 2018/19 7 B. Campos - UB

I. La decisin sobre Ho se basar en comparar la frecuencia relativa observada en la muestra (fr) con lo establecido en la hiptesis (=0,4). No hay que entenderlo como una comparacin matemtica, porque hay que tener en cuenta la incertidumbre de muestreo: Si fr se acerca a 0,4 z estar en el centro No se rechaza Ho

Si fr se aleja de 0,4 z estar en los extremos S se rechaza Ho J. En torno al centro de la distribucin, z=0, se sita la zona de no rechazo y ms all de los valores crticos est la zona de rechazo. La regin crtica estar en los extremos, porque contiene valores poco probables siendo cierta la hiptesis nula. El tamao de la regin crtica vendr determinado por el riesgo alfa que implica rechazar la hiptesis nula. En un contraste bilateral la regin crtica se reparte en las dos colas y los valores crticos de la z son -1,96 y +1,96 para alfa=5%.

K. Esquema de resolucin con ejemplo

CONFORMIDAD DE UNA MEDIA A. Objetivo. Comprobar si los datos aportan o no evidencia para responder a:

Est usted conforme en afirmar que la media poblacional vale .? B. La hiptesis nula de una conformidad de media tiene la forma:

Ho : =nmero p.ej. Ho: =174 C. El parmetro media poblacional () se refiere al valor medio de una variable continua medida en una poblacin determinada.

Medicina BEIR 2018/19 8 B. Campos - UB

Ejemplo: E= seleccionar al azar una persona de una poblacin de jvenes varones

X= altura (cm) = valor medio de altura en la poblacin D. Se supone que los datos se obtienen seleccionando n individuos de la poblacin por muestreo aleatorio simple. En cada uno de ellos se mide la caracterstica X. Las observaciones formarn una coleccin de nmeros. E. El mejor estimador de la media poblacional es la media aritmtica de la muestra:

>?$ 1@A B

F. La distribucin muestral de >? ser Normal si: - la variable X original es Normal (teorema de la adicin) - la variable X original no es Normal, pero el tamao de muestra es muy grande (teorema del lmite central)

El centro de la distribucin est en y el error tpico depende de n: >?~-!"CB, D F

G. La distribucin muestral de >? bajo Ho, es decir, asumiendo cierto lo que en ella se afirma, aparece al sustituir el parmetro por lo declarado en la hiptesis:

:B 174>?~-!"C174, D F H. Para trabajar con probabilidades de una Normal lo ms cmodo es transformar el estadstico. Si se conoce el valor de la variancia poblacional (), la transformacin es una tipificacin que genera una Zeta:

>? >?? BD ? 174D =~-0,1

Generalmente sigma es desconocida y habr que estimarla a partir de la muestra. La transformacin de >? con S da lugar al estadstico t que sigue una distribucin t de Student con n-1 grados de libertad:

>? >?? BH ? 174H ~ HIJ" 1

I. La decisin sobre Ho se basar en comparar la media muestral () con lo establecido en la hiptesis (=174). No hay que entenderlo como una comparacin matemtica, porque hay que tener en cuenta la incertidumbre de muestreo: Si se acerca a 174 t estar en el centro No se rechaza Ho

Si se aleja de 174 t estar en los extremos S se rechaza Ho J. En torno al centro de la distribucin, t=0, se sita la zona de no rechazo y ms all de los valores crticos est la zona de rechazo. La regin crtica estar en los extremos, porque contiene valores poco probables siendo cierta la hiptesis nula. El tamao de la regin crtica vendr determinado por el riesgo alfa que implica rechazar la hiptesis nula. En un contraste bilateral la regin crtica se reparte en las dos colas y

Medicina BEIR 2018/19 9 B. Campos - UB

los valores crticos de la t dependern de los grados de libertad. Para n=16, es decir 15 grados de libertad, los valores crticos son -2,131 y +2,131 para alfa=5%.

K. Esquema de resolucin con ejemplo

POTENCIA A. La potencia de una prueba cuantifica la capacidad para detectar la falsedad de una hiptesis nula. Se calcula como probabilidad condicionada:

L LM=|N" B. La potencia es complementaria del riesgo beta, que es la probabilidad de cometer error de tipo II:

L 1 1 -OLM=|N" Por tanto poca potencia significa mucha posibilidad de error. C. Afirmar que Ho es falsa puede significar muchas opciones distintas. Para hacer clculos de potencia la hiptesis alternativa se define de forma simple fijando un valor alternativo al de la hiptesis nula. Ejemplo:

: 0,6': 0,8 A la diferencia entre ambas se le denomina delta o tamao del efecto.

Q" ' 0,8 0,6 0,2 D. Puesto que el riesgo alfa y el beta estn relacionados, cambiar alfa afectar a la potencia. En concreto aumentar alfa, disminuir beta y por tanto aumentar la potencia. No obstante la ganancia en potencia es a costa del error de tipo I.

Medicina BEIR 2018/19 10 B. Campos - UB

E. Otra manera de aumentar la potencia es definiendo una hiptesis alternativa ms alejada de la nula. A mayor delta, menos se solapan las dos curvas y mayor ser la potencia. Sin embargo, esto afecta a la resolucin del contraste pues limitar la posibilidad de detectar cambios pequeos del parmetro. F. Sin modificar alfa ni delta, tambin se puede aumentar la potencia aumentando el tamao de la muestra. Esto es as porque disminuye el error tpico de la distribucin muestral, con lo cual las curvas se concentran y hace que sea ms fcil discriminar entre la hiptesis nula y la alternativa. La contrapartida es el gasto que implica trabajar con una muestra ms numerosa.

Medicina BEIR 2018/19 11 B. Campos - UB

P-VALOR o GRADO DE SIGNIFICACIN

A. Informally, a p-value is the probability under a specified statistical model that a statistical summary of the data (e.g. the sample mean difference between two compared groups) would be equal to or more extreme than its observed value8

B. Clculo del p-valor en un contraste de conformidad unilateral del parmetro media poblacional.

Ejemplo:

Medicina BEIR 2018/19 12 B. Campos - UB

Esta interpretacin justifica que al P-valor tambin se lo denomine grado de significacin.

E. Interpretar lo que es ms extremo requiere tener en cuenta el sentido de la desigualdad indicado en la hiptesis alternativa. En el ejemplo anterior se ha de entender que ms extremo es por encima del resultado, porque en la hiptesis alternativa se apunta hacia ms infinito. Sin embargo en un contraste bilateral la hiptesis alternativa apunta en ambos sentidos, porque no importa si el resultado se desva por la derecha de cero o por la izquierda. El clculo del P-valor ha de tener en cuenta ambas posibilidades:

|Oc de| |132 120| |12| "|12| ^ f 3 _ ^ \ _3 2 0.00135

Unilateral (alfa=5%)

vc=+1.645 P-valor(+3)=0.00135

Bilateral (alfa=5%) vc=-1.96; +1.96

P-valor(|3|)=0.0027

F. Nota histrica: Los primeros usos de la probabilidad para valorar si unos datos observados apoyan o contradicen una hiptesis aparecen ya en el siglo XVIII9. La introduccin formal del concepto de P-valor ocurre a principios del siglo XX. Se debe a K. Pearson quien lo aplic en sus trabajos para desarrollar la prueba ji-cuadrado. Despus fue R. Fisher quien populariz su uso a todas las pruebas de significacin. A esto contribuy que lo incluyera en su libro Statistical Methods for Research Workers (1925) que es una obra clsica de la estadstica. Tambin se debe a R. Fisher la convencin de comparar el P-valor con un riesgo alfa del 5%, lo que significa asumir una decisin errnea de tipo I de cada 20 intentos.

G. El uso de ordenadores para realizar los clculos estadsticos ha facilitado que todos los anlisis vayan acompaados de los P-valores correspondientes. Por otro lado, las revistas cientficas han promovido durante muchos aos que los

9 Stigler SM. The History of Statistics: The Measurement of Uncertainty before 1900. The Belknap Press of Harvard University Press. 1986

Medicina BEIR 2018/19 13 B. Campos - UB

resultados se valoraran en funcin del grado de significacin. En consecuencia se ha producido una focalizacin en el uso del P-valor que ha tenido efectos contraproducentes. Son muchos los estudios que sealan el mal uso y la mala interpretacin de este concepto. En 1999 S. Goodman10 acu el trmino p-value fallacy para denunciar esta influencia en la interpretacin de los datos de investigacin mdica, y en 200811 public una lista de doce interpretaciones incorrectas. La primera de ellas, por ser la ms ubicua y perniciosa, es: Misconception #1: If P.05, the null hypothesis has only a 5% chance of being true. Entrado ya el siglo XXI, la Asociacin Americana de Estadstica (ASA en ingls) acogi un debate sobre esta cuestin que acab en una declaracin que se public bajo el nombre The ASAs Statement on p-Values: context, process and purpose12. La conclusin se reproduce completa a continuacin: Good statistical practice, as an essential component of good scientific practice, emphasizes principles of good study design and conduct, a variety of numerical and graphical summaries of data, understanding of the phenomenon under study, interpretation of results in context, complete reporting and proper logical and quantitative understanding of what data summaries mean. No single index should substitute for scientific reasoning.

BIBLIOGRAFA RECOMENDADA

- Daniel WW, Cross, CL. Biostatistics: Basic Concepts and Methodology for the Health Sciences.10th ed. Hoboken, NJ: John Wiley & Sons; 2014.

- Forthofer RN, Lee ES, Hernandez M. Biostatistics : a guide to design, analysis, and discovery. Elsevier Academic Press, 2007, 2nd ed (en linea en CRAI-UB)

- Rosner BA. Fundamentals of biostatistics. 7th ed. Pacific Grove, Calif: Brooks/Cole, Cengage Learning; 2011.

- Wassertheil-Smoller S. Biostatistics and Epidemiology: a primer for health professionals. 2rd ed. New York. Springer-Verlag, 1990.

10 Goodman S. Toward evidence-based medical statistics. 1. The P value fallacy. Annals of Internal Medicine. 1999 Jun; 130(12): 995-1004. 11 Goodman S. A Dirty Dozen: Twelve P-Value Misconceptions. Seminars in hematology. 2008 Jul; 45(3): 135-40. 12 Wasserstein RL, Lazar NA. The ASAs Statement on p-Values: Context, Process, and Purpose. The American Statistician, 70:2, 129-133.

Medicina BEIR 2018/19 14 B. Campos - UB

GLOSARIO Conclusin clnica o prctica Conclusin estadstica Confianza Distribucin del estadstico de la prueba Distribucin muestral: exacta vs asinttica Error de tipo I Error de tipo II Estadstico de la prueba Falsos resultados de la prueba de hiptesis Grado de significacin = P-valor Hiptesis alternativa (Ha) Hiptesis nula (Ho) Hiptesis simple vs h. compuesta Incertidumbre Magnitud del efecto (delta) Nivel de significacin = riesgo alfa P-valor = grado de significacin Potencia Prueba o contraste de hiptesis Prueba bilateral vs unilateral Regin crtica (o rechazo) vs r. de aceptacin Resultado de la prueba: rechazo vs no-rechazo Riesgo alfa = nivel de significacin Riesgo beta Significacin estadstica Valor crtico (de tablas) = lmite r. rechazo