Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para...

8
ARTÍCULO DE REVISIÓN . Rev. CoL Anets. 26: 225, 1998 Algunas estadísticas de uso frecuente en investigación en salud (1 a. parte) 4/.. Aura Nidia Berrera Rojas*, Constanza Quintero**, Ricardo Sánchez*** RESUMEN El propósito de este artículo es revÚar algunos conceptos y procedimientos cuantitativos usadosfrecuentemente en investigación en salud. Se presentan conceptos tales comoproporción, razón y tasa. Se revisan las principales diferencias entre estadísticas descrzptivas e in.ferencias, lo mismo que las nociones sobre valor p., intervalos de confianza y procedimientos para estimar algunos parámetros. También sepresentan procedimientos usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test t, el de Wil/coxon, y el de Mann- W hitnry, para medir asociación como el co~ficiente de correlación de Pearson y el Chi cuadrado y .finalmente algunas nociones básicas sobre regresión lineal y logística. Palabras clave: Estadística. Im'estigación en salud, análisis ClJantitativo. SUMMARY The purpose '!f thÚ work Ú to review some concepts and quantitatitle procedures common/y used into health research. Concepts such as proportion, ratio, and rate are bri~f/Ypresented. The main differencesbetweendescrzptiveand i'!ferential statistics, principIes of in.ferential statistic, notions about "p value': confidential intemaLr and procedures to estímate some parameter are revielved. Then, some procedures frequent/y used to te.rtIypothesis about differencesbetIJ)eenmeans orproportions, like t-test, Ma1J1l-U7hitnry test and Wil/coxon test,. for association measurement such as, shi squared and Pearson corre/aliolI,are alsopresented. Fillal/y basic lIotions abottt linear and logistic regressionare short/y shOJved. Key words: statistics, health research,quantitative ana/ysis. INTRODUCCIÓN La operación básica en investigación empírica es, sin duda, la observación. En investigación en salud se observan los síntomas de una persona o los cambios después de la administración de una Profesora del Departamento de Psicología y miembro del Centro de Epidemiología Clínica de la Universidad Na- cional de Colombia. E-maíl: anherrpoblacíón bacata.usc.unal.edu.co Profesora del Departamento de Matemáticas y Estadísti- ca y miembro del Centro de Epidemiología Clínica de la Universidad Nacional de Colombia. Email: coquin tepo blacióncincias. ciencias. unal. edu. co. *** Profesor Asociado. Depto de Psiquiatría y miembro del Centro de Epídemiologí.a Clínica de la Universidad Na- cional de Colombia. Bogotá D.C. droga, entre muchos otros eventos de interés. Cuando se trata de investigación cuantitativa, otra operación básica es el conteo. Se cuenta el núme- ro de sujetos diagnosticados como hipertensos, el número de nuevos hipertensos en un período de tiempo, el número de personas cuya patología me- jora o desaparece después de un tratamiento, el número de recaídas en un período de tiempo. Los resultados directos de la operación de conteo son las frecuencias: 13 hipertensos en el instituto, 6 nuevos hipertensos en este año, 8 remisiones des- pués de administrar una droga. 3 recaídas en un año; son ejemplos de frecuencias. Sin embargo, éstas por sí solas reportan infor- mación limitada. No significa 10 mismo 13 hipertensos en un grupo de 80 pacientes que 13 en un grupo de 15. Así, esas frecuencias se expre- san en términos relativos para que resulten com- 225

Transcript of Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para...

Page 1: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

ARTÍCULO DE REVISIÓN. Rev. CoL Anets. 26: 225, 1998

Algunas estadísticas de uso frecuenteen investigación en salud

(1a. parte)

4/..

Aura Nidia Berrera Rojas*, Constanza Quintero**, Ricardo Sánchez***

RESUMEN

El propósito de este artículo es revÚar algunos conceptos y procedimientos cuantitativos usadosfrecuentemente en investigación en salud. Se

presentan conceptos tales comoproporción, razón y tasa. Se revisan lasprincipales diferencias entre estadísticas descrzptivas e in.ferencias, lo mismo

que las nociones sobre valorp., intervalos de confianza y procedimientos para estimar algunos parámetros. También sepresentan procedimientos

usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test t, el de Wil/coxon, y el de Mann-

W hitnry, para medir asociación como el co~ficiente de correlación de Pearson y el Chi cuadrado y .finalmente algunas nociones básicas sobre

regresión lineal y logística.

Palabras clave: Estadística. Im'estigación en salud, análisis ClJantitativo.

SUMMARY

The purpose '!f thÚ work Ú to review some concepts and quantitatitleprocedures common/y used into health research. Concepts such as

proportion, ratio, and rate are bri~f/Ypresented. The main differencesbetween descrzptiveand i'!ferential statistics, principIes of in.ferential

statistic, notions about "p value': confidential intemaLr and procedures to estímate some parameter are revielved. Then, some procedures

frequent/y used to te.rt Iypothesis about differences betIJ)eenmeans orproportions, like t-test, Ma1J1l-U7hitnry test and Wil/coxon test,.for

association measurement such as, shi squared and Pearson corre/aliolI,are alsopresented. Fillal/y basic lIotions abottt linear and logisticregressionare short/y shOJved.

Key words: statistics, health research,quantitative ana/ysis.

INTRODUCCIÓN

La operación básica en investigación empíricaes, sin duda, la observación. En investigación ensalud se observan los síntomas de una persona olos cambios después de la administración de una

Profesora del Departamento de Psicología y miembro delCentro de Epidemiología Clínica de la Universidad Na-cional de Colombia. E-maíl: anherrpoblacíónbacata.usc.unal.edu.co

Profesora del Departamento de Matemáticas y Estadísti-ca y miembro del Centro de Epidemiología Clínica de laUniversidad Nacional de Colombia.Email: coquin tepo blacióncincias. ciencias. unal. edu. co.

*** Profesor Asociado. Depto de Psiquiatría y miembro delCentro de Epídemiologí.a Clínica de la Universidad Na-cional de Colombia. Bogotá D.C.

droga, entre muchos otros eventos de interés.Cuando se trata de investigación cuantitativa, otraoperación básica es el conteo. Se cuenta el núme-ro de sujetos diagnosticados como hipertensos, elnúmero de nuevos hipertensos en un período detiempo, el número de personas cuya patología me-jora o desaparece después de un tratamiento, elnúmero de recaídas en un período de tiempo. Losresultados directos de la operación de conteo sonlas frecuencias: 13 hipertensos en el instituto, 6nuevos hipertensos en este año, 8 remisiones des-pués de administrar una droga. 3 recaídas en unaño; son ejemplos de frecuencias.

Sin embargo, éstas por sí solas reportan infor-mación limitada. No significa 10 mismo 13hipertensos en un grupo de 80 pacientes que 13en un grupo de 15. Así, esas frecuencias se expre-san en términos relativos para que resulten com-

225

Page 2: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

HerreroA, Quintero C, SánchezR

parables y fácilmente interpretables. Algunas deesas expresiones son: proporción, razón y tasa; tér-minos que con alguna frecuencia se usan de ma-new indiscriminada o sin hacer suficiente clari-dadsobre la información que ellas contienen. Estopuede resultar especialmente crítico si se tiene encuenta que dentro de este contexto los números noresultan interesantes como constructos matemá-ticos abstractos, sino en la medida en que conten-ga información que oriente la toma de decisiones yayude a incremementar el conocimiento sobre al-gún fenómeno de interés.

FRECUENCIA, PROPORCIÓN,RAZÓN Y TASA

Los tres términos hacen referencia a cocientesde la forma A/B. «La diferencia entre los tres con-ceptos resulta en el significado del numerador ydel denoninador y de las unidades de medida enrelación con los eventos que representan A y B,según las variables de persona, lugar y tiempo»(Colimon, K., 1990). Una proporción es una frecuen-cia dividida por el número de elementos que com-ponen el universo al cual pertenece; en consecuen-cia, el numerador está incluido en el denomina-dor, siempre toma valores entre O y 1, Y puede ex-presarse en términos de porcentaje. Si, por ejem-plo se observa que dentro de un grupo de 60 pacien-tes recibiendo tetracic1ina, 9 presentan gastritis,la proporción de gastritis en ese grupo sería 9/60 =0.15. Si ese resultado se multiplica por 100, se ob-tiene el porcentaje de pacientes que presentangastritis, es decir la frecuencia que se expresaríasi el número total de pacientes hubiera sido 100;puede afirmarse entonces que el 15% de los pa-cientes de ese grupo presentan gastritis.

Las proporciones y porcentajes son muy útilespuesto que permiten la comparación de resultadoshallados en grupos de tamaño diferente. Si por ejem-plo, en un grupo de pacientes de otra institución seencuentra que 21 presentan gastritis cuando reci-ben tetraciclina pero el grupo total de observadosestaba conformado por 140, la proporción de pacien-tes con gastritis para este grupo sería 21/140 =0.15. Puede verse entonces, que la proporción depacientes con gastritis es igual en las dos institu-ciones, a pesar de que en una se encontraron 9casos y en la otra 21. De otra parte, en investiga-ción en salud las proporciones y porcentajes per-miten estimaciones de prevalencia, incidencia yriesgo. Se entiende por prevalencia o prevalencia depunto, la proporción de casos observados en un mo-mento determinado sin importar el momento en elque se hayan originado. Las proporciones de pacien-

226

.tes presentadas antes son ejemplo de prevalenciade un efecto secundario en dos instituciones desalud diferentes. Nótese que el dato del numeradores un conteo de casos en un momento dado, sinimportar cuándo se ínició la adicción.

La incidencia es la proporción de nuevos casosen un período de tiempo determinado. Es una pro-porción puesto que el numerador es un conteo decasos y el denominador es el número de personasen el universo al cual pertenece; sin embargo, lainformación que reporta es diferente a la anteriorpuesto que se están contando sólo los casos nue-vos dentro de un período de tiempo, en un grupo deinterés.

Supóngase que se observa durante un año a ungrupo de 42 empleados que trabajan en jornadanocturna y se encuentra que durante ese periodo 5desarrollaron trastornos de sueño. La incidenciade ese trastorno para ese grupo sería 5/42 = 0.119o en términos de porcentaje, el 11.9%. La inciden-cia de una enfermedad en un periodo de tiempo,estima el riesgo de enfermar (Londoño, J., 1995).Con base en los resultados anteriores puede afir-marse que el riesgo de presentar trastornos de sue-ño en un período de un año, para el grupo estudia-do, es de 0.119.

Por otra parte, una razón es un cociente que com-para dos cantidades de naturaleza diferente, con elfin de expresar una relación entre ellas, en conse-cuencia, el numerador y el denominador hacenreferencia a grupos diferentes y los resultados pue-den tomar valores mayores que 1. Supóngase quede los 21 pacientes que presentaron gastritis se-gún el ejemplo anterior, 14 son hombres y 7 sonmujeres. La razón por sexo hombre/mujer de pa-cientes con gastritis sería 14/7 = 2. Es decir, hay 2hombres con gastritis por cada mujer con este efec-to secundario. En investigación en salud, un usomuy frecuente de razones son las medidas de ries-go relativo, entendiendo éste como la comparacióndel riesgo para grupos de expuestos y no expuestosa cualquier factor. Supóngase que en la mismaempresa donde se encontró un riesgo de trastor-nos de sueño igual a 0.119 para empleados de jor-nada nocturna, se observó en el mismo período detiempo a un grupo de 65 empleados de jomada diur-na y se encontraron 6 casos del mismo trastorno.El riesgo para el grupo de empleados de jornada diur-na sería 6/65 = 0.092. Una medida de riesgo relati-vo de trastornos de sueño, para empleados de esta<7IDpresa sería la razón 0.119/0.092 = 1.29. Esto es,por cada caso de trastornos de sueño entre emplea-dos de jornada diurna, hay 1.29 casos del mismotrastorno en empleados de jornada nocturna.

Page 3: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

Aunque el riesgo relativo es una medida de aso-ciación entre la exposición a un factor de riesgo yla incidencia de una enfermedad, el resultado nopuede interpretarse en términos de causa-efecto.Ya qtie no se considera la frecuencia de exposi-ción de toda la población al factor; el resultado nopuede verse como una medida de impacto de di-cho factor sobre la morbimortalidad de la misma,sino sencillamente como asociación entre el fac-tor y la incidencia de la enfermedad (Walter, 1978).Si la incidencia de trastornos de sueño fuera igualen empleados de jornada diurna y en empleadosde jornada nocturna, el riesgo relativo sería iguala 1 y podría afirmarse que no hay asociación en-tre jornada de trabajo y trastorno de sueño. Sinembargo, el hecho de que haya 1.29 casos de tras-torno de sueño en jornada nocturna por cada casoen jornada diurna, aunque ,indica una asociaciónpositiva entre los dos eventos, no constituye evi-dencia suficiente para afirmar que el trabajo noc-turno produce trastornos de sueño. Más adelantese retomará el tema de medidas de asociación.

Finalmente, una tasa es un cociente que ex-presa la frecuencia de ocurrencia de un eventoen el tiempo. Así, el numerador es el número decasos de interés y el denominador es el tiempohábil durante el cual han ocurrido (Londoño, J.1995); en consecuencia, las razones pueden to-mar valores muy pequeños o mayores que 1, de-pendiendo de las unidades de tiempo que se utili-cen en el denominador. Las tasas resultan demucha utilidad para estimar incidencia de unaenfermedad en grupos móviles, es decir grupos quepueden cambiar en un período de tiempo por lasalida o entrada de algunos sujetos. En estos ca-sos se habla de tasa de incidencia (K1einbaum ycols, 1982) y el denominador considera la perma-nencia de cada individuo en el grupo ya que nocontribuye lo mismo quien ha permanecido ex-puesto por un año y no ha presentado la enferme-dad que quien permaneció dos meses y no la pre-sentó. Supóngase que en el ejemplo de los 42 em-pleados de jornada nocturna, 3 se retiraron a los 4meses, 4 renunciaron a los 6 meses y los restan-tes 36 se observaron durante el año completo. Laincidencia de trastorno de sueño debería estimarsemediante una tasa cuyo denominador seria lasuma de los 3 que contribuyeron completo, esto es(3 * 1/3 año) + (4 * 1/2 año) + (35 * 1 año) = 38personas - año. En consecuencia, si en estas con-diciones se observaron los mismos 5 casos que sehabían supuesto en el ejemplo anterior, la tasa deincidencia de trastornos de sueño para este gruposería 5/38 = 0.132.

. Estadísticas en salud

INTERVALOS DE CONFIANZA YPRUEBA DE HIPÓTESIS

Siempre que dentro de una investigación se ten-ga un grupo de datos que deban ser objeto de algúnanálisis cuantitativo, se persigue uno de dos obje-tivos. Describir algunas características generalesdel grupo de datos como por ejemplo, la frecuenciade sujetos con una enfermedad dentro de un grupode individuos examinados o el promedio de edad deun grupo de mujeres que asisten a consultaoftalmo1ógica; o bien, estimar algunos valores parala población a la cual pertenece ese grupo, porejemplo, estimar la prevalencia de falla renal parauna determinada población, a partir del conteo decasos de una muestra. En el primer caso se estaráhaciendo uso de la estadística descriptiva y en elsegundo se estará haciendo inferencia estadística.Todos los ejemplos presentados hasta el momentocorresponden al primer caso puesto que las con-clusiones se han limitado al grupo estudiado. Auncuando algunas operaciones o cálculos no son dife-rentes en los dos casos, es importante tener encuenta que los alcances en cuanto a posibilidadesde generalización de los resultados sí lo son, y demanera importante.

Se denominará población al universo total deinterés dentro de una investigación, definido cla-ramente en el espacio y en el tiempo, dependiendode los objetivos de estudio. La definición en el es-pacio y en el tiempo son muy importantes puestoque permite identificar los límites dentro de loscuales las conclusiones del estudio son válidas. Porejemplo, si se pretende estimar la prevalencia dedesnutrición en niños escolarizados de Bogotá, ladefinición de la población implicará decidir sobrealgunas características como rangos de edad o tipode esco1arización. Pero además, las conclusionesdel estudio no serán generalizables a niños escola-res de los mismos rangos de edad y el mismo tipode esco1arización, en Barranquilla. Ahora, si el es-tudio se realizó en 1992, las conclusiones tampocoserán generalizables a la población de niños quecompartan las mismas características en la actua-lidad. Por otra parte, se llama muestra a unsubconjunto que pertenece a la población de inte-rés y que proporciona los datos para el análisis. Sien el ejemplo anterior se ha decidido que los casosde desnutrición se identifican con medicionesantropométricas y análisis bioquímicos, resultaríamuy costoso y probablemente poco útil, efectuarestos procedimientos a todos y cada uno de los ni-ños de la población; en consecuencia, se puede ele-gir un grupo mucho más pequeño de niños que se-rán sometidos al procedimiento diagnóstico. Este

227

Page 4: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

HerreraA, Quintero C, SánchezR

último grupo constituye la muestra para la inves-tigación. No es necesario tragarse toda la sopera parasaber si la sopa está demasiado salada; si se movióbastante, basta con probar una cucharada (Droesbeke& Ffue, 1997).

Sin embargo, si la sopa no se ha revuelto sufi-cientemente, el resultado de probar una cuchara-da no será aplicable a la sopera completa. Asi, lamuestra no puede ser cualquier grupo de la pobla-ción, los procedimientos para hacer una correctaelección de la misma, constituyen un capítulo bienextenso conocido como «técnicas de muestreo», cuyotratamiento trasciende los objetivos del presenteescrito. Ahora, la inferencia estadística está cons-truida sobre el supuesto de que la muestra exami-nada es representativa de la población a la cual per-tenece. La noción de representatividad como con-dición para que la inferencia sea válida, implicapor lo menos dos cosas: que las variables relacio-nadas con el fenómeno de interés estén igualmen-te distribuidas en la muestra y en la población, yque el número de casos en la muestra sea sufi-ciente para observar dicho fenómeno y para con-cluir sobre él. Si la muestra elegida para el estudiosobre desnutrición queda conformada mayori-tariamente por niños de estrato socioeconómicobajo, es posible que se encuentren más casos dedesnutrición que los que se observarían en unamuestra cuya composición por estrato socioeco-nómico fuera similar a la de la población; en con-secuencia, los resultados del análisis estaránsobreestimando la prevalencia de desnutrición enniños escolarizados. Por otra parte, si la proporciónde niños desnutridos en la población es muy pe-queña, en un número reducido de sujetos no seobservarán casos de desnutrición y por consiguien-te, el estudio no permitirá sacar conclusiones.

Una vez resueltos los aspectos relacionados conla selección de la muestra, los procedimientos es-tadísticos permiten hacer inferencia sobre algunosparámetros poblacionales de interés. Un parámetroes un valor que se supone existe para determinadapoblación pero que en la mayoría de situacioneses desconocido; generalmente se realiza unainvestigación con el objeto de buscar evidenciaempírica que permita acercarse al conocimientode dicho valor. El resultado que se encuentra a par-tir de la muestra se conoce como estimador y cons-tituye una aproximación al valodel parámetro o valorverdadero. Ahora, dado que este valor se encontróa partir de una única muestra, de muchas posiblesde la misma población, no se puede asumir que elvalor observado es exactamente igual al parámetro,sólo constituye una estimación. En el ejemplo an-terior se parte del supuesto de que existe determi-

228

.nada proporción (parámetro) de niños desnutridosdentro de todos los escolarizados de Bogotá que seencuentran dentro de determinado rango de edad;sin embargo la proporción es desconocida. La in-vestigación busca recoger información que permi-ta identificar algún valor o conjunto de valores quese aproximen al parámetro, con alguna confianza.Supóngase que una vez realizados los procedimien-tos diagnósticos a los sujetos de la muestra se esti-ma que el11 % (proporción = 0.11) son desnutridos,éste resultado es una primera estimación de la pro-porción poblacional desconocida. Sin embargo, elhecho de que el 11% de niños de la muestra seandesnutridos, no conlleva a concluir que exactamen-te el mismo porcentaje de los niños de la población10 son, sino que probablemente la proporciónpoblacional de menores desnutridos es cercana a0.11.

Surge aquí una pregunta: ¿qué tan cerca se en-cuentran el estimador y el parámetro? Que equi-vale a preguntar ¿cuál es el nivel de precisión delas conclusiones del estudio? Para responderla esnecesario hacer dos consideraciones. Por una par-te, dada determinada población es posible obtenermuchas muestras del mismo tamaño y caracterís-ticas de las que se utilizó para hacer la estima-ción, y resulta razonable suponer que el valor delestimador en todas ellas no sea exactamente igual.Si se acepta este último supuesto, debe aceptarsetambién que el estimador es una variable que pue-de tomar distintos valores según el número demuestras posibles a partir de la misma población.En el ejemplo anterior, si se tomaran otras mues-tras del mismo número de niños de la población deinterés, podria ocurrir que para algunas de ellas laproporción de desnutridos fuera 0.10 o 0.08 o 0.12 o0.15, etc., de manera que la proporción observadade niños desnutridos es una variable que puedetomar diferentes valores. Una segunda considera-ción hace referencia a la variabilidad natural delfenómeno que se está estudiando; si se concibe quela naturaleza es cambiante, no es fija ni estática,se tendrá que aceptar que cualquier resultado ob-tenido en una investigación está afectado por talesvariaciones. Nótese que no se está hablando aquíde los cambios producidos por algunas variablesasociadas, o aquellos que se pueden esperar demanera sistemática con el transcurso del tiempo ocomo efecto de una intervención, sino a variacio-nes caprichosas o aleatorias del fenómeno. La va-riación en los estimadores, ya sea por efecto delmuestreo o debidas a las fluctuaciones del objetode estudio, afectan la precisión de los resultadosde la investigación y se conocen como fuentes deerror aleatorio. Asi, el nivel de precisión a que se

Page 5: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

refería la pregunta inicial, está en relación inver-sa con la magnitud de error aleatorio (Bunge, M.,1983).

COI).el único propósito de facilitar la exposición,supoffgase que en el estudio sobre desnutrición seha estimado que un tamaño de muestra adecuadoes 240, que se extraen todas las muestras posiblescompuestas por 240 niños de la población de inte-rés y que se halla la proporción de desnutridos paracada muestra. Se tabulan todos los resultados deinterés y se obtiene una distribución como la queaparece identificada con la letra B, en la figura 1. Apartir de esta información se podría afirmar quelas proporciones observadas tienen distribuciónsimétrica muy similar a la conocida como distri-bución normal, que la proporción más frecuente entodas las muestras es 0.11 y que éstas varían en-tre 0.07 y 10.15. Sin embargo, a partir de la mismainformación cabe esperar que si se toma una úni-ca muestra, el valor más probable será 0.11 mien-tras que valores como 0.07 o. 0.15 se observaránen muy pocas muestras. Además, sería posible cal-cular la media y la desviación típica de todas lasproporciones observadas y la probabilidad de obte-ner cada uno de los valores. En pocas palabras, seconocería la distribución de probabilidad de la pro-porción de menores desnutridos en muestras de240 niños, para esa población y los parámetros dedicha distribución. Pero es evidente que llevar a lapráctica el ejemplo planteado aquí resultaría muycostos y dispendioso, que podría resultar más ade-cuado entrevistar a la población completa y obte-ner el valor de la proporción; se ha planteado úni-camente para ilustrar los razonamientos quesubyacen a algunos modelos teóricos que permi-ten hacer inferencia a partir de una sola muestra.

FIGURA No. 1

Representación de dos distribucionesmuestrales del mismo estimador con

magnitudes de error aleatorio diferentes.

DistribuDistribu

0.0 0.0 0.10.1

Estadísticas en salud

.Gracias a la teoría de la probabilidad, se cuenta

con modelos de distríbuciones de estimadores obte-nidos a partir de muestras de una población específi-ca. El ejemplo típico de tales modelos es la distribu-ción normal, muy utilizada en investigaciónepidemiológica, pero existen muchos otros como lachi cuadrado o la F. Pues bien, la distribución asocia-da a un estimador se conoce como distribuciónmuestralGuenther, W., 1985)yladesviaciónestándarde tal distribución es el error estándar o estimaciónde la magnitud de error aleatorío antes defmido. Así,el error estándar no es otra cosa que el grado de va-riabilidad del estimador y resulta evidente que entremás pequeño sea éste, la precisión de los resultadosde la investigación es mayor. Si se comparan las dosdistribuciones representadas en la figura 1, puedeobservarse que en la distribución A los valores sonmás variables que en la B; por consiguiente, la des-viación estándar de la primera será mayor que la dela segunda. Si en el ejemplo anterior se desconocie-ra el valor del parámetro y se aceptara que la distri-bución de la proporción de niños desnutridos es laidentificada con la letra A, cabría esperar que el re-sultado obtenido a partir de una sola muestra estu-viera entre 0.5 y 0.17, Y que la proporción verdaderade niños desnutridos se encontrara en el mismo in-tervalo, 10cual constituye un resultado menos preci-so que el obtenido si la distribución muestral es la B.

Ahora, si el ejemplo anterior se llevara a la prácti-ca, se conocería el valor del parámetro y no tendríasentido alguno hacer inferencia sobre el mismo. Loque ocurre en la realidad es que se parte de una dis-tribución teórica asociada al estimador de interés,siguiendo las técnicas de muestreo se elige unamuestra apropiada según los objetivos del estudio yse obtiene un único resultado a partir del cual, seestima el valor del parámetro. Una forma de estima-ción es sencillamente el cálculo del estimador parala muestra, la que se conoce como estimación pun-tual. Sin embargo, teniendo en cuenta que el valorobservado es sólo uno de los muchos posibles, resultamás informativo construir un intervalo o rango devalores dentro de los cuales, con alguna probabilidad,se encuentra el parámetro. Esta segunda forma deestimación se conoce como intervalos de confianza.

En el ejemplo, resulta evidente que el parámetrode interés es una proporción (número de niños des-nutridos sobre el total) y gracias a ila teoría estadísti-ca se sabe que las proporciones obtenidas a partirde muestras grandes tienen distribución normal

con desviación estándar igual a ~p (1 ~P1 , donde p'es la proporción observada a partir de la muestra, yn es el tamaño de la muestra o número de sujetosde la muestra. Si a partir de la entrevista realizada

229

Page 6: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

Herrero A, Quilltero C, S állchez R

a 240 niños se estima que el 11% son desnutridos(p' = 0.11), se tendría una estimación puntual del

..parámetro (0.11) y la desviación estándar de la dis-tribución de proporciones muestrales o errorestándar, sería:

~0.11(1-0.11) =~ 0.11 * 0.89 = 0.02.240 240

Pero además, la teoría estadística muestra quecuando una variable tiene distribución normal, el95% de los valores de la misma se encuentran enel intervalo comprendido entre la media y 1.96 des-viaciones estándar hacia arriba o hacia abajo. Así,en el ejemplo, el 95% de las proporciones observa-das a partir de muestras de 240 sujetos estaríanentre 0.11 - (1.96 * 0.02) = 0.071 Y 0.11 + (1.96 *0.02) = 1.49. En otras palabras, en 95 de cada 100muestras posibles de tamaño 240, la proporción de

destmtrídos estará entre 0.071 y 0.149. Finalmen-te, supóngase que el estudio se repite varias vecesy se encuentran resultados próximos pero diferen-tes entre sí; en consecuencia, de cada estudio re-sultaría un intervalo diferente. El 95% de las vecesque se repita el estudio, el intervalo resultante in-cluirá el valor verdadero del parámetro; es decir,en cada estudio se tiene un 95% de confianza de

que el valor del parámetro se encuentra dentro delrango resultante y un 5% de probabilidad de que no10 incluya. En el ejemplo, el rango de valores resul-tante a partir de un solo estudio, constituye un in-tervalo del 95% de confianza para la proporción deniños desnutridos en la población de interés. Lafigura dos ilustra los intervalos de confianza resul-tantes a partir de tres muestras diferentes para lamisma investigación l.

FIGURA No. 2

Tres intervalos de confianza diferentes para el ejemplo de investigaciónsobre prevalencia de desnutrición.

p' = 0.10

Error estándar: . [0.10 (1 - 0.10) = 0.019~ 240

Intervalo de confianza: 0.10 I (1.96 * 0.019)=0.063,0.137

p' = 0.11

Error estándar: . [0.11 (1 - 0.11) = 0.02~ 240

Intervalo de confianza: 0.11 I (1.96 * 0.02)= 0.071, 0.149

p'= 0.12

Errorestándar:J

O.12 (1-0.12) =0.021240

Intervalo de confianza: 0.12 I (1.96 * 0.021)= 0.079, 0.161

1. Debe aclararse que. en todos los ejemplos sepresentan datos hipotéticos

230

0.06

0.17

0.137

0.05 0.09 0.11 0.15

0.0711

\ 0.149V0.05 0.07 0.170.09 0.11 0.13 0.15

0.0791 ;

0.11 0.13

0.161

0.05 0.07 0.09 0.17

Page 7: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

Puedeobservarse en la figura 2 que la longituddel intervalo disminuye, s decir, los resultados sonmás precisos, a medida que el error estándar esmenor. Una forma de disminuir el error es aumen-t~l tamaño de muestra. Si por ejemplo se hubierarealizado el estudio con 300 niños, el error estándar

cuando p' = 0.11, sería ~0.11 (1-0.11) = 0.018300

Sin embargo, no puede esperarse que el aumentoindefinido del tamaño de la muestra conlleve a anu-lar el error. Siempre llegará un momento en quese debe aumentar de manera importante el tama-ño de muestra para obtener una disminución muypequeña del error; y si se tiene en cuenta que elaumento de la muestra implica mayores costos,puede resultar que se planee una investigación noviable desde el punto de vista práctico, por ganarunos muy pocos puntos de precisión en los resulta-dos. Las técnicas de muestreo permiten calcularel tamaño de muestra necesario para obtener dife-rentes niveles de confianza, los más utilizados son90%, 95% Y 99%; sin embargo, en la decisión finalse debe considerar tanto la viabilidad económicadel estudio, dado el tamaño de muestra, como lautilidad práctica de los resultados, dado el grado deconfianza.

Antes de continuar con otra forma de inferenciaestadística es necesario hacer claridad sobre dosaspectos: el haber tomado como ejemplo ilustrativola estimación de una proporción y haber hecho gi-rar toda la exposición en torno a ella, no significaque sea el único parámetro para el cual el razona-miento expuesto sea válido, ni que el modelo nor-mal sea el adecuado en todos los casos. Si bien escierto que en gran cantidad de investigaciones ensalud éste es el parámetro de interés y que en con-secuencia, si se dispone de muestras grandes, seutiliza el modelo normal, los principios generalesexpuestos aquí son aplicables cuando se trata deestimar otros parámetros, por ejemplo unavarianza, y se utiliza otro modelo, por ejemplo ladistribución chi cuadrado. En todos los casos, laapasionante tarea de la verdad es un juego en elque se deben hacer algunas suposiciones, obede-cer algunas reglas de juego y al final se tienen unosresultados que permiten hacer algunas afirmacio-nes con confianza pero sin certeza absoluta. Si setuviera tal certeza, no sólo el juego dejaría de serapasionante sino que ya no tendría sentido algunoseguir jugando.

El otro aspecto sobre el que se debe hacer clari-dad, hace referencia a la noción de error. El hechode que no se tenga certeza absoluta sobre los re-

Estadísticas en salud.sultados obtenidos en una investigación, no estáasociado aquí fallas metodológicas o errores de in-vestigador en el sentido convencional de la pala-bra. Se trata solamente de la probabilidad de que laconclusión sea falsa, dadas las fluctuacionesaleatorias del valor del parámetro. Cuando el juezdebe decidir acerca de si el acusado es culpable ono, recoge toda la evidencia necesaria para res-paldar su decisión, obedece ciertas normas y al fi-nalllega a una conclusión con cierta confianza perotambién con cierta probabilidad de haberse equi-vocado. Sin embargo, puede equivocarse no preci-samente porque haya obrado de mala fe2 o hayaviolado las reglas de juego, sino sencillamente porque-la verdad» y la -evidencia empírica» se encuentranen dos dimensiones diferentes de la realidad, y la de-cisión se toma conociendo únicamente la segunda.

Ahora bien, cuando se inicia la investigaciónpara decidir si el acusado es o no culpable, se partede la idea de éste es inocente mientras no se demuestre

lo contrario. De manera que existe una afirmaciónde partida que se considera verdadera: «el acusadoes inocente»; los investigadores judiciales trataránde recoger las pruebas (evidencia empírica) quepermitan falsear esta afirmación, 10 que equivalea buscar evidencia empírica que respalde la res-pectiva negación: «el acusado no es inocente». Elconjunto conformado por la afirmación que se con-sidera verdadera y su negación, expresadas formal-mente en términos de los parámetros, constituyen10 que se conoce como juego de hipótesis. La pri-mera de ellas es la hipótesis nula (Ha) y la segun-da, la hipótesis alterna (HJ Supóngase que en elejemplo sobre maltrato infantil, antes de iniciar elestudio se acepta que la proporción de niños des-nutridos es de 0.07 y el objetivo de la investigaciónes someter a prueba esta afirmación. En estas con-diciones el juego de hipótesis sería:

Ha: p = 0.07

H¡: p'F 0.07

Después de entrevistados los 240 niños se en-cuentra que la proporción de desnutridos es de 0.11.La pregunta es entonces: ¿este resultado es evi-dencia suficiente para rechazar la afirmación departida? o por el contrario ¿la diferencia entre elresultado y la hipótesis se debe a variacionesaleatorias y se puede seguir pensando que tal afir-mación es verdadera? Para responder estosinterrogantes, habrá que resolver previamente otro:si es cierto que la hipótesis nula es verdadera, ¿cuál

2. Quienes asi obran, generalmente sí conocen laverdad y tienen certeza de lo que están haciendo.

231

Page 8: Algunas estadísticas de uso frecuente en investigación en salud (1 · usados frecuentemente para medir hipótesis sobre diferencias entre razones y proporciones tales como el test

HerreraA, Quintero C, Sánchez R

es la probabilidad de obtener este resultado o unomás extremo? Si la probabilidad de obtener esterésultado, dado que la hipótesis nula es verdadera,es demasiado baja, se podrá concluir que estos da-to~falsean la hipótesis. Nuevamente habrá querecurrir a los modelos teóricos que permitan cal-cular esta probabilidad y hallar la respuesta que sebusca.

Si es cierto que la hipótesis nula es verdadera,de acuerdo con la teoria de la probabilidad, la distri-bución muestral de las proporciones sería la queaparece en la figura 3. Es decir, se trataría de unadistribución muy similar a la normal con promedioigual a 0.07 y desviación estándar (error estándar)

igual a ~0.07(1 - 0.07) = 0.016. De manera que el240

95% de las proporciones obtenidas a partir de mues-tras de 240 niños estarían entre 0.07 :!: (1.96 *0.016), es decir, entre 0.04 y 0.10. Y la probabilidadde obtener una proporción muestral de 0.11 o ma-yor, es apenas la representada por el áreasombreada en la figura 3. Según 10 que se apreciaen dicha figura se puede afirmar que tal probabili-dad es menor de 0.025; sin embargo, gracias a lateoria de la probabilidad, es posible calcularla demanera precisa y corresponde al valor p (p value) quereportan los paquetes estadísticos cuando se correun procedimiento de prueba de hipótesis. En pocaspalabras, el valor p es la probabilidad de obtener unaevidencia empírica como la que efectivamente seobtuvo en el estudio, si la hipótesis nula es verdadera.

FIGURA No. 3

Representación de la distribuciónmuestral de la proporción de niños desnu-

tridos si se asume que tal proporción

0.04

0.07 0.13

\~--I~ 0.1C

j0.110.01 0.03 0.090.05

"---Porcentajes 2.5%

---"2.5%95%

<ó----Probabilidades 0.025%

---"0.025%

232

.poblacional es igual a 0.07

Pero queda aún sin resolver la pregunta plan-teada antes: ¿son estos datos evidencia suficien-te para rechazar la hipótesis nula? La respuestadepende de la probabilidad de error que se esté dis-puesto a aceptar dentro de la investigación. Hastaahora se ha encontrado la probabilidad de obser-var un resultado como el que se obtuvo, si la hipó-tesis nula es verdadera; 10 que equivale a la pro-babilidad de llegar a una conclusión falsa si serechaza la hipótesis nula con esa evidencia. Sidentro de la investigación se admite una probabi-lidad de error mayor al "p value», los datos se con-siderarán evidencia suficiente para rechazar lahipótesis nula; es decir, se concluirá que a partirde esos datos la hipótesis probablemente no esverdadera. En el ejemplo se ha encontrado que laprobabilidad de observar un 11% de niños desnu-tridos en una muestra de 240, si es cierto que laproporción poblacional de niños desnutridos es de7%, es menor de 0.025 (p ualue < 0.025). Es decir,si se rechaza la hipótesis nula, existe una proba-bilidad menor de 0.025 de que la conclusión nosea correcta. Pero la investigación admite una pro-babilidad de error de 0.05, es decir un 95% de con-fianza, así que el investigador puede concluir tran-quilamente que con una probabilidad de error in-ferior a 0.025, los datos constituyen evidencia su-ficiente para rechazar la hipótesis nula y acep-tar que la proporción de niños desnutridos es dife-rente de 0.07.

Una vez recogidas las pruebas, eljuez puede pre-guntarse cuál es la probabilidad de que el acusadohaya sido visto en el momento del robo, con unamaleta a cuestas, saliendo muy apurado del sitioen donde desaparecieron las joyas (evidencia em-pírica), si es cierto que éste es inocente (hipótesisnula). Muy probablemente estime que efectivamen-te existe alguna probabilidad pero que ésta es defi-nitivamente muy baja. Si decide rechazar la ideade partida y culpar al acusado tiene esa probabili-dad de equivcarse pero considera que es tan pe-queña que bien puede concluir que el acusado noes inocente, más allá de una duda razonable. Aho-ra, si el acusado vive en el mismo edificio de lajoyería y tenía un vuelo urgente una hora despuésde la hora del robo, el juez puede considerar que laprobabilidad de que haya sido visto con una maletaa cuestas, saliendo muy apurado del edificio (evi-dencia empírica) siendo inocente (hipótesis nula),es alta; y que por 10 tanto, esa no es prueba sufi-ciente para rechazar la idea de que es inocente.

La 2a. parte de este articulo aparecerá en el No.4 - oc-tubre -diciembre 1998.