Bioestadistica Mir

20

Click here to load reader

Transcript of Bioestadistica Mir

Page 1: Bioestadistica Mir

BIOESTBIOESTADISTICAADISTICA

Sección 3

AUTORES

Dra. MAR GARCIA ARENILLAS

Dr. EMILIO VARGAS CASTRILLON*Facultativos Especialistas de AreaServicio de Farmacología Clínica

Hospital Clínico Universitario San CarlosMadrid

*Profesor asociado FarmacologíaEscuela Universitaria de Enfermería de la UCM

DC = Q3-Q1

2

Page 2: Bioestadistica Mir

Capítulo I. ESTADISTICA DESCRIPTIVA Y

ESTIMACION

Estadística y metodologíacientífica

Concepto y tipos de estadísticaConceptos estadísticos básicosEstadística descriptivaDistribuciones de frecuencia más utili-

zadas en medicinaEstimación de parámetros

Capítulo II. ESTADISTICA ANALITICA

Comprobación de hipótesisPruebas paramétricas y no paramétricasContrastes de hipótesis bivariantesContrastes variable categórica/ categó-

ricaContraste variable categórica/ cuantita-

tivaContraste variable cuantitativa/ cuanti-

tativaAnálisis de supervivencia

BIBLIOGRAFIA

INDICE DE MATERIAS

INDICE

BIOESTBIOESTADISTICAADISTICA

Page 3: Bioestadistica Mir

Estadística y metodología científicaConcepto y tipos de estadísticaConceptos estadísticos básicosEstadística descriptiva

Distribuciones de frecuencia más utilizadas en me-dicina

Estimación de parámetros

ESTESTADISTICA ADISTICA DESCRIPTIVDESCRIPTIVA Y A Y

ESTIMAESTIMACIONCION

Capítulo I

Indice

ESTADISTICA Y METODOLOGIA CIENTIFICA

El conocimiento biomédico, como otros conocimientos empí-ricos, se basa en la observación y en la experimentación. Laobservación permite elaborar modelos teóricos que intentanexplicar los distintos fenómenos biológicos, y la experimenta-ción pretende aceptar o rechazar el modelo propuesto. Aunquela ciencia médica ha realizado grandes avances sin herramien-tas estadísticas, el uso de estos métodos por investigadoresbiomédicos ha producido importantes resultados, y en la ac-tualidad prácticamente no es posible ningún estudio sin unacorrecta metodología estadística.

CONCEPTO Y TIPOS DE ESTADISTICA

La estadística es un sistema de razonamiento que proporcio-na un conjunto de herramientas matemáticas que permiten elmanejo e interpretación de datos. Los datos que utiliza tienen

como característica principal la variabilidad, es decir, puedentomar valores diferentes entre distintos individuos, o inclusodentro del mismo individuo si el dato se obtiene en momentosdiferentes. Dentro de la estadística podemos considerar dosgrandes apartados: Estadística descriptiva: pretende la organi-zación y presentación de los datos. Su papel principal se en-contraría en las fases observacionales del ciclo científico. Es-tadística analítica: intenta evaluar la probabilidad con que elazar es responsable de una determinada distribución de datos.Es también llamada estadística inferencial o deductiva.

CONCEPTOS ESTADISTICOS BASICOS

Población

Es el conjunto total de elementos sobre los que se quiereestudiar un determinado fenómeno. Cada uno de estos ele-mentos recibe el nombre de individuos. Las poblaciones pue-den ser finitas (conocemos el número de elementos que la for-

125

Page 4: Bioestadistica Mir

man) e infinitas (no podemos conocer cuántos elementos laforman).

Muestra

Es un subconjunto de elementos de la población que quere-mos estudiar. Se considera que una muestra es representativade una población cuando el método para elegir sus elementoses aleatorio (realizado al azar), es decir, cuando la probabilidadque tienen todos los elementos de la población de estar en lamuestra es la misma.

Los procedimientos para obtener una muestra representativade una población se denominan técnicas de muestreo. Cuandose estudian caracteres numéricos, se consideran muestrasgrandes aquellas que incluyen 30 o más individuos. Cuando seestudian caracteres cualitativos, se consideran grandes mues-tras aquellas en las que la proporción del carácter menos fre-cuente multiplicado por el número de individuos es ≥ 5.

Relación entre muestra y población

La población en la que se quiere estudiar el fenómeno reci-be el nombre de población diana (población objeto, poblaciónobjetivo, población de referencia, población blanco). Sin em-bargo, no todos los pacientes de la población diana son accesi-bles, ya que existen factores que limitan la posibilidad de quese incluyan en el estudio. El conjunto de elementos que real-mente puede ser incluido recibe el nombre de población infe-rencial (población marco, población de muestreo, población ac-cesible, población de estudio). Sobre esta población es sobrela que se realiza el muestreo, y lógicamente la muestra es re-presentativa de la población inferencial, no siéndolo siemprede la población diana. En otras palabras, la extrapolación deresultados a la población inferencial es directa, mientras quela extrapolación a la población diana no es directa y debe justi-ficarse que los factores limitantes para la inclusión no influyenen los resultados encontrados.

Variables

Una variable es cada uno de los caracteres o aspectos quese miden en los individuos. Según el tipo de escala de medidapodemos diferenciar:

Variables cualitativas (categóricas)

Sus valores son nominales (sexo, nacionalidad, medicamen-to utilizado, estado civil, etc.). La única operación que puederealizarse con ellas es la de igualdad/desigualdad. Aquellasvariables que pueden presentar únicamente dos valores se lla-man dicotómicas, las que pueden presentar varios valores sedenominan policotómicas.

Variables ordinales

Sus valores son también nominales, pero pueden ordenarse(gravedad: leve/moderado/severo; estadio de un tumor, etc.).Las operaciones que pueden realizarse con ellas son igual-

dad/desigualdad y menor/mayor. En muchas ocasiones las va-riables ordinales se representan con números, pero no por ellodeben considerarse variables cuantitativas.

Variables cuantitativas

Sus valores pueden medirse numéricamente y pueden cuan-tificarse. Con ellas pueden realizarse operaciones de igual-dad/desigualdad, cuantificando diferencias. Dentro de ellaspodemos diferenciar las continuas (tensión arterial, colestero-lemia), que pueden adoptar todos los valores del intervalo demedida (hasta la capacidad del instrumento de medición utili-zado), y las discretas que únicamente pueden adoptar algunosvalores (número de hijos, número de ingresos hospitalarios).

Existen otros términos que se utilizan con frecuencia al refe-rirse a las variables. Variable dependiente/independiente, ha-ce referencia principalmente a modelos en los que se valora lainfluencia de una o varias variables (independientes) sobreotra (dependiente), sugiriendo una relación causal. Tambiéncon mucha frecuencia, especialmente en diseños experimenta-les, se utiliza la terminología variable controlada/aleatoria, enreferencia a aquella variable cuyo valor depende del investiga-dor (controlada) y aquella que no (aleatoria).

Según el número de variables que se incluyan simultánea-mente en el análisis, podemos diferenciar técnicas univarian-tes, técnicas bivariantes y técnicas multivariantes.

Estadísticos y parámetros

Un parámetro es un valor que resume los valores de una de-terminada variable en una población. Un estadístico expresalos valores de una variable en una muestra. Los estadísticossuelen utilizarse como estimadores de los parámetros, pero ló-gicamente para que la estimación sea buena, las muestras uti-lizadas deben ser representativas.

ESTADISTICA DESCRIPTIVA

Tabulación y presentación gráfica de la información

La estadística descriptiva intenta condensar y sumarizar unconjunto de medidas realizadas en un gran número de indivi-duos. El primer paso de una descripción es la tabulación, ope-ración que permite realizar un resumen de los datos, indicandoel número de veces (frecuencia) con que se repite un determi-nado valor de una variable. El resumen de los datos se presen-ta como una tabla de frecuencias. Las tablas de frecuencias sepueden utilizar con cualquier tipo de variable, sin embargo enlas variables cuantitativas la información debe agruparse enintervalos (especialmente en las continuas), que tengan un lí-mite superior e inferior. Al tratarse de valores continuos la pro-babilidad o frecuencia en cada punto sería muy pequeña.

La frecuencia puede presentarse en forma absoluta (númerode veces que se repite un valor) o relativa (frecuencia absolu-ta/número de observaciones). Con variables cuantitativas y con

126

ESTADISTICA DESCRIPTIVA Y ESTIMACION

Page 5: Bioestadistica Mir

ordinales puede tener interés diferenciar la frecuencia simple(número de veces que se repite un valor) y la frecuencia acu-mulada (número de veces con que la variable puede tomar unvalor igual o inferior a uno determinado).

Las tablas de frecuencia pueden representarse gráficamentede diversas maneras (fig. 1). Las más frecuentemente utiliza-das son:

Diagrama de barras

Utiliza barras de la misma anchura para cada valor, que tie-nen una altura proporcional a la frecuencia. Se usa para varia-bles cualitativas y cuantitativas discretas. Su utilización en va-riables continuas no es razonable, ya que al estar las barrasseparadas unas de otras, sugieren una falta de continuidad.

Pictograma

Utiliza símbolos de distinto tamaño en función de la fre-cuencia. Se usa principalmente para variables cualitativas ycuantitativas discretas.

Diagrama de sección circular

Asigna sectores de un círculo de forma proporcional a la fre-cuencia (tarta, pastel). Se utiliza principalmente para variablescualitativas.

Cartograma

Utiliza mapas geográficos en los que se indica la frecuenciadel fenómeno en distintas localizaciones.

Histograma

Se utiliza para representar variables continuas. La frecuen-cia de cada intervalo es proporcional a su superficie (amplituddel intervalo por altura). Si la amplitud del intervalo es la mis-ma, sería similar a un diagrama de barras en el que las barrasestuvieran juntas. Cuando la amplitud del intervalo tiende a 0,el histograma representaría la función de probabilidad de lavariable.

Polígono de frecuencias

Consiste en unir con una línea los puntos medios de los in-tervalos de un histograma.

Los histogramas y polígonos de frecuencia pueden represen-tar la frecuencia simple o la acumulada.

Medidas de tendencia central

Las variables cualitativas quedan suficientemente descritascon las tablas de frecuencias, y sus correspondientes propor-ciones y porcentajes. No obstante, las variables cuantitativaspueden ser resumidas con algunos índices o medidas.

Las medidas de tendencia central intentan indicar el valor

127

3

BIOESTADISTICA

1

¿Cuál de las siguientes afirmaciones es falsa?:

1. El término población diana hace referencia al conjunto de indivi-duos accesibles para la realización del estudio.

2. Un estadístico resume los valores muestrales de una variable.3. Los estadísticos se utilizan como estimadores de los parámetros

poblacionales.4. Las muestras obtenidas de forma no aleatoria pueden producir es-

timadores sesgados.5. La moda es el valor de la variable que más veces se repite.

¿Cuál de las siguientes no es una medida de variabilidad?:

1. Desviación típica.2. Distancia entre percentil 25 y 75.3. Recorrido.4. Segundo decil.5. Varianza.

¿Qué medida de variabilidad no depende las unidades de medida?:

1. Amplitud.2. Recorrido intercuartílico.3. Coeficiente de variación.4. Desviación estándar.5. Desviación media.

¿Cuál de las siguientes no es una característica de la distribución normal ti-pificada?:

1. Es simétrica.2. Su media es 0.3. Su desviación típica es 0.4. Su varianza es 1.5. Su mediana es 0.

¿A qué denominamos intervalo de confianza al 95%?:

1. Una zona de la distribución donde con un 95% de posibilidades seencontrará el parámetro poblacional.

2. Una zona de la distribución donde con un 95% de posibilidades seencontraría el estimador muestral.

3. Una zona de la distribución donde sólo hay un 5% de posibilida-des de encontrar el estimador muestral.

4. Una zona de la distribución donde sólo hay un 5% de posibilida-des de encontrar al parámetro poblacional.

5. Ninguna de las anteriores es correcta.

2

3

4

5

RESPUESTAS:1: 1; 2:4; 3: 3; 4: 3; 5: 1.

Page 6: Bioestadistica Mir

de la variable sobre el que se agrupan las observaciones. Sonfundamentalmente tres:

Moda

Es el valor de la variable que más veces se repite. Una dis-tribución puede presentar una o varias modas (distribucionesunimodales, bimodales, trimodales....). La moda puede utilizar-se en variables cualitativas. En el caso de variables continuasdebe hablarse de intervalo modal.

Mediana

Es el valor que deja por debajo el 50% de los casos. Es puesel valor central del conjunto ordenado de las observaciones. En

series con un número par de casos, la mediana corresponde ala semisuma de los valores centrales. Si únicamente se dispo-ne de datos agrupados la mediana se calcula interpolando enel intervalo correspondiente.

Media aritmética

Representa el centro de gravedad de la distribución. La me-dia poblacional suele representarse por µ, y la muestral por x.Se calcula sumando todos los valores de la variable y dividien-do por el numero total de individuos.

∑ Xix = ———————-

n.° individuos

128

ESTADISTICA DESCRIPTIVA Y ESTIMACION

DIAGRAMA DE BARRAS

Consumo de fármacos al alta

0

N.° fármacos

450 400 350 300 250 200 150 100 50 0

Frec

uenc

ia

>81 2 3 4 5 6 7

103164

297

419

331

204

111

40 30

SECTOR CIRCULAR

Distribución de RAM por aparatos y sistemas.

Otros9,4%

Aparatocardiovascular

28,3%

Aparato digestivo62,3%

Mile

s de

def

unci

ones

/año

de

edad

POLIGONO FRECUENCIAS

Mile

s de

def

unci

ones

/año

de

edad

Edad en el momento de la defunción (años)

HISTOGRAMA

Edad en el momnento de la defunción (años)

80

70

60

50

40

30

20

10

0 0 10 20 30 40 50 60 70 80 90 100

80

70

60

50

40

30

20

10

010 20 30 40 50 60 70 80 90 100

Fig. 1. Tipos de gráficos.

Page 7: Bioestadistica Mir

Existen otras medias que se utilizan con poca frecuencia:media geométrica, media ponderada, media cuadrática, mediaarmónica.

Medidas de posición

Los percentiles dividen una distribución en 100 partes igua-les (el percentil 10 deja por debajo del valor al 10% de los ca-sos). Los deciles dividen la distribución en 10 partes (el decil 2deja al 20% de los casos por debajo de su valor) y los cuartilesla dividen en 4. El decil 5, el percentil 50 y el cuartil 2 coinci-den con la mediana.

Medidas de variabilidad

Evalúan la oscilación o dispersión de los valores de la varia-ble. Las más utilizadas son:

Amplitud

Es la diferencia entre el valor máximo y mínimo de la varia-ble. También se denomina rango (por traducción del inglés ran-ge), y recorrido.

Amplitud intercuartílica

Es la distancia entre el cuartil primero y tercero.

Desviación media

El promedio de los valores absolutos de las diferencias en-tre la media y los valores de la variable:

∑ Xi - x DM = ————————

n.° de individuos

Varianza (variancia)

Es el promedio de los cuadrados de las diferencias entre lamedia y los valores de la variable. La varianza muestral se re-presenta por S2, y la poblacional por σ2

∑ (Xi - x)2 ∑ (Xi - x)2

σ2 = —————— S2= ————————- n.° de individuos n.° individuos - 1

Desviación típica (desviación estándar)

Es la raíz cuadrada de la varianza.

Coeficiente de variación

Es la desviación típica dividida por la media aritmética.Frente a la desviación típica, tiene la ventaja de que no depen-de de las unidades de medida utilizadas, y permite comparar ladispersión de distribuciones distintas.

129

3

BIOESTADISTICA

6

¿Qué significa que un determinado valor (B) de una variable es el percentil20?:

1. El 20% de los valores de la variable son superiores a B.2. El 20% de los valores son inferiores o iguales a B.3. El 20% de los valores son iguales a B.4. El 80% de los valores son inferiores a B.5. 1 y 4 son verdaderas.

¿Cuál de las siguientes es una medida de apuntamiento?:

1. Amplitud intercuartílica.2. Coeficiente de variación.3. Kurtosis.4. Desviación media.5. Mediana.

Tiene usted una variable de distribución normal, que ha sido medida en100 pacientes. La media y mediana encontradas son de 6, y la varian-za es de 9. ¿Cuál sería aproximadamente el intervalo que contendríael 95% de los valores de esta distribución?:

1. 5.4 a 6.6.2. –3 a 15.3. 3 a 9.4. 0 a 12.5. No puede calcularse.

Tiene usted una variable de distribución normal, que ha sido medida en100 pacientes. La media y mediana encontradas son de 6, y la varian-za es de 9. ¿Cuál sería aproximadamente el intervalo que contendríael 68% de los valores de esta distribución?:

1. 5.4 a 6.6.2. –3 a 15.3. 3 a 9.4. 0 a 12.5. No puede calcularse.

Tiene usted una variable de distribución normal, que ha sido medida en100 pacientes. La media y la mediana encontradas son de 6 y la va-rianza es de 9. ¿Cuál sería aproximadamente el intervalo que conten-dría con un 95% de posibilidades la media poblacional?:

1. 5.4 a 6.6.2. –3 a 15.3. 3 a 9.4. 0 a 12.5. No puede calcularse.

7

8

9

10

RESPUESTAS: 6: 2; 7: 3; 8: 4; 9: 3; 10: 1.

Page 8: Bioestadistica Mir

130

ESTADISTICA DESCRIPTIVA Y ESTIMACION

DISTRIBUCION NORMAL

Media, mediana y moda

Punto de inflexión68,27%

95%

µ-2s

Representación de diferentes grados de apuntamiento.

PlaticúrticaK < 0

MesocúrticaK = 0

(normal)

LeptocúrticaK > 0

µ

Representación de los diferentes tipos de asimetría.

Asimetría negativaS < 0

SimetríaS = 0

Asimetría positivaS > 0

µ-s µ+sµ µ+2s

µ µ

µ µ µ

Fig. 2. Distribución normal y tipos de medidas de forma.

Page 9: Bioestadistica Mir

Medidas de forma

Las índices que se utilizan son los de asimetría (skewness) yde apuntamiento (kurtosis). La distribución normal tiene unosíndices de asimetría y apuntamiento de 0 (fig. 2).

Una distribución con un índice de asimetría de:

— 0: es simétrica.— < 0: es asimétrica a la izquierda.— > 0: es asimétrica a la derecha.

Una distribución con un índice de apuntamiento de:

— 0: es mesocúrtica (normal).— < 0: es platicúrtica (aplanada).— > 0: es leptocúrtica (puntiforme.)

DISTRIBUCIONES DE FRECUENCIA MASUTILIZADAS EN MEDICINA

Distribución normal

Es un tipo de función de distribución de variables continuasque se caracteriza porque (fig. 2):

— Es simétrica.— Media, mediana y moda coinciden, y constituyen su

eje de simetría.— Sus colas son asíntotas al eje horizontal.— La distancia entre el eje de simetría y el punto de in-

flexión de la curva es de 1 desviación típica. El inter-valo comprendido entre estos puntos contiene el 68%de los casos.

Como ocurre con las distribuciones continuas, el área bajola curva de la distribución representa una probabilidad. El áreatotal bajo la curva incluirá la totalidad de los casos (probabili-dad=1), y el área bajo la curva entre dos puntos representaríala probabilidad de que la variable presente valores comprendi-dos entre ellos. Por ello, la probabilidad de distintos intervalosde valores de las variables, que se ajusten a esta distribución,pueden calcularse fácilmente. Para ello se utilizan las tablasde la distribución normal reducida (tipificada), distribución quese representa por Z. La distribución normal reducida se carac-teriza porque: su media es 0 y su varianza y desviación típicaes 1.

Cualquier distribución normal puede ser transformada enuna reducida, restando la media a los valores de la variable ydividiendo esta resta por su desviación típica. Las funciones deprobabilidad de la normal reducida están ampliamente difundi-das.

x - µZ= ———

σ

131

3

BIOESTADISTICA

11

¿Qué tipo de representación gráfica es más adecuada para variables conti-nuas?:

1. Diagrama de barras.2. Diagrama de sección circular.3. Cartograma.4. Histograma.5. Ninguno de los anteriores.

¿Cuál de las siguientes afirmaciones es falsa?:

1. La media es una medida de tendencia central que se afecta pocopor los valores extremos.

2. El valor de la mediana se corresponde con el percentil 50.3. La mediana es una medida de tendencia central que se afecta

poco por los valores extremos.4. La moda no suele resultar de gran utilidad cuando manejamos

variables continuas.5. El decil 25 se corresponde con el primer cuartil.

¿Cuál de las siguientes características no corresponde a la distribuciónnormal?:

1. Es simétrica.2. Su media coincide con su mediana.3. Su mediana coincide con su moda.4. La distancia entre el punto de inflexión de la curva y el eje de si-

metría es de una varianza.5. Sus colas son asíntotas al eje horizontal.

¿Cuál de las siguientes medidas de variabilidad permite comparar distin-tas distribuciones?:

1. Amplitud.2. Desviación media.3. Varianza.4. Coeficiente de variación.5. Desviación típica.

Tiene usted la distribución de una variable continua obtenida a partir de sumedición en una muestra de 120 pacientes. La variable oscila entre20 y 300. Su mediana es 40, su media 80, y su desviación típica de36. ¿Cuál de las siguientes afirmaciones sobre ella es correcta?:

1. El 68% de los valores estarán comprendidos entre 50 y 110.2. La media poblacional de la variable se encontrará con un 95% de

probabilidades entre 20 y 140.3. La media poblacional de la variable se encontrará con un 95% de

probabilidades entre 74.5 y 85.5.4. Todas las anteriores son falsas, ya que esta distribución es cla-

ramente «no normal».5. Unicamente son ciertas 1 y 3.

12

13

14

15

RESPUESTAS: 11: 4; 12: 1; 13: 4; 14: 4 ;15: 4.

Page 10: Bioestadistica Mir

Distribución binomial

La distribución binomial es una distribución de frecuenciaque modeliza una variable dicotómica (factor Rh). Conociendocuál es la frecuencia (π) de ser Rh+ en una zona geográfica(70%), permitirá calcular cuál es la posibilidad de encontrar enuna muestra de n personas, k personas Rh+.

n!p(k)= ————— πk (1- π)n-k

k!(n-k)!

Sabiendo cuáles son los valores de que salgan 1,2,3 .... npersonas Rh+, podríamos calcular la probabilidad de cualquiercombinación.

Distribución de Poisson

La distribución de Poisson resuelve problemas similares alos de la binomial, pero únicamente para factores muy pocofrecuentes (≤ 0,05) y muestras grandes (≥100).

Otras distribuciones

Las distribuciones de Ji-Cuadrado, distribución de t de Stu-dent y F de Snedecort, tienen características que les confierenuna gran utilidad.

ESTIMACION DE PARAMETROS

La estimación es el proceso que nos permite conocer un de-terminado parámetro poblacional (media, proporción, varianza,etc.) a partir de la muestra estudiada, permitiéndonos obtenerconclusiones sobre la población sin haberla estudiado en sutotalidad. El estimador debe tener las siguientes característi-cas:

— No sesgado; que coincida con el parámetro poblacio-nal.

— Consistente; cuando aumente el tamaño muestral de-be converger hacia el valor del parámetro.

— Eficiente; debe tener la mínima varianza.— Suficiente; debe usar toda la información relevante

sobre el parámetro.

Los estadísticos son en sí mismos variables aleatorias quecambian en cada muestra que estudiamos. Sin embargo, cuan-do se realiza una estimación sólo estudiamos una muestra ysugerimos un determinado valor para el parámetro. Este es elprincipal problema de la estimación - ¿cuánto se acerca el es-timador al parámetro? -. Para solucionar este problema, a laestimación puntual se le añade el denominado intervalo deconfianza (IC). Es decir, un valor mínimo y máximo alrededordel estimador puntual (límites del intervalo de confianza), quenos determinan la zona donde más probablemente se encuen-tre el parámetro. Normalmente, el nivel de probabilidad que secalcula es el 95% (IC95%), lo que indicaría que sólo 5 de cada100 veces el parámetro estaría fuera de esos límites (error al-fa). La forma de calcular el intervalo de confianza es distintaen función del tipo de variable que midamos y del tamañomuestral.

Para finalizar este apartado deberíamos comentar el signifi-cado del error estándar (SE) y su diferencia frente a desviaciónestándar (DE). Ambos valores están matemáticamente relacio-nados, pero representan aspectos conceptualmente distintos.La desviación típica de la muestra es una estimación de la va-riabilidad de la variable que estamos analizando. El error es-tándar de la muestra indica la variabilidad de estimador (no dela variable) que estamos utilizando, e indicaría su precisión.

SE=DE/√ n

Como podemos deducir, una muestra mayor, aunque tengala misma variabilidad (igual desviación estándar) que otra me-nor, mejora la precisión del estimador, ya que reduce el errorestándar. Con muestras grandes en las que puede utilizarse ladistribución normal el IC95% es x ± 1,96*SE (el valor de “Zα”para el 5% es de 1,96), por ello cuanto mayor es el tamañomuestral mas pequeño es el intervalo de confianza.

132

ESTADISTICA DESCRIPTIVA Y ESTIMACION

Page 11: Bioestadistica Mir

Comprobación de hipótesisPruebas paramétricas y no paramétricasContrastes de hipótesis bivariantesContrastes variable categórica/categórica

Contraste variable categórica/cuantitativaContraste variable cuantitativa/cuantitativaAnálisis de supervivencia

ESTESTADISTICA ANADISTICA ANALITICAALITICA

Capítulo II

Indice

COMPROBACION DE HIPOTESIS

Concepto estadístico de hipótesis

Una hipótesis es una idea que construimos a partir de unmarco de conocimiento (¿produce un medicamento más cura-ciones que otro?). Para evaluar la verosimilitud de esta ideadesde una perspectiva estadística, lo que hacemos es determi-nar la denominada Hipótesis nula (H0 - no hay diferencias en-tre ambos medicamentos), y la Hipótesis alternativa (H1 - losmedicamentos se comportan de forma diferente). La verosimili-tud de que la hipótesis nula no sea verdadera, se evalúa deci-diendo si las diferencias en el número de curaciones entre lasmuestras de pacientes tratados con los dos fármacos son ex-plicables por la variabilidad del muestreo. Si las diferenciasencontradas no parecen ser debidas la azar, se rechaza la hi-pótesis nula y se acepta la alternativa. No rechazar la hipóte-sis nula no supone que los tratamientos sean iguales, única-mente supone que con el número de pacientes incluidos no so-

mos capaces de encontrar diferencias, lo que puede deberse a:que el número de pacientes incluidos es pequeño, o que la di-ferencia entre ambos tratamientos es pequeña, pero real. Deforma arbitraria se acepta como probabilidad baja aquella quees inferior al 5%, es decir, siendo la hipótesis nula cierta, larechazaríamos en 5 ocasiones de cada 100.

Las pruebas de contraste de hipótesis pueden ser (fig. 3):

Bilaterales

La hipótesis alternativa es que las muestras son diferentes(los medicamentos se comportan de forma diferente - es elmedicamento A mejor que el B, o el medicamento B mejor queel A-).

Unilaterales

La hipótesis alternativa es que una de las muestras es supe-rior a la otra (el medicamento A es mejor que el B), careciendode importancia para el investigador la otra posibilidad.

133

Dr. EMILIO VARGAS CASTRILLON

Page 12: Bioestadistica Mir

En general, se suelen utilizar pruebas bilaterales, ya que la

hipótesis unilateral tiene interés únicamente en pocas situa-

ciones.

Tipos de pruebas de hipótesis

Pruebas de conformidad

Verifican hipótesis sobre la forma de distribución (bondad de

134

ESTADISTICA ANALITICA

Prueba unilateral*

Ho: µ0 ≤ µHa: µ0 > µ

α = 0,05

0Z = 1 645

Prueba bilateral**

Ho µo = µHa µo ≠ µ

α/2 = 0,025

Ζ = 1,96

El aumento del tamañomuestral disminuye elerror B e incrementa lapotencia

Representación del riesgo β. Efecto del tamaño de muestra sobre el valor del riesgo β.

0

α/2 = 0,025

α/2

α/2

β

β

p

p

H0

H0

H0 H1

Ζ = −1,96

Fig. 3. Pruebas de contraste de hipótesis.

Page 13: Bioestadistica Mir

ajuste), o evalúan si un determinado valor muestral puede ajus-tarse a una parámetro poblacional. Una de las pruebas de bon-dad de ajuste más utilizada es la de Kolmogorov-Smirnov, queevalúa si una distribución se ajusta a la distribución normal.

Pruebas de relación/independencia

Evalúa la existencia de dependencia entre variables.

Pruebas de homogeneidad

Verifican si dos o más muestras provienen de la misma po-blación.

Las diferencias entre pruebas de homogeneidad y las de re-lación son sutiles, y a veces puede ser difícil diferenciarlas.

Tipos de errores

Al realizar una prueba de contraste de hipótesis se toma unadecisión de rechazo/no rechazo de la hipótesis nula, basándoseen estimaciones obtenidas a partir de muestras. Sin embargo, larealidad en las poblaciones de las que se obtienen las muestraspuede no coindicidir con lo decidido (tabla I, fig. 3).

La posibilidad de que en nuestro estudio concluyamos quelos tratamientos son diferentes, cuando la realidad no es así(aceptar H1 cuando la realidad es H0), recibe el nombre deerror tipo I (error alfa, error de 1.a especie), y corresponde conlo que suele denominarse valor de la p de la prueba estadísticautilizada (puede calcularse). Cuanto mayor número de pruebasde hipótesis realicemos, más facil es cometer un error tipo I.La posibilidad de que en nuestro estudio concluyamos que lostratamientos son iguales cuando la realidad es que son dife-rentes (aceptar H0 cuando la realidad es H1) recibe el nombrede error tipo II (error beta, error de 2.a especie ). Este último ti-po de error no es directamente calculable, ya que requiere de-terminar a partir de qué tamaño de diferencia consideraría-mos realmente distintas las posibilidades. Para cada magnitudde la diferencia tendremos un valor distinto de error tipo II. Laprobabilidad complementaria del error tipo II (1-error tipo II) re-cibe el nombre de potencia, y es la probabilidad de detectar di-ferencias entre los tratamientos en nuestro estudio cuando enla realidad estas diferencias existen (aceptar H1 cuando la rea-lidad es H1).

PRUEBAS PARAMÉTRICAS YNO PARAMETRICAS

Muchos de los procedimientos estadísticos más utilizados—métodos paramétricos— requieren que las variables a lasque se aplican sigan algún modelo de distribución (habitual-mente la normal). Sin embargo, en medicina, con frecuenciatrabajamos con variables que no cumplen el requisito de nor-malidad, o sobre las que no sabemos claramente si lo hacen(con pequeños tamaños muestrales - n < 10 - es muy difícil quepueda descartarse la normalidad, incluso en variables que nose ajustan claramente a esta distribución). En ocasiones, pode-

135

3

BIOESTADISTICA

16El error alfa indica:

1. La posibilidad de aceptar la hipótesis nula cuando la hipótesis al-ternativa es cierta.

2. La posibilidad de rechazar la hipótesis nula cuando la hipótesisalternativa es cierta.

3. La posibilidad de aceptar la hipótesis alternativa cuando la hipó-tesis nula es cierta.

4. La posibilidad de aceptar la hipótesis alternativa cuando la hipó-tesis nula es falsa.

5. La posibilidad de rechazar la hipótesis alternativa cuando la hipó-tesis nula es falsa.

¿Cuál de las siguientes afirmaciones es verdadera?:

1. Las pruebas no paramétricas se utilizan con variables que tienendistribuciones normales.

2. La prueba de Kolmogorov-Smirnov se utiliza para evaluar si ladistribución de una variable se ajusta a la normalidad.

3. En las muestras pequeñas siempre deben utilizarse pruebas para-métricas.

4. Cuando una variable no sigue la distribución normal no puedeanalizarse.

5. Los resultados de las pruebas paramétricas y no paramétricasson siempre similares.

Ha recogido usted información sobre la motalidad a los 30 días en 16 pa-cientes con intoxicación por setas. La mitad de los enfermos fuerontratados de forma habitual, y la otra mitad con un nuevo medicamen-to. De los 8 que recibieron el tratamiento habitual 7 murieron y de los8 que en los que se utilizó el medicamento nuevo solamente murió 1.¿Qué prueba utilizaría para descartar que estas diferencias puedan serdebidas a la casualidad?:

1. La prueba de Ji-Cuadrado con la corrección de Yates para mues-tras pequeñas.

2. La prueba exacta de Fisher.3. Un análisis de supervivencia mediante la técnica de Kaplam-

Meier.4. La prueba de la t de Student.5. Un análisis de la varianza.

Las pruebas no paramétricas:

1. Unicamente se utilizan para comparar distribuciones de variablescontinuas.

2. Requieren la comprobación del requisito de normalidad.3. Originan unos valores de error alfa similares a los que se calculan

mediante pruebas paramétricas.4. Deben utilizarse siempre que manejemos muestras de gran tamaño.5. No realizan asunciones sobre el tipo de distribución de la varia-

ble.

RESPUESTAS: 16: 3;17: 2; 18: 2; 19:5.

17

18

19

Page 14: Bioestadistica Mir

mos realizar transformaciones de las variables originales (loga-ritmo, raíz cuadrada, etc.) que normalicen la variable; sin em-bargo, con frecuencia resulta útil usar otras técnicas estadísti-cas llamadas no paramétricas (libres de distribución). En ellasla violación del supuesto de normalidad no afecta al resultado.Estas pruebas no utilizan los valores de la variable, sino queutilizan el orden de la distribución de sus valores. Por ello, pue-den utilizarse con variables continuas, discretas y cualitativasordinales.

CONTRASTES DE HIPOTESIS BIVARIANTES

La existencia de distintas pruebas de hipótesis dependeprincipalmente del tipo de variables incluidas. En la tabla IIpuede verse cuáles serían las técnicas más frecuentementeutilizadas.

Muchas de estas pruebas pueden realizarse para dos tiposde datos, los datos apareados y los datos independientes. Enlas pruebas de datos independientes la información provienede grupos diferentes de individuos (comparar la tensión arte-rial en un grupo de jóvenes frente a un grupo de ancianos); porel contrario, en los pruebas para datos apareados la informa-ción proviene con mucha frecuencia de determinar la mismamedición en el mismo individuo en momentos distintos (medirla tensión arterial en un grupo de personas jóvenes, esperar aque se hagan ancianos y repetir la medición). Los dos ejemplospropuestos intentarían contestar la misma duda (¿son diferen-tes las tensiones arteriales de los jóvenes que las de los ancia-nos?); sin embargo, el diseño apareado requeriría menos indi-viduos, ya que la variabilidad de la tensión arterial dependien-te del individuo se reduce. El ejemplo más claro de datos apa-reados es el de la repetición de la medida en el mismo indivi-duo, pero en algunos otros diseños también requieren la utili-zación de estas pruebas (estudios de gemelos, cuando los ca-sos se aparean por variables importantes, etc.).

CONTRASTES VARIABLECATEGORICA/CATEGORICA

La cuestión que se intenta resolver es si la distribución delos valores de cada variable se hace homogéneamente entrelos valores de la otra, o si por el contrario, cuando una variabletiene un valor en un individuo es más probable que tenga unvalor determinado en la otra. Por ejemplo, si estamos compa-rando dos medicamentos hipoglucemiantes, podemos valorarcuántos pacientes normalizan sus cifras de glucemia con cadauno de los medicamentos (tabla III).

Esta forma de presentar la información recibe el nombre detabla de contingencia. El número de casos en cada casilla sedenomina efectivos observados. El número de casos que ha-bría si la distribución fuese homogénea recibe el nombre deefectivos esperados.

El método de contestar estas preguntas depende del núme-ro de categorías de las variables y de los efectivos esperadosen cada una de las casillas de la tabla de contingencia, y de sise trata de datos independientes o apareados.

Si se trata de tablas de contingencia de 2 X 2 (dos variablesdicotómicas) la hipótesis nula puede contrastarse mediante laprueba exacta de Fisher. Esta prueba consiste en calcularexactamente la probabilidad de que aparezcan distribucionestan o más extremas (más heterogéneas) que la encontrada. Silos efectivos esperados en cada casilla de la tabla excede a 5los resultados de la prueba de Fisher son muy similares a losobtenidos con la prueba de Ji-Cuadrado.

Si se trata de tablas con dimensiones superiores a 2 X 2, elcontraste de la hipótesis nula se realiza calculando la Ji-Cua-drado de la tabla de contingencia. El valor obtenido se compa-ra con el existente en las tablas de esta distribución, lo quenos indica su probabilidad. El número de grados de libertadque deben aplicarse es de: (número de filas-1) * (número decolumnas-1), es decir, se multiplican el número de categorías

136

ESTADISTICA ANALITICA

TABLA IErrores en las pruebas de contrste de hipótesis

REALIDAD

E Diferentes Iguales S T Diferentes Correcto Error tipo I U (potencia) Error alfa DI Iguales Error tipo II Correcto O Error beta

Page 15: Bioestadistica Mir

menos uno de cada variable. Si en alguna casilla de la tablaexisten efectivos esperados entre 3 y 5, se debe utilizar la lla-mada corrección de Yates. Si en alguna de las casillas se ob-tienen efectivos esperados menores de 3, el valor de la Ji-Cua-drado obtenido no es correcto y la hipótesis no puede contras-tarse. En esta situación la única posibilidad es la de colapsarcategorías (unir valores de la variable). El valor de la Ji-Cua-drado representa la diferencia entre los valores observados yesperados de cada casilla.

Cuando los datos son agrupados, se realiza la prueba deMcNemar.

En algunas ocasiones puede darse un caso ligeramente dife-rente. Sabemos la distribución de una variable categórica enuna población porque se ha estudiado en su totalidad y tene-mos la distribución de esta variable en una muestra. Se pre-tende saber si la distribución muestral se ajusta a la poblacio-nal (se trataría de una prueba de conformidad). En esta hipóte-sis también se evalúa mediante la prueba de la Ji-Cuadrado,con la salvedad que el número de grados de libertad en estacaso es el número de categorías de la variable menos 1.

CONTRASTE VARIABLE CATEGORICA/CUANTITATIVA

En general estos contrastes se resuelven comparando losvalores medios de la variable cuantitativa en los distintos gru-pos definidos por la variable categórica. Por ejemplo, al eva-luar el efecto de dos medicamentos hipoglucemiantes pode-mos ver las glucemias de los pacientes que reciben cada trata-miento. La decisión del método de contraste a elegir dependedel número de grupos definidos por la variable cualitativa, desi se trata de datos apareados o independientes, y de si la dis-tribución de la variable cuantitativa sigue una distribución nor-mal.

Variable categórica dicotómica

Si la variable categoría diferencia 2 subgrupos las pruebasque suelen utilizarse son la prueba de Z y la t de Student. Laprimera para muestras grandes (ambos grupos con un númerode individuos ≥ 30) y la segunda para muestras pequeñas. Es-tas pruebas tienen versiones para datos apareados e indepen-dientes, y necesitan que se cumpla el supuesto de normalidad,y de igualdad de varianzas en los dos grupos (en caso de nodarse este último supuesto pueden utilizarse soluciones apro-ximadas).

En ocasiones no pretendemos comparar dos grupos distin-tos, sino que queremos comparar la media en una muestra ob-tenida con una media poblacional conocida (prueba de confor-midad). La sistemática en este caso es la misma, siendo única-mente distintas las fórmulas de cálculo de la Z y de la t.

Si los datos no cumplen el supuesto de normalidad, debenutilizarse pruebas no paramétricas. Estas pruebas no comparanla media de los valores, sino que comparan la distribución desu ordenación en ambos grupos. Para datos independientes se

137

3

BIOESTADISTICA

20

La p obtenida en la prueba bilateral de contraste utilizada es de 0,01. ¿Quésignifica este resultado?:

1. En el caso de que los tratamientos fuesen similares sólo se ha-bría encontrado esta distribución u otra más extrema en 1 de ca-da 100 casos.

2. Que si se hubiese utilizado una prueba unilateral la p valdría0,02.

3. Que si los tratamientos fuesen distintos, en 1 de cada 100 casosno encontraríamos diferencias entre ellos.

4. La interpretación del valor de la p es totalmente distinta en fun-ción de la prueba estadística utilizada.

5. Ninguna de las respuestas anteriores es correcta.

¿En cuál de los siguientes estudios no se aplicaría una prueba para datosindependientes?:

1. Se compara el efecto de 2 medicamentos sobre la evolución delesiones existentes en los pliegues interdigitales de los pies. Ca-da paciente recibe 1 tratamiento distinto en cada pie.

2. Se compara el efecto hipotensor de 2 medicamentos. Los enfer-mos reciben secuencialmente los dos medicamentos.

3. Se compara el efecto hipolipemiante de 2 medicamentos. Ungrupo de pacientes reciben el medicamento A y otro grupo elmedicamento B. Se evalúa la diferencia entre la colesterolemiaantes de iniciar el tratamiento y la existente tras un mes de tra-tamiento.

4. Se compara el efecto sobre el glaucoma de 2 medicamentos. Lospacientes reciben un medicamento distinto en cada ojo.

5. Se quiere evaluar si un medicamento tiene algún efecto hipoten-sor. Para ello se compara la tensión sistólica antes de tomar elmedicamento con la que presenta 1 hora después de haberlo re-cibido.

Ha realizado usted un cuestionario sobre personalidad a 50 pacientes dia-béticos y a 50 controles. Un porcentaje mayor de diabéticos presentauna personalidad neurótica (p<0,002). ¿Qué conclusiones obtendría?:

1. Esta relación no parece debida a la casualidad.2. Posiblemente la diabetes origine personalidad neurótica.3. Posiblemente la insulina origine personalidad neurótica.4. Esta relación parece ser debida a la casualidad.5. Todas las anteriores afirmaciones son falsas.

RESPUESTAS: 20:1; 21: 3;22:1.

21

22

Page 16: Bioestadistica Mir

utiliza la U de Mann-Whitney, y para datos apareados se utili-za la T de Wilcoxon.

Variable categórica politómica

En el caso de que la variable categórica diferencie más dedos grupos (comparar 3 fármacos hipoglucemiantes), podríapensarse que podrían realizarse varios pares de comparacio-nes utilizando las pruebas mencionadas en el apartado ante-rior. Sin embargo, esto no es razonable, ya que la posibilidadde cometer un error alfa aumentaría proporcionalmente al nú-mero de comparaciones realizadas. Por ello debe realizarseuna prueba especial, que recibe el nombre de análisis de la va-rianza (ANOVA).

La variabilidad de los valores de cada individuo puede de-berse al azar o al hecho de pertenecer a cada grupo. Este tipode prueba lo que hace es valorar si la variabilidad que aporta alos datos el pertenecer a los distintos grupos es superior a laque podría deberse al azar, es decir, la hipótesis nula sería quela varianza que aporta el pertenecer a los distintos grupos (va-rianza intergrupo) no es mayor que la esperable por el azar,que en este caso estaría representada por la llamada varianzaintragrupo (varianza residual). Lógicamente, si el pertenecer acierto grupo explica parcialmente el valor de la variable, susvalores medios en cada grupo serán diferentes.

Esta prueba nos informa de que las medias de los distintosgrupos son diferentes en conjunto, pero no informa específica-mente de cuáles son distintas entre sí (por parejas). Para resol-ver este problema se recurre a los llamados contrastes (Sheffé,Fisher, Tukey, etc.).

Existen soluciones de esta prueba para datos independien-tes y apareados (ANOVA de medidas repetidas).

El ANOVA requiere que se cumpla el supuesto de normali-dad y que la varianza en los distintos grupos sea homogénea.Si esto no ocurre, puede recurrirse a las pruebas no paramétri-cas. No obstante, los resultados del ANOVA no suelen ser muysensibles a pequeñas violaciones de estos supuestos. La prue-ba no paramétrica utilizada en esta situación es la prueba deKruskall-Wallis.

CONTRASTE VARIABLECUANTITATIVA/CUANTITATIVA

El problema que intentan contestar este tipo de técnicas essi el cambio del valor de una variable se acompaña de una mo-dificación de la otra. Por ejemplo, podemos intentar ver si ladosis de hipoglucemiante administrada se relaciona con eldescenso de las cifras de glucemia.

Las técnicas empleadas para la solución de este tipo de du-das se agrupan bajo el nombre de regresión/correlación. Estastécnicas buscan la recta que mejor se ajusta a la nube de pun-tos originada por la representación conjunta de ambas varia-bles y nos informa de la ecuación que mejor la representa(y=a+bx). Evalúan el grado de ajuste de la recta teórica a lospuntos (coeficiente de correlación y coeficiente de determina-ción). Estiman los parámetros propuestos (a, b, y coeficientes)y finalmente contrastan su verosimilitud.

El coeficiente de correlación (r) es un estadístico que indica laexactitud de la relación entre dos variables cuantiativas. Oscilaentre -1 y +1. Cuando su valor es 0, no hay relación entre ellas.

138

ESTADISTICA ANALITICA

TABLA IIPrincipales pruebas de hipótesis bivariantes

Variable Nominal Ordinal Cuantitativa

Nominal Prueba de Fisher Ji-Cuadrado de t de Student Ji-Cuadrado Mantel-Haenszel Prueba de Z

Prueba de McNemar ANOVA U de Mann-Whitney *

T de Wilcoxon * Kruskall-Wallis *

Cuantitativa Regresión Correlación

Correlación Sperman** Pruebas no paramétricas

Page 17: Bioestadistica Mir

Cuando su valor es +1, hay una relación positiva perfecta (X au-menta de forma exactamente proporcional al aumento de Y).Cuando su valor es -1, hay una relación negativa perfecta (X dis-minuye de forma exactamente proporcional al aumento de Y).

El coeficiente de determinación (r2) nos indica qué porciónde la variabilidad de una variable puede ser explicada por laotra y cuánta puede ser explicada por el azar. Es el cuadradodel coeficiente de correlación, y lógicamente oscila entre 0 y 1.Cuando su valor es 0, ninguna proporción de la variabilidad decada variable puede ser explicada por la otra. Cuando su valores 1, la modificación de una variable explica la totalidad delcambio que sufre la otra.

El coeficiente b (coeficiente de regresión) indica la magnituddel incremento de y con cada unidad de incremento de x. El co-eficiente a (término independiente) nos indica el valor teóricode y cuando x vale 0. Situación que frecuentemente no tienesentido biológico.

Los coeficientes de determinación y correlación no depen-den del tipo de unidades utilizadas en la medición de las varia-bles. Pero los coeficientes a y b sí dependen de estas unida-des.

Una vez que estos estadísticos han sido calculados, debencontrastarse. La hipótesis nula que suele evaluarse es la de noexistencia de relación, que en este caso equivale a que el coe-ficiente r o el b son distintos de 0. Esto se hace calculando elvalor de t, buscando posteriormente su probabilidad. En el ca-so de 2 variables el contraste de b o r aporta el mismo resulta-do. Pero si se incluyen variables existirían varios coeficientes b(y=a+b1x+b2x+b3x), y cada uno de ellos requeriría su contrasteindividualizado. En este caso, el contraste de r nos informaríasobre la verosimiltud global del modelo.

Estas técnicas requieren para su aplicación:

— Que la relación entre ambas variables sea lineal (seajuste a una línea recta); las variables estén asocia-das por otro tipo de ecuación (exponencial, parábola,etc.), y que los datos no se ajusten a una recta.

— Las variables deben ser normales. Ambas deben serloen correlación, y la dependiente (y) en regresión.

— Las variables deben ser homoescedásticas (varianzashomogéneas). Ambas deben serlo en correlacion, y ladependiente en regresión.

— Los valores de las variables deben ser independien-tes.

Los términos correlación y regresión están fuertemente em-parentados, pero no significan lo mismo. La regresión implicaun cierto componente causal, existiendo una variable indepen-diente (x), y una dependiente (y), que se modifica a consecuen-cia del cambio de x. La regresión está emparentada con los di-seños experimentales (el investigador puede modificar la va-riable independiente) y la correlación con observacionales. Porotro lado, a la regresión le interesan los coeficientes b y a, ysuele tener un objetivo predictivo; por el contrario, a la correla-ción le interesan r y r2.

139

3

BIOESTADISTICA

23Ha realizado usted un ensayo clínico en el que ha comparado el efecto hi-

potensor de 3 tratamientos distintos (A, B, C). El tratamiento A origi-nó un descenso medio de 20 mmHg en la tensión diastólica, el B de15 mmHg, y el C de 13 mmHg. El número de pacientes incluidos encada grupo no fue homogéneo. El análisis ha sido realizado medianteun ANOVA, y se ha obtenido un p<0,0001. ¿Qué conclusiones podríaobtener con esta información?:

1. El tratamiento A tiene mayor efecto que el B.2. El tratamiento B tiene mayor efecto que el C.3. El tratamiento A tiene mayor efecto que el C.4. Los tratamientos A, B y C tienen distinto efecto.5. Todas las anteriores son ciertas.

¿Podría haberse realizado el análisis del anterior ensayo mediante variaspruebas de la t de student?:

1. Sí, además este sistema permitiría comparar los tratamienos 2 a 2.2. Si, pero aumentando el valor de error alfa asumible.3. No, ya que disminuiría la potencia del estudio.4. No, ya que incrementaríamos la posibilidad de que ocurriera

error de tipo I.5. Sí, los resultados obtenidos serían estrictamente superponibles

a los del ANOVA.

Quiere usted evaluar si la edad (medida en años), se relaciona con la ten-sión arterial diastólica (medida en mmHg). ¿Qué método de análisisemplearía?:

1. Comparación de medias.2. prueba de McNemar.3. Regresión.4. ANOVA.5. t de Student.

Ha realizado usted un estudio de casos y controles sobre la relación entre elaceclofenaco y la hemorragia digestiva. Ha entrevistado a 200 pacien-tes con hemorragia digestiva (5 habían utilizado recientemente aceclo-fenaco) y a 200 controles (1 había utilizado recientemente aceclofena-co). El valor de p obtenido fue de 0,21. ¿Qué conclusiones obtendría?:

1. El aceclofenaco no se relaciona con el desarrollo de hemorragiadigestiva.

2. El aceclofenaco no produce hemorragia digestiva.3. Si no encontrásemos otros factores que expliquen la no existen-

cia de relación estadística entre la hemorragia digestiva y con-sumo de aceclofenaco, podríamos afirmar que el aceclofenacono produce hemorragia digestiva.

4. Debido a la baja prevalencia de consumo de aceclofenaco, lapotencia del estudio no es muy alta, por lo que no se puede afir-mar que el aceclofenaco no se relacione con el desarrollo de he-morragia digestiva.

5. La posbilidad de cometer un error de tipo II en este estudio esmuy baja.

24

25

26

RESPUESTAS: 23:4; 24: 4;25:3; 26: 4.

Page 18: Bioestadistica Mir

ARMITAGE, P.; BERRY, G.: «Estadística para la investigaciónbiomédica». Doyma. Barcelona, 1992.

BAKKE, O. M.; CARNÉ, X.; GARCIA-ALONSO, F.: «Ensayos Clí-nicos con medicamentos». Doyma. Barcelona, 1994.

CHOU, Y. L.: «Análisis estadístico». Interamericana. México,1977.

DOMÉNECH, J. M.; RIBA, M. D.: «Una síntesis de los métodosestadísticos bivariantes». Herder. Barcelona, 1987.

KRAMER, M. S.: «Clinical Epidemiology and Bioestatistics».Springer-Verlag. Berlin, 1988.

PARDELL, H.; COBO, E.; CANELA, J.: «Manual de bioestadísti-ca». Massons. Barcelona, 1986.

TSOKOS, M.: «Estadística para biología y ciencias de la salud».Interamericana, 1987.

La técnica no paramétrica que puede utilizarse cuando no secumplan los supuestos de normalidad es la correlación de Spe-arman.

ANALISIS DE SUPERVIVENCIA

Bajo este nombre se agrupan una serie de técnicas que secaracterizan por intentar analizar el tiempo que transcurre has-

ta que aparece un determinado acontecimiento. El nombre deanálisis de supervivencia se debe a que con mucha frecuenciael acontecimiento que se espera es la muerte, pero tambiénpueden utilizarse para evaluar el tiempo transcurrido hastaotro tipo de eventos (aparición de infarto agudo de miocardio,aparición de embolismo cerebral, etc.). Los métodos más utili-zados son el Kaplam-Meier y el actuarial.

140

ESTADISTICA ANALITICA

TABLA IIITabla de contingencia

MEDICAMENTO A B

Normalización SI 15 (19,4) 26 (21,5) 41 Glucemia NO 13 (8,6) 5 (9,5) 18

28 31 59

() Efectivos esperados

MEDICAMENTO A B

Normalización SI a (a´) b (b´) a+b Glucemia

NO c (c´) d (d´) c+d a+c b+d total

* Cálculo de efectivos esperados

(a+b)*(a+c) (a+b)*(b+d)Casilla a´ = Casilla b´ =

total total

BIBLIOGRAFIA

Page 19: Bioestadistica Mir

Sección 3

Amplitud, 129intercuartílica, 129

análisis de la varianza (ANOVA), 138apuntamiento, 131asimetría, 131Bilaterales, 133Cartograma, 127Coeficiente,

de correlación, 138de determinación, 138de regresión, 139de variación, 139

Comprobación de hipótesis, 133contrastes, 138corrección de Yates, 137correlación, 138cuartiles, 129datos apareados, 136datos independientes, 136deciles, 129Desviación,

estándar, 132media, 129típica (desviación estándar), 129

Diagrama de barras, 127

Diagrama de sección circular, 127Distribución,

binomial, 132de Poisson, 132normal, 131normal reducida (tipificada), 131

Error,alfa, 135beta, 135de 1.ª especie, 135de 2.ª especie, 135estándar, 132tipo I, 135tipo II, 135

Estadística descriptiva, 125, 126estadística inferencial o deductiva, 125Estadísticos, 126Estadística analítica, 125Estimación de parametros, 132estimador, 132Fisher, 138Hipótesis alternativa, 133Hipótesis nula, 133Histograma, 127intervalo de confianza, 132

141

INDICE INDICE DE DE

MAMATERIASTERIAS

Page 20: Bioestadistica Mir

Kolmogorrov-Smirmov, 135kurtosis, 131Media aritmética, 128Mediana, 128Medidas de tendencia central, 127Moda, 128Muestra, 126parámetros, 126percentiles, 129Pictograma, 127población, 126

diana, 126inferencial, 126

Polígono de frecuencias, 127prueba/as,

de Ji-Cuadrado, 136de McNemar, 137de Z, 137exacta de Fisher, 136

no paramétricas, 135paramétricas, 135

regresión, 138Sheffé, 138skewness, 131supervivencia, 140t de Student, 137T de Wilcoxon, 138tablas de contingencia, 136técnicas de muestreo, 126Tukey, 138U de Mann-Whitney, 138Unilaterales, 133variable/es, 126

aleatoria, 126controlada, 126dependiente, 126independiente, 126cualitativas, 126cuantitativas, 126ordinales, 126

Varianza (variancia), 129

142

INDICE DE MATERIAS