1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga,...

22
1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España [email protected]

Transcript of 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga,...

Page 1: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

1

Bioestadística

Francisco Javier Barón LópezDpto. Medicina PreventivaUniversidad de Málaga, Españ[email protected]

Page 2: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

2

Datos, variables y ficheros

Page 3: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

3

Categóricas: Frecuencias

Page 4: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

4

Nivel de estudios

6 2,0 2,0

89 30,1 32,1

129 43,6 75,7

72 24,3 100,0

296 100,0

Ninguno

Primarios

Medios

Universitarios

Total

VálidosFrecuencia Porcentaje

Porcentajeacumulado

Categóricas: Frecuencias

UniversitariosMediosPrimariosNinguno

Nivel de estudios

140

120

100

80

60

40

20

0

Fre

cuen

cia

72

129

89

6

Page 5: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

5

Variables numéricas

Page 6: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

6

¿Con media y desviación es suficiente?

45403530252015

Edad materna

50

40

30

20

10

0

Fre

cuen

cia

Media =30,09Desviación típica =5,168N =295

Page 7: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

7

¿Cómo interpretar media y desviación?

Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones.

A dos desviaciones típicas tenemos el 95% (aprox.)

150 160 170 180 190

0.00

0.01

0.02

0.03

0.04

0.05

xs

68.5 %

150 160 170 180 190

0.00

0.01

0.02

0.03

0.04

0.05

x2s

95 %

Page 8: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

8

Distribuciones casi normales

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

dens

idad

-3 -2 -1 0 1 2 3

x s

66 %

x 2s

95 %

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

dens

idad

-3 -2 -1 0 1 2 3

x s

71 %

x 2s

94 %

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

dens

idad

-3 -2 -1 0 1 2 3

x s

68 %x 2s94 %

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

dens

idad

-3 -2 -1 0 1 2 3

x s

70 %

x 2s

94 %

Page 9: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

9

Diagramas de Tukey Si 2 números no

son suficientes… ¡Probemos con 5!

Mínimo, cuartiles y máximo.

La zona central, ‘caja’, contiene al 50% central de los datos.

Diagrama de cajas de Tukey: Resumen en 5 números

Velocidad (Km/h) de 200 vehículos en ciudad

dens

idad

40 45 50 55 60 65

0.00

0.02

0.04

0.06

0.08

40 45 50 55 60 65

Mín. P25 P50 P75 Máx.

Diagrama de cajas de Tukey: Resumen en 5 números

Velocidad (Km/h) de 200 vehículos en autovía

dens

idad

80 90 100 110 120 130 140

0.00

0.01

0.02

0.03

0.04

80 90 100 110 120 130 140

Mín. P25 P50 P75 Máx.

Page 10: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

10

¿Media o mediana?

Altura mediana

Page 11: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

11

x

8 10 12 14 16 18 20

0.00

0.05

0.10

0.15

0.20

8 10 12 14 16 18 20

x s

78 %

x

-2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

0.5

-2 -1 0 1 2 3

x s

66 %

x

0 2 4 6 8 10 12 14

0.00

0.05

0.10

0.15

0.20

0 2 4 6 8 10 12 14

x s

78 %

Si hay asimetría… mejor usar la mediana

En función del signo del estadístico diremos que la asimetría es positiva o negativa. Distribución simétrica asimetría nula.

Page 12: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

12

¿Aplanada o apuntada?

La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal.

Aplanada

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

0.0 0.2 0.4 0.6 0.8 1.0

xs

57 %

Apuntada como la normal

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

-3 -2 -1 0 1 2 3

xs

68 %

Apuntada

-2 -1 0 1 2

0.0

0.2

0.4

0.6

0.8

-2 -1 0 1 2

xs

82 %

Page 13: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

13

El IMC, como medida de la relación entre peso y talla, muestra una población con media ajustada a la sobrecarga ponderal (IMC= 28.1075) con una clara desproporción hacia la obesidad

Poca información… ¿Falta algo?

Page 14: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

14

Se resume todo en una tabla

Page 15: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

15

Si algo no está en la tabla resumen, hay que describirlo por completo

La media de edad a la Menopausia fue de 47.41 años para el conjunto de mujeres menopaúsicas. El rango de edades fue de 41 años, con mínimo y máximo en 24 y 65 años, respectivamente. El histograma presentó un elevado índice de curtosis con desproporción hacia los valores inferiores consecuencia, de los efectos de intervenciones quirúrgicas sobre el aparato reproductor femenino.

Sólo menopáusicas.

No están en la tabla resumen

Page 16: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

16

Page 17: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

17

Estudiar dos variables a la vez

Numérica - Numérica

Numérica - Categórica

Categórica – Categórica

Page 18: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

18

Numérica - Numérica Los individuos que tienen

mayor puntuación en el test de dificultad emocional, tienen tendencia a puntuar más en el de dificultad de comunicación social. La relación no es perfecta, indicando que hay más factores que influyen en la asociación entre ambas variables.

706050403020100

Emocional

40

30

20

10

0

Co

mu

nic

ació

n s

oci

al

Sq r lineal = 0,641

Page 19: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

19

Page 20: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

20

Coeficiente de correlación lineal, ‘r’

Page 21: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

21

Numérica - Categórica

Mujer

Hombre

Sex

o

250200150100500

Puntuación test

153

247210267 139

Valores generalmente más bajos en hombres Menor dispersión en hombres

Page 22: 1 Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva Universidad de Málaga, España baron@uma.es.

22

Tabla de contingencia Grupo * Lactancia breve

111 24 135

82,2% 17,8% 100,0%

117 11 128

91,4% 8,6% 100,0%

228 35 263

86,7% 13,3% 100,0%

Recuento

% de Grupo

Recuento

% de Grupo

Recuento

% de Grupo

No intervención

Intervención

Grupo

Total

más de dossemanas

hasta dossemanas

Lactancia breve

Total

Categórica - Categórica

hasta dos semanasmás de dos semanas

Lactancia breve

120

100

80

60

40

20

0

Rec

uen

to

11

117

24

111

Intervención

No intervenciónGrupo