Estadística Descriptiva -...
Transcript of Estadística Descriptiva -...
GráficosValores típicos
Estadística DescriptivaBioestadística
Jesús Montanero Fernández
Cátedra de Bioestadística. UEx
3 de diciembre de 2010
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
¿De qué trata?
Descripción conjunto concreto de datos (sin generalizar)Clasificación Tablas de frecuenciaRepresentación GráficosResumen Valores típicos
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Tipos de variables ¿?
Según SPSSCualitativas (factores)
Nominales: Grupo sanguíneoOrdinales: Grado enfermedad
Cuantitativas o de escala : Temperatura, estatura, glucemia,no hijos...
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Problemas estadísticos: relación
Tipos de relacionesCualitativa (factor)↔ Cuantitativa (Comparación degrupos o tratamientos)Cuantitativa↔ Cuantitativa (Regresión)Cualitativa (factor)↔ Cuanlitativa (Tablas decontingencia)
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Gráficos
Tipos de variables según gráficoCualitativas Diagrama sectoresCuantitativas discretas Diagrama barrasCuantitativas continuas Histograma
*Nota: estudiaremos ahora una sola variable
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Variable cualitativa: diagrama de sectores
Grupo fi p̂i
0 2892 0,458A 2625 0,416B 570 0,090
AB 226 0,036Total 6313 1
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Figura: Grupo sanguíneo
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Variable cuantitativa discreta: diagrama de barras
Edad alumnos titulación universitaria
Edad fi p̂i
18 6 0.2419 5 0.2020 3 0.1221 3 0.1222 3 0.1223 3 0.1224 2 0.08
Total 25 1
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
18 19 20 21 22 23 24
Edad
Fre
quen
cia
01
23
45
6
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Variable cuantitativa continua
Glucemia n=100: Diagrama de barras
71.43061 76.69276 78.97109 80.0199 80.63695 81.29456 82.48693 82.96681 83.49599 84.3332 85.12535 86.0123 86.63882 87.17015 87.55771 88.70981 89.46449 90.48297 91.60582 93.09123
cero
Fre
quen
cy
0.0
0.2
0.4
0.6
0.8
1.0
Agrupar datos por intervalos
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Histograma
Glucemia k=6
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Otros gráficos para variables continuas
Tallo-hoja
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Diagrama de caja o box-plot
Figura: Concentración ozono
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
Valores típicos
Resumir numéricamente la informaciónMedidas de centralizaciónMedidas de dispersiónMedidas de posiciónMedidas de forma
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
Medidas de centralización
Centro de los datos, número más representativoMedia aritmética (centro de gravedad):
x =
∑ni=1 xi
n
Mediana (orden): dato que queda en medio una vezordenados de menor a mayor.
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
La mediana es robusta: no se ve influenciada por la presencia devalores extremos
Ansiedad n=20
Datos$ham
freq
uenc
y
8 10 12 14 16 18 20
02
46
810
12
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
Otro caso de sesgo n=350
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
Distribución normal: media
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
Medidas de dispersión
Variabilidad de los datosVarizanza desviación típicaAmplitud (o rango) intercuartil
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
Resumen de la información
Centralización-dispersión¿media-desv. típica o mediana-rango inter.?
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
media-desviación típicaResumen perfectamente la información si la distribución de losdatos sigue un modelo normal
x± s 68%x± 2s 95%x± 3s 99%
Podemos construir la distribución partiendo exclusivamente dex y s.
Datos$cero
freq
uenc
y
70 75 80 85 90 95 100
05
1015
2025
3035
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Estadística Descriptiva
GráficosValores típicos
Medidas de centralizaciónMedidas de dispersión
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Salario empleados de una banco (USA)
47500,037500,0
27500,017500,0
7500,0
300
200
100
0
Jesús Montanero Fernández Estadística Descriptiva