Post on 22-Jan-2016
Representaciones Gráficas
Análisis de Datos I
Semestre Otoño 2010
Gráficos para variables cualitativas (categóricas)
1. Gráfico de Sectores o de Torta
Se divide un círculo en tantas porciones como clases tenga la variable
A cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa
La información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan
Si el número de categorías es excesivamente grande (ej. Más de 3) la imagen proporcionada por el gráfico de sectores se empieza a tornar confusa.
Ejemplo Nº 1: Gráfico de sectores variable “Tipo de Fumador”
¿Cómo interpretamos este
gráfico?
Ejemplo Nº 2: Gráfico de sectores variable “Género”
¿Cómo interpretamos este
gráfico?
91 / 71%
38 / 29%
Mujeres
Hombres
Ej. Nº 3: Hay veces en que el sector que nos interesa describir se desagrupa
7 / 5%
57 / 44%
54 / 42%
11 / 9%
divorciado separado
casado
soltero
Omitido
¿Cómo interpretamos este
gráfico?
2.1 Gráfico de Barras SimplesLos diagramas de barras son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores (número de hijos, número de evaluaciones, etc.)
2. Gráficos de Barras
ESTCIVIL
divorciado separadocasadosolteroOmitido
Fre
cuen
cia
60
50
40
30
20
10
0
7
5754
11 ¿Cómo interpretamos este
gráfico?
Ejemplo Nº 4: Gráfico de Barras variable “Estado Civil” (cualitativa)
Número de Hijos
4 Hijos3 Hijos2 Hijos1 HijoSin Hijos
Fre
cue
nci
a
60
50
40
30
20
10
0
11
23
31
57
7
¿Cómo interpretamos este
gráfico?
Ejemplo Nº 5: Gráfico de Barras variable “Número de Hijos” (cuantitativa discreta)
2.2 Gráfico de Barras Agrupadas
• En Ocasiones se requiere agrupar dos variables en un mismo gráfico
• Para lo cual se sugiere ocupar un Gráfico de Barras Agrupadas
• Ayuda a comparar categorías de una variable en función de las Categorías o Intervalos de la otra variable
ESTCIVIL
divorciado separadocasadosolteroOmitido
Fre
cue
nci
a
50
40
30
20
10
0
GENERO
hombre
mujer
Ej. 6 “Gráfico de Barras agrupadas para las variables Estado civil y Género
¿Cómo interpretamos este
gráfico?
2.3 Gráfico de Barras Apiladas
• Cumple con las mismas características que el gráfico de barras agrupadas
• Busca Comparar dos variables superponiendo sus categorías o Intervalos
Ej. 7 “Gráfico de Barras Apiladas para las variables Categoría edad y Género
categoria edad
54 y más44 a 5334 a 4324 a 33Omitido
Fre
cue
nci
a
60
50
40
30
20
10
0
GENERO
mujer
hombre
6
19
19
42
554
1215 ¿Cómo
interpretamos este gráfico?
• Se utiliza cuando una variable Cualitativa tiene muchas categorías
• Es útil para entregar un ordenamiento de las categorías para realizar comparaciones
• Se ordenan las categorías de mayor a menor cantidad de apariciones o frecuencia y se les asigna cada categoría una barra
• El gráfico se complementa con una línea que representa la acumulación porcentual de las categorías
2.4 Gráfico de Pareto
ORIENTAC
Fre
cue
nci
a
140
120
100
80
60
40
20
0
Po
rcen
taje
100
50
0911131317
2126
Ej. 8 “Gráfico de Pareto Orientación Psicoterapeutica”
¿Cómo interpretamos este
gráfico?
1. HistogramasPara variables numéricas continuas, tales como la edad, la tensión arterial o el índice de masa corporal, el tipo de gráfico más utilizado es el histograma.Para construir un gráfico de este tipo, se divide el rango de valores de la variable en intervalos de igual amplitud, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en cada intervalo y el área de los rectángulos.
Gráficos para variables Cuantitativas
Tabla I. Distribución de frecuenciasde la edad en 100 pacientes.
Edad Nº de pacientes
18 1
19 3
20 4
21 7
22 5
23 8
24 10
25 8
26 9
27 6
28 6
29 4
30 3
31 4
32 5
33 3
34 2
35 3
36 1
37 2
38 3
39 1
41 1
42 1
• Como ejemplo, la anterior muestra la distribución de frecuencias de la edad de 100 pacientes, comprendida entre los 18 y 42 años.
• Como se vio en clases, se divide este rango en intervalos de dos años, el primer tramo está comprendido entre los 18 y 19 años, entre los que se encuentra el 4/100=4% del total.
• Por lo tanto, la primera barra tendrá altura proporcional a 4.
• Procediendo así sucesivamente, se construye el histograma que se muestra en la siguiente Diapositiva
Ej. 9 “Histograma Variable Edad
¿Cómo interpretamos este
gráfico?
2. Polígono de Frecuencias
• Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene una imagen que se llama polígono de frecuencias.
• Dicha figura pretende mostrar, de la forma más simple, en qué rangos se encuentra la mayor parte de los datos.
• Un ejemplo, utilizando los datos anteriores, se presenta en la siguiente Diapositiva
Ej. 10 “Polígono de Frecuencias Variable Edad
¿Cómo interpretamos este
gráfico?
3. Diagramas de Caja
• Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el concepto de percentiles, mediante diagramas de cajas
• Como se apreciará en el Ejemplo 11, la caja central indica el rango en el que se concentra el 50% central de los datos.
• Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución.
• La línea central en la caja es la mediana.
• De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja.
• Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribución.
• Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos).
• Esto resulta especialmente útil para comprobar, gráficamente, posibles errores en nuestros datos.
• En general, los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal.
8636N =
GENERO
mujerhombre
ED
AD
80
70
60
50
40
30
20
6366
Ej. 11 “Polígono de Frecuencias Variable Edad
¿Cómo interpretamos este
gráfico?
4. Gráficos de Líneas
• Los gráficos de líneas pueden resultar especialmente interesantes, sobre todo cuando interesa estudiar tendencias a lo largo del tiempo
• No son más que una serie de puntos conectados entre sí mediante rectas
• Cada punto puede representar distintas cosas según lo que nos interese en cada momento (el valor medio de una variable, porcentaje de casos en una categoría, el valor máximo en cada grupo, etc).
Ej. 12 “Gráfico de Líneas Variable Número de pacientes trasplantados renales en el Complejo Hospitalario “Félix Bulnes" durante el periodo 1981-1997”
¿Cómo interpretamos este
gráfico?
Ej. 13 Gráfico de Líneas Superpuestas Variable Variación en el peso medio de una muestra de recién nacidos según el control
ginecológico del embarazo y el hábito de fumar de la madre
¿Cómo interpretamos este
gráfico?
5. Gráfico de Dispersión
• Cuando lo que interesa es estudiar la relación entre dos variables continuas, el método de análisis adecuado es el estudio de la correlación.
• Los coeficientes de correlación (Pearson, Spearman, etc.) valoran hasta qué punto el valor de una de las variables aumenta o disminuye cuando crece el valor de la otra.
• Cuando se dispone de todos los datos, un modo sencillo de comprobar, gráficamente, si existe una correlación alta, es mediante diagramas de dispersión,
• Se confronta, en el eje horizontal, el valor de una variable y en el eje vertical el valor de la otra.
• Un ejemplo sencillo de variables altamente correlacionados es la relación entre el peso y la talla de un sujeto.
• Partiendo de una muestra arbitraria, podemos construir el diagrama de dispersión en el Ejemplo 14
• En él puede observarse claramente como existe una relación directa entre ambas variables
Ej. 14 Histograma de Variables Talla y Peso
¿Cómo interpretamos este gráfico?
Ejemplo Final: Relación entre Nivel de Estrés y Edad
EDAD
706050403020
Niv
el d
e E
str
és
5,0
4,5
4,0
3,5
3,0
2,5
2,0
¿Cómo interpretamos este gráfico?