Seminario 6

12
SEMINARIO 6 Análisis exploratorio de datos Tablas de frecuencias, resúmenes numéricos y gráficos. Selena Expósito Sollo

Transcript of Seminario 6

Page 1: Seminario 6

SEMINARIO 6Análisis exploratorio de

datos Tablas de frecuencias, resúmenes numéricos y

gráficos.Selena Expósito Sollo

Page 2: Seminario 6

EJERCICIO 1•Selecciona dos variables

cualitativas-factor del fichero

“activossalud.RData”, descríbelas en tablas de

frecuencias e interpreta al menos 3 aspectos en

relación a la distribución de las mismas.

Page 3: Seminario 6

• Las variables cualitativas que vamos a distribuir en tablas de frecuencia y a comentar son: Edad: variable tipo factor de la edad medida en intervalos: 1- 18

años, 2- 19-20 años, 3- 21-22 años, 4- 23-25 años, 4- Más de 25 años

Uso de píldora del día después: : 0- “Siempre”, 1- “Alguna vez”, 2- “Nunca”, 3- “No he tenido relación”

edad Uso de la píldora del día después

Page 4: Seminario 6

• En la variable “edad” observamos: Más del 38% tienen 18 años. Sólo el 10,03% tienen más de 25 años. El 77,51% tiene de 18 a 22 años.

• En la variable “uso de la píldora del dia después” vemos: No hay nadie en la muestra que la

haya usado siempre. El 69,43% no ha requerido nunca el

uso de la píldora. El 27.98% de las que han respondido

la ha usado alguna vez.

Page 5: Seminario 6

EJERCICIO 2• Selecciona dos variables

numéricas del fichero “activossalud.RData”, y

mediante resúmenes numéricos describe e

interpreta la distribución de las mismas.

Page 6: Seminario 6

• Las variables cuantitativas que vamos a resumir son:

Hora de práctica deportiva: Horas de dedicación a practicar deporte a la semana

Medicalización: Escala cuantitativa, formada tras sumar las siguientes preguntas: ¿Has tomado alguno de los siguientes medicamentos en el último trimestre: Analgésicos, Laxantes, Anti-inflamatorios, Inhaladores, Antibióticos, Jarabe?, cada una de ellas con las siguientes categorías de respuesta: 1- “Sí”, 2- “No”. Por tanto, a más puntuación menor uso de medicamentos.

Page 7: Seminario 6

• La media de tiempo de deporte entre las unidades de análisis es de 2,48 horas semanales.

• El 75% de las personas que han contestado al cuestionario realizan 4 horas de deporte semanalmente o menos.

• La media del consumo de medicamentos es de 9,91 lo que es un buen indicador puesto que el valor máximo es de 12.

• El valor mínimo en el consumo de medicamentos es 7, lo que nos indica que no hay que tenga menos de esa puntuación, es decir, los que ha contestado todos toman algún medicamento de los expuestos.

Page 8: Seminario 6

EJERCICIO 3•Debes realizar al menos un

gráfico de cada tipo con variables adecuadamente seleccionadas del fichero

“activossalud.RData”, describe e interpreta la distribución los mismos.

Page 9: Seminario 6

DIAGRAMA DE BARRAS• Variable cualitativa usada: Botellón

Más del 30% hace botellón sólo los fines de semana mientras que entre un 15 y un 20% no lo realiza. Sin embargo, hay un 2% de los alumnos que confiesa hacer botellón diariamente.

Page 10: Seminario 6

DIAGRAMA DE SECTORES• Variable cualitativa usada: Cerveza

Como se puede observar en el gráfico, un 40% aproximadamente no bebe cerveza nunca. Sin embargo, más de la mitad de los encuestados que contestaron esta pregunta, la consumen.

Page 11: Seminario 6

HISTOGRAMA• Variable cuantitativa usada: Altura

En el histograma observamos que las alturas que se dan con mayor frecuencia se encuentran en el intervalo entre 1,5 y 1,8m. Menos de 5 personas miden menos de 1,5m o más de 1,9m.

Page 12: Seminario 6

GRÁFICO DE CAJA O BIGOTE• Variable cuantitativa usada: Comunicación

familiar.

El gráfico nos muestra que la media se encuentra en 7h de comunicación aproximadamente y que el 50 % de la muestra dedica entre 6 y 9h a la comunicación familiar. El valor mínimo se encuentra alrededor de las 3h.