Análisis exploratorio de datos R Commander

24
Actividad Seminario 6 Análisis exploratorio de datos R Commander Verónica Morales López Grupo 4 Subgrupo 15

Transcript of Análisis exploratorio de datos R Commander

Page 1: Análisis exploratorio de datos R Commander

Actividad Seminario 6

Análisis exploratorio de datos R Commander

Verónica Morales LópezGrupo 4 Subgrupo 15

Page 2: Análisis exploratorio de datos R Commander

➲ Señale el objetivo deseado➲ Precise aún más el objetivo

Seleccionamos desde “Fichero” “Cambiar directorio de trabajo”

Page 3: Análisis exploratorio de datos R Commander

➲ Resuma la situación actual

Page 4: Análisis exploratorio de datos R Commander

Desarrollo hasta hoy

Page 5: Análisis exploratorio de datos R Commander

Desde “Datos”cliquear en “Cargar conjunto de datos”

Page 6: Análisis exploratorio de datos R Commander

Añadimos en archivo

➲ Recomiende una o varias estrategias➲ Resuma los resultados previstos➲ Mencione los próximos pasos➲ Distribuya las tareas

Page 7: Análisis exploratorio de datos R Commander
Page 8: Análisis exploratorio de datos R Commander

Actividad : Seminario 6.

1º Ejercicio

Selecciona dos variables cualitativas-factor del fichero “activossalud.RData”, descríbelas en tablas de frecuencias e interpreta al menos 3 aspectos en relación a la distribución de las mismas.

Page 9: Análisis exploratorio de datos R Commander

Vamos a adquirir dos variables. Seleccionar en “Estadísticos” “Resúmenes” “Distribución de

frecuencias”.

Page 10: Análisis exploratorio de datos R Commander

La primera variable es “embutidos” la seleccionamos ...

Page 11: Análisis exploratorio de datos R Commander

Las concluciones de la tabla obtenidos de la variable “embutidos” son:

El 89.24% de nuestra muestra cual consta de 288 individuos consumen embutidos.

El % mas alto corresponde al 26,74% representan a los individuos que mas consumen entre los cuales en 3 o mas veces por semana.

El 10.76% de los individuos nunca consumen.

Page 12: Análisis exploratorio de datos R Commander

Realizamos los mismos pasos para obtener la segunda variable . En este caso “edad”

Page 13: Análisis exploratorio de datos R Commander

Los datos obtenidos con la variable “edad”

➲ Nuestra muestra consta de 289 individuos de los cuales los individuos de 18 años corresponden a al mayor porcentaje de los datos obtenidos de los cuales son el 38.41%.

El menor porcentaje corresponde a las personas mayores de 25 años que se encuentran en un 10.03%.

Page 14: Análisis exploratorio de datos R Commander

2ºEjercicio

Selecciona dos variables numéricas del fichero “activossalud.RData”, y mediante resúmenes numéricos describe e interpreta la distribución de las mismas.Las variables elegidas son:

●Altura.●Medicalización

Page 15: Análisis exploratorio de datos R Commander

Seleccionamos las variables

Page 16: Análisis exploratorio de datos R Commander

Esquema

➲ Resuma los planes fundamentales➲ Exponga el desarrollo a largo plazo

Page 17: Análisis exploratorio de datos R Commander

Los datos obtenidos de la variable “altura”.

Consta de una media de 1.667 una desviación típica de 0.08078101.Solo tenemos un dato no disponible.

La mediana es de 1.655.

Se trata de una distribución simétrica debido a las cantidades de la media y la mediana que se encuentran que unos valores muy cercanos.

Page 18: Análisis exploratorio de datos R Commander
Page 19: Análisis exploratorio de datos R Commander

Los datos obtenidos con la variable “medicalización”

La media de la muestra es de .9.91235. La desviación típica es 1.283856.

Falta los datos de 40 individuos.

La mediana la cual coincide con la Q2 es 10.

Se trata de una distribución asimétrica donde los datos se encuentran muy dispersos.

Page 20: Análisis exploratorio de datos R Commander

3ª Ejercicio

Realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero “activossalud.RData”, describe e interpreta la distribución los mismos. En los cuales nos encontraremos con:➲ Gráfico de barras➲ Gráfico de cajas➲ Histogramas➲ Gráfico de sectores

Seleccionar “Gráficas” y desde ahí podemos

cliquear el gráfico que queremos obtener.

Page 21: Análisis exploratorio de datos R Commander

Diagrama de sectores Variable cualitativa.

“Dulces”

La mayor parte de la muestra toman dulces1 o 2 veces a la semana y en menor proporción comen dulces a diario

Page 22: Análisis exploratorio de datos R Commander

Diagrama de barrasVariables cualitativas

“cerveza”Contamos con una distribución asimétrica en los que se puede observar que los individuos que toman cerveza a diarioencuentran con muy poco porcentaje al contrario de los que nunca beben se encuentran con unagran diferencia lo que estos dos valores dan lugar mucha dispersión está en mayor proporción

Page 23: Análisis exploratorio de datos R Commander

Diagrama de cajaVariable cualititava

“altura”Como se puede observar la medianano se encuentra en el centro donde los valores máximos se encuentranmuy dispersos en la distribución y además en el Q1 es mucho menorque el Q3 donde da lugar a ser asimétrica.

Page 24: Análisis exploratorio de datos R Commander

Diagrama de barrasVariable cuantitativa

“peso”Se puede apreciar como la mayorparte de la muestra se encuentra enun peso de intervalo entre 50-60kg yun mismo porcentaje en valores de40-50 y de 70-80kg.