Seminario 6 trabajo blog

30
Noelia Marmesat Espejo Grupo 14 Seminario 6

Transcript of Seminario 6 trabajo blog

Page 1: Seminario 6 trabajo blog

N o e l i a M a r m e s a t E s p e j o

G r u p o 1 4

Seminario 6

Page 2: Seminario 6 trabajo blog

Paso 1: Se abre el programa R. Una vez abierto, pinchamos en R commander en el apartado “Datos”,

y posteriormente “Cargar conjunto de datos”.

Page 3: Seminario 6 trabajo blog

Paso 2: Esto lo realizamos para importar el archivo que queremos. En este caso será “activossalud”.

Hacemos clic en “Abrir”.

Page 4: Seminario 6 trabajo blog

Paso 3: Ya se encuentra nuestro archivo en el programa R. El primer ejercicio consiste en seleccionar dos variables

cualitativas-factor del fichero, describirlas en tablas de frecuencias e interpretar al menos 3 aspectos en relación a la

distribución de las mismas. Pinchamos en “Estadísticos”, que se encuentra en el margen superior de R commander.

Posteriormente hacemos clic en “Resúmenes”, y por último en “Distribución de frecuencias”.

Page 5: Seminario 6 trabajo blog

Paso 4: Las variables que hemos elegido son dulces y refrescos.

Page 6: Seminario 6 trabajo blog

Paso 5: Comenzaremos por la variable dulces. Hacemos clic en “dulces”, y posteriormente

en la opción “Aceptar”.

Page 7: Seminario 6 trabajo blog

Paso 6: Tras haber elegido esta variable, obtenemos los siguientes resultado que se

observan en la pantalla de R commander.

Page 8: Seminario 6 trabajo blog

Paso 7: Estos son los datos que obtenemos de la variable “dulces” en el archivo que hemos

importado a R.

A partir de estos datos podemos deducir la siguiente información:

20 personas consumen dulces a diario, lo que representa un 6’90% de la

población estudiada.

92 personas consumen dulces una vez a la semana, representando el 31’72%

de la población estudiada.

49 personas consumen dulces 3 o más veces en semana, representando el

16’90% de la población.

42 personas no consumen dulces nunca, y constituyen el 14’48% de la

población.

87 personas consumen dulces 1 o 2 veces en semana, y constituyen el 30% de

la población.

Page 9: Seminario 6 trabajo blog

Paso 8: Ahora haremos lo mismo pero con la segunda variable que hemos elegido,

refrescos.

Page 10: Seminario 6 trabajo blog

Paso 9: Obtenemos los siguientes datos que se observan en la pantalla de R

commander.

Page 11: Seminario 6 trabajo blog

Paso 10: Estos son lo datos que obtenemos de la variable “refrescos”.

A partir de estos datos podemos deducir la siguiente información:

35 personas consumen refrescos a diario, representando el 12’03% de la

población tomada para el estudio.

73 personas consumen refrescos menos de una vez en semana, representando el

25’09% de la población.

43 personas consumen refrescos 3 o más veces en semana, representando el

14’78% de la población.

73 personas no consumen refrescos nunca, representando el 25’09% de la

población.

67 personas consumen refrescos 1 o 2 veces en semanas, representando el

23’02% de la población.

Page 12: Seminario 6 trabajo blog

Paso 11: El segundo ejercicio consiste en seleccionar dos variables numéricas del fichero y mediante

resúmenes numéricos describir e interpretar la distribución de las mismas. Las variables elegidas son

medicalización y peso.

Page 13: Seminario 6 trabajo blog

Paso 12: Marcamos la variable “medicalización”, y posteriormente, hacemos clic

en “Aceptar”.

Page 14: Seminario 6 trabajo blog

Paso 13: Obtenemos los siguientes datos en la pantalla de R commander.

Page 15: Seminario 6 trabajo blog

Paso 14: Obtenemos los siguientes datos de la distribución de la variable

“medicalización”.

A partir de estos datos podemos deducir la siguiente información:

La variable “medicalización” tiene una media de 9’912351 y una desviación

típica de 1’283856.

Existen 40 casos no disponibles.

La mediana es 10, y coincide con el segundo cuartil.

La variable es simétrica ya que la media y la mediana tiene valores muy

similares, prácticamente iguales.

Page 16: Seminario 6 trabajo blog

Paso 15: Haremos lo mismo con la 2ª variable elegida, que en este caso es “peso”.

Page 17: Seminario 6 trabajo blog

Paso 16: Obtenemos los siguientes datos de la distribución de la variable “peso”.

A partir de estos datos podemos deducir la siguiente información:

La media es 62’75571 y la desviación típica 12’65981. Esto quiere decir que

los valores de peso oscilan entre 50 y 75.

Existen 16 casos no disponibles.

La mediana sería 60, y coincide con el segundo cuartil.

La variable sería simétrica, ya que la mediana y la media tienen valores muy

similares, prácticamente iguales.

Page 18: Seminario 6 trabajo blog

Paso 17: El tercer ejercicio consiste en realizar al menos un gráfico de cada tipo con variables adecuadamente

seleccionadas del fichero. Para las variables cualitativas-factor tenemos el gráfico de barras y el gráfico de sectores.

Primero vamos a realizar un gráfico de barras. Seleccionamos la opción “Gráficas” situada en el margen superior de

R commander, y posteriormente, “Gráfica de barras”.

Page 19: Seminario 6 trabajo blog

Paso 18: Vamos a realizar un gráfico de barras para la variable “cerveza”. Marcamos la variable que

queremos y hacemos clic en “Aceptar”.

Page 20: Seminario 6 trabajo blog

Paso 19: Posteriormente, aparecerá en la consola de R nuestra gráfica de barras

deseada.

Page 21: Seminario 6 trabajo blog

Paso 20: Ahora seleccionaremos la opción “Gráficas” y posteriormente, “Gráficas

de sectores”.

Page 22: Seminario 6 trabajo blog

Paso 21: Seleccionaremos una variable para representarla en la gráfica de

sectores. En este caso, elegiremos la variable “embutidos”, y hacemos clic en

“Aceptar”.

Page 23: Seminario 6 trabajo blog

Paso 22: Posteriormente, aparece esta gráfica de sectores en la consola de R, la

cual representa el hábito de consumo de los embutidos en la población estudiada.

Page 24: Seminario 6 trabajo blog

Paso 23: Podemos obtener diferentes tipos de gráficas, dependiendo de la variable que queramos

estudiar o nos interese. Ahora seleccionaremos la opción “Gráficas”, y posteriormente “Histograma”.

Page 25: Seminario 6 trabajo blog

Paso 24: Seleccionaremos la variable que queremos representar en el gráfico. En este caso,

elegiremos la variable “mantenimientohogar”, y hacemos clic en “Aceptar”.

Page 26: Seminario 6 trabajo blog

Paso 25: Obtendremos en la pantalla de la consola de R, esta representación de la variable

“mantenimientohogar” en forma de histograma.

Page 27: Seminario 6 trabajo blog

Paso 26: Por último, haremos como ejemplo de las muchas variedades de gráficas que R puede

representar, un diagrama de caja. Seleccionaremos la opción “Gráficas” y posteriormente, “diagrama

de caja”.

Page 28: Seminario 6 trabajo blog

Paso 27: Seleccionaremos la variable “altura” para representarla en el diagrama de caja.

Page 29: Seminario 6 trabajo blog

Paso 28: Obtendremos en la pantalla de la consola de R el diagrama de caja de la

variable altura.

Page 30: Seminario 6 trabajo blog

¡ESPERO QUE OS HAYA SIDO ÚTIL!