ESTADÍSTICA Y TIC
SEMINARIO 5
Lucía Mayo Garrucho1º Enfermería Grupo B. Macarena. Subgrupo 7Estadística y TICFacultad de enfermería, fisioterapia y podologíaUniversidad de Sevilla
ACTIVIDAD 1
ESTE ES EL FICHERO CON EL QUE VAMOS A TRABAJAR
Crear una nueva variable (IMC) a partir de dos variables que ya conocemos (talla y peso) y decodificar en distinta variable.
1.1 crear una variable a partir de otras variables.
*SPSS nos permite crear una variable a partir de una cuenta aritmética y dos o mas variables que ya tenemos en el fichero.
*El índice de masa corporal es una variable cuantitativa pues es una medida y es discreta.
a) Clicamos en TRANSFORMAR (contiene comandos para que SPSS trabaje con datos que ya tiene)CREAR VARIABLE
b)Introducimos el nombre de la variable en VARIABLE DE DESTINO y ponemos la fórmula con las variables que ya teníamos, así obtendremos la nueva variable (IMC en este caso).
IMC=
*Es importante que pongamos la etiqueta a la nueva variable y pongamos su medida correspondiente. En este caso será escala pues es una variable cuantitativa continua (es una medida).
1.2 Decodificar en distinta variable
*Normalmente con los números del IMC no nos ‘’entendemos’’ y es aconsejable categorizarla. Para ello vamos a decodificar en distinta variable (vamos a crear otra variable a partir de esta)
a) Clicar en TRANSFORMAR RECODIFICAR EN DISTINTAS VARIABLES (Vamos a crear otra variable codificada)
-creamos una variable nueva a partir de la de IMC. -La llamamos CAT_IMC y le ponemos como etiqueta “índice de masa corporal categorizado”.
b) Clicar en VALORES ANTIGUOS Y NUEVOS entonces metemos en los rangos los valores entre los que se encuentra cada categoría y en valor le damos un número (1,2,3…) que luego nos servirá para categorizar variable de conjunto de números.
*Vamos a categorizar grupos de números (entre tal y tal numero) le ponemos un valor (que luego tendrá un nombre)
Valores antiguos y nuevos
*A esta nueva variable le quitamos los decimales pues esta categorizada y no tiene sentido que haya decimales
*la medida en este caso será ordinal pues si bien es una medida, esta categorizada y NO CAMBIA LA NATURALEZA DE LA VARIABLE SI NO DE LA MEDIDA. Como esta categorizada y se establece un orden entre los distintos valores pues será ordinal.
c) Ahora codificamos los distintos valores (1-7) a los que antes le hemos asignado un conjunto de números a cada uno, para que esos numero ahora signifiquen una categoría determinada que cualquier persona pueda entender.
ACTIVIDAD 2Crear una tabla cruzada con una variable nominal y otra variable nominal, y crear otra tabla cruzada con una variable nominal y otra ordinal.
-Para crear una tabla cruzada debemos: clicar en ANALIZAR ESTADÍSTICOS DESCRIPTIVOS TABLAS CRUZADAS
2.1 Tabla cruzada para variable nominal y otra variable nominal *vamos a hacer una tabla 2x2 para dos variables de tipo nominal
a)Introducimos las variables en las filas y columnasFilas: sexoColumna: hábito tabáquico
b) Clicamos en mostrar en gráficos coagrupados
SexoHabito tabáquico
Mostrar en gráficos coagrupados
2.2 Tabla cruzada para variable nominal y otra variable ordinal
*vamos a hacer una tabla de 2X2 con una variable nominal y otra variable ordinal: -seguimos el mismo proceso de antes pero ahora las variables son sexo e IMC.Filas: sexoColumna: índice de masa corporal categorizado
Sexo
IMC categorizado
Mostrar en gráficos coagrupados
ACTIVIDAD 3Elaborar Gráficos ‘’cuadro de diálogos antiguos’’ a partir de las variables del fichero de datos.
Para elaborar gráficos vamos a utilizar la herramienta ANALIZAR
3.1 Gráfico para datos cuantitativos*Con las variables de tipo cuantitativo es recomendable trabajemos con frecuencias… si no nos darán tablas muy grandes no útiles ni visuales.
Proceso:a) Clicar en ANALIZARb) Clicar en ESTADÍSTICOS DESCRIPTIVOSc) Clicar en FRECUENCIAS
ANALIZARESTADÍSTICOS DESCRIPTIVOSFRECUENCIAS
d) Introducimos variables cuantitativas que queremos en el gráficoe) Clicamos en ESTADÍSTICOS. Aquí indicamos que se incluyan -los cuartiles-La tendencia central media-la desviación estándar
f)Clicamos en GRÁFICOS (Creamos un grafico). Como se trata de una variable de tipo cuantitativa no vale tipo redondo, ni el de barras pues serian muchos valores, para variables de tipo cuantitativo es aconsejable el histograma. Tambié n clicamos la opción de MOSTRAR CURVA NORMAL EN EL HISTOGRAMA (para obtener una curva que hará mas intuitivo y visual el Histograma.
Frecuencia PorcentajePorcentaje
válidoPorcentaje acumulado
15 1 ,4 ,4 ,4
16 3 1,3 1,3 1,7
17 1 ,4 ,4 2,1
18 6 2,5 2,5 4,6
19 2 ,8 ,8 5,4
20 3 1,3 1,3 6,7
21 8 3,3 3,3 10,0
22 4 1,7 1,7 11,7
23 6 2,5 2,5 14,2
24 6 2,5 2,5 16,7
25 3 1,3 1,3 17,9
26 4 1,7 1,7 19,6
27 6 2,5 2,5 22,1
28 4 1,7 1,7 23,8
29 4 1,7 1,7 25,4
30 5 2,1 2,1 27,5
31 8 3,3 3,3 30,8
32 5 2,1 2,1 32,9
33 2 ,8 ,8 33,8
34 6 2,5 2,5 36,3
35 6 2,5 2,5 38,8
36 6 2,5 2,5 41,3
37 5 2,1 2,1 43,3
38 3 1,3 1,3 44,6
39 6 2,5 2,5 47,1
40 8 3,3 3,3 50,4
41 6 2,5 2,5 52,9
42 5 2,1 2,1 55,0
43 3 1,3 1,3 56,3
44 5 2,1 2,1 58,3
46 3 1,3 1,3 59,6
47 5 2,1 2,1 61,7
48 2 ,8 ,8 62,5
49 1 ,4 ,4 62,9
50 2 ,8 ,8 63,8
51 3 1,3 1,3 65,0
52 3 1,3 1,3 66,3
53 6 2,5 2,5 68,8
54 3 1,3 1,3 70,0
55 3 1,3 1,3 71,3
56 3 1,3 1,3 72,5
57 5 2,1 2,1 74,6
58 7 2,9 2,9 77,5
59 3 1,3 1,3 78,8
60 1 ,4 ,4 79,2
61 6 2,5 2,5 81,7
62 4 1,7 1,7 83,3
63 3 1,3 1,3 84,6
64 6 2,5 2,5 87,1
65 7 2,9 2,9 90,0
66 8 3,3 3,3 93,3
67 2 ,8 ,8 94,2
68 7 2,9 2,9 97,1
69 7 2,9 2,9 100,0
Total 240 100,0 100,0
Edad
Válido
Frecuencia PorcentajePorcentaje
válidoPorcentaje acumulado
39,00 1 ,4 ,4 ,4
40,00 1 ,4 ,4 ,8
45,00 2 ,8 ,8 1,7
46,00 2 ,8 ,8 2,5
46,20 1 ,4 ,4 2,9
48,50 1 ,4 ,4 3,3
48,70 1 ,4 ,4 3,8
49,00 1 ,4 ,4 4,2
50,00 3 1,3 1,3 5,4
50,80 2 ,8 ,8 6,3
51,00 2 ,8 ,8 7,1
52,00 1 ,4 ,4 7,5
52,80 1 ,4 ,4 7,9
53,00 5 2,1 2,1 10,0
53,80 1 ,4 ,4 10,4
54,00 3 1,3 1,3 11,7
54,60 1 ,4 ,4 12,1
55,00 3 1,3 1,3 13,3
55,30 1 ,4 ,4 13,8
55,70 1 ,4 ,4 14,2
56,00 2 ,8 ,8 15,0
56,50 2 ,8 ,8 15,8
57,00 6 2,5 2,5 18,3
57,50 1 ,4 ,4 18,8
57,70 1 ,4 ,4 19,2
58,30 1 ,4 ,4 19,6
58,50 2 ,8 ,8 20,4
58,70 1 ,4 ,4 20,8
58,80 1 ,4 ,4 21,3
59,00 2 ,8 ,8 22,1
60,00 1 ,4 ,4 22,5
60,30 1 ,4 ,4 22,9
60,50 3 1,3 1,3 24,2
61,00 4 1,7 1,7 25,8
61,50 1 ,4 ,4 26,3
61,80 2 ,8 ,8 27,1
62,00 4 1,7 1,7 28,8
62,20 1 ,4 ,4 29,2
62,30 1 ,4 ,4 29,6
62,50 2 ,8 ,8 30,4
63,00 5 2,1 2,1 32,5
63,70 1 ,4 ,4 32,9
63,80 1 ,4 ,4 33,3
64,00 6 2,5 2,5 35,8
64,50 2 ,8 ,8 36,7
64,70 1 ,4 ,4 37,1
64,80 1 ,4 ,4 37,5
65,00 7 2,9 2,9 40,4
65,40 1 ,4 ,4 40,8
65,50 1 ,4 ,4 41,3
66,00 4 1,7 1,7 42,9
66,50 1 ,4 ,4 43,3
67,00 3 1,3 1,3 44,6
67,20 1 ,4 ,4 45,0
67,30 1 ,4 ,4 45,4
67,80 2 ,8 ,8 46,3
68,00 5 2,1 2,1 48,3
68,50 2 ,8 ,8 49,2
68,70 1 ,4 ,4 49,6
Peso medido en consulta
VálidoFrecuencia Porcentaje
Porcentaje válido
Porcentaje acumulado
1,40 1 ,4 ,4 ,4
1,41 2 ,8 ,8 1,3
1,42 1 ,4 ,4 1,7
1,43 2 ,8 ,8 2,5
1,44 2 ,8 ,8 3,3
1,45 1 ,4 ,4 3,8
1,46 2 ,8 ,8 4,6
1,47 1 ,4 ,4 5,0
1,48 3 1,3 1,3 6,3
1,49 3 1,3 1,3 7,5
1,50 6 2,5 2,5 10,0
1,51 9 3,8 3,8 13,8
1,52 5 2,1 2,1 15,8
1,53 2 ,8 ,8 16,7
1,54 5 2,1 2,1 18,8
1,55 10 4,2 4,2 22,9
1,55 1 ,4 ,4 23,3
1,56 1 ,4 ,4 23,8
1,56 15 6,3 6,3 30,0
1,57 11 4,6 4,6 34,6
1,58 12 5,0 5,0 39,6
1,59 11 4,6 4,6 44,2
1,60 10 4,2 4,2 48,3
1,61 4 1,7 1,7 50,0
1,62 12 5,0 5,0 55,0
1,63 1 ,4 ,4 55,4
1,63 9 3,8 3,8 59,2
1,64 10 4,2 4,2 63,3
1,65 1 ,4 ,4 63,8
1,65 11 4,6 4,6 68,3
1,66 2 ,8 ,8 69,2
1,67 4 1,7 1,7 70,8
1,68 8 3,3 3,3 74,2
1,69 7 2,9 2,9 77,1
1,70 6 2,5 2,5 79,6
1,71 7 2,9 2,9 82,5
1,72 5 2,1 2,1 84,6
1,73 9 3,8 3,8 88,3
1,74 2 ,8 ,8 89,2
1,75 3 1,3 1,3 90,4
1,76 2 ,8 ,8 91,3
1,77 3 1,3 1,3 92,5
1,78 2 ,8 ,8 93,3
1,79 2 ,8 ,8 94,2
1,80 4 1,7 1,7 95,8
1,81 3 1,3 1,3 97,1
1,82 1 ,4 ,4 97,5
1,83 3 1,3 1,3 98,8
1,84 2 ,8 ,8 99,6
1,88 1 ,4 ,4 100,0
Total 240 100,0 100,0
Altura
Válido
3.1 Gráfico para datos cualitativos
a)Clicamos en ANALIZAR
b)Clicamos en ESTADÍSTICOS DESCRIPTIVOS
c)Clicamos en DESCRIPTIVOS
ANALIZARESTADÍSTICOS DESCRIPTIVOS
DESCRIPTIVOS
Una vez abierta frecuencia:
d) Incluir las variables de las que queremos hacer la gráfica
EDAD
HABITO TABÁQUICO
RESULTADOS DE DESCRIPTIVOS PARA VARIABLES CUALITATIVAS
e) una vez que lo tenemos usamos la herramienta EXPLORAR para que se nos describa la relación entre dos variables es decir. Vamos a decirle que me calcule los percentiles (ESTADÍSTICOSPERCENTILES) y los gráficos (ambos).ANALIZA
RESTADÍSTICOS DESCRIPTIVOS
EXPLORAR
PERCENTILES
Percentilesa,b
Indice de masa corporal
categorizado
Percentiles
5 10 25 50 75 90 95
Promedio
ponderado(Definición 1)
Edad DELGADEZ MODERADA 21,00 21,00 21,00 23,00 . . .
NORMOPESO 18,00 20,00 24,00 32,50 41,00 60,50 65,00
SOBREPESO 19,80 23,20 31,00 44,00 58,00 65,00 66,80
OBESIDAD GRADO I 21,40 27,00 39,00 55,00 64,00 68,00 69,00
OBESIDAD GRADO II 25,00 30,60 41,00 54,00 64,00 67,60 .
OBESIDAD GRADO III 41,00 41,00 53,00 66,00 67,50 . .
Bisagras de Tukey Edad DELGADEZ MODERADA 22,00 23,00 29,50
NORMOPESO 24,00 32,50 41,00
SOBREPESO 31,50 44,00 58,00
OBESIDAD GRADO I 39,50 55,00 64,00
OBESIDAD GRADO II 43,00 54,00 62,00
OBESIDAD GRADO III 65,00 66,00 67,00
a. Edad es constante cuando Indice de masa corporal categorizado = DELGADEZ SEVERA. Se ha omitido.
b. Edad es constante cuando Indice de masa corporal categorizado = DELGADEZ ACEPTABLE. Se ha omitido.
CONCLUSIÓN: Hay una relación directamente proporcional entre el EDAD Y PESO
RESULTADOS CON VARIABLES SEXO Y PESO
Resumen de procesamiento de casos
Sexo
Casos
Válido Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Peso medido en
consulta
Masculino 87 100,0% 0 0,0% 87 100,0%
Femenino 153 100,0% 0 0,0% 153 100,0%
Percentiles
Sexo
Percentiles
5 10 25 50 75 90 95
Promedio ponderado(Definición
1)
Peso medido en consulta Masculino 55,8000 61,8000 66,0000 77,0000 88,5000 96,6000 103,3000
Femenino48,6400 51,4000 57,0000 65,0000 74,0000 86,3000 95,8100
Bisagras de Tukey Peso medido en consulta Masculino 66,5000 77,0000 88,2500
Femenino 57,0000 65,0000 74,0000
-A Continuación hemos hecho lo mismo pero con las variables SEXO y Peso. Estos son los resultados.
RESUMEN
PERCENTILES
Descriptivos
Sexo Estadístico Error estándar
Peso medido en consulta Masculino Media 77,8011 1,52032
95% de intervalo
de confianza
para la media
Límite
inferior
74,7789
Límite
superior
80,8234
Media recortada al 5% 77,5591
Mediana 77,0000
Varianza 201,089
Desviación estándar 14,18059
Mínimo 45,00
Máximo 115,00
Rango 70,00
Rango intercuartil 22,50
Asimetría ,321 ,258
Curtosis -,171 ,511
Femenino Media 67,1948 1,09317
95% de intervalo
de confianza
para la media
Límite
inferior
65,0350
Límite
superior
69,3545
Media recortada al 5% 66,6064
Mediana 65,0000
Varianza 182,838
Desviación estándar 13,52176
Mínimo 39,00
Máximo 108,50
Rango 69,50
Rango intercuartil 17,00
Asimetría ,682 ,196
Curtosis ,311 ,390
DESCRIPTIVOS
GRÁFICOS DE CAJAS Y BIGOTES