ESTADISTICA UTILIZANDO SPSS
INTEGRANTES:
Carlos Puello C.I: 13.526.963
Yohanna Torres CI:14433637 Joeli Garca C.I: 11.750.032
Barcelona, 20 Noviembre 2010
MAESTRA EN INGENIERA DE MANTENIMIENTO
GERENCIA DE SEGURIDAD Y CONFIABILIDAD
INDUSTRIAL
INTRODUCCION
Los campos de aplicacin de la estadstica son muy diferentes,
pero los mtodos son los mismos, dando lugar a la estandarizacin y
automatizacin de las tcnicas estadsticas, con una gran variedad de
programas informticos que se diferencian entre s por variados aspectos
(entornos de trabajo, capacidad, costos, etc.). Entre esta gama de
software se encuentra el SPSS, el cual es una potente herramienta para
realizar anlisis estadsticos, tiene ms de tres dcadas de existencia, fue
elaborado por Hull y Nie y quizs sea el programa informtico de
estadstica con mayor difusin a nivel mundial.
Es necesario aclarar que a pesar de la facilidad que resulta el
poder realizar clculos con gran facilidad con los modernos programas
informticos, es imprescindible que el investigador mantenga el control de
la situacin en todo momento, y sea l quien se convierta en el tomador
de decisiones; ya que el software lo nico que hace es obedecer una
orden, pero no manifiesta en ningn momento si el diseo de nuestro
estudio es el adecuado, si la tcnica es la idnea, etc., ya que presionar
un botn o dar un clic es muy sencillo, por lo que debemos estar siempre
alertas al momento de realizar nuestro anlisis estadstico.
HISTORIA
Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale
H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su
National Opinion Research Center estuvo a cargo del desarrollo,
distribucin y venta del programa. A partir de 1975 corresponde a SPSS
Inc.
Originalmente el programa fue creado para grandes computadores.
En 1970 se publica el primer manual de usuario del SPSS por Nie y Hall.
Este manual populariza el programa entre las instituciones de educacin
superior en EE. UU. En 1984 sale la primera versin para computadores
personales.
Desde la versin 14, pero ms especficamente desde la versin 15
se ha implantado la posibilidad de hacer uso de las libreras de objetos del
SPSS desde diversos lenguajes de programacin. Aunque principalmente
se ha implementado para Python, tambin existe la posibilidad de trabajar
desde Visual Basic, C++ y otros lenguajes.
El 28 de junio de 2009 se anuncia que IBM, meses despus de ver
frustrado su intento de compra de Sun Microsystems, adquiere SPSS, por
1.200 millones de dlares.1
SPSS Inc. desarrolla un mdulo bsico del paquete estadstico SPSS,
del que han aparecido las siguientes versiones:
SPSS-X (para grandes servidores tipo UNIX)
SPSS/PC (1984, en DOS. Primera versin para computador
porttil)
SPSS/PC+ (1986 (en DOS)
SPSS for Windows 6 (1992) / 6.1 para Macintosh
SPSS for Windows 7
SPSS for Windows 8
SPSS for Windows 9
SPSS for Windows 10 / for Macintosh 10 (2000)
SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
SPSS for Windows 11.5 (2002)
SPSS for Windows 12 (2003)
SPSS for Windows 13 (2004): Permite por primera vez trabajar con
mltiples bases de datos al mismo tiempo.
SPSS for Windows 14 (2005)
SPSS for Macintosh 13 (2006)
SPSS for Windows 15 (2006)
SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de
SPSS "SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]"
varios funcionarios de la empresa anunciaron previamente la salida
de la versin 16 de este software. En ella se incorpor una interfaz
basada en Java que permite realizar algunas mejoras en las
facilidades de uso del sistema.
SPSS for Macintosh 16
SPSS for Linux 16
SPSS for Windows 17 (2008): Incorpora aportes importantes como
el ser multilenguaje, pudiendo cambiar de idioma en las opciones
siempre que queramos. Tambin incluye modificaciones en el
editor de sintaxis de forma tal que resalta las palabras claves y
comandos, haciendo sugerencias mientras se escribe. En este
sentido se aproxima a los sistemas IDE que se utilizan en
programacin.
SPSS for windows 18 (2009): Cambia su denominacin de SPSS
por PASW 18.
BENEFICIOS
Aprender a manejar el SPSS tiene muchas ventajas. La primordial
es la seguridad y confianza que brinda el tener esta herramienta que
efecta los clculos ms complejos en el mundo de la estadstica de
manera eficiente y eficaz, y con un mnimo de esfuerzos. Posiblemente
esta sea la razn por la cual este programa es muy utilizado en el mundo
acadmico y laboral. Es una de las herramientas ms utilizadas en
investigacin comercial y en otros muchos campos de investigacin de las
ciencias sociales.
MANEJO DEL SPSS
A continuacin se mostrara paso a paso cada una de las funciones
del SPSS, a fin de poder familiarizarse y manejar el mismo en cada una
de sus fases.
Al comenzar una sesin de trabajo con el SPSS aparece una
ventana de apariencia similar a una hoja de Excel, que es el Editor de
Datos, tal y como se muestra en la Figura 1. Esta es la ventana principal
del SPSS, pero no la nica. Para irnos familiarizando con las diversas
funciones del programa, estudiaremos en un primer momento las diversas
ventanas y mens con que cuenta el SPSS, profundizando
posteriormente en cada uno de ellos y utilizando ejercicios prcticos para
una mejor compresin de la temtica.
En la Fig. 1 observamos en el encabezado el ttulo principal del
archivo en el cual se est trabajando, en este caso Sin ttulo, porque se
iniciar con la creacin de una base de datos. En la siguiente lnea se
tiene la barra del men con las opciones de archivo, edicin, ver, datos,
transformar, analizar, grficos, utilidades, ventaja, y ayuda (?). Luego
tenemos la barra de herramientas (ver figura 2), con cada uno de sus
conos.
En su orden, de izquierda a derecha, cada icono indica la siguiente
accin:
Abrir archivo
Guardar archivo
Imprimir
Recuperar cuadro de dilogo
Deshacer
Rehacer
Ir a grfico
Ir a caso
Variables
Buscar
Insertar casos
Insertar variable
Segmentar archivo
Ponderar casos
Seleccionar casos
Etiquetas de valor
Usar conjuntos
La lnea siguiente a la Barra de Herramientas (como se observa en
la Figura 1.3, en el crculo en rojo), indica el valor o atributo de la
variable en esa celda (fila y columna). Y el crculo en azul muestra
las solapas de vista de datos (valores en la base de datos) y vista
de variables (codificaciones realizadas para cada una de las
variables) para el fichero en el que se est trabajando en ese
instante.
Ahora veamos cada una de las opciones y subopciones que se
encuentran en la barra de men principal.
En la Figura 4 se observa la primera opcin del men, Archivo, que
incluye:
Nuevo. Crea nuevos ficheros o bases de datos, sintaxis, resultados
o de procesos
Abrir. Abre ficheros o bases de datos existentes, sintaxis,
resultados, de procesos u otros);
Abrir base de datos. Nueva consulta, editar consulta o ejecutar
consulta
Leer datos de texto. P uede transformar archivos de texto a tablas
Guardar. Guarda el archivo actual
Guardar Como. Guarda el archivo actual con otro nombre y en
otro directorio si as se quiere
Mostrar informacin de datos. Muestra los archivos de datos
posibles
Hacer cach de datos. Crea memoria para los datos que se estn
introduciendo
Imprimir Imprime la operacin actual.
Presentacin preliminar. Se visualiza en pantalla completa la
tarea actual, tal y como se imprimir
Cambiar servidor. Se tiene la posibilidad de cambiar de servidor al
que nos encontramos conectados.
Detener procesador. Interrumpe el procesamiento y anlisis de
datos en el SPSS
Datos usados recientemente Muestra un listado de los datos
utilizados mas recientemente
Archivos usados recientemente Muestra los archivos que se han
utilizado recientemente
Salir Opcin para salir del SPSS.
Luego tenemos la opcin de Edicin (Figura 5), que presenta la
siguientes subopciones:
En esta opcin tenemos las siguientes subopciones:
Deshacer Definir valor de casilla Deshace la ltima accin. Muy til
para rectificar.
Rehacer Definir valor de casilla Rehace la ltima accin deshecha
Cortar Corta la seleccin para almacenarla en el portapapeles
Copiar Copia la seleccin para almacenarla en el portapapeles
Pegar Pega el contenido del portapapeles en la ubicacin en donde se
encuentre el cursor
Pegar variables Pega la variable del portapapeles en donde se encuentre
ubicado el cursor
Eliminar Borra la seleccin
Buscar Realiza la bsqueda de datos que se especifiquen
Opciones Presenta opciones de tablas, grficos, procesos, etc.
La Figura 6 muestra la opcin Ver, y cuenta con las siguientes
subopciones:
Barra de estado (con esta opcin se activa y desactiva la barra de
estado);
Barras de herramientas (activa y desactiva las barras de herramientas);
Fuentes Con esta opcin se cambia el tamao y estilos de las fuentes.
Textos por ejemplo
Cuadrcula Con sta opcin se activa y desactiva la cuadrcula del editor
de datos
Etiquetas de valor Sita etiquetas de valor en las variables
seleccionadas
Variables Con esta opcin se activa el visor de variables en el editor de
datos)
La Figura 7 presenta la opcin Datos , que es una de las opciones
que mayor uso tienen cuando se trata de realizar anlisis con el SPSS.
Entre las subopciones tenemos las siguientes: Definir propiedades de
variables (etiqueta los valores de las variables y define otras propiedades
despus de explorar datos); Copiar propiedades de datos (permite copiar
sobre el archivo de datos de trabajo, las propiedades de un conjunto de
datos y de las variables seleccionadas); Definir fechas (Definir fechas
genera variables de fecha que se pueden utilizar para establecer la
periodicidad de una serie temporal y para etiquetar los resultados de los
anlisis de series temporales); Insertar variable (permite insertar una
variable en el editor); Insertar caso (permite insertar un caso en el editor);
Ir a caso (permite situarse en un caso determinado); Ordenar casos
(permite ordenar casos segn criterios preestablecidos); Transponer
(transpone filas por columnas en el editor de datos); Reestructurar
(reestructura los datos de varias variables columnas- en un nico caso y
convertirlos en grupos de casos relacionados filas- y viceversa); Fundir
archivos (permite mezclar archivos por casos o por variables); Agregar
(permite agregar variables a un archivo); Diseo ortogonal (admite disear
y mostrar diseos factoriales ortogonales); Segmentar archivo (admite
segmentar archivos segn ciertos criterios); Seleccionar casos (admite la
eleccin de uno o varios casos); Ponderar casos (permite la ponderacin
de casos).
La Figura 8 muestra la opcin Transformar , y contiene las
siguientes subopciones: Calcular (realiza clculos); Semilla de
aleatorizacin (fija la semilla para el clculo de nmeros aleatorios);
Contar apariciones (encuentra frecuencias absolutas de valores);
Recodificar (recodifica los valores de una variable); Categorizar variables
(convierte variables cuantitativas a cualitativas); Asignar rangos a casos
(crea nuevas variables que contienen rangos); Recodificacin automtica
(convierte los valores numricos y de cadena en valores enteros
consecutivos); Crear serie temporal (crea una variable tipo serie de
tiempo); Reemplazar valores perdidos (Reemplazar valores perdidos
creando nuevas variables); Ejecutar transformaciones pendientes (realizar
transformaciones en espera).
La opcin Analizar en la barra del men bsico contiene las
siguientes subopciones (ver figura 9): Informes, Estadsticos descriptivos,
Tablas, Comparar medias, Modelo lineal general, Modelos mixtos,
Correlaciones, Regresin, Loglineal, Reduccin de datos, Escalas,
Pruebas no paramtricas, Series temporales, Supervivencia y Respuestas
mltiples.
Se considera sta opcin del men (Analizar) como una de las ms
importantes dentro del SPSS, motivo por el cual se estudiarn cada una
de sus subopciones por separado.
La Figura 10 muestra la subopcin Informes , el cual abarca los
siguientes tems: Cubos OLAP (del ingls On-Line Analytic Processing -
Procesamiento analtico interactivo-, calcula totales, medias y otros
estadsticos univariados para variables de resumen continuas dentro de
las categoras de una o ms variables categricas de agrupacin);
Resmenes de casos (calcula estadsticos de subgrupo para las variables
dentro de las categoras de una o ms variables de agrupacin); Informe
de estadsticos en filas (genera informes en los cuales se presentan
distintos estadsticos de resumen en filas); Informe de estadsticos en
columnas (genera informes de resumen en los que diversos estadsticos
de resumen aparecen en columnas distintas).
Figura 10.
La figura 11 presenta la subopcin de Estadsticos descriptivos,
que contienen los siguientes tems: Frecuencias (muestra estadsticos y
representaciones grficas que resultan tiles para describir muchos tipos
de variables, y es un buen procedimiento para la inspeccin inicial de
datos); Descriptivos (presenta estadsticos de resumen univariados para
varias variables en una nica tabla y calcula valores tipificados,
denominados generalmente como puntuaciones Z); Explorar (genera
estadsticos de resumen y representaciones grficas, bien para todos los
casos o bien de forma separada para grupos de casos); Tablas de
contingencia (crea tablas de clasificacin doble y mltiple y, adems,
proporciona una serie de pruebas y medidas de asociacin para las tablas
de doble clasificacin); Razn (brinda una amplia lista de estadsticos de
resumen para describir la razn entre dos variables de escala, por ej.
mediana, moda, desviacin tpica, mximos y mnimos, y otros muy
usuales en investigacin).
A continuacin se tiene la figura 12, que muestra la subopcin de
Tablas, con la cual usted puede realizar todo tipo de anlisis y mostrarlos
de diversas maneras, siempre en formato de tablas. Los tems que se
incluyen ac son: Tablas personalizadas (el investigador selecciona las
variables y las medidas de resumen que aparecern en la tabla);
Conjuntos de respuestas mltiples (se utiliza para agrupar frecuencias de
respuestas por indicadores y variables); Tablas bsicas (genera tablas
con calidad de publicacin que muestran estadsticos de clasificacin
cruzada y de subgrupo); Tablas generales (se pueden generar tablas que
muestren diferentes estadsticos para distintas variables, variables de
respuestas mltiples, anidacin y apilacin mixta o totales complejos);
Tablas de respuestas mltiples (produce tablas de frecuencia y de
contingencia bsicas en las que una o ms variables es un conjunto de
respuestas mltiples); Tablas de frecuencias (permite generar tablas
especiales que contengan varias variables con los mismos valores).
Comparar medias (Figura 13), que contiene en orden respectivo:
Medias (calcula medias de subgrupo y estadsticos univariados
relacionados para variables dependientes dentro de las categoras de una
o ms variables independientes); Prueba T para una muestra (contrasta si
la media de una sola variable difiere de una constante especificada);
Prueba T para muestras independientes (compara las medias de dos
grupos de casos); Prueba T para muestras relacionadas (compara las
medias de dos variables de un solo grupo); ANOVA de un factor (este
procedimiento genera un anlisis de varianza de un factor para una
variable dependiente cuantitativa respecto a una nica variable de factor -
variable independiente-).
La figura 14 presenta la opcin de Modelo lineal general, que
incluye los siguientes apartados: Univariante (proporciona un anlisis de
regresin y un anlisis de varianza para una variable dependiente
mediante uno o ms factores o variables); Multivariante (proporciona un
anlisis de regresin y un anlisis de varianza para variables
dependientes mltiples por una o ms covariables o variables de factor);
Medidas repetidas (analiza grupos de variables dependientes
relacionadas que representan diferentes medidas del mismo atributo);
Componentes de la varianza (se emplea para modelos de efectos mixtos,
estima la contribucin de cada efecto aleatorio a la varianza de la variable
dependiente).
Posterior al Modelo lineal general, los siguientes apartados son:
Modelos mixtos (en este cuadro de dilogo le facilita al investigador
seleccionar variables que definen sujetos y observaciones repetidas, y
elegir una estructura de covarianzas para los residuos) y Correlaciones
(incluye correlaciones parciales, bivariadas y distancias).
La figura 15 presenta la subopcin de Regresin, que incluye los
siguientes apartados: Lineal (estima los coeficientes de un modelo lineal,
con una o ms variables independientes, que mejor prediga el valor de la
variable dependiente); Estimacin curvilnea (genera estadsticos de
estimacin curvilnea por regresin y grficos relacionados para varios
modelos diferentes de estimacin curvilnea por regresin); Logstica
binaria (es de mucha utilidad para los casos en los que se desea predecir
la presencia o ausencia de una caracterstica o resultado segn los
valores de un conjunto de variables predictoras); Logstica multinomial (es
til en aquellas situaciones en las que el investigador desee poder
clasificar a los sujetos segn los valores de un conjunto de variables
predictoras); Ordinal (permite dar forma a la dependencia de una
respuesta ordinal politmica sobre un conjunto de predictores, que
pueden ser factores o covariables); Probit (mide la relacin entre la
intensidad de un estmulo y la proporcin de casos que presentan una
cierta respuesta a dicho estmulo); No lineal (es un mtodo para encontrar
un modelo no lineal para la relacin entre la variable dependiente y un
conjunto de variables independientes); Estimacin ponderada (permite
calcular los coeficientes de un modelo de regresin lineal mediante
mnimos cuadrados ponderados -MCP, WLS-, de forma que se les d
mayor ponderacin a las observaciones ms precisas -es decir, aqullas
con menos variabilidad- al determinar los coeficientes de regresin);
Mnimos cuadrados en dos fases (utiliza variables instrumentales que no
estn correlacionadas con los trminos de error para calcular los valores
estimados de los predictores problemticos); Escalamiento ptimo (ampla
la aproximacin tpica mediante un escalamiento de las variables
nominales, ordinales y numricas simultneamente).
Despus de Regresin, tenemos la opcin Loglineal analiza las
frecuencias de las observaciones incluidas en cada categora de la
clasificacin cruzada de una tabla de contingencia, e incluye los
apartados de General, Logit y Seleccin del modelo .
En la figura 16 se tiene la subopcin de Clasificar, que es una de
las subopciones que mayor uso tiene cuando de realizar anlisis de
conglomerados se trata. Cuenta con los siguientes tems: Conglomerados
en dos fases (es una herramienta de exploracin que descubre las
agrupaciones naturales -o conglomerados- de un conjunto de datos que,
de otra manera, no sera posible detectar); Conglomerado de K medias
(con este procedimiento se intenta identificar grupos de casos
relativamente homogneos basndose en las caractersticas
seleccionadas y utilizando un algoritmo que puede gestionar un gran
nmero de casos); Conglomerados jerrquicos (combina los
conglomerados basndose en las caractersticas seleccionadas y los
clasifica en orden de jerarqua); Discriminante (este anlisis resulta til
para las situaciones en las que se desea construir un modelo predictivo
para pronosticar el grupo de pertenencia de un caso a partir de las
caractersticas observadas de cada uno de ellos).
Otra opcin interesante es la de Reduccin de datos, que se
observa en la figura 17, con los siguientes apartados: Anlisis factorial
(identifica variables subyacentes, o factores, que expliquen la
configuracin de las correlaciones dentro de un conjunto de variables
observadas); Anlisis de correspondencias (describe las relaciones
existentes entre dos variables nominales, recogidas en una tabla de
correspondencias, sobre un espacio de pocas dimensiones, mientras que
al mismo tiempo se describen las relaciones entre las categoras de cada
variable); Escalamiento ptimo (permite realizar escalados de las
variables, cual se tratara de un mapa).
La figura 18 presenta la opcin Escalas , con los siguientes tems:
Anlisis de fiabilidad (permite estudiar las propiedades de las escalas de
medicin y de los elementos que las constituyen); Escalamiento
multidimensional (trata de encontrar la estructura de un conjunto de
medidas de distancia entre objetos o casos); Escalamiento
multidimensional -PROXSCAL- (su propsito es encontrar la estructura
existente en un conjunto de medidas de proximidades entre objetos).
La siguiente subopcin la componen las Pruebas no
paramtricas, figura 19, entre las que se tienen las siguientes: Chi-
cuadrado (tabula una variable en categoras y calcula un estadstico de
chi-cuadrado); Binomial (compara las frecuencias observadas de las dos
categoras de una variable dicotmica con las frecuencias esperadas en
una distribucin binomial con un parmetro de probabilidad especificado.
Por defecto, el parmetro de probabilidad para ambos grupos es 0,5);
Rachas (contrasta si es aleatorio el orden de aparicin de dos valores de
una variable); K-S de 1 muestra (Prueba de Kolmogorov-Smirnov para
una muestra compara la funcin de distribucin acumulada observada de
una variable con una distribucin terica determinada, que puede ser la
normal, la uniforme, la de Poisson o la exponencial); 2 muestras
independientes (compara dos grupos de casos existentes en una
variable); K muestras independientes (realiza pruebas para varias
muestras independientes compara dos o ms grupos de casos respecto a
una variable); 2 muestras relacionadas (compara las distribuciones de dos
variables); K muestras relacionadas (compara las distribuciones de dos o
ms variables).
La figura 20 presenta las Series temporales, contiene los
siguientes tems: Suavizado exponencial (suaviza componentes
irregulares de datos de series temporales, para ello hace uso de una
variedad de modelos que incorporan diferentes supuestos acerca de la
tendencia y la estacionalidad); Autorregresin (estima un modelo de
regresin lineal con errores autorregresivos de primer orden); ARIMA
(estima modelos Arima -Modelo Autorregresivo Integrado de Media Mvil-
univariados estacionales y no estacionales, tambin conocidos como
modelos "Box-Jenkins"); Descomposicin estacional (estima factores
estacionales multiplicativos o aditivos para las series temporales).
La figura 21 nos muestra la opcin Supervivencia, que contiene
los siguientes apartados: Tablas de mortalidad (se utiliza en situaciones
en las se desea examinar la distribucin de un perodo entre dos eventos,
como por ejemplo, la duracin del empleo); Kaplan-Meier (se basa en la
estimacin de las probabilidades condicionales en cada punto temporal
cuando tiene lugar un evento y en tomar el lmite del producto de esas
probabilidades para estimar la tasa de supervivencia en cada punto
temporal); Regresin de Cox (es un mtodo para crear modelos para
datos de tiempos de espera hasta un evento con casos censurados
presentes); Cox con covariable dependiente del tiempo (denominado
tambin modelo de regresin de Cox extendido, el cual permite
especificar las covariables dependientes del tiempo).
Finalmente, en la opcin de Anlisis se tiene como una ltima
subopcin Respuestas mltiples , que est integrada por las siguientes
funciones: Definir conjuntos (agrupa variables elementales en conjuntos
de categoras mltiples y de dicotomas mltiples, para los que se pueden
obtener tablas de frecuencias y tablas de contingencia); Frecuencias ;
Tablas de contingencia.
La figura 22 presenta en forma desglosada todas las subopciones
que contiene la opcin de Grficos . Esta opcin nos permite realizar un
sinfn de grficas, de todo tipo, forma, en segunda o en tercera dimensin,
como los clsicos de barras, histogramas, de dispersin, lneas o curvas,
o los poco conocidos diagramas de caja. En esta opcin usted tiene
mucha versatilidad al momento de disear los grficos para la
presentacin de de resultados en su investigacin.
La figura 23 presenta la opcin de Utilidades dentro de la Barra del
Men Principal, y esta contiene las siguientes funciones: Variables
(muestra informacin sobre la definicin de la variable seleccionada
actualmente); Informacin del archivo (muestra en un listado las variables
de las cuales se compone el archivo); Definir conjuntos (crea
subconjuntos de variables que se muestran en las listas de origen de los
cuadros de dilogo); Usar conjuntos (restringe las variables mostradas en
las listas de origen de los cuadros de dilogo a los conjuntos
seleccionados que haya definido); Ejecutar proceso (busca y ejecuta un
archivo seleccionado, por ejemplo, una base de datos); Editor de mens
(se puede personalizar los mens utilizando este editor).
La figura 24 muestra la opcin de Ventana , que muestra las
ventanas que se encuentran activas en ese instante, tales como los
archivos o bases de datos en las que nos encontremos trabajando
actualmente, se observarn activas en sta opcin.
El software posee un completo sistema de ayuda al usuarios al que
puede accederse desde cualquier ventana o cuadro de dilogo. El
principal se encuentra en la Barra del Men Principal, que se seala en la
figura 25.
El men de Ayuda (?) de la barra de mens, incluye los siguiente:
Un sistema de ayuda por temticas que permite acceder a todos
los contenidos de la ayuda usando cuatro estrategias diferentes:
contenido, ndice, buscar y favoritos.
Un tutorial que explica, paso a paso, cmo llevar a cabo muchas
de las tareas propias del programa estadstico.
Un asesor estadstico que ayuda al usuario a decidir qu
procedimiento estadstico utilizar para analizar sus datos.
Adems de lo anterior, tambin el SPSS presenta las siguientes
opciones de ayuda:
La ayuda contextual de los cuadros de dilogo y de las tablas
pivotantes, que brinda ayuda especfica sobre los aspectos
concretos de un cuadro de dilogo o de una tabla del Visor de
resultados.
El botn de ayuda de los cuadros de dilogo, que permite ayuda
puntual sobre el procedimiento concreto del que en ese instante
trate el cuadro de dilogo.
La gua de sintaxis , que en la versin de este programa en Disco
Compacto contiene ayuda sobre la sintaxis especfica de cada
procedimiento.
El asesor de resultados , que ofrece ayuda similar al tutorial pero
referida a las diferentes partes de las tablas pivotantes del Visor de
resultados.
La figura 26 indica el proceso para obtener ayuda a travs de los
Temas. Con un simple clic usted obtiene la ventana de la derecha, y la
primera pestaa le indica una serie de temas agrupados por Contenido.
La ayuda tambin se presenta como un ndice de temas, tal y
como se observa en la figura 27.
En la figura 28 se observa la forma de realizar una Bsqueda en la
opcin de Ayuda. Lo nico que usted debe hacer es colocar una palabra
clave, tal y como seala el crculo color rojo. Luego, al obtener el listado
de temas relacionados, usted debe elegir cual es el tema que quiere
estudiar, y puede dar doble clic sobre el tema escogido o simplemente dar
un clic en la opcin de mostrar tema.
En la figura 29 se observan los Favoritos en la opcin de Ayuda.
Ac se tiene la libertad de agregar temas que a nos parezcan de inters y
se aaden a mis Favoritos. El crculo en color azul muestra el tema que el
investigador desea aadir, le da clic en el botn agregar y el crculo en
color rojo muestra la lista de temas que hasta el momento se han
agregado a los temas favoritos.
La figura 30 brinda detalles del Asesor estadstico con que cuenta
la opcin de Ayuda del SPSS. Este asesor es de gran utilidad para irnos
familiarizando con las funciones bsicas del SPSS, pero hay que tomar en
cuenta que este asesor no es un sustituto del analista de datos, de
manera que hay que tener algunas ideas claras para poder sacarle
provecho.
La figura 31 muestra la denominada ayuda contextual , la cual es
un sistema rpido para obtener ayuda rpida que brinda informacin
concreta sobre aspectos relacionados con la parte especfica del
programa desde la que se solicita la ayuda. Por ejemplo, el primer
recuadro de la figura es el dilogo de Frecuencias y el siguiente es la
Ayuda que el SPSS brinda sobre ste tema.
La figura 32 muestra otro tipo de ayuda , cuando nos encontramos
en el el recuadro con fondo amarillo. Esta es una opcin que trabajando
en el Visor de Resultados, por ejemplo en una Tabla de frecuencia ,
basta con dar un clic con el botn derecho del ratn el cuadro (grfico
figura) y obtenemos un men donde aparece la primera opcin de Qu
es esto?, y dando otro clic en sta opcin, se tiene el resultado mostrado
en SPSS resulta de suma utilidad para cuando necesitamos conocer
rpidamente un tema o asunto particular.
Otra opcin importante en el SPSS, es el Asesor de resultados , el cual
proporciona ayuda sobre el significado de las distintas partes de que
consta una tabla de resultados. Para ingresar al Asesor de resultados
usted lo puedo hacer de la siguiente manera:
Seleccione la tabla de resultados sobre la que desee obtener
ayuda, y colocndose sobre ella de doble clic con el botn
izquierdo del ratn, luego de un clic sobre el botn del Asesor de
resultados , tal y como lo muestra la figura 33b.
Seleccione la opcin Asesor de resultados en el men ayuda,
colocndose sobre la tabla de la que desee obtener ayuda, pulse
una vez el botn derecho del ratn y elija la opcin indicada (Figura
33a).
Una vez realizada cualquiera de los anteriores procedimientos, se obtiene
la Figura 34, que muestra paso a paso y en detalle, el significado de las
filas y columnas, as como define en forma precisa los conceptos
estadsticos que aparecen en dicha tabla.
Para familiarizarse an ms con el programa SPSS, se procedera
a crear una nueva base de datos. Al cargar o abrir el programa SPSS
surge un recuadro como lo muestra la figura 35(a), entonces, para crear
nuestra propia base de datos damos un clic en la opcin introducir datos
y luego clic en aceptar . Lo primero que debemos notar es que para
ingresar valores datos en el SPSS, las filas representan sujetos o casos
, en tanto que las columnas constituyen las caractersticas o atributos de
cada sujeto en una determinada variable. Esto se observa claramente en
la figura 35(b).
Ahora, el siguiente paso es ir a la vista de variables para designar
la primera variable de la investigacin. Como ejemplo se tomara dos
variables, la primera el gnero y la segunda la edad.
La figura 36 presenta dnde nos encontramos situados en este
momento. En la figura 36(a) se observa que se ha escrito el nombre de la
primera variable gnero, y se darn cuenta que al presionar la tecla de
enter, aparecen de inmediato valores en las otras casillas, lo que se ve
en la figura 36(b).
Muy bien, ahora enfoqumonos en cada una de las columnas que
aparecen en la Vista de variables, para analizar cada una de sus
propiedades.
Una vez colocado el nombre de la variable , se nos presenta el
Tipo de variable que se trate, especifica los tipos de datos de cada
variable. Por defecto se asume que todas las variables nuevas son
numricas. En nuestro caso, dejaremos la variable gnero como de tipo
cadena (alfanumrica), con una anchura de 8 caracteres (figura 37).
Uno de los puntos muy importantes y que debe ponrsele mucho
nfasis es la etiqueta , ya que as aparecer la variable en nuestras
tablas de anlisis. Continuando con el ejemplo anterior, seguiremos
trabajando con el nombre de gnero y as etiquetaremos la variable. En
algunos casos, cuando el nombre sea muy extenso, es recomendable
utilizar abreviaturas que identifiquen cada una de las variables, como por
ejemplo: latino (Latinoamericano), estud (estudiante), cirplast
(Cirujano Plstico), etc. La figura 38 nos muestra como se va
transformando hasta ahora nuestra base de datos.
Ahora pasamos a la opcin de Valores, que es donde combinamos
nmeros con palabras, que nos servir para identificar caractersticas o
atributos con un simple nmero y viceversa.
Para comenzar, damos un clic en la casilla en donde aparece hasta
el momento ninguno en valores, como se observa en la figura 39, y
aparece el recuadro de etiquetas de valor.
Cuando tenemos el recuadro, lo que debemos hacer es codificar
nombres con nmeros, asociando de esta forma un nmero para una
caracterstica o atributo del sujeto. Entonces, para nuestro caso de la
variable gnero, se designar de la siguiente forma:
Nmero 1 para femenino, y
Nmero 2 para masculino.
Una vez hecho esto, se pulsa en el botn aadir para que agregue
las nuevas etiquetas de valor. La figura 39(a) muestra este proceso.
Ahora seguimos con la opcin de perdidos . Ac se definen
valores de los datos especificados como perdidos por el usuario. A
menudo es til para saber por qu se pierde informacin. Por ejemplo,
puede desear distinguir los datos perdidos porque un entrevistado se
niega a responder, o datos perdidos porque la pregunta no afectaba a
dicho entrevistado, etc. Los valores de datos especificados como perdidos
por el usuario aparecen marcados para un tratamiento especial y se
excluyen de la mayora de los clculos. Para nuestra base de datos
ejemplo, asumiremos que no se tienen valores perdidos.
Las ltimas opciones son Alineacin y Medida (Figura 41). La
alineacin tiene que ver con la forma en que se ordena el concepto
dentro de la casilla (izquierda, centro, derecha), y la medida cataloga a
la variable como Nominal (cuando no se tiene ningn orden especificado
o el orden no interesa) , Ordinal (cuando existe una ordenacin de mayor
a menor, o viceversa) o Escala (denominadas por algunos autores
tambin como de razn, e indican que entre un atributo y otro existe la
misma diferencia o distancia, dependiendo el caso) . Para nuestro
ejemplo, la variable gnero queda catalogada con medida nominal, ya
que no tiene un ordenamiento especfico.
Ahora ya hemos completado la codificacin de nuestra variable
gnero. Procedemos a realizar lo mismo pero para la variable edad, de
esta forma haremos un repaso de todo el procedimiento, y que nos servir
para nuestro aprendizaje.
Con respecto a la variable edad, tendr un tratamiento un poco
diferente, ya que podemos reclasificarla para un mejor anlisis, de la
siguiente manera:
Joven, de 20 aos o menos (X 20)
Adulto, mayor de veinte aos y menor de 50 (20 < X < 50).
Persona mayor, de 50 aos o ms (X 50).
Entonces, comenzamos colocando el nombre a nuestra variable, tal
cual se muestra en la figura 42.
Ahora ingresaremos el tipo de la variable, que quedar como
numrica para la edad (Figura 43).
Las columnas de Anchura y Decimales no se cambiarn,
dejaremos las casillas tal cual. En Etiqueta digitaremos la palabra edad,
que as identificaremos nuestra variable (Figura 44).
Para la asignacin de valores a la variable edad , lo realizaremos
basndonos en la clasificacin anterior y con la siguiente codificacin:
1, para los jvenes (menores de 20 aos)
2, para las personas adultas (de 20 aos a 50 aos)
3, para las personas mayores (mayores de 50 aos).
Las figuras 45 muestran cmo realizara la asignacin de valores e
ingreso de los mismos.
Finalizada la operacin de asignar valores a la variable edad ,
ahora nos concentraremos en la medida que se le asignar. De
momento, las otras columnas quedarn con los valores por defecto, a
saber: perdidos, columnas y alineacin.
Si se observa detenidamente la figura 46, se notar (como ya se
dijo antes) que existen tres tipos de medida. En la variable gnero la
medida no era muy importante, pero en la actual variable (edad) si es
prioritario el asignarle un tipo de medida que nos ayude en la tipificacin
de la variable. Para este ejemplo, la variable edad tendr una medida de
carcter ordinal.
Para aquellos amigos lectores que se estn preguntando del
porqu debe elegirse una determinada medida, ya sea Escala, Ordinal o
Nominal, les diremos que esto nos ser de gran utilidad para realizar
anlisis estadsticos mucho ms profundos, que no son el fin principal de
este curso introductorio, pero que se estudiarn en el Curso Avanzado de
SPSS, que prximamente podrn ustedes ver publicado en el web site de
AulaFacil.com
Como ya tenemos codificadas las variables, ahora procedemos a
ingresar los valores de nuestra nueva base de datos, y para ello
simplemente hay que dar clic en la pestaa vista de datos como se
observa en la figura 47, siendo ah en donde ingresaremos los datos
recolectados.
Figura 47
Encontrndonos ahora en la vista de datos, ingresamos los datos
de 5 personas, que presentan estas caractersticas:
Mujer, 17 aos de edad.
Hombre, 19 aos de edad.
Hombre, 52 aos de edad.
Mujer, 24 aos de edad.
Hombre, 33 aos de edad.
Con esta informacin, ingresamos los datos tal y como se muestran
en la figura 48.
Ahora bien, con los valores ingresados, el SPSS tiene una funcin
para ver los atributos de las variables en lugar de simples nmeros, para
ello solo tenemos que ir a la opcin de etiquetas de valor y dar clic, tal y
como se observa en la figura 49(a).
La figura 49(b) muestra adems, otra opcin interesante dentro del
visor de datos cuando tenemos activada la funcin de etiquetas de valor
. Si a cualquiera de los atributos le damos un clic con el botn izquierdo
del ratn, se despliega una ventana donde nos muestra las diversas
opciones que se tienen para dicha variable. Por ejemplo, en la figura se
observa que se ha dado clic en la variable edad a uno de los atributos,
adultos, pero nos presenta el listado completo que se tiene en dicho
atributo (Jvenes, Adultos, Personas mayores).
Figura 49(b)
Para llevar a cabo en anlisis de datos en SPSS, se utiliza la
funcin Analizar del men principal, tal y como lo muestra la figura 50.
Continuando con nuestro ejemplo, realizaremos el anlisis de nuestra mini
base de datos, haremos uso de la funcin Analizar , luego elegiremos
Estadsticos descriptivos y ah seleccionaremos Frecuencias , dando
un clic en esta ultima opcin. Todo esto se ilustra en la figura 50.
Al dar clic en Frecuencias, aparece el recuadro que se observa en
la figura 51. Ah tenemos las opciones de Estadsticos, Grficos y
Formato.
La primera opcin que seleccionamos es Estadsticos, como
puede verse en la figura 51(a). Los Estadsticos se encuentran
clasificados en cuatro grandes reas: Valores percentiles (Cuartiles,
Puntos de corte, Percentiles); Tendencia central (Media, Mediana, Moda,
Suma); Dispersin (Desviacin tpica, Varianza, Ampitur, Mnimo,
Mximo, E. T. Media); Distribucin (Asimetra, Curtosis). Nosotros
seleccionaremos con un simple clic aquellos estadsticos sean de inters
para el propsito de nuestra investigacin. La figura 51(a) muestra
algunos indicadores que se han elegido y luego de la seleccin, basta dar
un clic en el botn Continuar .
Cuando ya hemos elegido las opciones estadsticas para nuestro
anlisis, seguimos con el siguiente botn de Frecuencias , que es
Grficos , lo que se observa en la figura 51(b).
Finalmente, en la figura 51(c) se muestra como elegir el formato
para nuestra tabla de anlisis, ya sea ordenando los valores en forma
ascendente o descendente, comparando variables, etc.
Ahora procederemos a elegir las variables que deseamos analizar.
En la figura 52 hemos seleccionado las dos variables de nuestro estudio:
Gnero y Edad.
El Visor del SPSS muestra los resultados finales, e incluye tablas,
grficos, estadsticas, etc., dependiendo de las indicaciones que nosotros
le hayamos incluido. La Figura 53 presenta la pantalla del visor de
resultados.
Las figuras 53(a), 53(b) y 53(c) presentan todos los resultados
obtenidos en el visor de resultados del SPSS, de las dos variables con
sus respectivos estadsticos y grficos.
Cuando tenemos los resultados, podemos copiar alguna tabla o
grfico que nos interese, y pegarlo en otra aplicacin, por ejemplo, en
Word. El procedimiento para realizar esto es muy sencillo, y se vislumbra
en la figura 54. Ubicamos el puntero del ratn sobre la tabla o grfico que
deseamos copiar, damos clic con el botn derecho y se despliega un
men, entonces elegimos la opcin copiar (o cortar) y con esto nos queda
guardada la tabla o el grfico en el portapapeles, para pegarlo donde
deseemos.
Las tablas que se han presentado hasta el momento presentan
tabulaciones sencillas, es decir, en donde solo se analizan las variables
con sus atributos o caractersticas, pero cuando de investigacin se trata,
deben realizarse anlisis ms profundos, y la tabulacin cruzada de datos
nos ofrece profundizar ms al comparar dos o ms variables entre s.
Para realizar una tabulacin cruzada en el SPSS, debemos ir a la Barra
de Men Principal, en la opcin de Estadsticos descriptivos, y ah
elegimos la opcin de Tablas de contingencia, como se muestra en la
figura 55. Al pulsar en la opcin Tablas de contingencia se obtienen las
figuras 55(a) y 55(b), donde se observa el proceso para tratar las
variables a analizar en forma cruzada.
La figura 56 surge al dar un clic en el botn Estadsticos en la
Tabla de contingencia. En la opcin de Estadsticos se pueden calcular
muchos indicadores, dependiendo de las caractersticas propias de las
variables que estemos estudiando, de tal forma que podemos: calcular el
Chi-cuadrado, Correlaciones, Variables Nominales (Coeficiente de
contingencia, Phi y V de Cramer, Lambda, Coeficiente de incertidumbre),
Variables Ordinales (Gamma, d de Somers, Tau-b de Kendall, Tau-c de
Kendall), Nominal por Intervalo (coeficiente Eta), ndice de Kappa,
Coeficiente de Riesgo, Coeficiente de McNemar), y los Estadsticos de
Cochran y de Mantel-Haenszel. Al seleccionar los coeficientes que
deseemos, el paso siguiente es dar un clic en el botn de Continuar ,
con lo que se guardan todos los cambios realizados y se pasa ala
siguiente etapa.
Tambin tenemos la opcin de elegir los datos que queremos en
las casillas de nuestra tabulacin cruzada, como se ve en la figura 57. Al
dar un clic en el botn de Casillas , aparece un recuadro con las
siguientes opciones: Frecuencias (Observadas, Esperadas); Porcentajes
(Fila, Columna, Total) y Residuos (No tipificados, Tipificados, Tipificados
corregidos). Para seleccionar las opciones presentadas, simplemente
debemos dar un clic a las casillas que nos interese que aparezcan en
nuestra tabla, y cuando hayamos terminado, entonces basta dar un clic al
botn Continuar.
La ltima opcin dentro de la Tabla de Contingencia es el Formato
, y nos da a elegir si los datos de nuestra tabla los queremos ordenados
en forma ascendente o descendente. Luego pulsamos en el botn
continuar, tal y como lo muestra la figura 58.
Ahora que ya hemos realizado todas las operaciones, y colocado
las opciones que deseamos para nuestra tabla cruzada, falta activar dos
opciones ms: la primera, si queremos que se nos muestren los grficos
de barras agrupadas, y la segunda, si deseamos que en el visor de
resultados se supriman las tablas. Luego de esto, el siguiente paso es
pulsar en el botn de Aceptar , y con eso ya estamos listos para
observar los resultados en el visor. Todo esto que se ha comentado se
observa detenidamente en la figura 59.
En la figura 60(a) se observa el visor de resultados, tal y como
aparece en el SPSS despus de realizar el procedimiento arriba descrito.
Presenta un resumen de los casos, la tabla de contingencia, los
indicadores estadsticos que se solicitaron, y brevemente realiza
comentarios o anotaciones sobre cada caso.
Las figuras 60(b) y 60(c) tambin muestran los resultados del visor
del SPSS. En la figura 60 (b) se presenta la tabla de contingencia entre
las variables que nosotros seleccionamos, gnero y edad , as como las
pruebas del estadstico Chi-cuadrado . Si nos fijamos detenidamente, la
tabla de contingencia muestra mucha ms informacin de la que nos
brindara una simple tabulacin cruzada, por lo que para nosotros cuando
realicemos una investigacin, resulta primordial realizar cruces de
variables, de las principales variables que tengamos en nuestro estudio,
a travs de las tablas de contingencia.
La figura 60(c) presenta el resto de medidas estadsticas de
nuestra investigacin. Como la muestra es demasiado pequea (N=5),
tomaremos el anlisis de los coeficientes estadsticos solo como un
ejemplo.
Para quienes estemos acostumbrados a trabajar en programas
como Excel, Word, etc., no tendremos ninguna dificultad en abrir un
fichero de datos en el SPSS, ya que se hace de la misma manera. La
forma ms sencilla es ir al botn abrir de la barra de herramientas, y se
abre un recuadro tal cual se observa en la figura 61. Adems de abrir
archivos con extensin *.sav (que es la extensin propia del SPSS),
tenemos las opciones de abrir archivos de texto, Lotus, Excel, y otros
ms, lo que muestra lo multifactico que es este programa para trabajar
con bases de datos.
En la figura 62 se ha elegido para abrir un archivo de Excel, y lo
nico que falta es dar clic en el botn de abrir para cargar el archivo,
pero en la vista de datos del SPSS.
La figura 63 nos muestra el proceso que debe seguirse para
guardar informacin en el SPSS. En primera instancia, nos vamos al
men Archivo , y se nos despliega un men, en el cual recomiendo se
elija la opcin de Guardar como , y aparece un recuadro en donde nos
pide la ubicacin en la que deseamos guardar el archivo (disco C, disco
A, Memoria flash, etc.), y adems nos solicita que le indiquemos en que
formato o extensin deseamos guardar el archivo (Excel, Lotus, etc.). Una
vez realizado esto, el siguiente paso es pulsar en el botn de Guardar del
recuadro, y nuestro archivo ya se encuentra salvado.