Guía SPSS v19 Apuntes de clases

download Guía SPSS v19 Apuntes de clases

of 29

Transcript of Guía SPSS v19 Apuntes de clases

2011

Apuntes de clases para guiar el uso del programa SPSS:Prcticas de estadstica bsicaUn primer intento de resumir la estadstica bsica a modo de apuntes de clases para facilitar a otros interesados en aplicar esta herramienta en investigaciones de biologa y ecologa. Para utilizar este documento obligatoriamente leer los siguientes modelos estadsticos: t para grupos independientes y relacionados, Anova de una y de dos vas, Correlacin de Pearson y Spearman, Regresin, Prueba de Mann-Whitney, Kruskal-Wallis, Friedman y Wilcoxon. Tener bases en la utilizacin de Diseo de investigacin.

Jos Carlos Herrera-Flores Docente de la UAGRM 10/08/2011

1

Apuntes de clases para guiar el uso del programa SPSS:Prcticas de estadstica bsica

Un primer intento de resumir la estadstica bsica a modo de apuntes de clases para facilitar a otros interesados en aplicar esta herramienta en investigaciones de biologa y ecologa. Para utilizar este documento obligatoriamente leer los siguientes modelos estadsticos: t para grupos independientes y relacionados, Anova de una y de dos vas, Correlacin de Pearson y Spearman, Regresin, Prueba de Mann-Whitney, Kruskal-Wallis, Friedman y Wilcoxon. Tener bases en la utilizacin de Diseo de investigacin.

M. Sc. Jos Carlos Herrera-Flores Docente de la UAGRM Santa Cruz de la Sierra - Bolivia 10/08/2011

2

I. INTRODUCCIN La estadstica es una herramienta que ayuda describir datos de acuerdo al diseo y principalmente de acuerdo a la pregunta de investigacin que corresponde o responde a una necesidad o problema que se requiere solucionarse con fines biolgicos, ecolgicos y socioeconmicos. Por lo anterior, para ejecutar los modelos estadsticos descriptivos e inferenciales se necesita conocer, como requisito: primero, la pregunta de investigacin y segundo el diseo de investigacin. Sin conocimiento de estos dos la investigacin no tiene validez su aplicacin. En este manual se asume que el alumno conoce estos dos requisitos. Por lo tanto se describe a continuacin en la forma que se ejecuta el SPSS de manera bsica en trabajos de biologa y ecologa. Principalmente se da a conocer las siguientes partes: introduccin al programa SPSS, manejo de base de datos, utilizacin estadsticos descriptivos, estadsticos inferencias (paramtricos y no paramtricos). Tambin se da a conocer la transformacin de datos.

II. INTRODUCCIN AL PROGRAMA Opciones para abrir diferentes archivos que corresponden a distintos formatos. Abrir nuevos archivos de Datos, Sintaxis, Resultado y Proceso. Archivo Nuevo Datos

Abrir archivos existentes en diferentes formatos, como el Excel, las opciones son Datos, Sintaxis, Resultados y Proceso. Archivo Abrir Datos

3

Exportar archivos del Excel

Indicar el rango de los datos existentes en Excel

4

Pantalla que muestra la base de datos extrados de Excel

Pantalla que muestra las caractersticas de diferentes tipos de variables

5

Pantalla que muestra los resultados de los anlisis estadsticos

6

III. ESTADSTICA DESCRIPTIVA a) FRECUENCIAS Analizar Estadsticos descriptivos Frecuencias La ventana de Frecuencias genera cuatro subventanas: Estadsticos, Grficos, Formato y Bootstrap. La ventana Estadsticos ofrece cuatro tipos de estadsticos: Valores percentiles, Tendencia central, Dispersin y Distribucin. La ventana de Grficos slo ofrece Grficos de barras, Grficos de barras (tortas) e Histogramas, este ltimo con opcin a curva normal, slo para variables continuas. Ventana principal

La ventana de Formato da la posibilidad de ordenar los valores, comparar variables y organizarlas.Categrica Ordinal Cuantitativa Tendencia central Media Mediana Moda Dispersin Desviacin estandar Varianza Error Tipo Rando amplitud Distribucin Asimtrica Curtosis Grfico Barra Torta Normal X X X X X X X X X X X X X X X

X

X X

X

En la caracterizacin de datos, utilizando estadstica de tendencia central, percentiles, dispersin, distribucin y grficos, se considera los tipos de variables: Categrica, Ordinal y Cuantitativa, por ejemplo las variables categricas no se pueden someter a pruebas de Dispersin. Estas reglas en general estn en el cuadro izquierdo.

7

Resultados de estadstica descriptiva FRECUENCIASStatisti cs DAP N Valid Missing

Mean Std. Error of Mean Median Mode Std. Dev iation Variance Skewness Std. Error of Skewness Kurt osis Std. Error of Kurtos is Range Minimum Max imum Sum Percentiles 25 50 75

196 0 32, 3184 1, 05860 33, 1000 31, 50 14, 82033 219,642 ,644 ,174 1, 342 ,346 88, 50 6, 10 94, 60 6334,40 19, 7500 33, 1000 40, 7750

Estadstica de tendencia central son Media (Mean), Mediana (Median) y Moda (Mode); de dispersin son desviacin estndar (Std. Deviation), varianza (Varience), rango o amplitud (Range), mximo y mnimo; de distribucin son curtosis (Kurtosis) y asimtrica (Skewness). Las decisiones de normalidad, con valores de asimetra y curtosis, se realizan con el valor de 1,96. Valores calculados mayores a +1,96 y menores a -1,96 significa que no son normales. Pero los valores calculados que estn entre -1,96 y +1,96 significan que son normales (la muestra).

En los resultados se tiene Frecuencia, Porcentaje de lo que representa la frecuencia y el Porcentaje acumulativo. Es til para conocer los datos que se repiten, la frecuencia y el porcentaje que representa con respecto a los dems datos.

Muestra una distribucin de los datos, con respecto a la normalidad. Adems agrega datos de Media, Desviacin estndar (Std. Dev.) y el nmero de casos (N); aunque estos mismos datos se repiten en el cuadro de arriba. Esta opcin de grficos tambin muestra grficos de barra y torta. Para aplicar estos grficos se encuentran descritos en la parte final de la hoja anterior.

8

b) DESCRIPTIVOS Analizar Estadsticos descriptivos Descriptivos

Ventana principal

Este estadstico muestra resultados iguales al estadstico que se describi en Frecuencias, interpretndose de forma similar; PERO, con una diferencia, esta opcin es slo para variables continas.

9

c) EXPLORAR Analizar Estadsticos descriptivos Explorar Explorar abre una ventana, donde se coloca una variable dependiente y en la otra la variable categrica u ordinal.

Ventana principal

La ventana principal da opcin a otras subventanas: Estadsticos, Grficos, Opciones y Bootstrap. Tambin da una opcin rpida de salida de resultados: Estadsticos, Grficos o Ambos anteriores. Por omisin viene sealado en Ambos, como se muestra en el grfico (Both).

Descriptivos: tiene opcin para la estadstica descriptiva, pero no tiene opcin para elegir estadstica de tendencia central o dispersin. Estimadores robustos centrales M: es la media ponderada que recibe poca influencia de los valores extremos, los estimadores son Huber, Andrew, Hampel y Tukey. Valores atpicos: se muestran los 5 valores ms extremos. Percentiles: son aplicados de acuerdo a los datos, con diferentes mtodos. Esta opcin muestra Diagramas de caja, Descriptivos (De tallo y hojas e Histograma), Grficos con pruebas de normalidad y homogeneidad de varianzas (Transformada o no transformada).

10

Resultados de estadstica descriptiva EXPLORAR Gua principal para A,B,C

A

B

C

D

E

F

G

H I J A= Resumen de los casos, B= Estadstica descriptiva, C= Pruebas de normalidad, D= Homogeneidad de varianza, E= Histograma, F= Tallo y hojas, G= Q-Q normal (puntos alineados a la lnea significa normal), H= Tendencia Q-Q (puntos al azar significa normalidad), I= Grfico de caja (se observan puntos extremos), y J= Pendiente. 11

d) TABLAS DE CONTINGENCIA (Chi-cuadrado) Pruebas para frecuencias Primero se da peso a las frecuencias: Datos Segmentar archivo

Analizar Estadsticos descriptivos Tablas de contingencia

El estadstico tiene opcin para cuatro ventanas, las principales son: Estadsticos y Casillas. La primera ofrece modelos que estn basados en asociacin. La segunda da forma a las celdas de los resultados.

12

IV. PRUEBAS PARAMTRICAS Los modelos deben cumplir con los siguientes puntos principales: los datos deben ser normales, las varianzas en los que se comparan deben ser similares. a) T PARA MUESTRAS INDEPENDIENTES (t para dos grupos independientes) Analizar Comparar medias Prueba T para muestras independientes

Ventana principal

RESULTADOS

Pruebas de significancia

Una forma de interpretar es lo siguiente: Los dimetros mayores y menores del tallo de un pino son similares en los bosques de Canad (t=0,537; df=194; p=0,592).

13

b) T PARA MUESTRAS RELACIONADAS (t pareada) Analizar Comparar medias Prueba T para muestras relacionadas

Se desplaza una ventana principal.

En esta ventana se puede colocar ms de un par de anlisis. Ahora con A20022003, pero se puede agregar otro, como B2003-C2004, y sucesivamente.

RESULTADOS

Para cada par saca un estadstico descriptivo simple.

Es la correlacin de Pearson el que es estudiado ms adelante.

Cuadro principal de este anlisis relacionado, o t pareado. El crecimiento diamtrico del isigo es significativo entre el ao 2002 y 2003 (t= -12,7; df=310; p