Carla Rodríguez Francisco Álvarez Métodos Cuantitativos Capitulo 9, SPSS para Windows.

Post on 28-Jan-2016

245 views 0 download

Transcript of Carla Rodríguez Francisco Álvarez Métodos Cuantitativos Capitulo 9, SPSS para Windows.

• Carla Rodríguez• Francisco Álvarez

Métodos Cuantitativos Capitulo 9, SPSS para Windows

Obtener funciones lineales de las variables independientes

Clasificar individuos en una de las subpoblaciones por los valores de la variable dependiente

(x …, x ), i=1,…n,1i ip

Sea…

La expresión de una función discriminante, D , será:

= + … + + sD 1sB 1X spB pX 0sB

BBBd s0sp1s1is ... xx ipi

Ejemplo: muestra de 132 observaciones de las variables

REAPARIC: Tiempo de reaparición de úlcera (meses) Valores: 4, 8, 12 y 16 meses, codificados como 1, 2, 3 y 4

RESPUEST: Tiempo de respuesta al tratamiento (semanas)

TABACO: El paciente ha dejado de fumar durante tratamiento Valores: Sí o No, codificados como 1 y 2

ALCOHOL: Consumo de alcohol (gramos diarios)

CAFÉ: Consumo de café Valores: 0,…, 9 (de nada a mucho)

ANTIACID: Consumo de antiácidos Valores: 0,…, 9 (de nada a mucho)

•ANALIZAR – CLASIFICAR – DISCRIMINANTE•VARIABLE DE AGRUPACION: REAPARIC (1, 4)•INDEPENDIENTE

Tiempo de RespuestaConsumo de alcoholConsumo de caféConsumo de antiácidosPaciente ha dejado de fumar

•USAR METODO DE INCLUSION POR PASOS•CLASIFICAR

Probabilidades previas: SEGÚN TAMAÑO DE GRUPOSMostrar: RESULTADOS PARA CADA CASO, TABLA RESUMEN

•Continuar•SELECCIONAR

Variable selección: filter_$1•ACEPTAR

Se trata de obtener unas funciones lineales de las variables independientes RESPUEST,

TABACO, ALCOHOL, CAFÉ y ANTIACID de la forma:

= RESPUEST + TABACO + ALCOHOL +

+ CAFÉ + ANTIACID +

sD 1sB 2sB 3sB

4sB 5sB 0sB

Objetivo: predecir el tiempo de reaparición de la sintomatología ulcerosa para cualquier paciente que haya sido sometido

al tratamiento

Para un conjunto de p variables independientesmide las desviaciones totales sin distinguir

grupos, en el espacio p-dimensionalgenerado por los valores dentro de cada gruporespecto a las desviaciones de las p variables.

En cada paso se introduce la variable que minimiza

la Lambda de Wilks

Figura 9.5b

Número de variables seleccionadasen una etapa q

Variable candidata a ser seleccionadaen la etapa siguiente q + 1

Estadístico F de entradaEvalúa la disminución que se produciría

en Lambda de Wilks si la variablecorrespondiente fuera seleccionada

Estadístico F de salidaEvalúa el incremento que se produciría en la Lambda de Wilks si la variable

correspondiente fuera eliminada

Tolerancia, con variables , …, , , …,

= 1 -

1jX

jTol 2jR

es el cuadrado del coeficiente de correlaciónmúltiple entre y las variables , …, , , …,

2jR

jX 1jX1X 1jX pX

1jX1X 1jX pX

Siguiendo con el ejemplo…

Variable de mínimo valor de la Lambda de Wilks

RESPUEST

Mayor que 3.83

<< F que introducir = 119.221>>

Figura 9.5b

Tabla <<Variables no incluidas en el análisis>>

En el siguiente paso, de entre las restantes variables independientes(segundo bloque tabla <<Variables no incluidas en el análisis>>)

Mínimo valor en la columna de Lambda de Wilks ALCOHOL

F de entrada = 121. 93

Mayor que 3.84

Una vez comprobado que ninguna variable puede ser eliminada, el siguiente paso será comprobar si la F de entrada

correspondiente a la variable candidata a ser seleccionada, a la que proporcione el mínimo valor de la Lambda Wilks, es mayor que 3.84

TABACO

F de entrada = 55.571

Mayor que 3.84

Candidata a ser seleccionada en el cuarto paso ANTIACID

F de entrada = 1.284

Menor que 3.84En consecuencia, dado que ninguna variablemás puede ser eliminada o seleccionada,

el proceso finaliza.

Valor Lambda Wilkspara el conjunto de variables seleccionadas

RESPUEST, ALCOHOL, TABACO, = 0.107

s = 1, 2, 3 e i = 1, …, 312 BTABACOBALCOHOLBRESPUESTBd s0is3S2s1is

ii

= RESPUEST + TABACO + ALCOHOL +

+ CAFÉ + ANTIACID +

sD 1sB 2sB 3sB

4sB 5sB 0sB

El valor de la Lambda de Wilks para el conjunto de variables independientes coincide con el correspondiente el conjunto de variables independientes

seleccionadas

Figura 9.5c

Medidas relacionadas con la Lambda de Wilks

Permiten evaluar la información que aportará cada función discriminante

Correlación canónicaDesviaciones de las puntuaciones

discriminantes entre grupos respectoa las desviaciones totales sin distinguir

grupos

AutovalorDesviaciones de las puntuaciones

discriminantes entre grupos respectoa las desviaciones dentro de los

grupos

A partir de las funciones discriminantes tipificadas

Figura 9.5c <<Coeficientes estandarizados de las fun. Discriminantes canónicas>>

Figura 9.5d

Figura 9.5e

• ANALIZAR – CLASIFICAR – DISCRIMINANTE• RESTABLER•VARIABLE DE AGRUPACION: REAPARIC (1, 4)•INDEPENDIENTES

Tiempo de respuestaConsumo de alcoholPaciente ha dejado de fumar

• INTRODUCIR INDEPENDIENTES JUNTAS• CLASIFICAR

Probabilidades previas: según tamaño de gruposMostrar: tabla resumenContinuar

• GUARDARGrupo de pertenencia pronosticadoProbabilidades de pertenencia al grupocontinuar

• ACEPTAR

Figura 9.6

Figura 9.9