1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf ·...

73
1 Pr´ acticas de An´ alisis de Correspondencias. BMDP. Programa CA. 1.1 Introducci´ on. El An´alisis de Correspondencias es una generalizaci´on multivariante de lo que conocemos como Scatterplot y convierte tablas de frecuencia en representaciones gr´ aficas, en las que cada fila y cada columna de la tabla viene representada por un punto. Proporciona un m´ etodo para comparar filas entre s´ ı, columnas entre s´ ı, y filas y columnas entre s´ ı, descomponiendo la medida de la asociaci´ on de la tabla, χ 2 , en componentes. Dependiendo del tipo de tabla tendremos el An´alisis de Correspondencias Simple, objeto de nuestra pr´actica, o el M´ ultiple para tablas multiv´ ıa, aunque en algunos casos, ´ estas se pueden estudiar a trav´ es del An´alisis de Correspondencias Simple. Los datos se pueden introducir: Caso a caso. Dando los ´ ındices y frecuencia de cada posici´on de la tabla. Como una tabla de frecuencias. Se pueden incluir puntos suplementarios, dando los valores correspondientes de sus perfiles filas o columnas, o se pueden generar autom´aticamente. La salida del programa proporciona: Tablas de frecuencias observadas. Tablas de frecuencias esperadas. Tablas de porcentajes por fila, por columna y totales. Descomposici´on de la Inercia. Coordenadas de cada perfil fila y columna en las representaciones gr´ aficas. Medidas de la calidad de la representaci´ on de dichos perfiles. Representaciones bidimensionales de los perfiles fila y columna, solo perfiles fila, o solo perfiles columna. Representaciones unidimensionales de esos perfiles. 1.2 ´ Ordenes espec´ ıficas de CA. 1. arrafo INPUT TABLE=#list.: Obligatorio si los datos se introducen en forma de tabla de frecuencias multiv´ ıa. Los n´ umeros #, son los ´ ındices de cada una de las variables categ´oricas, su producto es el n´ umero de posiciones de la tabla. El primer n´ umero es el ´ ındice que var´ ıam´asr´ apido (columna), el siguiente es el segundo m´as r´ apido y as´ ı sucesivamente. El n´ umero de VARIABLES debe ser igual al n´ umero de ´ ındices. El FORMATO deber´a describir las caracter´ ısticas que tengan los n´ umeros en la tabla. CONTENT=DATA, COUNT. (s´olo uno de los dos): Se utiliza la primera opci´on para datos en c´odigo ASCII, y la segunda para datos de un fichero en formato BMDP. El valor por defecto es DATA. REAL.: Analiza una tabla de datos reales (no se requiere que sean enteros), e imprime la tabla observada con datos reales, siempre que los datos se introduzcan en formato de tabla. 2. arrafo CATEGORY (O GROUP) NAMES(var)=List.: Asigna nombres a las categor´ ıas de cada variable, que se reflejar´ an en las distintas representaciones gr´ aficas de la salida del programa, siempre que dentro del p´arrafo CORRESPONDENCE se especifique una sola variable en ROW y una sola variable en COLUMN. 3. arrafo CORRESPONDENCE Es obligatorio y se puede repetir en modo interactivo. Construye una tabla de doble entrada y realiza el An´alisis de Correspondencias con la descomposici´on de la Inercia. Se puede obtener una estructura multiv´ ıa a trav´ es de una de doble entrada apilando las variables. ROW=List.: Indica la lista de nombres de las variables que definen las filas de la tabla. Si se indica m´as de una variable se apilan. COLUMN=List.: Lo mismo, para las columnas. AXIS=#: Indica el n´ umero de ejes que se van a usar en el an´alisis. Si no se utiliza se tomar´an tantos ejes como sea necesario hasta explicar el 90% del total de la Inercia. 1

Transcript of 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf ·...

Page 1: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1 Practicas de Analisis de Correspondencias. BMDP. Programa CA.

1.1 Introduccion.

El Analisis de Correspondencias es una generalizacion multivariante de lo que conocemos como Scatterplot y conviertetablas de frecuencia en representaciones graficas, en las que cada fila y cada columna de la tabla viene representada por unpunto. Proporciona un metodo para comparar filas entre sı, columnas entre sı, y filas y columnas entre sı, descomponiendola medida de la asociacion de la tabla, χ2, en componentes. Dependiendo del tipo de tabla tendremos el Analisis deCorrespondencias Simple, objeto de nuestra practica, o el Multiple para tablas multivıa, aunque en algunos casos, estasse pueden estudiar a traves del Analisis de Correspondencias Simple.

• Los datos se pueden introducir:

– Caso a caso.

– Dando los ındices y frecuencia de cada posicion de la tabla.

– Como una tabla de frecuencias.

– Se pueden incluir puntos suplementarios, dando los valores correspondientes de sus perfiles filas o columnas, ose pueden generar automaticamente.

• La salida del programa proporciona:

– Tablas de frecuencias observadas.

– Tablas de frecuencias esperadas.

– Tablas de porcentajes por fila, por columna y totales.

– Descomposicion de la Inercia.

– Coordenadas de cada perfil fila y columna en las representaciones graficas.

– Medidas de la calidad de la representacion de dichos perfiles.

– Representaciones bidimensionales de los perfiles fila y columna, solo perfiles fila, o solo perfiles columna.

– Representaciones unidimensionales de esos perfiles.

1.2 Ordenes especıficas de CA.

1. Parrafo INPUT

• TABLE=#list.: Obligatorio si los datos se introducen en forma de tabla de frecuencias multivıa. Los numeros#, son los ındices de cada una de las variables categoricas, su producto es el numero de posiciones de la tabla.El primer numero es el ındice que varıa mas rapido (columna), el siguiente es el segundo mas rapido y asısucesivamente. El numero de VARIABLES debe ser igual al numero de ındices. El FORMATO debera describirlas caracterısticas que tengan los numeros en la tabla.

• CONTENT=DATA, COUNT. (solo uno de los dos): Se utiliza la primera opcion para datos en codigoASCII, y la segunda para datos de un fichero en formato BMDP. El valor por defecto es DATA.

• REAL.: Analiza una tabla de datos reales (no se requiere que sean enteros), e imprime la tabla observada condatos reales, siempre que los datos se introduzcan en formato de tabla.

2. Parrafo CATEGORY (O GROUP)

• NAMES(var)=List.: Asigna nombres a las categorıas de cada variable, que se reflejaran en las distintasrepresentaciones graficas de la salida del programa, siempre que dentro del parrafo CORRESPONDENCEse especifique una sola variable en ROW y una sola variable en COLUMN.

3. Parrafo CORRESPONDENCE

Es obligatorio y se puede repetir en modo interactivo. Construye una tabla de doble entrada y realiza el Analisis deCorrespondencias con la descomposicion de la Inercia. Se puede obtener una estructura multivıa a traves de una dedoble entrada apilando las variables.

• ROW=List.: Indica la lista de nombres de las variables que definen las filas de la tabla. Si se indica mas deuna variable se apilan.

• COLUMN=List.: Lo mismo, para las columnas.

• AXIS=#: Indica el numero de ejes que se van a usar en el analisis. Si no se utiliza se tomaran tantos ejescomo sea necesario hasta explicar el 90% del total de la Inercia.

1

Page 2: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

• CONSTANT=#.: Restringe el analisis a los ejes que acumulativamente contribuyen a la proporcion de lainercia total expresada. Anula la anterior orden AXIS=#.

• SELECT(j)=List.: Restringe el analisis a los valores especificados en la lista de la variable j, que no tiene queser necesariamente una variable ROW o COLUMN. La variable j puede ser la lista de CODES o los nombresde las variables declarados en NAMES, o los valores definidos en CUTPOINTS. Si se utiliza este ultimocaso, se deben poner los nombres de dichos cortes en la lista. Los otros valores de la variable j se excluyen dela tabla y del analisis. Se puede repetir.

• REJECT(j)=List.: Se usa para eliminar el valor especificado de la variable j.

• QLT=#.: Toma un valor comprendido entre 0 y 1. Solo los puntos con una QLT mayor que ese valor, serepresentaran graficamente.

• COUNT=var, FREQ.: Es obligatorio si los datos se introducen dando los ındices de las celdillas. Indica elnombre de la variable que contiene dichos valores. Se utiliza FREQ cuando se lee una tabla de valores de unfichero en formato BMDP.

• RNAME=List.: Indica una lista de nombres para las categorıas de las variables fila, definidas en ROW.

• CNAME=List.: Lo mismo, para las columnas.

• TITLE=’text’.: Asigna un tıtulo para cada Analisis de Correspondencias. No se imprime en modo interactivo.El numero maximo de caracteres es de 160.

4. Parrafo PLOT

Realiza una representacion uni o bidimensional de filas y columnas separadamente o en conjunto. En modo nointeractivo, por defecto, se representan las tres posibilidades. Se puede repetir interactivamente.

• BOTH.: Es la opcion por defecto. Si se declara NO BOTH no se realiza la repesentacion conjunta. Estaopcion no afecta a los posibles parrafos PLOT posteriores que se declaren.

• ROWS.: Representa los perfiles fila separadamente. Es la opcion por defecto en modo no interactivo. NOROWS suprime dicha representacion sin afectar a los posibles parrafos PLOT posteriores.

• COLUMNS.: Lo mismo, para perfiles columna.

• XAXIS=List.YAXIS=List.: Representa las coordenadas en todas las parejas de ejes formadas por cada uno de los valoresde la lista del eje X, frente a cada uno de los valores de la lista del eje Y.

• SROWS.: Representa los perfiles fila suplementarios dados en el parrafo previo SUPPLEM. NO SROWSes la opcion por defecto en modo interactivo.

• SCOLS.: Lo mismo, para perfiles columna.

• LABEL=NAME, NUMBER. (solo uno de los dos): Si se indica NAME, los nombres del parrafo CAT-EGORY o RNAME o CNAME se utilizan por defecto. Si se especifica NUMBER se utiliza R1,R2, . . .para las filas, C1, C2, . . . para las columnas, S1,S2, . . . para las filas suplementarias y D1, D2, . . . para lascolumnas suplementarias.

• SIZE=#1, #2.: Especifica el tamano de la representacion, siendo #1 el numero de caracteres para el ejehorizontal, y #2 el numero de lıneas para el eje vertical. Por defecto en modo interactivo es 30, 15 y en modono interactivo 70, 42. Para representaciones unidimensionales solo se requiere un parametro, puesto que lalongitud del eje horizontal es fija, siendo en este caso #2, el numero de lıneas para el eje vertical y #1 seignora.

• MINIMUM=#List. (hasta 3 numeros): Asigna lımites inferiores a la escala del dibujo, uno para cada eje.Por defecto se utilizara el mınimo valor de las coordenadas.

• MAXIMUM=#List. Lo mismo para lımites superiores.

• QLT=#.: Igual que la misma orden del parrafo CORRESPONDENCE, aunque esta anula a la de dichoparrafo.

5. Parrafo PRINT

Si se omite, el programa CA imprime las tablas de valores observados y excluidos. Se puede repetir interactivamente.

• LEVEL=MINIMAL, NORMAL. (solo uno de los dos): Si se especifica MINIMAL se obtienen las salidasdel programa en modo interactivo y si se especifica NORMAL se obtienen las salidas en modo no interac-tivo, independientemente del modo que utilicemos. Por defecto en modo interactivo es MINIMAL y en nointeractivo NORMAL.

• OBSERVED.: A menos que se indique NO OBS, CA imprime la tabla de frecuencias de doble entrada.

2

Page 3: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

• EXCLUDED.: A menos que se indique NO EXC, CA imprime la tabla de valores excluidos, si existen dichosvalores.

• PERCENT=NONE, ROW, COLUMN, TOTAL.: ROW indica la tabla de porcentajes por filas, COLpor columnas y TOTAL para la tabla de porcentajes totales. Por defecto es NONE (no se imprime ninguna).

• EXPECTED.: Se imprime la tabla de valores esperados bajo la hipotesis de independencia. El valor pordefecto es NO EXP.

• DIFFERENCE.: Imprime la tabla del cociente entre la diferencia entre valores observados y esperados yvalores esperados. NO DIFF es el valor por defecto.

• DICTIONARY.: Cuando las variables han sido apiladas en el parametro CORRES, esta opcion genera unatabla de la composicion de las etiquetas, formada por la primera letra de cada nombre. Por defecto su valor esNO DICT.

• CHISQUARE=#.: Imprime tablas de frecuencias esperadas, donde # es el numero de ejes necesario pararepresentar graficamente las tablas y obtiene el valor del estadıstico χ2 para cada tabla. Por defecto su valores el que aparece en AXIS dentro del parrafo CORRES.

6. Parrafo SUPPLEMENTARY

Analiza perfiles suplementarios y en modo no interactivo imprime los valores de sus coordenadas. El perfil decualquier variable no usada en el parrafo CORRES se puede generar automaticamente por RVAR y CVAR o sepueden introducir directamente con ROW y COLUMN. Se puede repetir interactivamente. Se representan en elsiguiente parrafo PLOT a su definicion.

• RVAR=List.: Indica los nombres de las variables que van a considerarse perfiles fila suplementarios. Se formanfilas suplementarias con estas variables, utilizando las columnas que aparezcan en el ultimo parrafo CORRES.Se deben definir CODES y CUTPOINTS en el parrafo CATEGORY para variables con mas de 10 valoresdistintos.

• CVAR=List. : Lo mismo, para columnas.

• ROW(#)=# List.: El primer numero designa el orden de la fila suplementaria si hay varias. El segundorepresenta los valores del perfil fila y debe tener tantos valores como categorıas en cada fila. Se puede repetir.

• COLUMN(#)=# List.: Lo mismo, para columnas.

• RNAMES=List.: Indica los nombres para las filas suplementarias definidas con ROW . Por defecto tomalos valores S1, S2, . . .

• CNAMES=List.: Lo mismo, para columnas. Por defecto toma los valores D1,D2, . . .

7. Parrafo SAVE

Solo se utiliza para guardar ficheros en formato BMDP. Es interactivo y se puede repetir. Solo se puede guardar unanalisis de CA en cada fichero BMDP.

• CONTENT=DATA, COUNT, SCORES. (solo uno): Se introduce cualquiera de esos valores segun seandatos, frecuencias o coordenadas, lo que se grabe en formato BMDP. El valor por defecto es DATA salvo si enel parrafo INPUT se ha usado COUNT, en cuyo caso este serıa el valor por defecto.

• AXIS=#.: Se utiliza cuando CONTENT=SCORES, especifica el numero de coordenadas que se van agrabar, luego debera ser menor o igual que el numero de ejes utilizado en el analisis. El valor por defecto es elmismo que AXIS en el parrafo CORRES.

1.3 Habitos de fumar

El siguiente ejemplo es muy utilizado en la literatura de AC, Greenacre (1984).Despues de la publicacion a escala nacional de un estudio sobre los peligros del habito de fumar, el director de una gran

companıa, decide realizar un estudio sobre sus empleados. Para ello elige convenientemente una muestra de 193 personascorrespondiente al 10%, de entre las cinco categorıas profesionales existentes en la empresa: Directivos senior, Directivosjunior, Empleados senior, Empleados junior y Administrativos, segun nomenclatura anglosajona. El habito de fumar secategoriza en 4 niveles: no, poco, regular y mucho. Posteriormente se pregunta a los 193 empleados de la muestra de lacompanıa sobre si consumen bebidas alcoholicas, por la posible influencia en el habito de fumar. Los datos obtenidos sereflejan en las siguientes tablas:

A traves de un estudio similar al realizado por el director de la empresa, se conoce que el porcentaje a nivel nacional,de los diferentes niveles de fumar es el siguiente: NO 42%, POCO 29%, REGULAR 20%, MUCHO 9%. Vamos a analizareste ejemplo, tıpico en la literatura del Analisis de Correspondencias, utilizando la informacion sobre la bebida y sobre elestudio a nivel nacional como puntos suplementarios.

3

Page 4: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Table 1: Habitos de fumar

Categorıas de fumadoresPlantilla NO POCO REGULAR MUCHO Total filaDIR SEN 4 2 3 2 11DIR JUN 4 3 7 4 18EMPL SEN 25 10 12 4 18EMPL JUN 18 24 33 13 88ADMINIS 10 6 7 2 25Total columna 61 45 62 25 193

Table 2: Consumo de bebidas alcoholicas

Consumo bebidasalcoholicas

Plantilla BEBE NO BEBEDIR SEN 0 11DIR JUN 1 17EMPL SEN 5 46EMPL JUN 10 78ADMINIS 7 18

1.4 Aplicacion practica

Dentro de una tabla bidimensional tenemos que estudiar las relaciones entre las filas, entre las columnas, y las relacionesque puedan existir entre las filas y columnas, por lo tanto hay que dar tres informaciones separadas como conclusion delanalisis. Para ello nos vamos a basar en las representaciones graficas uni y bidimensionales que figuran a continuacion.Asimismo contamos con una serie de valores numericos cuyo nombre generico es ayudas a la interpretacion, que modulany complementan lo que las graficas representan.

El orden que vamos a seguir en el analisis de los resultados es el siguiente:

• Primero analizaremos las filas de la tabla, (perfiles fila), observando las representaciones graficas sobre el primer ejefactorial, sobre el segundo eje factorial y sobre ambos ejes bidimensionalmente. La justificacion de este orden es queel primer eje factorial, explica el 87.8% de la variabilidad existente entre las filas, y el segundo eje el 11.8%, por loque hay que darle mas importancia a lo visto sobre el primer eje que a lo visto sobre el segundo. Se termina con larepresentacion bidimensional que matiza y corrige lo visto sobre la primera dimension.

• En segundo lugar analizaremos las columnas de la tabla, (perfiles columna), con el mismo procedimiento del apartadoanterior.

• En tercer lugar analizaremos las relaciones existentes entre las filas y columnas, tambien con ese mismo procedimiento,aunque en este caso, si el contraste de independencia de la χ2 que realiza el programa CA, rechaza la independenciaentre ambas variables, fila y columna, significa que la dependencia existente va a permitir mayores posibilidades deobtener conclusiones entre las categorıas de una y otra variable.

1.4.1 Perfiles fila

A la vista de las representaciones graficas obtenidas al ejecutar el programa CA del paquete estadıstico BMDP (BiomedicalProgram), observamos lo siguiente:

1. Las categorıas profesionales EMPL SEN y por otro lado DIR JUN y EMPL JUN se encuentran en los extremosnegativo y positivo del primer eje respectivamente, lo que indica que tienen comportamientos contrarios en relaciona los habitos de fumar, teniendo los dos grupos ultimos mayor parecido. El que unos grupos esten en la parte negativay otros en la positiva, no tiene ningun significado, solo es interesante analizar las diferencias o similitudes existentesentre ellos.

2. Las categorıas ADMINIS y DIR SEN ocupan posiciones intermedias entre los dos grupos anteriores, por lo que elprimero tiende a tener un comportamiento mas parecido a EMPL SEN y el segundo un comportamiento intermedioentre los dos grupos del apartado anterior.

3. Intencionadamente no hemos hecho mencion de ninguna categorıa de los habitos de fumar, para insistir en el hechode que se pueden establecer a traves de la observacion grafica, comparaciones exclusivamente entre las filas de latabla.

4

Page 5: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.4.2 Perfiles columna

En este ejemplo, las columnas tienen un mayor interes en la explicacion de la asociacion entre las dos variables de la tabla.Podemos observar lo siguiente:

1. El primer eje divide a los que no fuman de los que fuman, situandose la categorıa NO a la izquierda del eje y lasdemas a la derecha.

2. Ademas observamos una jerarquizacion del primer eje sobre los habitos de fumar de manera que el orden en el que sepresentan las categorıas es: NO, POCO, REGULAR y MUCHO, lo que siempre es interesante a la hora de establecerrelaciones entre filas y columnas.

3. Las mayores diferencias se dan entre las categorıas NO y MUCHO, lo que no tiene porque ser logico, porque noestamos analizando las diferencias entre las personas que no fuman y que fuman mucho de forma absoluta, sino atraves de las categorıas profesionales de la empresa, dicho de otra forma, si en las cinco categorıas profesionales,hubiese muy pocos que no fuman y muy pocos que fuman mucho, ambos perfiles estarıan situados juntos en larepresentacion grafica.

4. Se observa tambien que no hay grandes diferencias entre las tres categorıas de fumadores: POCO, REGULAR yMUCHO, presentando REGULAR un comportamiento intermedio entre ambas.

1.4.3 Perfiles fila y columna

Podemos establecer las siguientes relaciones:

1. La mayor proporcion de no fumadores se da dentro de los EMPL SEN y tambien es cierto que dentro de la categorıaprofesional EMPL SEN mayoritariamente no se fuma.

2. Existe una fuerte asociacion positiva entre la categorıa profesional DIR JUN y fumar MUCHO.

3. Existe una asociacion positiva entre la categorıa profesional EMPL JUN y fumar POCO y REGULAR.

4. La categorıa ADMINIS presenta bastante asociacion positiva con NO fumar y algo menos con fumar POCO.

5. Los trabajadores clasificados en DIR SEN, tienen asociacion positiva con los habitos de fumar extremos, NO yMUCHO, por estar situados entre ambos.

6. Por ultimo debido a la jerarquizacion del primer eje en relacion a los habitos de fumar comentada antes, cuanto masa la izquierda este situada una categorıa profesional, mas tendencia tendra a no fumar y conforme se vaya situandomas a la derecha mas tendencia a fumar mas, lo que nos permite ordenar las categorıas profesionales segun los habitosde fumar de menos a mas, de la siguiente forma: EMPL SEN, ADMINIS, DIR SEN, EMPL JUN y DIR JUN.

1.4.4 Perfiles suplementarios

Tenemos en este ejemplo una fila y dos columnas suplementarias. En este caso son de naturaleza distinta, mientras elprimero llamado PROMEDIO, proviene de una fuente externa al estudio, y se utiliza para establecer una comparacionentre la informacion a nivel nacional y de nuestro estudio, las columnas llamadas BEBE y NO BEBE proceden de lamuestra de 193 personas de la empresa, luego podrıan haberse incluido, de haberlo estimado necesario, en el estudioinicial. Las conclusiones a las que llegamos son las siguientes:

1. Al estar situado el punto PROMEDIO, (perfil que representa el porcentaje a nivel nacional de los habitos de fumar),entre NO y POCO, podemos afirmar que los trabajadores de nuestra empresa tienen una alta proporcion de fumadorescomparada con la media nacional.

2. Existe cierta asociacion entre fumar MUCHO con BEBE y entre NO BEBE y consumir menos tabaco. En cualquiercaso una de las ayudas a la interpretacion (COR2 = 0.04) nos indica que esos puntos no estan suficientemente bienrepresentados en la grafica y las conclusiones podrıan ser erroneas.

5

Page 6: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.5 AC en BMDP

Resultados proporcionados por el programa CA del BMDP

PROGRAM INSTRUCTIONS

/PROBLEM TITTLE IS ’Habitos de Fumar’.

/INPUT VARIABLES=2.

FORMAT=FREE.

TABLE=4,5.

FILE IS ’c:\fumar.ASC’.

/VARIABLES NAMES=FUMAR,PLANTILLA.

/CATEGORY NAMES(FUMAR)=NO,POCO,REGULAR,MUCHO.

NAMES(PLANTILLA)=DIR_SEN,DIR_JUN,EMPL_SEN,EMPL_JUN,

ADMINIS.

/END

CORRES ROW=PLANTILLA.

COL=FUMAR. /

PRINT PERCENT=ROW,COL,total./

PLOT SIZE=70,42.

Xaxis=1./

PLOT /

SUPPLEM ROW=42,29,20,9.

RNAME=PROMEDIO.

COL(1)=0,1,5,10,7.

COL(2)=11,17,46,78,18.

CNAMES=NO_BEBE,BEBE./

PLOT /

END/

ANALYSIS OF OBSERVED FREQUENCY TABLE

TOTAL INERTIA = SUM OF EIGENVALUES = 0.0852

AXIS EIGENVALUE % OF INERTIA CUM % HISTOGRAM

1 0.075 87.8 87.8 ****************************

2 0.010 11.8 99.5 ****

MAXIMUM NUMBER OF FACTORS TO EXTRACT .................... 3

CUT-OFF TOLERANCE ....................................... 90.00%

NUMBER OF FACTORS ACCOUNTING FOR 90.00% OF INERTIA ..... 2

NUMBER OF FACTORS ACTUALLY EXTRACTED .................... 2

CHISQUARE VALUE WITH 12 DF = 16.442

CHISQUARE ASSOCIATED P-VALUE = 0.172

6

Page 7: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

ROWS

----

--------------------------------------------------------------------------------

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

--------------------------------------------------------------------------------

1 DIR_SEN 0.057 0.893 0.003 | -0.066 0.092 0.003 | 0.194 0.800 0.214

2 DIR_JUN 0.093 0.991 0.012 | 0.259 0.526 0.084 | 0.243 0.465 0.551

3 EMPL_SEN 0.264 1.000 0.038 | -0.381 0.999 0.512 | 0.011 0.001 0.003

4 EMPL_JUN 0.456 1.000 0.026 | 0.233 0.942 0.331 | -0.058 0.058 0.152

5 ADMINIS 0.130 0.999 0.006 | -0.201 0.865 0.070 | -0.079 0.133 0.081

--------------------------------------------------------------------------------

COLUMNS

-------

--------------------------------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

--------------------------------------------------------------------------------

1 NO 0.316 1.000 0.049 | -0.393 0.994 0.654 | 0.030 0.006 0.029

2 POCO 0.233 0.984 0.007 | 0.099 0.327 0.031 | -0.141 0.657 0.463

3 REGULAR 0.321 0.983 0.013 | 0.196 0.982 0.166 | -0.007 0.001 0.002

4 MUCHO 0.130 0.995 0.016 | 0.294 0.684 0.150 | 0.198 0.310 0.506

--------------------------------------------------------------------------------

SUPPLEMENTARY ROWS

------------------

--------------------------------------------------------------------------------

SROW NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

--------------------------------------------------------------------------------

1 PROMEDIO 0.761 | -0.258 0.631 | -0.118 0.131

--------------------------------------------------------------------------------

SUPPLEMENTARY COLUMNS

---------------------

--------------------------------------------------------------------------------

SCOL NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

--------------------------------------------------------------------------------

1 NO_BEBE 0.399 | 0.157 0.177 | -0.175 0.222

2 BEBE 1.728 | 0.300 1.225 | 0.192 0.504

--------------------------------------------------------------------------------

7

Page 8: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

***** OBSERVED FREQUENCY TABLE

PLANTILL FUMAR

------ ------

NO POCO REGULAR MUCHO TOTAL

------------------------------------------------------

DIR_SEN 4 2 3 2 | 11

DIR_JUN 4 3 7 4 | 18

EMPL_SEN 25 10 12 4 | 51

EMPL_JUN 18 24 33 13 | 88

ADMINIS 10 6 7 2 | 25

--------------------------------------------|---------

TOTAL 61 45 62 25 | 193

***** PERCENTS OF ROW TOTALS

PLANTILL FUMAR

------ ------

NO POCO REGULAR MUCHO TOTAL

------------------------------------------------------

DIR_SEN 36.4 18.2 27.3 18.2 | 100.0

DIR_JUN 22.2 16.7 38.9 22.2 | 100.0

EMPL_SEN 49.0 19.6 23.5 7.8 | 100.0

EMPL_JUN 20.5 27.3 37.5 14.8 | 100.0

ADMINIS 40.0 24.0 28.0 8.0 | 100.0

--------------------------------------------|---------

TOTAL 31.6 23.3 32.1 13.0 | 100.0

***** PERCENTS OF COLUMN TOTALS

PLANTILL FUMAR

------ ------

NO POCO REGULAR MUCHO TOTAL

------------------------------------------------------

DIR_SEN 6.6 4.4 4.8 8.0 | 5.7

DIR_JUN 6.6 6.7 11.3 16.0 | 9.3

EMPL_SEN 41.0 22.2 19.4 16.0 | 26.4

EMPL_JUN 29.5 53.3 53.2 52.0 | 45.6

ADMINIS 16.4 13.3 11.3 8.0 | 13.0

--------------------------------------------|---------

TOTAL 100.0 100.0 100.0 100.0 | 100.0

***** PERCENTS OF THE TABLE TOTAL

PLANTILL FUMAR

------ ------

NO POCO REGULAR MUCHO TOTAL

------------------------------------------------------

DIR_SEN 2.1 1.0 1.6 1.0 | 5.7

DIR_JUN 2.1 1.6 3.6 2.1 | 9.3

EMPL_SEN 13.0 5.2 6.2 2.1 | 26.4

EMPL_JUN 9.3 12.4 17.1 6.7 | 45.6

ADMINIS 5.2 3.1 3.6 1.0 | 13.0

--------------------------------------------|---------

TOTAL 31.6 23.3 32.1 13.0 | 100.0

8

Page 9: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS

.

.3 + + +

- . -

- DIR_JUN . -

- . -

- EMPL_JUN . -

- . -

.2 + + +

- . -

- . -

- . -

- . -

- . -

.1 + + +

- . -

- . -

- . -

- . -

- . -

A 0. + + +

X - . -

I - . -

S - . -

- DIR_SEN . -

1 - . -

-.1 + + +

- . -

- . -

- . -

- . -

- . -

-.2 + ADMINIS + +

- . -

- . -

- . -

- . -

- . -

-.3 + + +

- . -

- . -

- . -

- . -

- EMPL_SEN . -

-.4 + + +

LX = .0748 ( 87.8%)

9

Page 10: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS

.

.3 + MUCHO + +

- . -

- . -

- . -

- . -

- . -

.2 + REGULAR + +

- . -

- . -

- . -

- . -

- . -

.1 + POCO + +

- . -

- . -

- . -

- . -

- . -

A 0. + + +

X - . -

I - . -

S - . -

- . -

1 - . -

-.1 + + +

- . -

- . -

- . -

- . -

- . -

-.2 + + +

- . -

- . -

- . -

- . -

- . -

-.3 + + +

- . -

- . -

- . -

- . -

- . -

-.4 + NO + +

LX = .0748 ( 87.8%)

10

Page 11: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS

.

.3 + + MUCHO +

- . -

- DIR_JUN . -

- . -

- EMPL_JUN . -

- . -

.2 + + REGULAR +

- . -

- . -

- . -

- . -

- . -

.1 + + POCO +

- . -

- . -

- . -

- . -

- . -

A 0. + + +

X - . -

I - . -

S - . -

- DIR_SEN . -

1 - . -

-.1 + + +

- . -

- . -

- . -

- . -

- . -

-.2 + ADMINIS + +

- . -

- . -

- . -

- . -

- . -

-.3 + + +

- . -

- . -

- . -

- . -

- EMPL_SEN . -

-.4 + + NO +

L1 = .0748 ( 87.8%)

11

Page 12: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS

......+.......+.......+.......+.......+.......+.......+.......+.......+..

- | -

.25 + + +

- | DIR_JUN -

- | -

- | -

- | -

- | -

.20 + + +

- DIR_SEN -

- | -

- | -

- | -

- | -

.15 + + +

- | -

- | -

- | -

- | -

A - | -

X .10 + + +

I - | -

S - | -

- | -

2 - | -

- | -

.05 + + +

- | -

- | -

- | -

- | -

- EMPL_SEN | -

0.0 +-----+-------+-------+-------+-------+-------+-------+-------+-------+-+

- | -

- | -

- | -

- | -

- | -

-.05 + + +

- | EMPL_JUN -

- | -

- ADMINIS | -

- | -

- | -

......+.......+.......+.......+.......+.......+.......+.......+.......+..

-.27 -.09 .09 .27

-.36 -.18 0.0 .18 .36

AXIS 1

LX = .0748 ( 87.8%) LY = .0100 ( 11.8%)

12

Page 13: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS

.....+.......+.......+.......+.......+.......+.......+.......+.......+...

- | -

.20 + + MUCHO +

- | -

- | -

- | -

- | -

- | -

.15 + + +

- | -

- | -

- | -

- | -

- | -

.10 + + +

- | -

- | -

- | -

- | -

A - | -

X .05 + + +

I - | -

S - NO | -

- | -

2 - | -

- | -

0.0 +----+-------+-------+-------+-------+-------+-------+-------+-------+--+

- | REGULAR -

- | -

- | -

- | -

- | -

-.05 + + +

- | -

- | -

- | -

- | -

- | -

-.10 + + +

- | -

- | -

- | -

- | -

- | POCO -

.....+.......+.......+.......+.......+.......+.......+.......+.......+...

-.27 -.09 .09 .27

-.36 -.18 0.0 .18 .36

AXIS 1

LX = .0748 ( 87.8%) LY = .0100 (11.8%)

13

Page 14: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS

.....+.......+.......+.......+.......+.......+.......+.......+.......+...

- | DIR_JUN -

- | -

- | -

- | -

.20 + + MUCHO +

- DIR_SEN BEBE -

- | -

- | -

- | -

.15 + + +

- | -

- | -

- | -

- | -

.10 + + +

- | -

- | -

- | -

A - | -

X .05 + + +

I - | -

S - NO | -

- | -

2 - EMPL_SEN | -

0.0 +----+-------+-------+-------+-------+-------+-------+-------+-------+--+

- | REGULAR -

- | -

- | -

- | -

-.05 + + +

- | EMPL_JUN -

- | -

- ADMINIS | -

- | -

-.10 + + +

- | -

- PROMEDIO | -

- | -

- | POCO -

-.15 + + +

- | -

- | -

- | NO_BEBE -

.....+.......+.......+.......+.......+.......+.......+.......+.......+...

-.27 -.09 .09 .27

-.36 -.18 0.0 .18 .36

AXIS 1

L1 = .0748 ( 87.8%) L2 = .0100 ( 11.8%)

14

Page 15: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.6 AC en SPSS

Dentro del programa SPSS, existen dos modulos o paquetes que permiten realizar un AC sobre una tabla de datos:ANACOR y CORRESPONDENCE y dependiendo de la forma de introducir los datos, tenemos diversas variantes, segunse introduzcan a traves de una tabla de frecuencias, o frecuencias casilla a casilla indicando la posicion de cada una deellas.

1. Modulo ANACOR

ordenes

DATA LIST FREE

/PLANTI FUMAR FREQ.

WEIGHT BY FREQ.

VALUE LABELS

PLANTI 1 ’Dir_sen’ 2 ’Dir_jun’ 3 ’Emp_sen’ 4 ’Emp_jun’ 5 ’Adminis’

/FUMAR 1 ’No’ 2 ’Poco’ 3 ’Regular’ 4 ’Mucho’.

BEGIN DATA

1 1 4 1 2 2 1 3 3 1 4 2

2 1 4 2 2 3 2 3 7 2 4 4

3 1 25 3 2 10 3 3 12 3 4 4

4 1 18 4 2 24 4 3 33 4 4 13

5 1 10 5 2 6 5 3 7 5 4 2

END DATA.

ANACOR TABLE=PLANTI(1,5) BY FUMAR(1,4)

/DIMENSION=2

/NORMALIZATION=CANONICAL

/VARIANCES=SINGULAR ROWS COLUMNS

/PRINT=SCORES TABLE CONTRIBUTIONS

/PLOT NDIM(1,2) TRROWS TRCOLUMNS ROWS(15) COLUMNS(15) JOINT.

Analisis de correspondencias

A N A C O R - VERSION 0.4

BY

DEPARTMENT OF DATA THEORY

UNIVERSITY OF LEIDEN, THE NETHERLANDS

The table to be analyzed:

1 2 3 4

No Poco Regular Mucho Margin

1 Dir_sen 4 2 3 2 11

2 Dir_jun 4 3 7 4 18

3 Emp_sen 25 10 12 4 51

4 Emp_jun 18 24 33 13 88

5 Adminis 10 6 7 2 25

-------------------------------------------

Margin 61 45 62 25 193

15

Page 16: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Dimension Singular Inertia Proportion Cumulative

Value Explained Proportion

1 ,27342 ,07476 ,878 ,878

2 ,10009 ,01002 ,118 ,995

3 ,02034 ,00041 ,005 1,000

--------- ---------- ----------

Total ,08519 1,000 1,000

Row Scores:

PLANTI Marginal Dim

Profile 1 2

1 Dir_sen ,057 -,126 ,612

2 Dir_jun ,093 ,495 ,769

3 Emp_sen ,264 -,728 ,034

4 Emp_jun ,456 ,446 -,183

5 Adminis ,130 -,385 -,249

Contribution of row points to the inertia of each dimension:

PLANTI Marginal Dim

Profile 1 2

1 Dir_sen ,057 ,003 ,214

2 Dir_jun ,093 ,084 ,551

3 Emp_sen ,264 ,512 ,003

4 Emp_jun ,456 ,331 ,152

5 Adminis ,130 ,070 ,081

-------- --------

1,000 1,000

Contribution of dimensions to the inertia of each row point:

PLANTI Marginal Dim Total

Profile 1 2

1 Dir_sen ,057 ,092 ,800 ,893

2 Dir_jun ,093 ,526 ,465 ,991

3 Emp_sen ,264 ,999 ,001 1,000

4 Emp_jun ,456 ,942 ,058 1,000

5 Adminis ,130 ,865 ,133 ,999

Column Scores:

FUMAR Marginal Dim

Profile 1 2

1 No ,316 -,752 ,096

2 Poco ,233 ,190 -,446

3 Regular ,321 ,375 -,023

4 Mucho ,130 ,562 ,625

Contribution of column points to the inertia of each dimension:

FUMAR Marginal Dim

Profile 1 2

1 No ,316 ,654 ,029

2 Poco ,233 ,031 ,463

3 Regular ,321 ,166 ,002

4 Mucho ,130 ,150 ,506

-------- --------

16

Page 17: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1,000 1,000

Contribution of dimensions to the inertia of each column point:

FUMAR Marginal Dim Total

Profile 1 2

1 No ,316 ,994 ,006 1,000

2 Poco ,233 ,327 ,657 ,984

3 Regular ,321 ,982 ,001 ,983

4 Mucho ,130 ,684 ,310 ,995

Variances and Correlation Matrix of the singular values:

Dim Variances Correlations between dimensions

1 ,005 1,000

2 ,006 ,020 1,000

Variances and Correlation Matrix of scores of Row 1 Dir_sen

Dim Variances Correlations between dimensions

1 ,377 1,000

2 ,840 ,101 1,000

Variances and Correlation Matrix of scores of Row 2 Dir_jun

Dim Variances Correlations between dimensions

1 ,213 1,000

2 ,261 ,007 1,000

Variances and Correlation Matrix of scores of Row 3 Emp_sen

Dim Variances Correlations between dimensions

1 ,012 1,000

2 ,025 ,107 1,000

Variances and Correlation Matrix of scores of Row 4 Emp_jun

Dim Variances Correlations between dimensions

1 ,014 1,000

2 ,015 ,611 1,000

Variances and Correlation Matrix of scores of Row 5 Adminis

Dim Variances Correlations between dimensions

1 ,025 1,000

2 ,023 -,360 1,000

Variances and Correlation Matrix of scores of Column 1 No

Dim Variances Correlations between dimensions

1 ,014 1,000

2 ,021 ,402 1,000

Variances and Correlation Matrix of scores of Column 2 Poco

Dim Variances Correlations between dimensions

1 ,079 1,000

2 ,085 ,054 1,000

Variances and Correlation Matrix of scores of Column 3 Regular

17

Page 18: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Dim Variances Correlations between dimensions

1 ,032 1,000

2 ,110 ,020 1,000

Variances and Correlation Matrix of scores of Column 4 Mucho

Dim Variances Correlations between dimensions

1 ,130 1,000

2 ,195 -,155 1,000

Figure 1: Perfiles fila sobre el eje 1

Punt. de fila para PLANTI

Simétrica Normalización

Consta

nte

,6

,4

,2

−,0

−,2

−,4

−,6

Adminis Emp_junEmp_sen Dir_junDir_sen

18

Page 19: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 2: Perfiles columna sobre el eje 1

Punt. de columna para FUMAR

Simétrica Normalización

Co

nsta

nte

,6

,4

,2

−,0

−,2

−,4

−,6

MuchoRegularPocoNo

Figure 3: Perfiles fila sobre los ejes 1,2

Punt. de fila para PLANTI

Simétrica Normalización

Dimensión 1

,6,4,20,0−,2−,4−,6−,8

Dim

en

sió

n 2

,8

,6

,4

,2

0,0

−,2

−,4

Adminis

Emp_jun

Emp_sen

Dir_jun

Dir_sen

19

Page 20: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 4: Perfiles columna sobre los ejes 1,2

Punt. de columna para FUMAR

Simétrica Normalización

Dimensión 1

,6,4,20,0−,2−,4−,6−,8

Dim

en

sió

n 2

,8

,6

,4

,2

−,0

−,2

−,4

−,6

Mucho

Regular

Poco

No

Figure 5: Perfiles fila-columna sobre los ejes 1,2

Punt. de fila y columna

Simétrica Normalización

Dimensión 1

,6,4,20,0−,2−,4−,6−,8

Dim

en

sió

n 2

,8

,6

,4

,2

−,0

−,2

−,4

−,6

FUMAR

PLANTI

Mucho

Regular

Poco

No

Adminis

Emp_jun

Emp_sen

Dir_sen

20

Page 21: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

2. Modulo CORRESPONDENCE

Fichero de datos

Rowcat_ No Poco Regular Mucho

1 4 2 3 2

2 4 3 7 4

3 25 10 12 4

4 18 24 33 13

5 10 6 7 2

ordenes

DATA LIST

/ROWCAT_ 1 No 3-4 Poco 6-7 Regular 9-10 Mucho 12-13.

BEGIN DATA

1 04 02 03 02

2 04 03 07 04

3 25 10 12 04

4 18 24 33 13

5 10 06 07 02

END DATA.

VALUE LABELS ROWCAT_ 1 ’DIR_SEN’ 2 ’DIR_JUN’ 3 ’EMP_SEN’ 4 ’EMP_JUN’ 5 ’ADMINIS’.

CORRESPONDENCE TABLE=ALL(5,4)

/PRINT=TABLE RPROF CPROF RPOINTS CPOINTS RCONF CCONF

/PLOT NDIM(1,2) RPOINTS CPOINTS TRROWS TRCOLUMNS BIPLOT.

En DATA LIST aparece ROWCAT que es el nombre de la variable Categorica fila. 1 es la posicion columna queocupan los valores de la variable (1, 2, 3, 4, 5) en la tabla de datos. A continuacion aparecen los nombres delas variables columnas: No, Poco, Regular y Mucho, y las posiciones columna que ocupan sus valores en la tabla:columnas (3,4), (6,7), (9,10) y (12,13) respectivamente. Se introducen en BEGIN DATA los valores de la tablade doble entrada, anadiendo la primera columna (ROWCAT ) y despues se definen las etiquetas de la variable fila(ROWCAT ), que en este ejemplo corresponden a ’DIR SEN’, ’DIR JUN’, ’EMP SEN’, ’EMP JUN’ y ’ADMINIS’,es obligatorio que vayan entre comillas. Por ultimo es imprescindible en la orden TABLE poner el comando ALLseguido de las dimensiones reales de la tabla.

Figure 6: Valores de los perfiles fila-columna

21

Page 22: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 7: Resultados de las ayudas a la interpretacion

22

Page 23: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 8: Desviaciones de las coordenadas de los perfiles fila

Figure 9: Desviaciones de las coordenadas de los perfiles columna

Figure 10: Diagramas de las coordenadas de las filas y columnas sobre los ejes 1 y 2

Dimensión 1 Transformadas Row categorías

Simétrica Normalización

Row

ADMINISEMP_JUNEMP_SENDIR_JUNDIR_SEN

Dim

en

sió

n 1

Tra

nsfo

rma

da

s R

ow

ca

teg

orí

as

,6

,4

,2

0,0

−,2

−,4

−,6

−,8

23

Page 24: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Dimensión 2 Transformadas Row categorías

Simétrica Normalización

Row

ADMINISEMP_JUNEMP_SENDIR_JUNDIR_SEN

Dim

en

sió

n 2

Tra

nsfo

rma

da

s R

ow

ca

teg

orí

as

1,0

,8

,6

,4

,2

0,0

−,2

−,4

Dimensión 1 Transformadas Column categorías

Simétrica Normalización

Column

MUCHOREGULARPOCONO

Dim

en

sió

n 1

Tra

nsfo

rma

da

s C

olu

mn

ca

teg

orí

as

,8

,6

,4

,2

,0

−,2

−,4

−,6

−,8

−1,0

Dimensión 2 Transformadas Column categorías

Simétrica Normalización

Column

MUCHOREGULARPOCONO

Dim

en

sió

n 2

Tra

nsfo

rma

da

s C

olu

mn

ca

teg

orí

as

,8

,6

,4

,2

−,0

−,2

−,4

−,6

24

Page 25: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 11: Grafica de los perfiles fila, ejes 1-2

Puntos de fila para Row

Simétrica Normalización

Dimensión 1

,6,4,20,0−,2−,4−,6−,8

Dim

en

sió

n 2

,8

,6

,4

,2

0,0

−,2

−,4

ADMINIS

EMP_JUN

EMP_SEN

DIR_JUN

DIR_SEN

Figure 12: Grafica de los perfiles columna, ejes 1-2

Puntos de columna para Column

Simétrica Normalización

Dimensión 1

,6,4,20,0−,2−,4−,6−,8

Dim

en

sió

n 2

,8

,6

,4

,2

−,0

−,2

−,4

−,6

MUCHO

REGULAR

POCO

NO

25

Page 26: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 13: Grafica de los perfiles fila-columna, ejes 1-2

Puntos de columna y de fila

Simétrica Normalización

Dimensión 1

,6,4,20,0−,2−,4−,6−,8

Dim

en

sió

n 2

,8

,6

,4

,2

−,0

−,2

−,4

−,6

Column

Row

MUCHO

REGULAR

POCO

NO

ADMINISEMP_JUN

EMP_SEN

DIR_SEN

26

Page 27: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

3. Modulo CORRESPONDENCE. Introduciendo los datos uno a uno segun la posicion. Los resultados son los mismosdel caso anterior.

Fichero de datos

Planti Fumar Freq

1,00 1,00 4,00

1,00 2,00 2,00

1,00 3,00 3,00

1,00 4,00 2,00

2,00 1,00 4,00

2,00 2,00 3,00

2,00 3,00 7,00

2,00 4,00 4,00

3,00 1,00 25,00

3,00 2,00 10,00

3,00 3,00 12,00

3,00 4,00 4,00

4,00 1,00 18,00

4,00 2,00 24,00

4,00 3,00 33,00

4,00 4,00 13,00

5,00 1,00 10,00

5,00 2,00 6,00

5,00 3,00 7,00

5,00 4,00 2,00

ordenes

DATA LIST FREE

/PLANTI FUMAR FREQ.

WEIGHT BY FREQ.

VALUE LABELS

PLANTI 1 ’DIR_SEN’ 2 ’DIR_JUN’ 3 ’EMPL_SEN’ 4 ’EMPL_JUN’ 5 ’ADMINIS’

/FUMAR 1 ’no’ 2 ’poco’ 3 ’regular’ 4 ’mucho’.

BEGIN DATA

1 1 4 1 2 2 1 3 3 1 4 2

2 1 4 2 2 3 2 3 7 2 4 4

3 1 25 3 2 10 3 3 12 3 4 4

4 1 18 4 2 24 4 3 33 4 4 13

5 1 10 5 2 6 5 3 7 5 4 2

END DATA.

CORRESPONDENCE TABLE=PLANTI(1,5) BY FUMAR(1,4)

/DIMENSION=2

/PLOT TRROWS TRCOLUMNS RPOINTS(15) CPOINTS(15) BIPLOT.

27

Page 28: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

4. Modulo CORRESPONDENCE. Usando menus del programa. Los resultados son los mismos del caso anterior.

Fichero de datos

Planti Fumar Freq

1,00 1,00 4,00

1,00 2,00 2,00

1,00 3,00 3,00

1,00 4,00 2,00

2,00 1,00 4,00

2,00 2,00 3,00

2,00 3,00 7,00

2,00 4,00 4,00

3,00 1,00 25,00

3,00 2,00 10,00

3,00 3,00 12,00

3,00 4,00 4,00

4,00 1,00 18,00

4,00 2,00 24,00

4,00 3,00 33,00

4,00 4,00 13,00

5,00 1,00 10,00

5,00 2,00 6,00

5,00 3,00 7,00

5,00 4,00 2,00

ordenes

CORRESPONDENCE

TABLE = planti(1 5) BY fumar(1 4)

/DIMENSIONS = 2

/MEASURE = CHISQ

/STANDARDIZE = RCMEAN

/NORMALIZATION = SYMMETRICAL

/PRINT = TABLE RPOINTS CPOINTS RPROFILES CPROFILES RCONF CCONF

/PLOT = NDIM(1,2) BIPLOT(20) RPOINTS(20) CPOINTS(20) TRROWS(20) TRCOLUMNS(20) .

Secuencia de menus:

Abrir Fichero de Datos o Introducir Datos −→ Analizar −→ Reduccion de Datos −→ Analisis de Correspondencias−→ −→ Variable Fila −→ −→ Planti −→ Rango de Filas −→ Min=1, Max=5 −→ Actualizar −→ Continuar −→Variable Columna −→ Fumar −→ Rango de Columnas −→ Min=1, Max=4 −→ Actualizar −→ Continuar −→Modelo −→ Estadısticos −→ Graficos −→ Continuar −→ Aceptar.

Nota: Hay que introducir la variable Freq como una variable de peso: datos—-ponderar casos por Freq.Para abrir el editor de sintaxis basta con pulsar el boton Pegar en la ventana: Analizar—Reduccion de datos—Analisisde correspondencias.

28

Page 29: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.7 AC en R

El programa R a partir de su version 2.8.1, utiliza 2 paquetes que realizan Analisis de correspondencias, el paquete cacreado por Michael Greenacre y Oleg NenadicLas y el paquete anacor creado por Jan de Leeuw y Patrick Mair, ademas enesta practica implementamos otra variante que consiste en realizar el analisis paso a paso, recreando el desarrollo teoricodel AC. Utilizamos 3 formas de introducir los datos, leyendolos desde un archivo externo como tabla de frecuencias, comovectores y como una matriz.R en principio (R commander), no funciona con menus sino con ordenes, y en la practica, debajo de cada orden aparecenlıneas precedidas con el caracter #, para indicar que lo que sigue es un comentario de texto, que unas veces explica elsignificado de la operacion inmediatamente anterior, y otras proporciona los resultados de la operacion realizada en el pasoanterior. El programa R, ası como los paquetes asociados, se actualizan periodicamente y permiten realizar cualquier tipode tecnica estadıstica, por lo que consideramos es uno de los programas estadısticos con mayor proyeccion de futuro.

1. AC paso a paso: Fichero de ordenes y resultados:

R version 2.8.1 (2008-12-22) Copyright (C) 2008 The R Foundation for Statistical Computing ISBN 3-900051-07-0

carfumar<-read.table("carfumar.asc",header=T)

# Lee como una tabla con cabecera, el fichero en ASCII,

# c:\rw1071\bin\carfumar.asc.

carfumar

# No Poco Regular Mucho

# Dir_sen 4 2 3 2

# Dir_jun 4 3 7 4

# Emp_sen 25 10 12 4

# Emp_jun 18 24 33 13

# Adminis 10 6 7 2

carfumar.mat<-as.matrix(carfumar)

# Convierte la tabla carfumar en una matriz.

carfumar.mat

# No Poco Regular Mucho

# Dir_sen 4 2 3 2

# Dir_jun 4 3 7 4

# Emp_sen 25 10 12 4

# Emp_jun 18 24 33 13

# Adminis 10 6 7 2

carfumar.prop<- carfumar.mat/sum( carfumar)

# Dividimos todos los valores de la tabla por su total.

carfumar.prop

# No Poco Regular Mucho

# Dir_sen 0.02072539 0.01036269 0.01554404 0.01036269

# Dir_jun 0.02072539 0.01554404 0.03626943 0.02072539

# Emp_sen 0.12953368 0.05181347 0.06217617 0.02072539

# Emp_jun 0.09326425 0.12435233 0.17098446 0.06735751

# Adminis 0.05181347 0.03108808 0.03626943 0.01036269

carfumar.filat<-apply( carfumar.prop,1,sum)

# Calcula la suma de las filas (1) del la matriz carfumar.

carfumar.filat

# Dir_sen Dir_jun Emp_sen Emp_jun Adminis

# 0.05699482 0.09326425 0.26424870 0.45595855 0.12953368

carfumar.colt<-apply( carfumar.prop,2,sum)

# Calcula la suma de las columnas (2) de la matriz carfumar

carfumar.colt

29

Page 30: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

# [,1]

# No 0.3160622

# Poco 0.2331606

# Regular 0.3212435

# Mucho 0.1295337

fdiag<-diag(1/sqrt(carfumar.filat))

# Matriz diagonal utilizada para calcular la matriz E, definida en un paso posterior.

fdiag

# [1] 4.188729

cdiag<-diag(1/sqrt(carfumar.colt))

# Matriz diagonal utilizada para calcular E.

cdiag

# [1] 1.778745

carfumar.filat<-as.matrix(carfumar.filat)

# Convierte el vector carfumar.filat en matriz para calcular E.

carfumar.colt<-as.matrix(carfumar.colt)

# Convierte el vector carfumar.colt en matriz para calcular E.

E<-fdiag%*%(carfumar.prop-carfumar.filat%*%t(carfumar.colt))%*%cdiag

# Calcula la matriz E=(f_(ij)-f_i.f_.j)/sqrt(f_i.f.j)

E

# [,1] [,2] [,3] [,4]

# [1,] 0.02020239 -0.025384382 -0.02043562 0.03468162

# [2,] -0.05097522 -0.042054470 0.03644840 0.07864884

# [3,] 0.15922216 -0.039477006 -0.07795287 -0.07298869

# [4,] -0.13394189 0.055330472 0.06404368 0.03413421

# [5,] 0.05373569 0.005097772 -0.02618966 -0.04953368

carfumar.sva<-svd(E)

# Calcula la Descomposicion en valores singulares de E.

carfumar.sva

# $d

# [1] 2.734211e-01 1.000859e-01 2.033652e-02 5.294257e-17

# $u

# [,1] [,2] [,3] [,4]

# [1,] -0.05742524 -0.46212293 0.8332653 -0.01642830

# [2,] 0.28923816 -0.74239515 -0.5061482 -0.09978896

# [3,] -0.71554563 -0.05475038 -0.1303234 -0.67608617

# [4,] 0.57530335 0.38957951 0.1097504 -0.60356179

# [5,] -0.26469630 0.28376408 -0.1430158 0.41035708

# $v

# [,1] [,2] [,3] [,4]

# [1,] -0.8087001 -0.17127755 -0.0246170 0.5621941

# [2,] 0.1756411 0.68056865 0.5223178 0.4828671

# [3,] 0.4069601 0.04167443 -0.7151246 0.5667835

# [4,] 0.3867013 -0.71116353 0.4638695 0.3599079

raizlambda<-carfumar.sva$d

# Selecciona los valores singulares d.

raizlambda

# [1] 2.734211e-01 1.000859e-01 2.033652e-02 5.294257e-17

30

Page 31: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

U<-carfumar.sva$u[,1:2]

# Selecciona los dos primeros vectores propios de las filas.

# [,1] [,2]

# [1,] -0.05742524 -0.46212293

# [2,] 0.28923816 -0.74239515

# [3,] -0.71554563 -0.05475038

# [4,] 0.57530335 0.38957951

# [5,] -0.26469630 0.28376408

V<-carfumar.sva$v[,1:2]

# Selecciona los dos primeros vectores propios de las columnas.

V

# [,1] [,2]

# [1,] -0.8087001 -0.17127755

# [2,] 0.1756411 0.68056865

# [3,] 0.4069601 0.04167443

# [4,] 0.3867013 -0.71116353

U[,1]<-raizlambda[1]*U[,1]/sqrt(carfumar.filat)

U[,2]<-raizlambda[2]*U[,2]/sqrt(carfumar.filat)

V[,1]<-raizlambda[1]*V[,1]/sqrt(carfumar.colt)

V[,2]<-raizlambda[2]*V[,2]/sqrt(carfumar.colt)

# Escalamos los vectores propios para calcular las coordenadas.

U[,1]

# [1] -0.06576838 0.25895842 -0.38059489 0.23295191 -0.20108912

U[,2]

# [1] -0.19373700 -0.24330457 -0.01065991 0.05774391 0.07891123

V[,1]

# [1] -0.39330845 0.09945592 0.19632096 0.29377599

V[,2]

# [1] -0.030492071 0.141064289 0.007359109 -0.197765656

inercia<-sum(raizlambda[raizlambda>0]*raizlambda[raizlambda>0])

# Calcula la inercia para valores singulares >0.

inercia

# [1] 0.08518986

pc1<-(raizlambda[1]*raizlambda[1]/inercia)*100

pc2<-(raizlambda[2]*raizlambda[2]/inercia)*100.0

# Porcentajes de inercia explicados por cada eje

pc1

# [1] 87.75587

pc2

# [1] 11.75865

# w<-8

# h<-w*raizlambda[1]/raizlambda[2]

# par(pin=c(w,h))

# Asigna el tama~no del area de la grafica para que la

# proporcion entre los ejes permita comparar distancias entre puntos.

# w

# [1] 8

31

Page 32: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

# h

# [1] 21.85492

options(digits=5)

plot(U[,1],U[,2],type="n",

xlab=paste("Eje 1 % inercia=",format(pc1)),

ylab=paste("Eje 2 % inercia=",format(pc2)))

# Crea un marco en el que representar las etiquetas de filas y columnas.

text(U[,1],U[,2],labels=

c(dimnames(carfumar.mat)[[1]]))

title(main="Perfiles fila")

Figure 14: Representacion de los perfiles fila, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2

−0.

25−

0.20

−0.

15−

0.10

−0.

050.

000.

05

Eje 1 % inercia= 87.756

Eje

2 %

iner

cia=

11.

759

Dir_sen

Dir_jun

Emp_sen

Emp_jun

Adminis

Perfiles fila

plot(V[,1],V[,2],type="n",

xlab=paste("Eje 1 % inercia=",format(pc1)),

ylab=paste("Eje 2 % inercia=",format(pc2)))

# Crea un marco en el que representar las etiquetas de filas y columnas.

text(V[,1],V[,2],labels=

c(dimnames(carfumar.mat)[[2]] ))

title(main="Perfiles columna")

T<-rbind(U,V)

# Combina las matrices U y V por filas para representarlas en la matriz T.

T

options(digits=5)

plot(T[,1],T[,2],type="n",

xlab=paste("Eje 1 % inercia=",format(pc1)),

ylab=paste("Eje 2 % inercia=",format(pc2)))

# Crea un marco en el que representar las etiquetas de filas y columnas.

text(T[,1],T[,2],labels=

c(dimnames(carfumar.mat)[[1]],dimnames(carfumar.mat)[[2]]))

title(main="Perfiles fila y columna")

32

Page 33: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 15: Representacion de los perfiles columna, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3

−0.

20−

0.15

−0.

10−

0.05

0.00

0.05

0.10

0.15

Eje 1 % inercia= 87.756

Eje

2 %

iner

cia=

11.

759

No

Poco

Regular

Mucho

Perfiles columna

Figure 16: Representacion de los perfiles fila-columna, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3

−0.

2−

0.1

0.0

0.1

Eje 1 % inercia= 87.756

Eje

2 %

iner

cia=

11.

759

Dir_sen

Dir_jun

Emp_sen

Emp_jun

Adminis

No

Poco

Regular

Mucho

Perfiles fila y columna

33

Page 34: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

2. Ca: Hay que cargar el paquete ca

> carfumar<-read.table("carfumar.asc",header=T)

# Lee el fichero carfumar.asc con cabecera como tabla de frecuencias y lo guarda en el objeto carfumar

> carfumar <- structure(list(No=c(4, 4, 25, 18, 10), Poco= c(2, 3, 10, 24, 6),

Regular= c(3, 7, 12, 33, 7), Mucho= c(2, 4, 4, 13, 2)), .Names = c("NO", "Poco", "Regular", "Mucho"),

row.names = c("Dir_S", "Dir_J", "Emp_S", "Emp_J", "Adm"), class = "data.frame")

# Otra forma de introducir los datos con la funcion structure

> carfumar

# Comprobamos el contenido del objeto carfumar

No Poco Regular Mucho

Dir_sen 4 2 3 2

Dir_jun 4 3 7 4

Emp_sen 25 10 12 4

Emp_jun 18 24 33 13

Adminis 10 6 7 2

> summary(ca(carfumar))

# Obtenemos un resumen del analisis

Principal inertias (eigenvalues):

dim value % cum% scree plot

[1,] 1 0.074759 87.8 87.8 *************************

[2,] 2 0.010017 11.8 99.5 ***

[3,] 3 0.000414 0.5 100.0

[4,] -------- -----

[5,] Total: 0.085190 100.0

Rows:

name mass qlt inr k=1 cor ctr k=2 cor ctr

1 | Dr_s | 57 893 31 | -66 92 3 | -194 800 214 |

2 | Dr_j | 93 991 139 | 259 526 84 | -243 465 551 |

3 | Emp_s | 264 1000 450 | -381 999 512 | -11 1 3 |

4 | Emp_j | 456 1000 308 | 233 942 331 | 58 58 152 |

5 | Adm | 130 999 71 | -201 865 70 | 79 133 81 |

Columns:

name mass qlt inr k=1 cor ctr k=2 cor ctr

1 | No | 316 1000 577 | -393 994 654 | -30 6 29 |

2 | Poc | 233 984 83 | 99 327 31 | 141 657 463 |

3 | Rgl | 321 983 148 | 196 982 166 | 7 1 2 |

4 | Mch | 130 995 192 | 294 684 150 | -198 310 506 |

> plot(ca(carfumar))

# Representacion bidimensional de filas y columnas en coordenadas estandar

< plot(ca(carfumar), mass=c(T,T))

# Representacion bidimensional de filas y columnas en coordenadas estandar donde ademas el tama~no del

# sımbolo de los puntos representa sus masas

> plot(ca(carfumar), what = c("none", "all"), mass = TRUE, contrib = "relative")

# Representacion de los perfiles columna, donde el tama~no del sımbolo de los puntos representa sus

# masas y la intensidad del color las contribuciones relativas (CTR)

> plot(ca(carfumar), what = c("all", "none"), mass = TRUE, contrib = "relative")

# Representacion de los perfiles fila, donde el tama~no del sımbolo de los puntos representa sus masas

# y la intensidad del color las contribuciones relativas (CTR)

34

Page 35: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 17: Representacion de los perfiles fila y columna, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3

−0.

3−

0.2

−0.

10.

00.

10.

2

Dir_sen

Dir_jun

Emp_sen

Emp_junAdminis

No

Poco

Regular

Mucho

Figure 18: Representacion de los perfiles fila y columna con masas, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3

−0.

3−

0.2

−0.

10.

00.

10.

2

Dir_sen

Dir_jun

Emp_sen

Emp_junAdminis

No

Poco

Regular

Mucho

> plot(ca(carfumar), what = c("all", "all"), mass = TRUE, contrib = "relative")

# Representacion de los perfiles columna, donde el tama~no del sımbolo de los puntos representa sus

# masas y la intensidad del color las contribuciones relativas (CTR)

35

Page 36: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 19: Representacion de los perfiles columna con masas y CTR, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3

−0.

3−

0.2

−0.

10.

00.

10.

20.

3

No

Poco

Regular

Mucho

Figure 20: Representacion de los perfiles fila con masas y CTR, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2

−0.

3−

0.2

−0.

10.

00.

10.

2

Dir_sen

Dir_jun

Emp_sen

Emp_junAdminis

36

Page 37: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 21: Representacion de los perfiles fila y columna con masas y CTR, ejes1-2

−0.4 −0.3 −0.2 −0.1 0.0 0.1 0.2 0.3

−0.

3−

0.2

−0.

10.

00.

10.

2

Dir_sen

Dir_jun

Emp_sen

Emp_junAdminis

No

Poco

Regular

Mucho

3. Anacor: Hay que cargar el paquete anacor

> carfumar<-read.table("carfumar.asc",header=T)

# Lee el fichero carfumar.asc con cabecera como tabla de frecuencias y lo guarda en el objeto carfumar

> carfumar

# Comprobamos el contenido del objeto carfumar

No Poco Regular Mucho

Dir_sen 4 2 3 2

Dir_jun 4 3 7 4

Emp_sen 25 10 12 4

Emp_jun 18 24 33 13

Adminis 10 6 7 2

> res<-anacor(carfumar, scaling=c("standard","standard"))

# El resultado de aplicar la funcion anacor se guarda en el objeto res

> res

# Comprobamos el contenido del objeto res

Principal inertias (eigenvalues):

dim value % cum% scree plot

[1,] 1 0.074759 87.8 87.8 *************************

[2,] 2 0.010017 11.8 99.5 ***

[3,] 3 0.000414 0.5 100.0

[4,] -------- -----

[5,] Total: 0.085190 100.0

> summary(res)

# Obtenemos un resumen del analisis

37

Page 38: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

z-test for singular values:

Singular Values Asymptotical SE p-value

D1 0.2734 0.0700 0.0000

D2 0.1001 0.0756 0.0929

Row scores:

D1 D2

Dir_S 0.24054 -1.93571

Dir_J -0.94710 -2.43096

Emp_S 1.39197 -0.10651

Emp_J -0.85199 0.57694

Adm 0.73546 0.78844

Column scores:

D1 D2

NO 1.43847 -0.30466

Poco -0.36375 1.40943

Regular -0.71802 0.07353

Mucho -1.07445 -1.97596

> plot(res, plot.type="rowplot", xlab="Plantilla", ylab="Habito de fumar")

# Representacion bidimensional de las filas en coordenadas estandar

Figure 22: Representacion de los perfiles fila, ejes1-2

−1.0 −0.5 0.0 0.5 1.0

−2.

5−

2.0

−1.

5−

1.0

−0.

50.

00.

5

Row Plot

Plantilla

Háb

ito d

e fu

mar

Dir_sen

Dir_jun

Emp_sen

Emp_jun

Adminis

< plot(res, plot.type="colplot", xlab="Plantilla", ylab="Habito de fumar")

# Representacion bidimensional de las columnas en coordenadas estandar

> plot(res, plot.type="jointplot", xlab="Plantilla", ylab="Habito de fumar")

# Representacion bidimensional conjunta de las fuilas y columnas en coordenadas estandar

38

Page 39: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Figure 23: Representacion de los perfiles columna, ejes1-2

−1.0 −0.5 0.0 0.5 1.0 1.5

−2.

0−

1.5

−1.

0−

0.5

0.0

0.5

1.0

1.5

Column Plot

Plantilla

Háb

ito d

e fu

mar

No

Poco

Regular

Mucho

Figure 24: Representacion de los perfiles fila y columna, ejes1-2

−1.0 −0.5 0.0 0.5 1.0 1.5

−2

−1

01

Joint plot

Plantilla

Háb

ito d

e fu

mar

Dir_sen

Dir_jun

Emp_sen

Emp_jun

Adminis

No

Poco

Regular

Mucho

39

Page 40: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.8 Ejemplo 2.

Una companıa trabaja con tres tipos de clientes, a los que llamaremos A, B y C respectivamente. Se extrae una muestraaleatoria de cada una de las tres categorıas de clientes, de las que se recogen cinco variables demograficas: Sexo, Estadocivil, Edad, Ingresos y Comunidad de residencia. La siguiente tabla muestra las dieciocho categorıas de estas cincovariables:

Variables demograficas Tipo de clienteA B C

Sexo Hombre 2444 853 1547Mujer 712 551 923

Estado civil Soltero 523 290 519Casado 2630 1106 1946

Edad e1 (16–24) anos 189 70 136e2 (25–34) anos 796 133 444e3 (35–49) anos 1100 314 706e4 ≥ 50 anos 1070 882 1187

Ingresos i1 (mas bajos) 273 336 427i2 1005 422 739i3 1049 305 609i4 (mas altos) 767 250 612

Comunidad c1 436 142 315de c2 843 226 494residencia c3 243 84 453

c4 346 145 248c5 775 584 708c6 519 226 263

Nota:(Esta tabla no es una verdadera tabla de contingencia, puesto que esta formada por cinco tablas de contingencia en

donde cada variable demografica categoriza a la muestra, compuesta de alrededor de siete mil clientes.)

• Crea un fichero A:\CA2.ASC, que contenga los datos de la tabla anterior.

• Crea el fichero de ordenes, de nombre CA2.INP.

• Comenta los resultados obtenidos.

1.8.1 Fichero de ordenes y salida generada por BMDP

Programa de ordenes del fichero CA1.INP

/PROBLEM TITTLE IS ’SEGUNDA PRACTICA DE CA’.

/INPUT VARIABLES=2.

FORMAT=FREE.

TABLE=3,18.

FILE IS ’A:\CA2.ASC’.

/VARIABLES NAMES=CLIENTES,DEMOGRAFIA.

/CATEGORY NAMES(CLIENTES)=CLIEN_A,CLIEN_B,CLIEN_C.

NAMES(DEMOGRAFIA)=H,M,S,C,e1,e2,e3,e4,i1,

i2,i3,i4,c1,c2,c3,c4,c5,c6.

/PRINT LEVEL=NORMAL.

/END

CORRES COL=CLIENTES.

ROW=DEMOGRAFIA./

PRINT PERCENT=ROW./

PLOT SIZE=53,25. /

PLOT MAX=0.18, 0.05. MIN=-0.17,-0.13. NO ROWS. NO COL./

PLOT XAXIS=1. NO ROWS. NO COL./

PLOT XAXIS=1. NO ROWS. NO COL. MAX=0.25. MIN=-0.1. SIZE=53,35./

END/

Salida proporcionada por el programa CA del BMDP

40

Page 41: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

ANALYSIS OF OBSERVED FREQUENCY TABLE

TOTAL INERTIA = SUM OF EIGENVALUES = 0.0354

AXIS EIGENVALUE % OF INERTIA CUM % HISTOGRAM

1 0.028 78.7 78.7 |************************

2 0.008 21.3 100.0 |******

MAXIMUM NUMBER OF FACTORS TO EXTRACT .................... 2

CUT-OFF TOLERANCE ....................................... 90.00%

NUMBER OF FACTORS ACCOUNTING FOR 90.00% OF INERTIA ..... 2

NUMBER OF FACTORS ACTUALLY EXTRACTED .................... 2

CHISQUARE VALUE WITH 34 DF = 1235.272

CHISQUARE ASSOCIATED P-VALUE = 0.000

ROWS

----------------------------------------------------------------------

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 Hombre 0.139 1.000 0.002 | -0.105 0.922 0.055 | 0.031 0.078 0.017

2 Mujer 0.063 1.000 0.004 | 0.244 0.940 0.134 | -0.061 0.060 0.031

3 Soltero 0.038 1.000 0.001 | 0.108 0.865 0.016 | -0.043 0.135 0.009

4 Casado 0.163 1.000 0.000 | -0.023 0.802 0.003 | 0.011 0.198 0.003

5 e1 0.011 1.000 0.000 | -0.064 0.980 0.002 | -0.009 0.020 0.000

6 e2 0.039 1.000 0.004 | -0.297 0.966 0.125 | -0.056 0.034 0.016

7 e3 0.061 1.000 0.001 | -0.154 0.984 0.052 | -0.020 0.016 0.003

8 e4 0.090 1.000 0.006 | 0.248 0.975 0.199 | 0.040 0.025 0.019

9 i1 0.030 1.000 0.005 | 0.409 0.995 0.178 | 0.028 0.005 0.003

10 i2 0.062 1.000 0.000 | -0.024 0.761 0.001 | 0.014 0.239 0.002

11 i3 0.056 1.000 0.002 | -0.171 0.980 0.059 | 0.025 0.020 0.005

12 i4 0.047 1.000 0.001 | -0.075 0.439 0.009 | -0.084 0.561 0.044

13 c1 0.026 1.000 0.000 | -0.096 0.845 0.008 | -0.041 0.155 0.006

14 c2 0.045 1.000 0.002 | -0.189 0.999 0.057 | 0.004 0.001 0.000

15 c3 0.022 1.000 0.005 | 0.128 0.070 0.013 | -0.466 0.930 0.645

16 c4 0.021 1.000 0.000 | -0.030 0.599 0.001 | 0.024 0.401 0.002

17 c5 0.059 1.000 0.003 | 0.197 0.797 0.083 | 0.100 0.203 0.078

18 c6 0.029 1.000 0.001 | -0.075 0.156 0.006 | 0.175 0.844 0.117

COLUMNS

---------------------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 CLIEN_A 0.450 1.000 0.014 | -0.173 0.966 0.486 | 0.033 0.034 0.064

2 CLIEN_B 0.198 1.000 0.015 | 0.244 0.806 0.424 | 0.120 0.194 0.378

3 CLIEN_C 0.352 1.000 0.007 | 0.084 0.374 0.090 | -0.109 0.626 0.558

---------------------------------------------------------------------

41

Page 42: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

*** OBSERVED FREQUENCY TABLE

demograf clientes

------ ------

CLIEN_A CLIEN_B CLIEN_C TOTAL

---------------------------------------------

H 2444 853 1547 | 4844

M 712 551 923 | 2186

S 523 290 519 | 1332

C 2630 1106 1946 | 5682

e1 189 70 136 | 395

e2 796 133 444 | 1373

e3 1100 314 706 | 2120

e4 1070 882 1187 | 3139

i1 273 336 427 | 1036

i2 1005 422 739 | 2166

i3 1049 305 609 | 1963

i4 767 250 612 | 1629

c1 436 142 315 | 893

c2 843 226 494 | 1563

c3 243 84 453 | 780

c4 346 145 248 | 739

c5 775 584 708 | 2067

c6 519 226 263 | 1008

-----------------------------------|---------

TOTAL 15720 6919 12276 | 34915

*** PERCENTS OF ROW TOTALS

demograf clientes

------ ------

CLIEN_A CLIEN_B CLIEN_C TOTAL

---------------------------------------------

H 50.5 17.6 31.9 | 100.0

M 32.6 25.2 42.2 | 100.0

S 39.3 21.8 39.0 | 100.0

C 46.3 19.5 34.2 | 100.0

e1 47.8 17.7 34.4 | 100.0

e2 58.0 9.7 32.3 | 100.0

e3 51.9 14.8 33.3 | 100.0

e4 34.1 28.1 37.8 | 100.0

i1 26.4 32.4 41.2 | 100.0

i2 46.4 19.5 34.1 | 100.0

i3 53.4 15.5 31.0 | 100.0

i4 47.1 15.3 37.6 | 100.0

c1 48.8 15.9 35.3 | 100.0

c2 53.9 14.5 31.6 | 100.0

c3 31.2 10.8 58.1 | 100.0

c4 46.8 19.6 33.6 | 100.0

c5 37.5 28.3 34.3 | 100.0

c6 51.5 22.4 26.1 | 100.0

-----------------------------------|---------

TOTAL 45.0 19.8 35.2 | 100.0

42

Page 43: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS (fig.1)

...+.....+.....+.....+.....+.....+.....+.....+.....+....

- | -

.2 + + +

- c6 | -

- | -

- | CLIEN_B -

- | c5 -

- | -

- i3 H c4| e4 i1 -

0. +--+-----+c2---+-e1-C+-----+-----+-----+-----+-----+---+

- e3 c1 | S -

A - e2 | M -

X - i4 | -

I - | CLIEN_C -

S - | -

- | -

2 -.2 + + +

- | -

- | -

- | -

- | -

- | -

- | -

-.4 + + +

- | -

- | c3 -

- | -

...+.....+.....+.....+.....+.....+.....+.....+.....+....

-.3 -.2 -.1 0. .1 .2 .3 .4 .5

AXIS 1

L1 = .0279 ( 78.7%) L2 = .0075 ( 21.3%)

*** NOTE *** LABELS AND COORDINATES OF POINTS WHICH

WOULD OVERWRITE POINTS ALREADY PLOTTED LABEL (AXIS 1, AXIS 2)

i2( -0.02, 0.01) CLIEN_A (-0.17, 0.03)

PLOT OF ROWS (fig.2)

...+.....+.....+.....+.....+.....+.....+.....+.....+....

- | -

.2 + + +

- c6 | -

- | -

- | -

- | c5 -

- | -

- i3 H c4| e4 i1 -

0. +--+-----+c2---+-e1-C+-----+-----+-----+-----+-----+---+

- e3 c1 | S -

A - e2 | M -

X - i4 | -

I - | -

S - | -

- | -

2 -.2 + + +

- | -

- | -

- | -

- | -

- | -

- | -

-.4 + + +

- | -

- | c3 -

- | -

...+.....+.....+.....+.....+.....+.....+.....+.....+....

-.3 -.2 -.1 0. .1 .2 .3 .4 .5

AXIS 1

LX = .0279 ( 78.7%) LY = .0075 ( 21.3%)

***NOTE*** LABELS AND COORDINATES OF POINTS WHICH WOULD OVERWRITE

POINTS ALREADY PLOTTED LABEL (AXIS 1, AXIS 2) i2(-0.02, 0.01)

43

Page 44: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS (fig.3)

.+....+....+....+....+....+....+....+....+....+....+....

- | -

- | CLIEN_B -

- | -

.10 + + +

- | -

- | -

- | -

- | -

.05 + + +

- | -

A - CLIEN_A | -

X - | -

I - | -

S 0.0 ++----+----+----+----+----+----+----+----+----+----+---+

- | -

2 - | -

- | -

- | -

-.05 + + +

- | -

- | -

- | -

- | -

-.10 + + +

- | CLIEN_C -

- | -

.+....+....+....+....+....+....+....+....+....+....+....

-.15 -.05 .05 .15 .25

-.20 -.10 0.0 .10 .20 .30

AXIS 1

LX = .0279 ( 78.7%) LY = .0075 ( 21.3%)

PLOT OF ROWS AND COLUMNS (fig.4)

.....+.....+.....+.....+.....+.....+.....+.....+.....+..

- | -

- | -

.05 + + +

- | -

- H | -

- c4 | -

- i2 | -

- C | -

0.0 +----+-----+-----+-----+-----+-----+-----+-----+-----+-+

- e1 | -

A - e3 | -

X - | -

I - | -

S - c1 | S -

-.05 + + +

2 - | -

- | -

- | -

- i4 | -

- | -

-.10 + + +

- | CLIEN_C -

- | -

- | -

- | -

- | -

.....+.....+.....+.....+.....+.....+.....+.....+.....+..

-.15 -.05 .05 .15 .25

-.10 0.0 .10 .20

AXIS 1

L1 = .0279 ( 78.7%)

L2 = .0075 ( 21.3%)

44

Page 45: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS (fig.5)

- . -

.4 + i1 + +

- . -

- . -

- . -

- . -

- M .CLIEN_B -

- . -

.2 + c5 + +

A - . -

X - . -

I - S . -

S - .CLIEN_C -

- . -

1 - . -

0. + + +

- C . -

- e1 . -

- i4 . -

- H . -

- e3 . -

- i3 .CLIEN_A -

-.2 + c2 + +

- . -

- . -

- e2 . -

L1 = .0279 ( 78.7%)

*** NOTE *** LABELS AND COORDINATES OF POINTS WHICH

WOULD OVERWRITE POINTS ALREADY PLOTTED LABEL(AXIS 1)

e4(0.25) i2(-0.02) c1(-0.10) c3(0.13) c4(-0.03) c6(-0.07)

PLOT OF ROWS AND COLUMNS (fig.6)

.25 + e4 + +

- M .CLIEN_B -

- . -

- . -

- . -

.20 + c5 + +

- . -

- . -

- . -

- . -

.15 + + +

- . -

- c3 . -

- . -

A - S . -

X .10 + + +

I - . -

S - .CLIEN_C -

- . -

1 - . -

.05 + + +

- . -

- . -

- . -

- . -

0.0 + + +

- . -

- i2 C . -

- c4 . -

- . -

-.05 + + +

- e1 . -

- c6 i4 . -

- . -

- . -

-.10 + c1 + +

45

Page 46: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.8.2 Analisis del ejemplo 2.

Como hemos dicho antes, al no ser una verdadera tabla de contingencia no es aplicable el P-VALUE del contraste de χ2

de independencia de las variables.Al ser una tabla de (18x3), la verdadera dimension de la tabla es dos, por lo que al realizar el CA, la representacion

bidimensional va a ser un fiel reflejo de la posicion de los puntos y por eso los dos primeros ejes representan el 100% de laInercia y las QLT van a ser todas uno, es decir vamos a tener una representacion exacta de la nube de puntos y la tablade contribuciones no va a ser necesaria salvo para estudiar los ejes principales individualmente.

La interpretacion debe hacerse en terminos de las categorıas de cada variable demografica, en relacion a los tipos declientes, es decir, solo podremos estudiar los perfiles fila y comparar perfiles fila entre si, por la particular tabla que tenemosy por lo tanto unicamente especificamos la tabla de porcentajes por filas. Se observa que el primer eje esta en la direccionde los puntos e4, i1, M, y e2 que son los que tienen un mayor valor de CTR, asımismo el segundo eje esta en la direccionde c6 y c3 que son los que aportan mayor contribucion a la inercia del eje, y por lo tanto determinan la orientacion delmismo. Ademas estos dos puntos son los que forman un mayor angulo con el primer eje, por eso presentan el COR2 masbajo.

• figuras 1,2,5

– Los cuatro puntos que representan el grupo de la edad se observa que estan aproximadamente en lınea recta,ortogonalmente al vector que representa el punto CLIEN C, lo que sugiere que hay poca diferencia en laproporcion de estos clientes a traves de ese grupo, apreciandose una mayor proporcion de CLIEN B en losgrupos de mayor edad y una mayor proporcion de CLIEN A entre los mas jovenes, en especial en el grupo e2,entendiendo esa mayor proporcion en relacion al origen, centroide o centro de gravedad (0.45, 0.19, 0.35).

– Tambien se observa una baja proporcion de CLIEN B en e2 (grupo de edad de 25–34 anos).

– Se observa una alta proporcion de CLIEN A, en los grupos: H (hombres), e2 (25–34) anos, e3 (35–49) anos, i2,i3, c1, c2 y c4.

– Se observa una alta proporcion de CLIEN B en el grupo c5.

– Hay una alta proporcion de CLIEN B y CLIEN C en el grupo de M (mujeres), S (solteros), e4 (≥ 50 anos), i1(ingresos mas bajos).

– Hay una alta proporcion de CLIEN A y CLIEN C en los grupos de C (casados), e1 (16–24) anos, i4 (ingresosmas altos).

– Hay una alta proporcion de CLIEN A y CLIEN B en el grupo de residencia c6.

– Los puntos C (casados), i2, c4, estan muy proximos al origen.

– La proximidad entre el punto i1 (ingresos mas bajos) y M (mujeres), indica que tienen ambos una alta proporcionde CLIEN B y CLIEN C y una baja proporcion de CLIEN A, lo que significa que en relacion a los serviciosque presta la companıa, ambos puntos tienen el mismo tratamiento, y no que las mujeres tengan ingresos muybajos.

– El grupo i4 (ingresos mas altos) esta muy proximo al c1 (primera comunidad de residencia), lo que indica queambos tienen la misma proporcion de clientes, es decir el mismo tipo de servicio y no que los que viven en c1tienen ingresos mas altos.

– Las diferencias entre los puntos H (hombres) y M (mujeres) es la misma que la existente entre los de mayor ymenor edad en relacion al tipo de cliente,es decir al tipo de servicio que reciben de la companıa, etc. . .

• La figura 3 en este caso representa a los tipos de clientes y solo sirve para ver el punto CLIEN A que no aparece enlas representaciones anteriores al estar solapado con otros puntos.

• Las figuras 4 y 6 son ampliaciones de las figuras 1 y 5 respectivamente, para mostrar los puntos que estaban solapados.En la figura 4 aparece el punto i2 que no aparecıa en la 1, y en la figura 6 aparecen los puntos e4, c1, c4 y c3 queno se representaban en la 5, aunque siguen sin salir i2 y c6. Para lograr esto se marcan unos valores maximos ymınimos para cada uno de los ejes.

46

Page 47: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.9 Ejemplo 3.

La difusion de la prensa en Espana desde 1982 hasta 1991 segun los boletines de la O.J.D., viene recogida en el Anuariodel diario El Paıs del ano 1993, segun la siguiente tabla que hemos limitado a los 24 periodicos de mayor difusion. Realizaun analisis de correspondencias sobre dicha tabla.

Table 3: Difusion de la prensa en Espana en miles de ejemplares

Diarios 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991

El Paıs 296 341 348 348 360 373 376 378 376 395

Abc 134 146 157 219 235 247 268 280 291 293

Marca 97 93 113 112 92 144 165 200 210 259

El Periodico 123 127 128 147 151 154 157 172 171 172

As 140 137 143 157 154 157 160 163 160 151

El Correo Espanol 83 103 108 114 116 123 126 127 130 134

Diario 16 125 130 128 130 135 136 140 145 145 126

La Voz de Galicia 73 71 77 78 77 82 88 95 96 102

El Diario Vasco 64 68 72 75 77 81 84 86 89 92

Sport 44 46 50 50 51 50 62 66 70 70

El Mundo Deportivo 41 40 44 48 50 55 57 57 58 57

Diario de Navarra 39 37 41 42 42 43 48 52 55 57

Las Provincias 46 51 61 57 55 56 56 56 58 57

Heraldo de Aragon 52 50 49 50 49 49 49 50 51 53

Ya 110 105 96 88 80 75 69 63 60 46

Egin 43 43 43 44 42 40 42 43 44 46

La Verdad 46 45 43 43 40 40 38 44 45 45

La Nueva Espana 31 30 31 33 35 36 37 38 39 44

Levante 28 25 27 30 28 27 42 43 46 44

Avui 39 39 40 40 42 39 37 37 38 39

Sur 26 25 28 39 27 32 33 35 36 37

La Provincia 29 29 29 33 32 32 34 37 36 36

Informacion 22 21 24 29 32 31 31 34 36 36

Ideal 24 23 23 23 23 26 26 31 33 34

Pasos a seguir en la realizacion de la practica.

• Crea un fichero A:\CA3.ASC, que contenga los datos de la tabla anterior.

• Crea el fichero de ordenes, de nombre CA3.INP.

• ¿Que relaciones establece el primer eje principal?

• ¿Que relaciones establece el segundo eje principal?

• Compara los perfiles fila entre sı.

• Compara los perfiles columna entre sı.

• Interpreta las relaciones entre los perfiles fila y los perfiles columna.

• ¿Que sera mas interesante, el estudio de los perfiles fila a traves de los perfiles columna o lo contrario?

47

Page 48: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.9.1 Fichero de ordenes y salida generada por BMDP

Programa de ordenes del fichero CA3.INP

/PROBLEM TITTLE IS ’TERCERA PRACTICA DE CA’.

/INPUT VARIABLES=2.

FORMAT=FREE.

TABLE=10,24.

FILE IS ’A:\CA3.ASC’.

/VARIABLES NAMES=Periodo,Prensa.

/CATEGORY NAMES(Periodo)=’1982’, ’1983’, ’1984’, ’1985’, ’1986’,

’1987’,’1988’, ’1989’, ’1990’, ’1991’.

NAMES(Prensa)=’El Pais’, Abc, Marca, ’El Periodico’,

As, ’El Correo’, Diario16, Voz_Galicia, D_Vasco,

Sport, Mund_Deportivo, D_Navarra, Provincias,

Heraldo_Aragon, Ya, Egin, ’La Verdad’, Nueva_Espana,

Levante, Avui, Sur, La_Provincia, Informacion, Ideal.

/PRINT LINESIZE=80.

LEVEL=NORMAL.

/END

CORRES COL=Periodo.

ROW=Prensa./

PRINT PERCENT=ROW,COL./

PLOT SIZE=70,30./

PLOT XAXIS=1. SIZE=40,40./

PLOT XAXIS=1. NO ROWS. NO COL. MAX=0.2. MIN=-0.14./

END /

Salida proporcionada por el programa CA de BMDP

ANALYSIS OF OBSERVED FREQUENCY TABLE

TOTAL INERTIA = SUM OF EIGENVALUES = 0.0165

AXIS EIGENVALUE % OF INERTIA CUM % HISTOGRAM

1 0.013 81.7 81.7 |************************

2 0.002 12.2 93.9 |****

3 0.000 2.7 96.6 |*

4 0.000 1.2 97.8 |

5 0.000 1.0 98.7 |

6 0.000 0.6 99.3 |

7 0.000 0.3 99.6 |

8 0.000 0.3 99.9 |

9 0.000 0.1 100.0 |

MAXIMUM NUMBER OF FACTORS TO EXTRACT .................... 9

CUT-OFF TOLERANCE ....................................... 90.00%

NUMBER OF FACTORS ACCOUNTING FOR 90.00% OF INERTIA ..... 2

NUMBER OF FACTORS ACTUALLY EXTRACTED .................... 2

CHISQUARE VALUE WITH 207 DF = 347.106

CHISQUARE ASSOCIATED P-VALUE = 0.000

48

Page 49: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

ROWS

-------------------------------------------------------------------------------

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 El Pais 0.171 0.662 0.000 | -0.040 0.625 0.021 | -0.010 0.037 0.008

2 Abc 0.108 0.989 0.003 | 0.140 0.763 0.157 | -0.076 0.226 0.310

3 Marca 0.071 0.996 0.005 | 0.247 0.839 0.320 | 0.107 0.158 0.402

4 El Perio 0.071 0.556 0.000 | 0.010 0.135 0.001 | -0.018 0.421 0.011

5 As 0.072 0.903 0.000 | -0.063 0.826 0.021 | -0.019 0.077 0.013

6 El Corre 0.055 0.432 0.000 | 0.009 0.039 0.000 | -0.030 0.392 0.025

7 Diario16 0.064 0.860 0.000 | -0.077 0.848 0.028 | -0.009 0.011 0.003

8 Voz_Gali 0.040 0.886 0.000 | 0.013 0.158 0.001 | 0.028 0.727 0.016

9 D_Vasco 0.037 0.253 0.000 | 0.004 0.106 0.000 | -0.005 0.147 0.001

10 Sport 0.027 0.701 0.000 | 0.056 0.569 0.006 | 0.027 0.132 0.010

11 Mund_Dep 0.024 0.591 0.000 | 0.021 0.205 0.001 | -0.028 0.386 0.010

12 D_Navarr 0.022 0.791 0.000 | 0.035 0.443 0.002 | 0.031 0.347 0.010

13 Provinci 0.026 0.601 0.000 | -0.069 0.593 0.009 | -0.008 0.008 0.001

14 Heraldo_ 0.024 0.948 0.000 | -0.098 0.851 0.017 | 0.033 0.097 0.013

15 Ya 0.038 0.994 0.005 | -0.351 0.969 0.344 | 0.057 0.026 0.061

16 Egin 0.020 0.939 0.000 | -0.094 0.835 0.013 | 0.033 0.104 0.011

17 La Verda 0.020 0.934 0.000 | -0.112 0.716 0.019 | 0.062 0.219 0.038

18 Nueva_Es 0.017 0.118 0.000 | 0.008 0.041 0.000 | 0.010 0.078 0.001

19 Levante 0.016 0.625 0.000 | 0.108 0.524 0.014 | 0.047 0.101 0.018

20 Avui 0.019 0.930 0.000 | -0.123 0.930 0.021 | 0.001 0.000 0.000

21 Sur 0.015 0.014 0.000 | 0.009 0.009 0.000 | -0.006 0.004 0.000

22 La_Provi 0.016 0.428 0.000 | -0.022 0.427 0.001 | -0.001 0.001 0.000

23 Informac 0.014 0.787 0.000 | 0.060 0.478 0.004 | -0.049 0.309 0.016

24 Ideal 0.013 0.782 0.000 | 0.036 0.205 0.001 | 0.060 0.576 0.023

COLUMNS

--------------------------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 1982 0.083 0.947 0.003 | -0.174 0.816 0.188 | 0.070 0.131 0.202

2 1983 0.087 0.969 0.003 | -0.167 0.940 0.179 | 0.029 0.029 0.037

3 1984 0.091 0.895 0.001 | -0.116 0.828 0.090 | 0.033 0.067 0.049

4 1985 0.097 0.767 0.001 | -0.061 0.559 0.026 | -0.037 0.209 0.066

5 1986 0.096 0.945 0.001 | -0.061 0.311 0.027 | -0.087 0.634 0.361

6 1987 0.101 0.608 0.000 | 0.008 0.020 0.000 | -0.041 0.587 0.085

7 1988 0.106 0.828 0.000 | 0.056 0.674 0.024 | -0.027 0.154 0.037

8 1989 0.111 0.955 0.001 | 0.097 0.953 0.078 | 0.004 0.002 0.001

9 1990 0.113 0.960 0.002 | 0.117 0.954 0.114 | 0.009 0.006 0.005

10 1991 0.115 0.978 0.004 | 0.179 0.901 0.273 | 0.052 0.078 0.157

*** OBSERVED FREQUENCY TABLE

Prensa Periodo

------ ------

1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 TOTAL

-----------------------------------------------------------------------

El Pais 296 341 348 348 360 373 376 378 376 395 | 3591

Abc 134 146 157 219 235 247 268 280 291 293 | 2270

Marca 97 93 113 112 92 144 165 200 210 259 | 1485

El Perio 123 127 128 147 151 154 157 172 171 172 | 1502

As 140 137 143 157 154 157 160 163 160 151 | 1522

El Corre 83 103 108 114 116 123 126 127 130 134 | 1164

Diario16 125 130 128 130 135 136 140 145 145 126 | 1340

Voz_Gali 73 71 77 78 77 82 88 95 96 102 | 839

D_Vasco 64 68 72 75 77 81 84 86 89 92 | 788

Sport 44 46 50 50 51 50 62 66 70 70 | 559

Mund_Dep 41 40 44 48 50 55 57 57 58 57 | 507

D_Navarr 39 37 41 42 42 43 48 52 55 57 | 456

Provinci 46 51 61 57 55 56 56 56 58 57 | 553

Heraldo_ 52 50 49 50 49 49 49 50 51 53 | 502

Ya 110 105 96 88 80 75 69 63 60 46 | 792

Egin 43 43 43 44 42 40 42 43 44 46 | 430

La Verda 46 45 43 43 40 40 38 44 45 45 | 429

Nueva_Es 31 30 31 33 35 36 37 38 39 44 | 354

Levante 28 25 27 30 28 27 42 43 46 44 | 340

Avui 39 39 40 40 42 39 37 37 38 39 | 390

Sur 26 25 28 39 27 32 33 35 36 37 | 318

La_Provi 29 29 29 33 32 32 34 37 36 36 | 327

Informac 22 21 24 29 32 31 31 34 36 36 | 296

Ideal 24 23 23 23 23 26 26 31 33 34 | 266

--------------------------------------------------------------|--------

TOTAL - 1755 1825 1903 2029 2025 2128 2225 2332 2373 2425 | 21020

49

Page 50: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

*** PERCENTS OF ROW TOTALS

Prensa Periodo

------ ------

1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 TOTAL

-----------------------------------------------------------------------------

El Pais 8.2 9.5 9.7 9.7 10.0 10.4 10.5 10.5 10.5 11.0 | 100.0

Abc 5.9 6.4 6.9 9.6 10.4 10.9 11.8 12.3 12.8 12.9 | 100.0

Marca 6.5 6.3 7.6 7.5 6.2 9.7 11.1 13.5 14.1 17.4 | 100.0

El Perio 8.2 8.5 8.5 9.8 10.1 10.3 10.5 11.5 11.4 11.5 | 100.0

As 9.2 9.0 9.4 10.3 10.1 10.3 10.5 10.7 10.5 9.9 | 100.0

El Corre 7.1 8.8 9.3 9.8 10.0 10.6 10.8 10.9 11.2 11.5 | 100.0

Diario16 9.3 9.7 9.6 9.7 10.1 10.1 10.4 10.8 10.8 9.4 | 100.0

Voz_Gali 8.7 8.5 9.2 9.3 9.2 9.8 10.5 11.3 11.4 12.2 | 100.0

D_Vasco 8.1 8.6 9.1 9.5 9.8 10.3 10.7 10.9 11.3 11.7 | 100.0

Sport 7.9 8.2 8.9 8.9 9.1 8.9 11.1 11.8 12.5 12.5 | 100.0

Mund_Dep 8.1 7.9 8.7 9.5 9.9 10.8 11.2 11.2 11.4 11.2 | 100.0

D_Navarr 8.6 8.1 9.0 9.2 9.2 9.4 10.5 11.4 12.1 12.5 | 100.0

Provinci 8.3 9.2 11.0 10.3 9.9 10.1 10.1 10.1 10.5 10.3 | 100.0

Heraldo_ 10.4 10.0 9.8 10.0 9.8 9.8 9.8 10.0 10.2 10.6 | 100.0

Ya 13.9 13.3 12.1 11.1 10.1 9.5 8.7 8.0 7.6 5.8 | 100.0

Egin 10.0 10.0 10.0 10.2 9.8 9.3 9.8 10.0 10.2 10.7 | 100.0

La Verda 10.7 10.5 10.0 10.0 9.3 9.3 8.9 10.3 10.5 10.5 | 100.0

Nueva_Es 8.8 8.5 8.8 9.3 9.9 10.2 10.5 10.7 11.0 12.4 | 100.0

Levante 8.2 7.4 7.9 8.8 8.2 7.9 12.4 12.6 13.5 12.9 | 100.0

Avui 10.0 10.0 10.3 10.3 10.8 10.0 9.5 9.5 9.7 10.0 | 100.0

Sur 8.2 7.9 8.8 12.3 8.5 10.1 10.4 11.0 11.3 11.6 | 100.0

La_Provi 8.9 8.9 8.9 10.1 9.8 9.8 10.4 11.3 11.0 11.0 | 100.0

Informac 7.4 7.1 8.1 9.8 10.8 10.5 10.5 11.5 12.2 12.2 | 100.0

Ideal 9.0 8.6 8.6 8.6 8.6 9.8 9.8 11.7 12.4 12.8 | 100.0

---------------------------------------------------------------------|-------

TOTAL 8.3 8.7 9.1 9.7 9.6 10.1 10.6 11.1 11.3 11.5 | 100.0

*** PERCENTS OF COLUMN TOTALS

Prensa Periodo

------ ------

1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 TOTAL

-----------------------------------------------------------------------------

El Pais 16.9 18.7 18.3 17.2 17.8 17.5 16.9 16.2 15.8 16.3 | 17.1

Abc 7.6 8.0 8.3 10.8 11.6 11.6 12.0 12.0 12.3 12.1 | 10.8

Marca 5.5 5.1 5.9 5.5 4.5 6.8 7.4 8.6 8.8 10.7 | 7.1

El Perio 7.0 7.0 6.7 7.2 7.5 7.2 7.1 7.4 7.2 7.1 | 7.1

As 8.0 7.5 7.5 7.7 7.6 7.4 7.2 7.0 6.7 6.2 | 7.2

El Corre 4.7 5.6 5.7 5.6 5.7 5.8 5.7 5.4 5.5 5.5 | 5.5

Diario16 7.1 7.1 6.7 6.4 6.7 6.4 6.3 6.2 6.1 5.2 | 6.4

Voz_Gali 4.2 3.9 4.0 3.8 3.8 3.9 4.0 4.1 4.0 4.2 | 4.0

D_Vasco 3.6 3.7 3.8 3.7 3.8 3.8 3.8 3.7 3.8 3.8 | 3.7

Sport 2.5 2.5 2.6 2.5 2.5 2.3 2.8 2.8 2.9 2.9 | 2.7

Mund_Dep 2.3 2.2 2.3 2.4 2.5 2.6 2.6 2.4 2.4 2.4 | 2.4

D_Navarr 2.2 2.0 2.2 2.1 2.1 2.0 2.2 2.2 2.3 2.4 | 2.2

Provinci 2.6 2.8 3.2 2.8 2.7 2.6 2.5 2.4 2.4 2.4 | 2.6

Heraldo_ 3.0 2.7 2.6 2.5 2.4 2.3 2.2 2.1 2.1 2.2 | 2.4

Ya 6.3 5.8 5.0 4.3 4.0 3.5 3.1 2.7 2.5 1.9 | 3.8

Egin 2.5 2.4 2.3 2.2 2.1 1.9 1.9 1.8 1.9 1.9 | 2.0

La Verda 2.6 2.5 2.3 2.1 2.0 1.9 1.7 1.9 1.9 1.9 | 2.0

Nueva_Es 1.8 1.6 1.6 1.6 1.7 1.7 1.7 1.6 1.6 1.8 | 1.7

Levante 1.6 1.4 1.4 1.5 1.4 1.3 1.9 1.8 1.9 1.8 | 1.6

Avui 2.2 2.1 2.1 2.0 2.1 1.8 1.7 1.6 1.6 1.6 | 1.9

Sur 1.5 1.4 1.5 1.9 1.3 1.5 1.5 1.5 1.5 1.5 | 1.5

La_Provi 1.7 1.6 1.5 1.6 1.6 1.5 1.5 1.6 1.5 1.5 | 1.6

Informac 1.3 1.2 1.3 1.4 1.6 1.5 1.4 1.5 1.5 1.5 | 1.4

Ideal 1.4 1.3 1.2 1.1 1.1 1.2 1.2 1.3 1.4 1.4 | 1.3

---------------------------------------------------------------------|-------

TOTAL 100.0 100.0 100.0 100.0 100.0 100.0 100.0 100.0 100.0 100.0 | 100.0

50

Page 51: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS (fig.1)

......+.......+.......+.......+.......+.......+.......+........

.10 + + +

- | -

- | -

- | -

- 1982 | -

- La Verda | -

- | Ideal -

.05 + + Levante +

- | 1991 -

- Heraldo_| -

- 1983 |Voz_Gali -

A - | -

X - | -

I - |Nueva_Es1990 -

S 0.0 +-----+-------+-----Avui----La_Provi--1989----+-------+-------+

- El Pais -

2 - | -

- As |El Perio -

- |El Corre -

- 1985 | -

- |1987 -

-.05 + + Informac +

- | -

- | -

- | -

- | Abc -

- 1986 | -

- | -

-.10 + + +

......+.......+.......+.......+.......+.......+.......+........

-.3 -.2 -.1 0. .1 .2 .3

AXIS 1

L1 = .0135 ( 81.7%) L2 = .0020 ( 12.2%)

PLOT OF ROWS (fig.2)

........+.......+.......+.......+.......+.......+.......+......

- | Marca -

.10 + + +

- | -

- | -

- | -

- | -

- | -

- La Verda | Ideal -

-Ya | -

.05 + + Levante +

- | -

A - | -

X - Heraldo_ |Voz_Gali -

I - | Sport -

S - | -

- |Nueva_Es -

2 - | -

0.0 +-------+-------+----Avui-----La_Provi--+-------+-------+-----+

- Diario16Sur -

- El Pais -

- As |El Perio -

- | -

- |El Corre -

- | -

- | -

-.05 + + Informac +

- | -

- | -

- | -

- | Abc -

........+.......+.......+.......+.......+.......+.......+......

-.27 -.18 -.09 0.0 .09 .18 .27

AXIS 1

LX = .0135 ( 81.7%) LY = .0020 ( 12.2%)

51

Page 52: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS (fig.3)

......+.......+.......+.......+.......+.......+.......+........

- | -

.10 + + +

- | -

- | -

- | -

- 1982 | -

- | -

- | -

.05 + + 1991 +

- | -

- 1984 | -

- 1983 | -

A - | -

X - | 1990 -

I - | 1989 -

S 0.0 +-----+-------+-------+-------+-------+-------+-------+-------+

- | -

2 - | -

- | -

- | 1988 -

- 1985 | -

- |1987 -

-.05 + + +

- | -

- | -

- | -

- | -

- 1986 | -

- | -

-.10 + + +

......+.......+.......+.......+.......+.......+.......+........

-.3 -.2 -.1 0. .1 .2 .3

AXIS 1

LX = .0135 ( 81.7%) LY = .0020 ( 12.2%)

PLOT OF ROWS AND COLUMNS (fig.4)

- Marca . -

- . -

- . -

.2 + + +

- .1991 -

- . -

- . -

- Abc . -

- .1990 -

.1 + Levante +1989 +

- . -

- Informac . -

- Sport .1988 -

- D_Navarr . -

- El Perio . -

A 0. + D_Vasco +1987 +

X - La_Provi . -

I - El Pais . -

S - . -

- As .1985 -

1 - Diario16 . -

-.1 + Heraldo_ + +

- La Verda .1984 -

- . -

- . -

- .1982 -

- . -

-.2 + + +

- . -

- . -

- . -

- . -

- . -

-.3 + + +

- . -

- . -

- Ya . -

52

Page 53: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS (fig.5)

- .1991 -

- . -

- . -

.15 + + +

- Abc . -

- . -

- .1990 -

- Levante . -

.10 + +1989 +

- . -

- . -

- . -

A - Sport .1988 -

X .05 + + +

I - Ideal . -

S - D_Navarr . -

- Mund_Dep . -

1 - El Perio .1987 -

0.0 + D_Vasco + +

- . -

- La_Provi . -

- . -

- El Pais . -

-.05 + + +

- As .1985 -

- Provinci . -

- Diario16 . -

- Egin . -

-.10 + Heraldo_ + +

- La Verda . -

- Avui .1984 -

L1 = .0135 ( 81.7%)

ETIQUETAS Y COORDENADAS DE LOS PUNTOS NO REPRESENTADOS POR SOLAPAMIENTO

El Corre(0.01) Voz_Gali(0.01) Nueva_Es(0.01) Sur(0.01) Informac(0.06)

1986(-0.06)

1.9.2 Analisis del ejemplo 3.

Recordemos que cada punto perfil fila, en este caso los periodicos, es un resumen de todas las frecuencias relativas delperfil e indica el numero de ejemplares vendidos por ese periodico a traves de los diez anos. Cada punto perfil columnaes, en este caso, un resumen de cada uno de los anos, e indica la variacion en la venta de periodicos en cada ano a travesde los distintos diarios. Y no hay que olvidar los puntos con bajo COR2 que pueden estar mal representados y ocasionarmalas interpretaciones. Los puntos El Correo Espanol, La Nueva Espana y Sur, entre otros, tienen un bajo COR2 sobreel primer eje, ası como ocurre con el ano 1987 dentro de los perfiles columna.

• figura 3

– En esta representacion se observa una clara diferenciacion dentro de los perfiles columna, es decir los anos.Aparecen tres grupos claramente separados que son, un primer grupo formado por los anos 1989, 1990 y 1991que estan situados a la derecha del primer eje principal, un segundo grupo formado por los puntos 1985, 1986,1987 y 1988 situados en medio de dicho eje por debajo, y un tercer grupo formado por los puntos 1982, 1983 y1984 situados a la izquierda de dicho eje por arriba. Esto indica que hay una clara distincion entre los modelosdel numero de periodicos vendidos entre los anos 1989, 1990, 1991 y 1982, 1983, 1984 en cuanto a los distintosperiodicos, presentandose en los ultimos anos una situacion bastante estabilizada.

• figura 2

– La distancia entre los perfiles fila (ası como entre los perfiles columnas) es una medida de la similitud entreperfiles, por lo que en esta representacion podemos observar que los puntos del diario Marca situado a la derechahacia arriba, diario Ya, situado a la izquierda, y Abc, situado en medio hacia abajo, presentan perfiles que estanunos lejos de otros, por lo que sus perfiles son claramente distintos, con una mayor diferencia entre los perfiles

53

Page 54: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

de los puntos (Marca y Ya) y (Abc y Ya) que entre (Marca y Abc) debido a la mayor inercia representadapor el primer eje principal (81.7%) respecto al segundo (12.2%), en relacion siempre al numero de ejemplaresvendidos a traves de los diez anos.

– Podemos observar un grupo de periodicos como Ideal, La Verdad, El Heraldo de Aragon, La Voz de Galicia,Sport y La Nueva Espana, que estan a mitad de camino entre los diarios Marca y Ya.

– Hay un grupo de periodicos en torno al origen o centro de gravedad, como Sur, La Provincia, Diario 16, As, ElPeriodico y El Paıs, lo que indica que sus perfiles son todos muy similares entre sı, y ademas con valores muyproximos al valor del centroide que es el perfil (8.3, 8.7, 9.1, 9.7, 9.6, 10.1, 10.6, 11.1, 11.3, 11.5).

– Tambien se puede observar, por ejemplo, que el punto que representa Diario 16 esta casi en el centro de la lıneaque une los diarios Ya y Abc, lo que sugiere que existen las mismas diferencias entre Diario 16 y cualquierade los otros dos periodicos. No obstante todas estas apreciaciones, la conclusion que se puede obtener de estarepresentacion es que en general, salvo unos pocos periodicos reflejados anteriormente, existe poca diferenciacionde unos con otros, existiendo un nucleo muy grande en torno al origen.

• figuras 1, 4 y 5

– Estas graficas representan los perfiles fila y columna conjuntamente. Como ya sabemos, cada punto represen-tando un periodico se encontrara mas o menos en la direccion del ano en el que su perfil sea mayor, pero nohay que olvidar que entre los perfiles fila y columna no se pueden establecer distancias en terminos de χ2 comoentre perfiles fila entre sı o columnas entre sı. Es decir, solo podemos calibrar una cierta tendencia positiva onegativa entre ambos conjuntos de puntos fila y columna.

– En nuestro ejemplo, podemos observar como el diario Ya se encuentra cerca de los puntos 1982 y 1983, porquetuvo esos anos el valor relativo mas alto en la difusion del periodico.

– La Verdad se encuentra proxima a los puntos 1982, 1983 y 1984, ası como los diarios Egin y Heraldo de Aragonporque tienen en estos anos unas altas proporciones de ventas de periodicos. Valores relativos o proporciones,mayores o menores, siempre en relacion al origen o centro de gravedad indicado anteriormente.

– El diario Marca se encuentra proximo a 1991, es decir, en el diario Marca hay una alta proporcion de periodicosvendidos en 1991.

– El diario Abc se encuentra cerca de los puntos 1988, 1989 y 1990, luego hay una alta proporcion de periodicosvendidos esos anos, en el diario Abc.

– Existe una alta proporcion de periodicos vendidos en 1987 en el diario Informaciones.

– Se observa una alta proporcion de diarios vendidos durante 1989, 1990 y 1991 del Ideal.

– Se observa una alta proporcion de diarios vendidos en 1983, 1984 y 1985 del diario Avui. Y ası podriamoscomtinuar con todos los periodicos que estan proximos a puntos que representan los anos.

– Las figuras 4 y 5 son proyecciones de los puntos fila y columna sobre el primer eje principal y corroboran granparte de las afirmaciones realizadas anteriormente, siendo la figura 5, una ampliacion de la figura 4.

54

Page 55: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.10 Ejemplo 4.

Los datos de la tabla provienen de un estudio que ha clasificado a 794 investigadores en cinco categorıas, con el fin derepartir los fondos para investigacion. Los investigadores se clasifican de acuerdo a su materia cientıfica (filas) y a lacategorıa de los fondos que reciben (columnas). Las cinco columnas se denominan A, B, C, D y E, donde A correspondea los investigadores que reciben las subvenciones mas altas hasta D las mas bajas, reservandose la categorıa E para losinvestigadores que no reciben fondos.

Categorıa de los fondosDisciplina cientıfica A B C D EGeologıa 3 19 39 14 10Bioquımica 1 2 13 1 10Quımica 6 25 49 21 29Zoologıa 3 15 41 35 26Fısica 10 22 47 9 26Ingenierıa 3 11 25 15 34Microbiologıa 1 6 14 5 11Botanica 0 12 34 17 23Estadıstica 2 5 11 4 7Matematicas 2 11 37 8 20

Se incluyen dos filas suplementarias, la primera llamada Museos que contiene las frecuencias de los investigadoresque trabajan en museos, en contraposicion al resto de las materias que son universitarias, y la segunda llamada CienciasMatematicas que corresponde a la suma de las filas de Estadıstica y Matematicas.

Museos 4 12 11 19 7Ciencias Matematicas 4 16 48 12 27

Se incluye tambien una columna llamada Y correspondiente a las dotaciones recibidas por los investigadores mas jovenes:

Y (0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 1)

Realiza un Analisis de Correspondencias de esta tabla.Pasos a seguir en la realizacion de la practica.

• Crea un fichero A:\CA4.ASC, que contenga los datos de la tabla anterior.

• Crea el fichero de ordenes, de nombre CA4.INP.

• ¿Que relaciones establece el primer eje principal?

• ¿Que relaciones establece el segundo eje principal?

• Compara los perfiles fila entre sı.

• Compara los perfiles columna entre sı.

• Interpreta las relaciones entre los perfiles fila y los perfiles columna.

• ¿Que sera mas interesante, el estudio de los perfiles fila a traves de los perfiles columna o lo contrario?

• ¿Por que esta situado el perfil suplementario Ciencias Matematicas entre Matematicas y Estadıstica?

• ¿Se podrıan considerar los puntos suplementarios fila Museos y Ciencias Matematicas y el punto suplementariocolumna Y como puntos iniciales en el estudio citado?

55

Page 56: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.10.1 Fichero de ordenes y salida generada por BMDP

Programa de ordenes del fichero CA4.INP

/PROBLEM TITTLE IS ’CUARTA PRACTICA DE CA’.

/INPUT VARIABLES=2.

FORMAT=FREE.

TABLE=5,10.

FILE IS ’A:\CA4.ASC’.

/VARIABLES NAMES=FONDOS,DISCIPLINA.

/CATEGORY NAMES(FONDOS)=A, B, C, D, E.

NAMES(DISCIPLINA)=GEOLOGIA,BIOQUIMICA,QUIMICA,ZOOLOGIA,

FISICA,INGENIERIA,MICROBIOLOGIA,BOTANICA,ESTADISTICA,

MATEMATICAS.

/PRINT LINESIZE=80.

LEVEL=NORMAL.

/END

CORRES COL=FONDOS.

ROW=DISCIPLINA./

PRINT PERCENT=ROW,COL./

PLOT SIZE=70,30./

PLOT XAXIS=1./

SUPPLEM ROW(1)=4,12,11,19,7.

ROW(2)=4,16,48,12,27.

RNAMES=MUSEOS,C_MATEMA.

COL=0,1,0,0,1,1,1,1,0,1.

CNAME=Y./

PLOT /

PLOT NO ROW. NO COL. XAXIS=1./

END /

ANALYSIS OF OBSERVED FREQUENCY TABLE

TOTAL INERTIA = SUM OF EIGENVALUES = 0.0808

AXIS EIGENVALUE % OF INERTIA CUM % HISTOGRAM

1 0.039 48.8 48.8 |***************

2 0.028 34.1 82.8 |**********

3 0.011 13.8 96.6 |****

4 0.003 3.4 100.0 |*

MAXIMUM NUMBER OF FACTORS TO EXTRACT .................... 4

CUT-OFF TOLERANCE ....................................... 90.00%

NUMBER OF FACTORS ACCOUNTING FOR 90.00% OF INERTIA ..... 3

NUMBER OF FACTORS ACTUALLY EXTRACTED .................... 3

CHISQUARE VALUE WITH 36 DF = 64.136

CHISQUARE ASSOCIATED P-VALUE = 0.003

LOS VALORES QUE VIENEN A CONTINUACION SE REFIEREN

A LOS DOS PRIMEROS EJES

ROWS

---------------------------------------------------------------------

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 Geologia 0.107 0.924 0.011| 0.088 0.075 0.021 | 0.297 0.849 0.344

2 Bioquimi 0.034 0.779 0.008| 0.192 0.163 0.032 |-0.374 0.616 0.173

3 Quimica 0.164 0.598 0.002| 0.039 0.152 0.006 | 0.067 0.445 0.027

4 Zoologia 0.151 0.927 0.019|-0.323 0.831 0.401 | 0.110 0.096 0.066

5 Fisica 0.144 0.880 0.016| 0.315 0.879 0.361 | 0.008 0.001 0.000

6 Ingenier 0.111 0.884 0.013|-0.131 0.147 0.048 |-0.294 0.738 0.348

7 Microbio 0.047 0.685 0.001| 0.008 0.003 0.000 |-0.114 0.682 0.022

8 Botanica 0.108 0.649 0.006|-0.179 0.627 0.089 |-0.033 0.022 0.004

9 Estadist 0.037 0.548 0.001| 0.124 0.548 0.014 | 0.003 0.000 0.000

10 Matemati 0.098 0.327 0.005| 0.106 0.234 0.028 |-0.067 0.093 0.016

56

Page 57: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

COLUMNS

--------------------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

--------------------------------------------------------------------

1 A 0.039 0.580 0.015| 0.478 0.576 0.226| 0.041 0.004 0.002

2 B 0.161 0.782 0.009| 0.132 0.318 0.071| 0.159 0.464 0.148

3 C 0.390 0.471 0.008| 0.088 0.366 0.076| 0.047 0.105 0.031

4 D 0.162 0.968 0.028| -0.386 0.851 0.613| 0.143 0.117 0.121

5 E 0.247 0.990 0.020| -0.046 0.027 0.014| -0.279 0.963 0.697

--------------------------------------------------------------------

SUPPLEMENTARY ROWS

-------------------------------------------------------------------

SROW NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

-------------------------------------------------------------------

1 Museos 0.545 | -0.304 0.212 | 0.381 0.334

2 C_Matema 0.572 | 0.110 0.482 | -0.048 0.090

-------------------------------------------------------------------

SUPPLEMENTARY COLUMNS

-------------------------------------------------------------------

SCOL NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

-------------------------------------------------------------------

1 Y 0.599 | 0.260 0.048 | -0.877 0.551

-------------------------------------------------------------------

LOS VALORES QUE VIENEN A CONTINUACION

SE REFIEREN A LOS TRES PRIMEROS EJES

ROWS

-------------------------------------------------------------------

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 Geologia 0.107 0.986 0.011| 0.088 0.075 0.021| 0.297 0.849 0.344

2 Bioquimi 0.034 0.934 0.008| 0.192 0.163 0.032|-0.374 0.616 0.173

3 Quimica 0.164 0.807 0.002| 0.039 0.152 0.006| 0.067 0.445 0.027

4 Zoologia 0.151 0.958 0.019|-0.323 0.831 0.401| 0.110 0.096 0.066

5 Fisica 0.144 0.990 0.016| 0.315 0.879 0.361| 0.008 0.001 0.000

6 Ingenier 0.111 0.975 0.013|-0.131 0.147 0.048|-0.294 0.738 0.348

7 Microbio 0.047 0.773 0.001| 0.008 0.003 0.000|-0.114 0.682 0.022

8 Botanica 0.108 0.976 0.006|-0.179 0.627 0.089|-0.033 0.022 0.004

9 Estadist 0.037 0.967 0.001| 0.124 0.548 0.014| 0.003 0.000 0.000

10 Matemati 0.098 0.978 0.005| 0.106 0.234 0.028|-0.067 0.093 0.016

ROWS

---------------------------------------------------------

ROW NAME MASS QLT INR | FACTOR COR2 CTR

| AXIS 3

1 Geologia 0.107 0.986 0.011 | -0.080 0.061 0.061

2 Bioquimi 0.034 0.934 0.008 | -0.188 0.156 0.108

3 Quimica 0.164 0.807 0.002 | 0.046 0.209 0.031

4 Zoologia 0.151 0.958 0.019 | 0.062 0.030 0.051

5 Fisica 0.144 0.990 0.016 | 0.111 0.110 0.160

6 Ingenier 0.111 0.975 0.013 | 0.103 0.091 0.106

7 Microbio 0.047 0.773 0.001 | -0.041 0.087 0.007

8 Botanica 0.108 0.976 0.006 | -0.130 0.327 0.163

9 Estadist 0.037 0.967 0.001 | 0.108 0.419 0.038

10 Matemati 0.098 0.978 0.005 | -0.176 0.652 0.274

SUPPLEMENTARY ROWS

---------------------------------------------------------------

SROW NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

1 Museos 0.997 | -0.304 0.212 | 0.381 0.334

2 C_Matema 0.961 | 0.110 0.482 | -0.048 0.090

---------------------------------------------------------------

57

Page 58: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

COLUMNS

-----------------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR |FACTOR COR2 CTR

| AXIS 1 | AXIS 2

1 A 0.039 0.965 0.015 | 0.478 0.576 0.226 | 0.041 0.004 0.002

2 B 0.161 0.815 0.009 | 0.132 0.318 0.071 | 0.159 0.464 0.148

3 C 0.390 0.950 0.008 | 0.088 0.366 0.076 | 0.047 0.105 0.031

4 D 0.162 0.997 0.028 |-0.386 0.851 0.613 | 0.143 0.117 0.121

5 E 0.247 0.996 0.020 |-0.046 0.027 0.014 |-0.279 0.963 0.697

COLUMNS

---------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR

| AXIS 3

1 A 0.039 0.965 0.015 | 0.391 0.385 0.536

2 B 0.161 0.815 0.009 | 0.042 0.032 0.025

3 C 0.390 0.950 0.008 | -0.100 0.479 0.353

4 D 0.162 0.997 0.028 | 0.072 0.030 0.075

5 E 0.247 0.996 0.020 | 0 .022 0.006 0.011

SUPPLEMENTARY COLUMNS

----------------------------------------------------------------

SCOL NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

1 Y 0.782 | 0.260 0.048 | -0.877 0.551

*** OBSERVED FREQUENCY TABLE

Discipli Fondos

A B C D E TOTAL

---------------------------------------------------------------

Geologia 3 19 39 14 10 | 85

Bioquimi 1 2 13 1 10 | 27

Quimica 6 25 49 21 29 | 130

Zoologia 3 15 41 35 26 | 120

Fisica 10 22 47 9 26 | 114

Ingenier 3 11 25 15 34 | 88

Microbio 1 6 14 5 11 | 37

Botanica 0 12 34 17 23 | 86

Estadist 2 5 11 4 7 | 29

Matemati 2 11 37 8 20 | 78

-----------------------------------------------------|---------

TOTAL 31 128 310 129 196 | 794

*** PERCENTS OF ROW TOTALS

Discipli Fondos

A B C D E TOTAL

---------------------------------------------------------------

Geologia 3.5 22.4 45.9 16.5 11.8 | 100.0

Bioquimi 3.7 7.4 48.1 3.7 37.0 | 100.0

Quimica 4.6 19.2 37.7 16.2 22.3 | 100.0

Zoologia 2.5 12.5 34.2 29.2 21.7 | 100.0

Fisica 8.8 19.3 41.2 7.9 22.8 | 100.0

Ingenier 3.4 12.5 28.4 17.0 38.6 | 100.0

Microbio 2.7 16.2 37.8 13.5 29.7 | 100.0

Botanica 0.0 14.0 39.5 19.8 26.7 | 100.0

Estadist 6.9 17.2 37.9 13.8 24.1 | 100.0

Matemati 2.6 14.1 47.4 10.3 25.6 | 100.0

-----------------------------------------------------|---------

TOTAL 3.9 16.1 39.0 16.2 24.7 | 100.0

*** PERCENTS OF COLUMN TOTALS

Discipli Fondos

A B C D E TOTAL

---------------------------------------------------------------

Geologia 9.7 14.8 12.6 10.9 5.1 | 10.7

Bioquimi 3.2 1.6 4.2 0.8 5.1 | 3.4

Quimica 19.4 19.5 15.8 16.3 14.8 | 16.4

Zoologia 9.7 11.7 13.2 27.1 13.3 | 15.1

Fisica 32.3 17.2 15.2 7.0 13.3 | 14.4

Ingenier 9.7 8.6 8.1 11.6 17.3 | 11.1

Microbio 3.2 4.7 4.5 3.9 5.6 | 4.7

Botanica 0.0 9.4 11.0 13.2 11.7 | 10.8

Estadist 6.5 3.9 3.5 3.1 3.6 | 3.7

Matemati 6.5 8.6 11.9 6.2 10.2 | 9.8

-----------------------------------------------------|---------

TOTAL 100.0 100.0 100.0 100.0 100.0 | 100.0

58

Page 59: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

- | -

- | Geologia -

- | -

- | -

- | -

.2 + + +

- | -

-D | B -

- | -

- Zoologia | -

- | Quimica -

A - | C A -

X - | -

I 0. +-----+-----+-----+-----+-----+Estadist---+Fisica-----+-----+-+

S - Botanica | -

- | -

2 - | Matemati -

- | -

- Microbio -

- | -

- | -

-.2 + + +

- | -

- | -

- E | -

- Ingenier| -

- | -

- | -

- | Bioquimi -

-.4 + + +

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

-.3 -.2 -.1 0. .1 .2 .3 .4 .5 .6

AXIS 1

L1 = .0394 ( 48.8%) L2 = .0275 ( 34.1%)

PLOT OF ROWS

....+.......+.......+.......+.......+.......+.......+.......+..

- | -

- | Geologia -

- | -

- | -

- | -

.2 + + +

- | -

- | -

- | -

- Zoologia | -

- | Quimica -

A - | -

X - | -

I 0. +---+-------+-------+-------+-------+-Estadist------+Fisica-+-+

S - Botanica | -

- | -

2 - | Matemati -

- | -

- |Microbio -

- | -

- | -

-.2 + + +

- | -

- | -

- | -

- Ingenier | -

- | -

- | -

- | Bioquimi -

-.4 + + +

....+.......+.......+.......+.......+.......+.......+.......+..

-.3 -.2 -.1 0. .1 .2 .3 .4

AXIS 1

LX = .0394 ( 48.8%) LY = .0275 ( 34.1%)

59

Page 60: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

.2 + + +

- | -

- | B -

-D | -

- | -

- | -

.1 + + +

- | -

- | -

- | C -

- | A -

- | -

A 0. +-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-+

X - | -

I - | -

S - | -

- | -

2 - | -

-.1 + + +

- | -

- | -

- | -

- | -

- | -

-.2 + + +

- | -

- | -

- | -

- | -

- E | -

-.3 + + +

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

-.3 -.2 -.1 0. .1 .2 .3 .2 .5 .6

AXIS 1

LX = .0394 ( 48.8%) LY = .0275 ( 34.1%)

PLOT OF ROWS AND COLUMNS

- . -

- . -

- .A -

- . -

.4 + + +

- . -

- . -

- Fisica . -

- . -

- . -

.2 + Bioquimi + +

- . -

A - Estadist .B -

X - Geologia .C -

I - . -

S - Quimica . -

0. + Microbio + +

1 - .E -

- . -

- . -

- Ingenier . -

- Botanica . -

-.2 + + +

- . -

- . -

- . -

- Zoologia . -

- . -

-.4 + +D +

- . -

- . -

L1 = .0394 ( 48.8%)

60

Page 61: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS SUPPLEMENTARY

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

- | -

- Museos | -

- | -

.3 + + Geologia +

- | -

- | -

- | B -

-D Zoologia | -

- | Quimica -

- | C A -

0. +-----+-----+-----+-----+-----+Estadist---+Fisica-----+-----+-+

- Botanica | C_Matema -

A - | Matemati -

X - Microbio -

I - | -

S - | -

- | -

2 -.3 + Ingeni E+ +

- | -

- | Bioquimi -

- | -

- | -

- | -

- | -

-.6 + + +

- | -

- | -

- | -

- | -

- | -

- | Y -

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

-.3 -.2 -.1 0. .1 .2 .3 .4 .5 .6

AXIS 1

L1 = .0394 ( 48.8%) L2 = .0275 ( 34.1%)

PLOT OF ROWS

....+.......+.......+.......+.......+.......+.......+.......+..

- | -

.4 + + +

- Museos | -

- | -

- | -

- | Geologia -

- | -

- | -

.2 + + +

- | -

- | -

- Zoologia | -

A - | -

X - | Quimica -

I - | -

S 0. +---+-------+-------+-------+-------+-Estadist------+Fisica-+-+

- Botanica | C_Matema -

2 - | Matemati -

- | -

- |Microbio -

- | -

- | -

-.2 + + +

- | -

- | -

- Ingenier | -

- | -

- | -

- | Bioquimi -

-.4 + + +

- | -

....+.......+.......+.......+.......+.......+.......+.......+..

-.3 -.2 -.1 0. .1 .2 .3 .4

AXIS 1

LX = .0394 ( 48.8%) LY = .0275 ( 34.1%)

61

Page 62: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

- | -

- | -

-D | B -

- | -

- | -

- | C A -

0. +-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-+

- | -

- | -

- | -

- | -

- | -

A - | -

X - E | -

I -.3 + + +

S - | -

- | -

2 - | -

- | -

- | -

- | -

- | -

-.6 + + +

- | -

- | -

- | -

- | -

- | -

- | -

- | Y -

-.9 + + +

......+.....+.....+.....+.....+.....+.....+.....+.....+.....+..

-.3 -.2 -.1 0. .1 .2 .3 .4 .5 .6

AXIS 1

LX = .0394 ( 48.8%) LY = .0275 ( 34.1%)

PLOT OF ROWS AND COLUMNS

.

- . -

- . -

- .A -

- . -

.4 + + +

- . -

- . -

- Fisica . -

- . Y -

- . -

.2 + Bioquimi + +

- . -

A - Estadist .B -

X - C_Matema Geologia .C -

I - . -

S - Quimica . -

0. + Microbio + +

1 - .E -

- . -

- . -

- Ingenier . -

- Botanica . -

-.2 + + +

- . -

- . -

- Museos . -

- Zoologia . -

- . -

-.4 + +D +

- . -

- . -

L1 = .0394 ( 48.8%)

62

Page 63: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.10.2 Analisis del ejemplo 4.

Recordemos que una tabla de datos como la del presente estudio puede tratarse indistintamente como un conjunto deperfiles fila, o como un conjunto de perfiles columna, y es el propio interes del estudio el que nos dice cual elegir. Ennuestro caso parace razonable considerar los perfiles fila, es decir, los perfiles de las disciplinas cientıficas a traves de lascategorıas de los fondos que reciben.

• Los dos primeros ejes principales explican el 82.8% de la inercia total, por lo que convendrıa una vez estudiadas lasrepresentaciones bidimensionales, contrastar todos los elementos del analisis, con el tercer eje principal que explicael 13.8% de la inercia total. Asımismo pierden valor las representaciones unidimensionales al explicar solo el 48.8%y 34.1% para los dos primeros ejes.

• Como siempre, antes de hacer ningun tipo de interpretacion, hay que observar en la tabla de valores, que perfilesestan mal representados (los que tengan un COR2 bajo respecto de algun eje, o la QLT baja respecto al plano),en estos casos las interpretaciones que afecten a esos perfiles se deben verificar con los datos. En nuestro caso,Estadıstica y Matematicas presentan una baja calidad respecto al plano, casi las dos terceras partes (0.327) de suinercia esta fuera del plano principal, y en cuanto a perfiles columna A y C.

Tambien los perfiles que presenten una alta CTR tendran un papel predominante en la formacion de los ejes princi-pales, Zoologıa y Fısica para los perfiles fila y A, D para los perfiles columna respecto al primer eje.

• Se observa para los perfiles columna que el primer eje establece una separacion entre los perfiles E y D, situados a laizquierda del origen, y A, B y C situados a la derecha, de forma que la variacion de izquierda a derecha contrapone alas categorıas D y A, con B y C en medio de ambas, estableciendo una jerarquizacion de menor a mayor subvencion.

Si miramos respecto al segundo eje, se establece una diferenciacion entre el perfil E por un lado y el resto por otro.Por lo tanto cuanto mas baja este una disciplina en el grafico, tendra mas investigadores que no reciben fondos (E).Cuanto mas a la derecha del grafico permanezca una disciplina mas fondos recibira (A). Luego la mejor region paraque se situen las disciplinas, es la parte superior derecha del grafico. En las disciplinas que esten situadas en elcuadrante inferior derecho, predominaran las de altas y bajas subvenciones, por ejemplo Bioquımica tiene un perfilfavorable para recibir fondos, pero aparece en direccion a E debido al alto porcentaje de investigadores 37% de estacategorıa. La disciplina mas favorable es sin duda Fısica, y las que menos Zoologıa, Botanica e Ingenierıa. Siempreentendiendo mas o menos favorecida una disciplina en relacion del perfil promedio fila o centroide u origen de larepresentacion.

• Las distancias entre los perfiles fila son aproximadamente distancias χ2 por lo que se puede decir que Quımica estaa mitad de camino entre Botanica y Fısica en relacion a los fondos que reciben los investigadores en esas materias,y lo mismo se puede decir sobre los perfiles columna entre sı, C esta a mitad de camino entre A y D.

• Si estudiamos los elementos del tercer eje principal, que explica el 13.8% de la inercia total, vemos que A y C yasi estan bien representados, y ademas este tercer eje lleva las direcciones de A y C debido a las altas CTR, 0.536 y0.353 respectivamente, tambien estan ya bien representadas Matematicas y Estadıstica.

El tercer eje principal queda determinado por las posiciones de A y C en oposicion respecto al origen (los valoresde las coordenadas respecto a ese eje son 0.391 y -0.100 respectivamente), estando Fısica e Ingenierıa en el lado deA (las coordenadas son 0.111 y 0.103), y Matematicas y Botanica en el lado de C (las coordenadas son -0.176 y-0.130 respectivamente). Estadıstica y Matematicas presentan una alta correlacion con este eje (COR2 es 0.419 y0.652) estando una a cada lado del origen, por lo que ambos perfiles que eran practicamente similares, en relaciona los fondos recibidos en el estudio con los dos primeros ejes principales, ahora al introducir el tercer eje principal,muestran diferencias entre ellos, de forma que Matematicas tiene menos investigadores del grupo A y mas del C, queEstadıstica ( los signos de las coordenadas de Matematicas y C y de Estadıstica y A coinciden).

Para imaginarnos el tercer eje representado, pensemos en la grafica bidimensional y que el eje sale hacia afuera delpapel, situandose el punto A por encima del papel (coordenada positiva) y C por debajo, estando Estadıstica porencima del papel y Matematicas por debajo. En este caso la region mas favorable tridimensionalmente hablando, encuanto a fondos recibidos, serıa el cuadrante superior derecho por encima de la pagina.

• Los Puntos Suplementarios son puntos que no intervienen en la formacion de los ejes principales y se les puedeconsiderar como puntos de masa cero, luego no tienen masa ni CTR, aunque si se pueden proyectar sobre el planoprincipal existente y por lo tanto tienen COR2 y QLT, y sirven para hacer comparaciones con los perfiles iniciales.

En este caso tenemos tres tipos de perfiles suplementarios:

– El perfil fila Museos esta bastante bien representado en el plano (QLT=0.545). Su posicion en el cuadrantesuperior izquierdo del grafico indica, que los investigadores de los Museos son de los que reciben fondos perocon tendencia hacia las categorıas mas bajas.

– El perfil fila C Matema se obtiene sumando las frecuencias de Matematicas y Estadıstica, es el centroide delas componentes de las dos filas ponderadas por sus masas, por lo que se parecera mas a Matematicas que a

63

Page 64: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

Estadıstica, (78 frente a 29) y graficamente esta entre Matematicas y Estadıstica, aunque mas proximo a laprimera que a la segunda. Este perfil no podrıa entrar como uno mas, es decir, como punto no suplementario,junto con los dos de Matematicas y Estadıstica, puesto que contarıamos dos veces a los mismos 117 investi-gadores. Analogamente se podrıan dar puntos suplementarios obtenidos al separar una categorıa en varias, osea lo contrario del perfil C Matema.

– El perfil columna Y se considera un perfil outlier, puesto que solo contiene 6 investigadores, no se parece aningun perfil columna existente (toma el valor 1 en 6 disciplinas y en el resto 0). Si se incluyera en el analisis alprincipio, contribuirıa fuertemente a la determinacion de los ejes y podrıa distorsionar toda la representacion.El perfil Y esta bastante correlacionado con el plano (QLT=0.782). En relacion a los valores iniciales de esteperfil Y(0,1,0,0,1,1,1,1,0,1,0,1), puesto que al ser suplementario solo se necesitan los correspondientes a las 10disciplinas, los dos ultimos valores se ignoran, en razon tambien al significado de los dos perfiles suplementariosfila.

Tambien se pueden calcular las inercias de los perfiles y las contribuciones de los perfiles a los ejes de estos puntos, puesaunque en principio no tienen significado, se pueden inspeccionar estos valores para observar sus comportamientossi se incorporaran al principio del problema, siempre que los datos vengan expresados en las mismas unidades, comoen nuestro caso.

64

Page 65: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.11 Ejemplo 5.

La siguiente tabla se refiere a la distribucion de los fondos para Investigacion y Desarrollo sobre once categorıas distintasen cinco paıses europeos. Observa que las columnas estan expresadas en porcentajes. Posteriormente se sabe que losfondos de I+D para Espana en el ano 1993 fueron: (2.1, 1.5, 11.5, 8.5, 8.5, 9, 2.1, 14, 11.1, 25.4, 6.3).Realiza un Analisis de Correspondencias sobre esta tabla.

Table 4: Distribucion de los fondos de Investigacion y Desarrollo en cinco paıses Europeos en 1989

Gran Bretana Alemania Francia Italia Paıses BajosExploracion del planeta 1.8 1.9 1.4 1.4 0.6Contaminacion Medioambi. 1.2 3.4 0.4 1.5 3.1Salud 4.4 3.3 3.6 5.8 2.5Energıa 3.7 8.8 6.7 10.1 4.0Agricultura 4.2 2.0 3.6 2.8 4.3Industria 9.0 15.6 10.7 22.4 17.6Investigacion Espacial 2.8 5.0 5.9 8.8 2.8Universidades 16.5 29.9 12.0 30.3 40.7Investigacion no orientada∗ 4.8 12.8 14.7 6.2 10.3Defensa 48.4 12.7 34.2 7.0 2.8Otros 3.2 4.6 6.8 3.7 11.3Total 100.0 100.0 100.0 100.0 100.0

∗Principalmente en Matematicas y Ciencias de la Naturaleza

Pasos a seguir en la realizacion de la practica.

• Crea un fichero A:\CA5.ASC, que contenga los datos de la tabla anterior.

• Crea el fichero de ordenes, de nombre CA5.INP.

• ¿Que relaciones establece el primer eje principal?

• ¿Que relaciones establece el segundo eje principal?

• Compara los perfiles fila entre sı.

• Compara los perfiles columna entre sı.

• Interpreta las relaciones entre los perfiles fila y los perfiles columna.

• ¿Que sera mas interesante, el estudio de los perfiles fila a traves de los perfiles columna o lo contrario?

• ¿Que inconvenientes habrıa tenido este estudio si las cifras de cada paıs no se hubiesen dado en porcentajes, sino enfrecuencias absolutas?

• ¿Seran comparables las masas de los perfiles columna de nuestro estudio con la del perfil columna suplementario deEspana?

65

Page 66: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

1.11.1 Fichero de ordenes y salida generada por BMDP

Programa de ordenes del fichero CA5.INP

/PROBLEM TITTLE IS ’QUINTA PRACTICA DE CA’.

/INPUT VARIABLES=2.

FORMAT=FREE.

TABLE=5,11.

FILE IS ’A:\CA5.ASC’.

REAL.

/VARIABLES NAMES=PAISES,SECTORES.

/CATEGORY NAMES(PAISES)=GRAN_BRE,ALEMANIA,FRANCIA,ITALIA,PA_BAJOS.

NAMES(SECTORES)=EXP_PLAN,CONTAMIN,SALUD,ENERGIA,AGRICULT,

INDUSTRIA,I_ESPACI,UNIVERSI,I_NO_ORI,DEFENSA,OTROS.

/PRINT LINESIZE=80.

LEVEL=NORMAL.

/END

CORRES COL=PAISES.

ROW=SECTORES.

AXIS=2./

PRINT PERCENT=ROW,COL./

PLOT SIZE=70,30./

PLOT XAXIS=1./

SUPPLEM

COL=21,15,115,85,85,90,21,140,111,254,63.

CNAME=ESPA~NA./

PLOT /

PLOT NO ROW. NO COL. XAXIS=1./

END /

Salida proporcionada por el programa CA del BMDP

ANALYSIS OF OBSERVED FREQUENCY TABLE

TOTAL INERTIA = SUM OF EIGENVALUES = 0.2643

AXIS EIGENVALUE % OF INERTIA CUM % HISTOGRAM

1 0.201 76.2 76.2 |***********************

2 0.034 12.9 89.1 |****

3 0.021 7.9 97.0 |**

4 0.008 3.0 100.0 |*

MAXIMUM NUMBER OF FACTORS TO EXTRACT .................... 4

CUT-OFF TOLERANCE ....................................... 90.00%

NUMBER OF FACTORS ACCOUNTING FOR 90.00% OF INERTIA ..... 3

NUMBER OF FACTORS ACTUALLY EXTRACTED .................... 2

CHISQUARE VALUE WITH 40 DF = 132.155

CHISQUARE ASSOCIATED P-VALUE = 0.000

LOS VALORES A CONTINUACION SE REFIEREN A LOS DOS

PRIMEROS EJES PRINCIPALES

ROWS

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

-------------------------------------------------------------------

1 Exp_Plan 0.014 0.584 0.001|-0.177 0.301 0.002| 0.171 0.283 0.012

2 Contamin 0.019 0.624 0.007| 0.424 0.502 0.017|-0.209 0.122 0.025

3 Salud 0.039 0.777 0.003|-0.045 0.025 0.000| 0.248 0.753 0.071

4 Energia 0.067 0.891 0.010| 0.150 0.155 0.007| 0.327 0.736 0.209

5 Agricult 0.034 0.545 0.002|-0.087 0.112 0.001|-0.170 0.433 0.029

6 Industri 0.151 0.945 0.015| 0.285 0.791 0.061| 0.126 0.154 0.070

7 I_Espaci 0.051 0.887 0.010| 0.116 0.069 0.003| 0.399 0.818 0.236

8 Universi 0.259 0.910 0.041| 0.369 0.850 0.175|-0.098 0.060 0.073

9 I_no_ori 0.098 0.063 0.015| 0.049 0.016 0.001|-0.083 0.046 0.020

10 Defensa 0.210 0.997 0.145|-0.828 0.995 0.715|-0.035 0.002 0.008

11 Otros 0.059 0.796 0.015| 0.236 0.223 0.016|-0.378 0.573 0.249

66

Page 67: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

COLUMNS

COL NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

-------------------------------------------------------------------

1 Gran_Bre 0.200 0.927 0.096|-0.666 0.921 0.441|-0.056 0.007 0.019

2 Alemania 0.200 0.577 0.016| 0.209 0.556 0.043| 0.040 0.021 0.009

3 Francia 0.200 0.713 0.042|-0.387 0.713 0.149| 0.008 0.000 0.000

4 Italia 0.200 0.943 0.043| 0.342 0.547 0.116| 0.292 0.396 0.499

5 Pa_Bajos 0.200 0.988 0.067| 0.502 0.749 0.250|-0.284 0.239 0.473

SUPPLEMENTARY COLUMNS

SCOL NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

--------------------------------------------------------------------

1 Espa~na 0.171 | -0.239 0.168 | 0.034 0.003

VALORES REFERIDOS A LOS TRES PRIMEROS EJES PRINCIPALES

ROWS

ROW NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

-------------------------------------------------------------------

1 Exp_Plan 0.014 0.585 0.001|-0.177 0.301 0.002| 0.171 0.283 0.012

2 Contamin 0.019 0.644 0.007| 0.424 0.502 0.017|-0.209 0.122 0.025

3 Salud 0.039 0.940 0.003|-0.045 0.025 0.000| 0.248 0.753 0.071

4 Energia 0.067 0.970 0.010| 0.150 0.155 0.007| 0.327 0.736 0.209

5 Agricult 0.034 0.634 0.002|-0.087 0.112 0.001|-0.170 0.433 0.029

6 Industri 0.151 0.975 0.015| 0.285 0.791 0.061| 0.126 0.154 0.070

7 I_Espaci 0.051 0.937 0.010| 0.116 0.069 0.003| 0.399 0.818 0.236

8 Universi 0.259 0.992 0.041| 0.369 0.850 0.175|-0.098 0.060 0.073

9 I_no_ori 0.098 0.976 0.015| 0.049 0.016 0.001|-0.083 0.046 0.020

10 Defensa 0.210 1.000 0.145|-0.828 0.995 0.715|-0.035 0.002 0.008

11 Otros 0.059 0.877 0.015| 0.236 0.223 0.016|-0.378 0.573 0.249

ROWS

ROW NAME MASS QLT INR | FACTOR COR2 CTR

| AXIS 3

---------------------------------------------------------

1 Exp_Plan 0.014 0.585 0.001 | 0.006 0.000 0.000

2 Contamin 0.019 0.644 0.007 | 0.084 0.020 0.006

3 Salud 0.039 0.940 0.003 | 0.115 0.162 0.025

4 Energia 0.067 0.970 0.010 | -0.107 0.079 0.036

5 Agricult 0.034 0.634 0.002 | 0.077 0.089 0.010

6 Industri 0.151 0.975 0.015 | 0.055 0.030 0.022

7 I_Espaci 0.051 0.937 0.010 | -0.099 0.051 0.024

8 Universi 0.259 0.992 0.041 | 0.115 0.082 0.162

9 I_no_ori 0.098 0.976 0.015 | -0.370 0.913 0.636

10 Defensa 0.210 1.000 0.145 | 0.047 0.003 0.022

11 Otros 0.059 0.877 0.015 | -0.142 0.081 0.057

COLUMNS

COL NAME MASS QLT INR | FACTOR COR2 CTR | FACTOR COR2 CTR

| AXIS 1 | AXIS 2

------------------------------------------------------------------

1 Gran_Bre 0.200 0.999 0.096|-0.666 0.921 0.441|-0.056 0.007 0.019

2 Alemania 0.200 0.651 0.016| 0.209 0.556 0.043| 0.040 0.021 0.009

3 Francia 0.200 0.977 0.042|-0.387 0.713 0.149| 0.008 0.000 0.000

4 Italia 0.200 0.980 0.043| 0.342 0.547 0.116| 0.292 0.396 0.499

5 Pa_Bajos 0.200 0.993 0.067| 0.502 0.749 0.250|-0.284 0.239 0.473

--------------------------------------------------------

COL NAME MASS QLT INR | FACTOR COR2 CTR

| AXIS 3

--------------------------------------------------------

1 Gran_Bre 0.200 0.999 0.096 | 0.186 0.072 0.329

2 Alemania 0.200 0.651 0.016 | -0.076 0.075 0.056

3 Francia 0.200 0.977 0.042 | -0.235 0.263 0.527

4 Italia 0.200 0.980 0.043 | 0.089 0.037 0.075

5 Pa_Bajos 0.200 0.993 0.067 | 0.037 0.004 0.013

67

Page 68: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

SUPPLEMENTARY COLUMNS

--------------------------------------------------------------

SCOL NAME QLT | FACTOR COR2 | FACTOR COR2

| AXIS 1 | AXIS 2

--------------------------------------------------------------

1 Espa~na 0.178 | -0.239 0.168 | 0.034 0.003

--------------------------------------------------------------

--------------------------------------------------------

SCOL NAME QLT | FACTOR COR2

| AXIS 3

--------------------------------------------------------

1 Espa~na 0.178 | -0.049 0.007

--------------------------------------------------------

*** OBSERVED FREQUENCY TABLE

Sectores Paıses

------ ------

Gran_Bre Alemania Francia Italia Pa_Bajos TOTAL

-------------------------------------------------------------------

Exp_Plan 1.8 1.9 1.4 1.4 0.6 | 7.1

Contamin 1.2 3.4 0.4 1.5 3.1 | 9.6

Salud 4.4 3.3 3.6 5.8 2.5 | 19.6

Energia 3.7 8.8 6.7 10.1 4.0 | 33.3

Agricult 4.2 2.0 3.6 2.8 4.3 | 16.9

Industri 9.0 15.6 10.7 22.4 17.6 | 75.3

I_Espaci 2.8 5.0 5.9 8.8 2.8 | 25.3

Universi 16.5 29.9 12.0 30.3 40.7 | 129.4

I_no_ori 4.8 12.8 14.7 6.2 10.3 | 48.8

Defensa 48.4 12.7 34.2 7.0 2.8 | 105.1

Otros 3.2 4.6 6.8 3.7 11.3 | 29.6

----------------------------------------------------------|--------

TOTAL 100.0 100.0 100.0 100.0 100.0 | 500.0

*** PERCENTS OF ROW TOTALS

Sectores Paıses

------ ------

Gran_Bre Alemania Francia Italia Pa_Bajos TOTAL

---------------------------------------------------------------

Exp_Plan 25.4 26.8 19.7 19.7 8.5 | 100.0

Contamin 12.5 35.4 4.2 15.6 32.3 | 100.0

Salud 22.4 16.8 18.4 29.6 12.8 | 100.0

Energia 11.1 26.4 20.1 30.3 12.0 | 100.0

Agricult 24.9 11.8 21.3 16.6 25.4 | 100.0

Industri 12.0 20.7 14.2 29.7 23.4 | 100.0

I_Espaci 11.1 19.8 23.3 34.8 11.1 | 100.0

Universi 12.8 23.1 9.3 23.4 31.5 | 100.0

I_no_ori 9.8 26.2 30.1 12.7 21.1 | 100.0

Defensa 46.1 12.1 32.5 6.7 2.7 | 100.0

Otros 10.8 15.5 23.0 12.5 38.2 | 100.0

-----------------------------------------------------|---------

TOTAL 20.0 20.0 20.0 20.0 20.0 | 100.0

*** PERCENTS OF COLUMN TOTALS

Sectores Paıses

------ ------

Gran_Bre Alemania Francia Italia Pa_Bajos TOTAL

---------------------------------------------------------------

Exp_Plan 1.8 1.9 1.4 1.4 0.6 | 1.4

Contamin 1.2 3.4 0.4 1.5 3.1 | 1.9

Salud 4.4 3.3 3.6 5.8 2.5 | 3.9

Energia 3.7 8.8 6.7 10.1 4.0 | 6.7

Agricult 4.2 2.0 3.6 2.8 4.3 | 3.4

Industri 9.0 15.6 10.7 22.4 17.6 | 15.1

I_Espaci 2.8 5.0 5.9 8.8 2.8 | 5.1

Universi 16.5 29.9 12.0 30.3 40.7 | 25.9

I_no_ori 4.8 12.8 14.7 6.2 10.3 | 9.8

Defensa 48.4 12.7 34.2 7.0 2.8 | 21.0

Otros 3.2 4.6 6.8 3.7 11.3 | 5.9

-----------------------------------------------------|---------

TOTAL 100.0 100.0 100.0 100.0 100.0 | 100.0

68

Page 69: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS

.....+......+......+......+......+......+......+......+......+.

- | -

- | -

.4 + + I_Espaci +

- | -

- | -

- | Energia -

- | Italia -

- Salud -

- | -

.2 + + +

- Exp_Plan -

- | -

A - | Industri -

X - | -

I - | -

S - | Alemania -

0. +----+------+------Francia+------+------+------+------+------++

2 - Defensa | -

- Gran_Bre | -

- | I_no_ori Universi -

- | -

- | -

- Agricult -

-.2 + + Contamin +

- | -

- | -

- | Pa_Bajos -

- | -

- | -

- | Otros -

-.4 + + +

.....+......+......+......+......+......+......+......+......+.

-.8 -.6 -.4 -.2 0. .2 .4 .6 .8

AXIS 1

L1 = .2014 ( 76.2%) L2 = .0341 ( 12.9%)

PLOT OF ROWS

...+.......+.......+.......+.......+.......+.......+.......+...

- | -

- | -

.4 + + I_Espaci +

- | -

- | -

- | Energia -

- | -

- Salud -

- | -

.2 + + +

- Exp_Plan -

- | -

A - | Industri -

X - | -

I - | -

S - | -

0. +--+-------+-------+-------+-------+-------+-------+-------+--+

2 - Defensa | -

- | -

- | I_no_ori Universi -

- | -

- | -

- Agricult -

-.2 + + Contamin +

- | -

- | -

- | -

- | -

- | -

- | Otros -

-.4 + + +

...+.......+.......+.......+.......+.......+.......+.......+...

-.8 -.6 -.4 -.2 0. .2 .4 .6

AXIS 1

LX = .2014 ( 76.2%) LY = .0341 ( 12.9%)

69

Page 70: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF COLUMNS

.......+.......+.......+.......+.......+.......+.......+.......

- | -

.3 + + Italia +

- | -

- | -

- | -

- | -

.2 + + +

- | -

- | -

- | -

- | -

.1 + + +

A - | -

X - | -

I - | Alemania -

S - | -

0. +------+-------+Francia+-------+-------+-------+-------+------+

2 - | -

- | -

- Gran_Bre | -

- | -

-.1 + + +

- | -

- | -

- | -

- | -

-.2 + + +

- | -

- | -

- | -

- | Pa_Bajos -

.......+.......+.......+.......+.......+.......+.......+.......

-.6 -.4 -.2 0. .2 .4 .6

AXIS 1

LX = .2014 ( 76.2%) LY = .0341 ( 12.9%)

PLOT OF ROWS AND COLUMNS

.

.6 + + +

- . -

- .Pa_Bajos -

- . -

- Contamin . -

- Universi .Italia -

.3 + Industri + +

- Otros . -

- .Alemania -

- Energia . -

- I_Espaci . -

- I_no_ori . -

A 0. + + +

X - Salud . -

I - Agricult . -

S - . -

- Exp_Plan . -

1 - . -

-.3 + + +

- . -

- .Francia -

- . -

- . -

- . -

-.6 + + +

- .Gran_Bre -

- . -

- . -

- . -

- Defensa . -

-.9 + + +

L1 = .2014 ( 76.2%)

70

Page 71: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS SUPPLEMENTARY

.....+......+......+......+......+......+......+......+......+.

- | -

- | -

.4 + + I_Espaci +

- | -

- | -

- | Energia -

- | Italia -

- Salud -

- | -

.2 + + +

- Exp_Plan -

- | -

A - | Industri -

X - | -

I - | -

S - Espa~na | Alemania -

0. +----+------+------Francia+------+------+------+------+------++

2 - Defensa | -

- Gran_Bre | -

- | I_no_ori Universi -

- | -

- | -

- Agricult -

-.2 + + Contamin +

- | -

- | -

- | Pa_Bajos -

- | -

- | -

- | Otros -

-.4 + + +

.....+......+......+......+......+......+......+......+......+.

-.8 -.6 -.4 -.2 0. .2 .4 .6 .8

AXIS 1

L1 = .2014 ( 76.2%) L2 = .0341 ( 12.9%)

PLOT OF COLUMNS

.......+.......+.......+.......+.......+.......+.......+.......

- | -

.3 + + Italia +

- | -

- | -

- | -

- | -

.2 + + +

- | -

- | -

- | -

- | -

.1 + + +

A - | -

X - | -

I - Espa~na | Alemania -

S - | -

0. +------+-------+Francia+-------+-------+-------+-------+------+

2 - | -

- | -

- Gran_Bre | -

- | -

-.1 + + +

- | -

- | -

- | -

- | -

-.2 + + +

- | -

- | -

- | -

- | Pa_Bajos -

.......+.......+.......+.......+.......+.......+.......+.......

-.6 -.4 -.2 0. .2 .4 .6

AXIS 1

LX = .2014 ( 76.2%) LY = .0341 ( 12.9%)

71

Page 72: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

PLOT OF ROWS AND COLUMNS

.

.6 + + +

- . -

- .Pa_Bajos -

- . -

- Contamin . -

- Universi .Italia -

.3 + Industri + +

- Otros . -

- .Alemania -

- Energia . -

- I_Espaci . -

- I_no_ori . -

A 0. + + +

X - Salud . -

I - Agricult . -

S - . -

- Exp_Plan . -

1 - . Espana -

-.3 + + +

- . -

- .Francia -

- . -

- . -

- . -

-.6 + + +

- .Gran_Bre -

- . -

- . -

- . -

- Defensa . -

-.9 + + +

L1 = .2014 ( 76.2%)

1.11.2 Analisis del ejemplo 5.

En este caso lo mas razonable sera estudiar los perfiles columna es decir, los perfiles de los distintos paıses, a traves de losdistintos sectores de I+D.

• Vamos a resolver primero la cuestion planteada, de que habrıa ocurrido, si los datos en vez de venir expresadosen porcentajes, hubiesen venido expresados en cantidades absolutas, como por ejemplo en dolares, al ejecutar elAnalisis de Correspondencias: Como los datos de las columnas vienen dados, de forma que suman todos una cantidadconstante, esto quiere decir que todos tienen la misma masa. En cambio si los datos se hubiesen dado en dolares,cada paıs tendrıa una masa proporcional a la cantidad total asignada a I+D, lo que supondrıa que los paıses maspequenos, tendrıan un menor papel en el analisis, comparados con los mas grandes, por ejemplo Alemania– los PaısesBajos, y como lo que interesa aquı, es comparar las polıticas de los diferentes paıses en relacion a los gastos de losfondos de I+D, antes que las cantidades totales gastadas, es interesante que todos los paıses partan con la mismamasa. Esto hace que la tabla inicial no sea una verdadera tabla de contingencia.

• Los dos primeros ejes principales explican el 89.1% de la inercia total, por lo que al igual que en el anterior ejercicio,podrıa interesar contrastar los resultados del estudio bidimensional, con el tridimensional, aunque aquı ocurre estoen menor medida que en el ejercicio anterior. Se pueden estudiar las proyecciones de los perfiles sobre el primer ejeprincipal al explicar el 76.2% de la inercia total.

• Los puntos que presentan una baja calidad de representacion respecto al plano principal son, Investigacion noOrientada que presenta un valor de 0.063, y en menor medida Agricultura y Exploracion del Planeta, y en cuantoperfiles columna Alemania, por lo que debemos comprobar con los datos, las interpretaciones en las que se encuentrenestos puntos.

Los perfiles que presentan un alto CTR, como ya sabemos, participan determinantemente en la formacion de los ejesprincipales, en nuestro caso, respecto al primer eje principal, Defensa y Universidades para los perfiles fila, y GranBretana y Paıses Bajos para los perfiles columna, y respecto al segundo eje principal, Energıa, Investigacion Espacialy Otros, para los perfiles fila, e Italia y Paıses Bajos, para los perfiles columna. Esto se traduce graficamente,en que los ejes estan en las direcciones de esos perfiles, como se puede apreciar en las distintas representacionesbidimensionales.

• Para los perfiles columna se observa que el primer eje principal, establece una separacion entre Francia y GranBretana, situadas a la izquierda del origen, e Italia, Paıses Bajos y Alemania en el lado derecho. Esta oposicion sepuede explicar, porque Francia y Gran Bretana tienen a su izquierda solo a Defensa y a su derecha al resto de lossectores, estando especialmente lejos de Universidades y Contaminacion Medioambiental. La traduccion de este hecho

72

Page 73: 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa …gallardo/pdf/PRAC-ACS.pdf · 2012-10-08 · 1 Pr´acticas de An´alisis de Correspondencias. BMDP. Programa CA.

es que Francia y Gran Bretana gastan mas en Defensa y menos en Universidades y Contaminacion Medioambiental,teniendo en cuenta que ese mas o menos, es en relacion al promedio de los perfiles columna.

Por supuesto aquı caben todas las comparaciones posibles entre perfiles fila entre sı o alternativamente perfilescolumna, en el sentido de que Francia se encuentra a mitad de camino entre Gran Bretana y Alemania en relacional reparto de fondos de I+D. El gasto de Paıses Bajos en Universidades y Contaminacion Medioambiental es mayorque el del promedio de los paıses. Cuanto mas a la derecha se situe un paıs mas fondos destinara a Industria,Universidades y Contaminacion, y cuanto mas a la izquierda se situe, mas gastara en Defensa.

• El segundo eje establece una separacion entre Italia, en la parte superior, y Paıses Bajos en la parte inferior, situandosepor encima de este eje, Energıa, Investigacion Espacial e Industria y por debajo, Contaminacion Mediambiental,Agricultura y Otros, por lo que este eje establece una diferenciacion entre Sectores Tecnologicos por encima yMedioambientales por debajo, de manera que Italia es relativamente alta en los sectores Tecnologicos y Paıses Bajoses mas alto en sectores Medioambientales.

• El tercer eje lleva la direcciones de los perfiles de Francia y Gran Bretana, explicando el 7.9% de la inercia total,y terminando de representar bien a Investigacion no Orientada, no lograndolo con Contaminacion, Agricultura yExploracion del Planeta.

• El perfil suplementario Espana esta muy mal representado sobre los tres ejes principales, (QLT=0.178), situandosemuy cercano al origen, es decir al perfil promedio de las columnas, con cierta tendencia a la parte izquierda es decira mayores gastos de Defensa y menores en Universidades y Contaminacion Medioambiental. Tambien podemos decirque se encuentra entre Francia y Alemania en relacion al reparto de los fondos de I+D.

73