Técnicas de análisis de datos en investigaclon de mercados (Teodoro Luque)

544
<00' ...., ..j Coordinador TEODORO LUQUE MARTíNEZ PROFESOR TITULAR DE COMERCIALlZACION E INVESTIGACION DE MERCADOS DE LA UNIVERSIDAD DE GRANADA Técnicas de análisis de datos . . . / en lnvestlgaclon de mercaaos EDICIONES PIRÁMIDE

Transcript of Técnicas de análisis de datos en investigaclon de mercados (Teodoro Luque)

/ 0,05.Skippingrotatwn1 forextraction1manalyslS1.LamatnzdecorrelacIOnesreproducidas (debaJodeladiagonal) paraestecasocOincideconlaImclal ylacomunalidad(enladiagonal yparatodoslos casosesuno);todaslasvanablesestn perfectamente recogidasen el modelo, y por tanto nohay residuos(valorespor encima dela diagonal). Estonosera as con otrosproce-dimientosdeextraccIndelosejes.TABLA2.19Matrizdecoeficientesde puntuaciones factonales(Factor ScoreCoefficzent Matrix)Faclol' 1 Factor 2 I X, 0,26870 -0,58950 1,86908 1,56758X20.28061 -0,38242 -0.27670 -4,09660X30,27242 -0,44619 -1,69807 2,41821X.0,24848 1,55855 0,15293 0,28004EdiCIonesPirmideAnlisIsfactorialTABLA2.20Matrizdecovarianzas paralas puntuaciones factorialesestimadas por regresin(CovarianceMatrix forEstimated RegressionFactor Scores)Factor , Factor 2Factor 1Factor 2Factor 3Factor 4',1,000000,000000,000000,000001,000000,000000,000001,000000,00000 1,000004 pe EXAcr factor scores will be saved.Followmg factor scores will be added tothe working file:Name LabelFACI_2FAC2_2FAC3_2FAC4_2REGR factor score1 foranalysis1.REGR factorscore 2 foranalysis1.REGR factorscore 3 for analysis l.REGR factor score 4 for analysis1.Ediciones PirmideLaspuntuacionesfactonales sirvenparalarepresentacingrfica. Si seqUierecalcularlapuntuacindeunfactorenunaobservacin: seaelfactor 1 enlaobser-vacini-sima:(Factor1), =0,26870X + 0,28061X2 +0,27242X3 +0,24848X4Estas puntuaciones pueden ser estimadas por vanos procedimientos; en este casosehautilizadoel deregresin, porloqueseproporcIOnalamatnzdecovananzas.CuandoseaplicaelmtodolaspuntuacionesnoestntipificadasmmcorrelaclOna-das; noessteel casoahora. EnSPSSlaspuntuacionesparacadacasosegrabanen un ficherocon el nombre y etiqueta (name, label) para cada columna como el es-pecificadoarriba. Porejemplo, FACL2REGR factorscore1 foranalysisl. Assepuedeproceder a la representacin deloscasos. En otrosprogramassedandirecta-mente, comoenSTATISTICA, quefacilitalasigUiente tabladepuntuacIOnesfacto-nalesparalosdiferentescasos:TABLA2.21Puntuaciones factoriales(factor scores)1: l"actorJ'.'. ... 3 . 1 -1,17650 0,69316 -1,21295 -0,619702 0,21733 1,20879 0,55350 -0,396953 1,41951 0,64754 -0,18474 0,824354 -1,04593 -0,49907 0,46142 1.595795 -0,08681 -0,64581 1,39598 -1,053476 0,67240 -1,40460 -1,01321 -0,3500271TcnicasdeanlisisdedatosenInvestigacindemercadosLosdiversos mtodos deobtencindeestaspuntuacionesfactonales puedenpresentar valoresmuydiferentes. En realidadesto esdebidoa problemasdeescala,pero cuando setrasladana un plano dedosfactoreslas representacionesas obteni-dascomciden.AnlisisfactorialSi se hubiese optadopor unanlisIsfactonal seleccionando tresfactoresse pro-ducIranalgunasvarIantesa partIr deesta decIsin.TABLA2.22Estadstictasimciales(InttwlStatistics)lflJ,'!Sjrjanzaacumulada(CumPet.)X, 1,00000*1 3,48555 87,1 87,1X21,00000*2 0,32032 8,0 95,1X31,00000*3 0,15440 3,9 99,0X41,00000*4 0,03974 1,0 100,0Se extraentresfactorespor componentespnncipalescuyamatriz decargasfac-torialeses:TABLA2.23Factor MatrixFactor0,936580,978100,949530,86608-0,18883-0,12249-0,142920,499230,28858-0,04272-0,262170,0236172pe extracted 3 factors.Hasta aqu todocomcidesalvo queahora tenemostresfactores.EdiclOnesPirmideAnlisisfactorialTABLA 2.24Estadstlctas finales(Final StatistlcS)X,X2X3X40,996120,973500,990770,99988****1233,485550.320320,1544087,18,03,987,195,199,0Yalacomunalidadnoes l ysuvalor paracadavarIablecomcide conladiago-naldelamatnzsIgUIente.TABLA 2.25Matrtzdecorrelactnreproductda(reproduced correlattonmatrzx)0,99612*0,926870,840640,72370-0,010140,97350*0,957440,784940,00599-0,015640,99077*0,744820,00069-0,001810,001070,99988*Ediciones PirmideThe lowertefttriangLecontamstherelJroducedcorrelatwnmalriX;thediagonal, reproducedcommunalities; andtheupper nght triangleresidualsbetween the observed correlattons and thereproducedc o r r e ~latrons. ThereareO rO,O%) residuals(abovediagonal) withabsolutevaLues > 0,05.Skippingrotatwn1 for extractlOn1inanalysls1.Estamatrizyaesdiferente, tenemosestImacIOnesdelacomunalidad(diagonal)que nolleganal puestoqueslotenemostresfactores. Por ejemplo, paralaVarIa-ble X,:0,936582+ (-0,18883)2 + 0,288582=0,99612Tampocolas correlacIOnesentrevariables (valorespordebajOdeladiagonal)vanaser lasmIsmasquelasIll1CIales; enrealidad ladiferenciaentrelasmiClalesylasreproducidasoresiduos(valoresporencima deladiagonal)nosdaunamedidadelabondaddeajustedelasolucinfactorial. Enestecasolosresiduos sonpe-queosypodemosafirmar queel ajustees bueno. Ahora la correlacin reproducidaentrelasvarIables Xl y X3secalcula delasIgUIente forma:(0,93658X 0,94953) + (-0,18883X -0,14292) + (0,28858X -0,26217) = 0,8406473TcnicasdeanlisisdedatoseninuestigacindemercadosLamatnzdecoeficIentesdepuntuacIOnesfactonales cOIncideconlacomen-tada antenormente y el procedimIento para estImar las puntuacIOnes factorialestam-bin.RotacinSiserotanlosfactoresseproducen diferencIasen la matriz decargas, en la re-presentacin y en laspuntuaciones factonales. Todo lo cualtIenesus consecuenCIasen la Interpretacin de los resultados, aunquesta esuna facetaqueno tIene muchoInters en este ejemplo. Lo que sIgue es la salida de STATISTICA para una rotacinVarimaxraw.TABLA2.26Matrizdecargas factorialesIj;/;i,:.-----je--;--t!-+-+-+--j---+---+--+-i-+-+-+-----+--+--+--t-+-+-, enJ. J. SnchezCarrn, Introduccinalas tcnicasdeanliSISmultivarzableaplicadasalascienciasSOCiales, CentrodeInvestigacionesSociolgicas,Madrd.Cuadras, C. M. (1991): MtodosdeanliSIS multlvarzante, PPU, Barcelona.Churchill, G. A. (1979): MarketingResearch. Methodotoglcat Foundatlons, TheDrydenPress, Hinsdale(IL).Dillon, W. R.; Madden, T. J., YFirtle, N. H. (1987): Marketing Researchm a Marketmg En-vzronment, Irwm, Homewood(IL).Evrard, Y..Pras, B., y Roux, E. (1993): Market. tudes et recherches en marketing, ditlOnsNathan.Harmau, H. H. (1967): Modem factoranalYSlS. Umversityof ChicagoPress, Chicago(IL).86 Ediciones PirmideAnlisisfactorialHalr, J. F.; Anderson, R. E., Tatham, R. L., YBlack,W. C. (1995): Multlvanate Data Analy-SIS wlth Redings, Prenhce-HallIntematlOnal, Englewood Cliffs, NJ.Kinnear, T. c., yTaylor, J. R. (1989): Investigacindemercados. Unenfoqueaplicado,McGraw-Hill, Bogot (Colombia).Lawley, D. N., YMaxwell, A. E. (1971): Factor analysls as statlstlcal method, Amencan EI-seVler, Nueva York.LuqueMartnez, T., yCordnPozo, E. (1994): Unaaplicacindel anlisIsmulhvarlablealas caractersllcas socioeconmlcasycomercialesdelascapitalesdeprovmclaes-paolas. ReVIstaEuropeadeDireccinyEconomadelaEmpresa, vol. 3, nm. 1,pp. 101-112.Malhotra, N. K. (1993): MarketingResearch. An Applied OnentatlOn, Prentice-Hall, Engle-wood Cliffs(NJ).Norusis, M. J. (1986):Advanced Statlstlc SPSS/PC+, SPSSInc., Chicago(IL).Ortega, E., etal. (1990): Manualdeinvestigacincomercial, Pirmide, Madrid.SnchezCarrin, J. J., et al. (1984): Introduccinalastcmcasdeanlisismultivariableaplicadasa lascIenciassocIales, CentrodeInvestigacIOnesSocIOlgicas,Madrid.Santesmases Mestre, M. (1997): DYANE. Diseo y anliSIS deencuestas eninvestIgacin so-CIal ydemercados, Pirmide, Madrid.Sanzdela Tajada, L. A. (1990): El anliSISmulhvanable. enE. Ortega etal., Manualdeinvestigacincomercial, Pirmide, Madrid.Sheth, J. N. (1971): The MulllvarlateRevolutlOnin MarketmgResearch, Joumal of Mar-keting, vol. 34,nm. 1, enero, pp. 13-19.Statlstlca forWindows(1995). StatSoft.Stevens, J. (1986): Applied multivariatestatlstlcs forthesocIalSClences, Hillsdale NJ., Er!-baumn.Uriel, E. (1995): AnliSISdedatos. SenestemporalesyanliSISmultivanante, AC, Madrid.Vidosa, J. (1990): AnlisIsfactona!, enE. Ortegaet al., Manual deinvestigacincomer-cial, Pirmide, Madrid.EdicIOnes Pirmide87Miguel ngel RodrguezMelina1. INTRODUCCiNEl anlisisdecorrespondencIas(AC), otambinanlisIsfactorial decorrespon-dencias, es una tcllca multIvariante que fuedesarrollada en la dcada delossesen-tapor J. P. Benzcnysuscolaboradores. El ongenfrancs deestatcnicaexplicaenparteporqunoseencontrabapresenteenlamayoradelospaquetesestadstI-cosanglosajones. Sinembargo, pocoa poco, el anlisIsdecorrespondencIashaidoextendindose ensuaplicaciny enestosmomentosconstituyeun poderosoInStru-mentoenloscasosenqueel investigadortIenequetrabajarcondatoscualitatIvos.Esuna tcmca de Interdependencia quenoselimita simplementea describIr unconjuntodedatos, SInOquevamsall, tratadedescubrirsusdimenSIOnesestruc-turales, estudiandolassllnilitudesnoentrelasmagnitudesabsolutas, sinoentrelasformas. AdemsdereducIrlasdimenSIOnes, conducealaobtencin demapasper-ceptuales; por esto, puede ser clasificada comouna tcnicadecomposIcin, porqueproporcIOnaun mapa perceptual basadoenla asociacin entre objetosy unconJun-todecaracterstIcasdescnptIvasoatributos(Har et al., 1995).Lagardedefineel anliSISdecorrespondencIascomo unmododerepresen-tacingrficadelastablasdecontIngencIao, SI seprefiere, delastablascruzadasy mltiples. DichoanlisistratadeevidenCIar en unooenvanosgrficos(general-mentemenosdecuatroyhabitualmenteenunoslo)lamayor cantidadposibledeinformacincontenidaenunatabla, fijndosenoenlosvalores absolutos, SInOenlascorrespondencIasentre lascaracterstIcas, esdecir, enlosvaJoresrelatIvos'Como se desprendedeestas defimclOnes, lasprinCIpales caracterstIcasdel an-lisisdecorrespondencIasseresumenen:1. Est Incluida dentrodelosmtodosdeInterdependencIa. EsdeCIr, noeXIS-tedistIncinentrevariablesdependientese independientes.VaseConde(1992).EdicIOnes Pirmide 89TcnicasdeanlisIsdedatoseninvestigacindemercados2. Su objetIvo es establecer relacionesentre vanables categricas dispuestas enuna tabladecontingencIa.3. Trabajaconvariablescategricas, esdecir, noconmedicionescuantitatIvasSinO con frecuencias.4. LasrelaconesentrelasvariablesseanalizanmediantemapasperceptualesmuyintUItIvos, que perilllten noslo reducir elnmerodevariables quein-terVIenenenel anlisIs, SinOestudiar lasfonnasqueadoptanlasrelaCIOnesentre lasvariables.El anlisisdecorrespondenCIascOincideconel MDS(multidimensional sca-ling) enqueutilizadatoscualitatIvos, y conel anJisisfactorial ensuobjetIvoderedUCIrel nmerodedimensonesparafacilitar ysImplificarlainterpretacIndeunfenmeno. Sinembargo, apesardeestaestrecharelaCInenel objetIvoper-seguido, eXIsteunadiferenCIafundamental: el anlisIsfactorial utilizadatos bsi-camente mtricos,mIentras que el anlisIsde correspondencias utiliza datosnom-tricos.Tantoel anlisisdecorrespondenCIascomoel MDSpuedenrepresentar, enunespacodemenordimensinqueel originalmentedado, unconjuntodedatosnomtricos, pero la mtrIca utilizada es diferente.Mientras que en AClos datosde en-trada estnmedidosen escalasnominales, en MDSvIenenmedidosen escalas ordi-nalesocuantItatIvas.El hechodequeel anlisIsdecorrespondencIas trabajecon datoscualitatIvosleconfieredos caracterstIcasdiferenCIales. Porunlado, trabajaconfrecuencIas queson elproducto del cruce de dos vanables o ms.Por otro, cuando se cruzan dosva-riables, el anlisisdecorrespondencIasutilizacomoindividuosyvariableslasdis-tIntasmodalidades.ste es el anlisis decorrespondencias simple (ACS). Cuando elnmerodemodalidadespertenecea msdedosvarIables, elmtodopuedegenera-lizarse. steesel anlisisdecorrespondenciasmltiple(ACM).Conanteroridad, el anJisisdetablasdecontingencIaselimItabaa comprobarSI exista asociacin entre lasvarIablesestudiadascon el findeformularalgnmo-delocausalo sImplementeparatratardeobservar si eXIsta algntipodeinterrela-cin, apartir dediferentestestscomola ji-cuadrado(X2). Peroestonoaclaranadasobrequcategorassonlasqueprovocanestarelacinyculessonaquellasquecontribuyen poco a dicha asociacIn, El anlisis de correspondencIas pennIte extraerconclusionesdeestetIpo, es decIr, definesimilitudesydisImilitudesentremodali-dades deunavarIablepermItIendoobservarculessonlascategorasqueseen-cuentranrelaconadas. Adems, permItelarepresentacinengrficosfciles delll-terpretar quevIsualizanlasrelaConesobtemdas.Porotraparte, esteanlisIspuedeconstItUIrunpasointennedioparalaaplica-cindeotrastcnicascomoel anlisiscluster, el anlisisderegresIno el anlisisdiscriminante. As, posibilita laaplicacIna uncOllJunto dedatoscualitativosobte-nindosecoordenadasmtricasen el espacIO quedefinenlosfactores.Enfin, esunmtodomultIvananteellllnentementedescriptivo, unaherrallllenta90 EdicionesPirmideAnlisisdecorrespondenciaSsimple y mltiplemuytilpara el lllvestIgador, sobre todo en estudiosde carcter exploratonodondenoeXIstenhIpteSISdefinidaspreVIamente.2. BREVERESEA HISTRICALosorgenesdel anliSISdecorrespondenCIasse remontancasi 65aosgraCIasal trabajOpublicado por Hartley(1935), donde se expona la frmula quecalculabala correlacinentre filasy columnasde una tabladecontlllgencIa.En la dcada delostrelllta existen tambin otrostrabajos quesugeran ideasSI-milaresa lasdeHartley en el campo dela pSIcometra. En este sentido son dedes-tacar lostrabajosdeRichardsonyKuder(1933)yHorst (1935). Mstarde, Fisher(1940) desarrolllamIsmateoraa partIrdel anliSISdiscnmlllante, utilizandounejemplobasado en el color del pelo y delosojos que esclSICO en losmanuales deanliSIS decorrespondenCIas. AlmIsmotIempo, Guttman(1941)trat el caso gene-ral demsdedos variablesInIciandolospnmerospasosde10quehoyseconocecon el nombre deanliSISdecorrespondencIasmltIples.LadcadadeloscincuentasupusounfuerteImpulsoparael desarrollomate-mtIcodel anliSISdecorrespondencias. AdemsdelostrabajOSdeGuttmanysusseguidoresenel campodelapSlcometra, aparecenlostrabajOSdeHayashi (1950,1952, 1954, 1968). Eldesarrollodelosordenadoressupuso tambinunfuerteem-pujn para el conocImIento de la tCnIca, ya quetodoslosprocedimIentos matem-tIcosdesarrolladOShasta el momentotuvIeronuna aplicacin lllmediata.Sin embargo, el ACno era tancOJlocido fuera del campo de la pSIcometra. Fuea partIrdel trabajOde Hill(1974)cuandolapopularidaddeestatCnIcaaument.Hillla catalogcomo una tcnIcamultivarJante descuidada.El desarrollogeomtricodel anliSISdecorrespondencIastuvolugarduranteladcada delossetenta con lostrabajosdeBenzcny sus colaboradores. Lasaporta-cIOnestencasdeBenzcri2facilitaronsuconocImIentogeneralizado. EntretalesaportacIOnesdestacan:1. SuplanteamientolllductIvo, desdeloparticularalogeneral. EstopermiteformularunodelospnnciplOsdeBenzcn: Elmodeloseajustaalosda-tos, noviceversa.2. Uso dela geometra para lllterpretar mediante grficossencillos la informa-cin.3. RazonamIento matemtico nguroso y exhaustIvo en la expresin de las fun-cIOnes y caractersticasdelosoperadoresy operandos.2 Juntoal trabajo de Benzcn. son destacables las obras de Lebar!. Morineau y Tabard (1977) y Le-bar!, Morineau y Warwlck(1984), entreotras. Para ms detalle sobre la histona del AC vase Mallowsand Tukey(1982), Gifi (1981) YGreenacre(1984).EdiclOnes Pirmide91Tcnicasdeanlisisdedatoseninvestigacindemercados3. ANLISISDECORRESPONDENCIASSIMPLE(ACS)3.1. ConsideracionesgeneralesEl anlisIsdecorrespondencIassImplepartedeunatabladecontmgencIaquecontienedos varIables. consusdiversas modalidades, ycadacasilla recogelafre-cuenCIa enquesepresentan. A partIr deaqutratadehaceralgoparecidoal anli-SIS de componentesprincipales, considerandoa las filascomo losmdividuosy a lascolumnas como lasvariables. AunqueSI se cambIan las filaspor las columnasen latabla decontmgencIa lamformacin permanece malterada.Igual que el anlisIsde componentes princIpales, el ACStrata de explicar la dis-persin de la,matriz de varianzas-covarianzas (aunque en este caso se denomina ma-trizdemercia) atravsdeunnmeromenordevarIables(factores), peroeste an-liSISdebe realizarsetanto para lasfilascomo para las columnas. Por tanto, y esunapartIcularidad de la tcmca, se tienenque llevar a cabo dosanlisIsde componentesprincipales, unoparaeLespacIOquedefinenlasfilasy otro para el espacio quede-finenlascolumnas.Enmuchosestudioses frecuentequeel investIgador precIseutilizar sImultnea-mentevariables medidastantoenescalasnomtrIcascomomtricas. Ental caso.resultamteresantetransformarlas variables mtricas enotrasquenolosean. Deestemodo, todaslasvariablesestaranmedidasenlamIsmaescala(nomtrica) ysera posibleoperar con ellas conjuntamenteaplicandoACSo ACM.Undilemaa resolver esestablecer elnmerodeclaseselegidasy losmtervalosdeVarIacin decada clase. Elnmerodeclasesa defimrsiempre resulta polmico.ya queSI esmuy reducido hacequese pIerda mucha mformacin; adems, se agru-paranenunall11smaclasemdividuosposiblementemuyheterogneos, porloquelasconclusionessernmuygenerales. Porel contrarIo, unnmerodeclasesmuyamplionoest exentodeproblemas. yaquecomplica la mterpretacin.Tampocopara definir losmtervaloshayreglasfijasasegUIr. Una reglaprcticadegranaceptacinconSIsteendefimrclasesquecontenganparecidonmerodeefectIvosmsqueclasescon igual intervalo devarIacin.3.2. Formulacin del ACSSea una tabla de contingencia (tabla 3.1) donde estn representadas las varIables1, conncategoras, yJ, con p, dondelamterseccindeunafilayunacolumna esla frecuencIacon quese presenta la modalidadi de la varIable 1 y la modalidad J delavariable 1. AestamatriZdefrecuencIasla denoll11naremosmatriZK.92Ediciones PirmideAnlisisdecorrespondenczassimpleymltipleTABLA3.1Matrizde frecuenciasabsolutas(K)k,.Total col.dondek,.Jk = ~ k..1. ~ IJJk. = ~ k.} L..J 1)kEsevidenteque losvaloresabsolutosnoperrmtencomparar a dosfilasoa doscolumnas. Por tanto, nosmteresaexpresarlamatrrzKentrrmnosrelatIvos, divi-diendocada una delasfrecuencIasabsolutasentreel total delasfilasodelasco-lumnas(k). Obtenemosas la matrizde frecuencIasrelatIvas(F) (tabla3.2).TABLA 3.2Matrizde frecuencias relativas(F)Total col.Ediciones Pirmide12Total fIlal93Tcncasdeanlisisdedatoseninvestigacindemercadosdondekfu= k. ~f,=t=,L,fu,If, =~ J =~ ~ f,. =11. ~ . ) LJL 1]J, JLasumadelasfrecuencIas relativasparacadafilanospermIteobtenerlafre-cuenciamargInal decadafila f,,, mientrasquelasumaparacadacolumnapermIteobtener la frecuenciamarginal decada columna JrPor otraparte, la ley condicIOnal deunacolumna j ser la formaen quese dis-tribuyesumargInal Jjentre las diferentes filas, es decIr, un vector columna quecon-tIeneloscoefiCIentes f,/f)' stasrepresentancmosedistribuyenlasproporcionesenquesepresentanlascaracterstIcasdefinidas porlasfilasdadalacaractersticadefinida por la columna J. A estevector se le denominaperfil dela columna. UnrazonamIentosmular podra hacersepara el caso delasfilas,3.2.1. Distancias entre filasy columnasEl carctercualitatIvodelas varIablesobligaausarunadistancIadistIntaalaeucldea. En nuestro caso,para medir la distancIa entre dosfilaso entre doscolum-nas serecurrealadenomInadadistancIaXl. EnrealidadesunadistanCIaeucldeaponderada por la masa delas columnas en caso dequeestemosmidiendola distan-CIa entredosfilaso ponderada por lamasadelas filasen caso dequeestemosmI-diendoladistanCIaentredoscolunmas. Sedemuestraqueconesaponderacinalsumar filasocolumnasproporCIOnales, o con perfilSImilar, la distanCIaqueda inal-terada(pnnciplOdeeqUIvalenCIa distribuclOnal).La expresindela distanCIa entredosfilas, e i' esIgual a:(1)Paralelamente, la distanciaentredoscolumnas j y j' se obtieneaplicandolaSI-guienteexpresin:94(2)EdiCIOnes PirmideAnlisisdecorrespondenciassimple y mltipleLasdistanciasnosemidenentredosfilasoentredoscolumnas, smoquevIe-nenexpresadasconrespectoal centrodegravedaddefinidoencada filaoencadacolumna. El centrodegravedad deunafilavIenedadopor lamasadela columnaif.),mIentras que para una columna es la masa de una fila(J;). As,el centro de gra-vedad para una columna podemos defirnr!o como el promedio de las coordenadas deesa columna ponderadaspor sumasa. Esunvector formadopor puntos deltipo:(3)LadistanCIadecadacolumnaydecadafilaal centrodegravedadseexpresacomosigue:y3.2.2. Inercia delas filas ylas columnasHasta ahorasabemosmedirladistanciadeunafilao unacolumna alcentrodegravedad. esto es, a sumedia. Sin embargo, estonoesmsque parte delclculode una vananza o una covananza. As.en el caso de la varianza, cada diferencIa en-tre un punto ysu media est elevadaalcuadrado y est ponderada de la mIsma for-ma(IIn). Enel clculodela covananzacada diferencIaentreunpuntoyel centrodegravedadestponderadapor lln. Noobstante, enesteltimocasola diferencIaentrecadapuntoyel centrodegravedadnoestelevadaal cuadrado. Ahorabien,en el ACSlas filaso las columnasno reciben la rmsma ponderacin. BenzcnaSIg-na unasponderacIOnes queson Igualesa lasmasasdecada filao decada columna.Endefirntiva, ladispersinomerCIadelascolumnaseslasuma delasdiferenciasdecada punto respecto delcentro degravedad ponderadaspor la masa decada fila.Estose expresa dela sIgUIente forma:EdiCIOnes PirmideI=" f.d2(,G)=" f I ~ ( f i j _t)2 =I(fij-t.Xf?'"-'.} J e '"-'.}"f" "xfJ j' Ji. . .J i,j Ji. .J(6)95TcnicasdeanlisIsdedatoseninvestigacindemercadosAnlogamente, la dispersInomerCla decada filaesla suma delasdiferencIasdecadapuntorespectodeeste centrodegravedadponderadaspor lamasadecadacolumna. Esto es:1 =L. f,d2(i,G) = L1,~ -.l. (fij _f .)2=L. (fij - ; x y (7)." f ."''" f +. .J , +. x fJ _/ Ji. >./ Ji. .JPortanto, lasumadelamerCIadelasfilas esIgual a lasuma dela merdadelascolumnas.Lamatrzdedispersinomatrzdemerclatantoparalascolumnascomoparalasfilasse expresa comosIgue:para el espacIO quedefinenlospuntosi en RP(8)para el espacIO quedefinenlospuntos) en R" (9)dondeXeslamatnzcuyotnmnogeneral es:(10)96Lasmatncesantenores sQnsimtrcas. Al diagonalizarunamatrIzsImtrIca, lasuma delosautovaloreseslatraza delamatrIz(V). Recordemosquela trazadelamatrIzV vienedada por lasvarIanzasdelascolumnaso delasfilas, y quela sumadeellas es la mercla odispersinquetratamosde explicar a travsdelnuevoespa-CIO. Enconclusin, losautovalores indicanqupartedeesadispersinvIeneex-plicada por cada dimenSIn(factor)en el nuevoespado. steser el prxImo paso.No obstante, antesdeestoveamosla reladnqueexiste entre el estadstIco X2y lamerCIa.DelasexpresIOnes6y 7 sededucequelamercla deuna tablaesIgual al esta-dsticoX2divididoentreel nmerodemdividuosencuestados (k). Adems, el co-cIenteentrela contribudndecadacasillaal estadstIcoX2y el nmerodemdivi-duos encuestados (k) es Igual acadaunode los sumandos enel clculode lamerCIa.3,2.3. Diagonalizacindelas matricesVe yVFObtenidaslasmatncesde merda para las columnasy para las fIlas, elsIguiente. paso escalcular susvaloresyvectorespropIOS.Para el espacIO de pdimenSIOnesque definen los puntos fila, es necesarIO diago-nalizar la matrIzVpobteniendo susvaloresy vectorespropIOS que penmtun calcu-Ediciones PirmideAnlisisdecorrespondenciassimple ymltiplelar las coordenadas de los puntos 1 en RPEstas coordenadas tendrn la sIgUIente ex-presin:(11)dondeuc./c\/..... g.d.!,,O,?oo.'i/.'"; .,\..... i'i i\ . ,.]';u:X JackDi>.....Jiliati Necesi.\ ..... > {"',Marca cara 4.562-11,123 -4,271 -11,600 -7,592 33,447 -6,625 6,563 -3,360ProductomasIvo -2,200 12,831 2,592 5,800 -4,229 -9,967 -1,270 -3,610 0,053Poca variedad 7,459 2.554 2,488 0,200 0,622-14,095 2,581 -1,716 -0,092SeanunciaenteleVIsin -5,225 -5,000 -3,718 -21,000 -6,676 48,648 -7,718 1,070 -0,380Acabadoperrecto 0.598 8,477 -0,167 -8,800 -4,882 6,667 2,079 -4,361 0,389Marcanoconocida 1,003 5,185 1,351 15,400 11,423-25,600 0,381 -4,859 -4,284Ahorra lIempo -0,692 9,862 2,350 -8,800 3,862 -8,691 5,827 -3,828 0,111Dura lIempo -2,225 -7,000 -0,718 34,000 2,324-16,352 1,282 -4,930 -6,380Innovadora 14,951 1,523 -0,270 -0,200 1,530-18,371 -0.516 -2,498 3,850Exclusiva -2,049-13,477 -1,270 -4,200 2.530 10,629 -5,516 9,502 3,850Fcildeencontrar -9,744 10,200 -0,270 -15,400 -8,031 17.538 -0,070 5,532 0,245ImItacin 7,547 3,815 3,213 16,600 -4,775-22,104 3,182 -4,001 -3,476MarcaeconmIca -1,516 -5,615 -0,202 -6,000 -1,932 11,290 -3,971 2,603 5,341Anticuada -0,516 12,385 1,798 14,000 -3,932-19,710 0,029 -2,397 -1,659Artesanal -0,060 -6,246 -0,064 14,800 12,267-16,205 1,229 -3,254 -2,466Demoda -7,795 3,538 -0,891 2,000 -3,924 2,767 3,033 -3,107 4,379LUJOsa -5.578 -7,046 -3,616 -21,600 22,912 -3,315 4,876 4,208 9,159Buendiseo -8,314 -3,262 -3,443 -13,400 -7,279 36,657 -2,320 4,355 -2,995Buen rendimIento -4,034 -8,415 1,246 -14,400 6,713 0,180 3,677 7,065 7,967Barata 1,396 1,123 2,074 18,600 7,465-22,700 -0.572 -3,112 -4,274Paraclasealta 6,345 4,462 0,454 13,000 -4,428-16,471 -3,469 -1,752 1,860BuenserVICIO 15.572 -5,354 3.523 6,400 -0,329-18,719 0,631 0,319 -2,044Proporcionaorgullo -2,567 -8,277 -1,822 -3,600 -3,825 19,519 4,132 -0.036 -3.525Ofrece regalos 5,624 11,308 3,143 6,000 -1,436-23,948 2,528 -3,041 -0,178Marca decalidad -12,541 -6,446 -3,512 -17,800 -8,378 48,905 -3,419 5,284 -2,092122EdiCiOnesPirmideAnlisisdecorrespondenciassimple y mltipleLa tabla3.19, al diagonalizarlamatnzdeinercia, expresalosvaloressingula-res, losvalorespropIOS, la mercla yla X2para cada factor.TABLA3.19Valores proplOSemerClaexplicada por cada factor1 0,294 0,087 50,638 50,638 399,7192 0,201 0,040 23,530 74,169 185,7393 0.141 0,020 11,602 85,771 91,5834 0.105 0,011 6,494 92,265 51,2595 0,074 0,005 3,185 95.450 25.1426 0,063 0,004 2,286 97,736 18,0477 0,055 0,003 1,754 99.491 13,8478 0,030 0,001 0,509 100,000 4,022As, elprimer factorexplica msdeun50%dela inerCIa delosdatosongma-les. El segUndofactorexplica un23,5%yel terceroun11,60%. Losdospnmerosfactoresexplican de forma conjunta ms de un 74% segn mdica la qumta columna,y SI se une el tercerose logra explicar casI un86%dela mercla.Laaplicacin del cntenoqueconsIsteen tomarunnmerodefactoresqueex-pliquenunporcentajesufiCIentedelamformacinaconsejaretenerlostrespn-meros factores. Si se aplica el cnterio de elegIr factores que expliquen ms de100/po100/(P - 1), escogeramosmcamente losdospnmeros, Finalmente, SI aplicamosla regla dela descomposIcin aditiva dela X2obtenemoslosresultadosque resumelatabla3,20, Entoncessedebenretenercuatrofactores conlosqueseexplicaun92,26%delamerCla,TABLA 3.20DescomposicinaditivadelestadstICO x:l''xC......j.iC.p(;2 399,72 31 0,000003 185,74 29 0,000004 91,58 27 0.000005 51,26 25 0,001496 25.14 23 0,343167 18,05 21 0,645838 13,85 19 0,7923494,02 17 0,99947Total 789,36 192EdicIOnes Pirmide123TcnicasdeanlisisdedatoseninvestigacindemercadosSabemosquediferentescntenospuedenaconsejar seleccionesdistmtas. En estecaso, y deacuerdocon locomentado, empleamosmcamentelos dosprimeros fac-toresenarasdeunamayor SImplicidad y facilidadpara obtener losgrficosderiva-dosdel ACS.Elegidoel nmerodefactores vamos adescribIrlos utilizandoparaellolascontribucionesabsolutasyrelatIvas(tabla3.21) ylascoordenadas(tabla3.22) enelnuevoespacio. Recordemosquela contribucinabsolutamuestra la contribucindelospuntosa la formacindeleje, mientrasquela contribucin relativamdica lobien omalqueestnrepresentadoslospuntosen los factores. Lospuntoscon altascontribucionesabsolutas yrelatIvas nosmdicarnqumformacInresumecadafactor.Latabla3.21tambinmuestralacalidadoporcentajequedecadapuntoseTABLA3.21ContribuCIOnesabsolutasyrelatlvasdelos atributos ylasmarcas. !>['C.\I, 0i

>'i

....,i CTR2.x " r'....0l .. 'relativa.'Marca cara 0,03315 0,76359 0,07608 0.11118 0,74004 0,00761 0,02355Productomasivo 0.04030 0,66675 0.02188 0,01067 0.24687 0,03905 0,41988Poca variedad 0,04095 0,59792 0.01000 0,01178 0,59664 0,00005 0,00128SeanunciaenTV 0,04225 0,90155 0,07495 0,12970 0,87630 0,00804 0,02524Acabadoperfecto 0,03879 0,32747 0,01694 0,00068 0,02036 0,02211 0,30712Marca noconocida 0,04182 0,83951 0,04568 0,07027 0,77894 0,01176 0,06058Ahorra tiempo 0,03554 0,20699 0,02472 0,00924 0,18926 0,00186 0,01773Duratiempo 0,04225 0,43517 0,05686 0,04730 0,42124 0,00337 0,01394Innovadora 0,04572 0,35175 0,02055 0,01384 0,34110 0,00093 0,01065ExclUSiva 0,04572 0,60862 0,03619 0,02618 0,36632 0,03727 0,24230Fcil deencontrar 0,03944 0,58306 0,04266 0.03893 0,46218 0.02191 0,12088Imitacin 0,04269 0,91029 0,03214 0,04064 0,64022 0.03689 0,27007Marcaeconmica 0;03900 0,63214 0,01448 0,01708 0,59750 0,00213 0,03464Antlcuada 0,03900 0,84706 0,03027 0,03062 0,51221 0,04307 0,33484Artesanal 0,03814 0,73792 0,04105 0,03621 0,44669 0,05081 0,29123Demoda 0,04334 0,10564 0,01202 0.00007 0,00274 0,00526 0,10290LUjosa 0,03532 0,94424 0,13097 0,00179 0,00693 0,52169 0,93731Buendiseo 0.04052 0,94969 0,05035 0,08945 0,89968 0,01070 0,05001Buenrendimiento 0,03619 0,78322 0,04472 0,01101 0,12465 0,12517 0,65857Barata 0,03727 0,81473 0,03710 0,05837 0,79670 0,00284 0,01802Paraclasealta 0,04117 0,66983 0,01958 0,01526 0,39481 0,02288 0,27501Buen serVicio 0,04074 0,32082 0,02719 0,01718 0,31999 0,00010 0,00083ProporCIOna orgullo 0,04290 0,44708 0,01836 0,01562 0,43073 0,00128 0,01635Ofrece regalos 0,03684 0,79330 0,03044 0,04071 0,67728 0,01501 0,11602Marcadecalidad 0,04095 0,95522 0,08483 0,15621 0,93245 0,00821 0,02276124EdiCIOnes PirmideAnlisisdecorrespondenciassImpley mltipleTABLA 3.21(continuacin).1......,..............,erA 2ColulllIllls !Calidad CTR2",. , .. ..ECUA 0.11398 0,32753 0.06739 0,04141 0,31116 0,00469 0,01637JACKDA 0,09231 0,47248 0,11581 0,05256 0,22981 0,11944 0,24268MARLBO 0,03445 0,66063 0,02842 0,034450,61379 0,00566 0,04684EMPRES 0,20000 0,75802 0.17014 0,22848 0,68004 0,05638 0,07798ABSOR 0,04962 0,96083 0,20017 0,072270.18282 0,66185 0,77800IMATI 0,37616 0,96444 0,23138 0,435660,95344 0,01082 0,01100NECESI 0,04984 0,36384 0,04383 0,02349 0,27141 0,01722 0,09243COLOCA 0,03554 0,73194 0,08857 0.10760 0,61517 0,04396 0.11678NOVOCLA 0,04810 0,38482 0,05428 0,00408 0,03809 0,07999 0,34672TABLA3.22Coordenadasdelas filasylascolumnasenlosdos przmerosejesCoordenadas factor 1.. 2Marca cara 0,538955 0,096140ProductomaSIVO -0.151412 0,197464Pocavanedad -0,157826 0,007310SeanunCIa entelevisin 0,515630 0,087511Acabadoperfecto 0,038992 0,151456Marca noconocida -0,381486 -0,106384Ahorra tiempo -0.150068 -0,045932DuratIempo -0,311373 0,056634Innovadora -0,161921 -0,028612ExclusIva 0,222707 -0.181127Fcildeencontrar 0,292414 0,149544IIIlltacin -0,287144 0,186496MarcaeconmIca 0.194775-0,046898Anticuada -0,260755 0,210828Artesanal -0,286784 -0,231564Demoda 0,011410 0,069863LUjosa 0,066292-0,771020Buendiseo0,437266 0.103090Buen rendimiento 0.162332-0,373121Barata -0,368314-0,055396Para clasealta -0.1791910,149553Buenservicio -0.1911220,009730ProporCIOna orgullo 0.1775650,034599Ofreceregalos -0,3093950.128057Marca decalidad 0,5747820,089805IEdicionesPirmide125TcnicasdeanlisisdedatoseninvestigacindemercadosTABLA 3.22(continuacin)ECUAJACKOAMARLBOEMPRESABSORIMATINECESICOLOCANOVOCLA-0,I77387-0.222070-0,294303-0,314558-0,3551700,316720-0,2020600,5121070,0857430,0406880,2282020,0812960,106520-0,7326790,034024-0,117918-0,223124-0,258690126explica con dos factores, es un concepto anlogo al de comunalidad. Igualmente ex-presa la parte en quecada punto contribuye a la formacindela Inercia dela tabla(inercIa relatIva).Si analizamoslos puntos que mayor contribucin tIenen en la formacindel PrI-merejedebemosresaltar: marcadecalidad, seanunClGenteleVIsin, marcacara,buendiseo, marcanoconocidaybarata. Estospuntosestnbienrepresentados(alta contribucin relativa)yexplicanmsdel 61 %dela informacinquecontIeneel prImerfactor. Si observamoslascoordenadasdelospuntosenel primer factorcomprobamos cmomarcadecalidad, seanunciaenteleVIsin, marcacaray buendiseoseoponenamarcanoconocidaybarata. El primerfactor diferenCIaentremarcaspercibidascomomuydiferentes. Porunlado, lasqueseasociancomodecalidad,buen diseo y una considerable publicidad en televisiny, por otro, lasquesepercibencomobaratasy noconocidas.Para Interpretar el segundo factorsegUImos el Ullsmo procedimiento. Los puntosquemscontribuyena la formacIndeeste factor son: lUjosaybuenrendimiento.Conslo estosdospuntosse explica msdel64%dela InerCIa del segundo factor;ya el primer punto(lUJosa) contribuye de forma muy Importante con cerca del53%.EstohacesospechardelapresencIadeunpuntoaberranteuoutliers. Los puntosaberranteshacenquelaInterpretacindelosejessea difcil yaqueagrupaalrestode los puntos, ademscon riesgode provocar Inestabilidad en el segundo factor. Poresta raznelsIgUIentepasoser Investigar la estabilidad Interna de losfactoresconla configuracinactua19Latabla3.23recogelatransformacinquesufren los factorescuandoseelimI-naalgnpunto. El prImer ejepuedeconsiderarseestableyaquelaelimInacindecualqUIera delospuntosno hacequerotemsde450En el caso del segundo fac-torlospuntoslUjosay la marca ABSORprovocanrotacIOnesconsiderablesaunqueno llegan a ser superiores a 450Para el caso del plano el puntolUjosa es el que ma-9 Aeste respectovaseel anexoalfinal de captulo dondese presenta mayor detalle sobre la ope-ratorta.EdiCIOnes PirmideAnlisisdecorrespondenciassimple y mltipleyorinestabilidadprovoca. Aspues, consideramos aesteltimopuntocomosuple-mentario, yaquehaceinestableal segundofactor yprovocatambinunaltogradodemestabilidadenel plano(vasefigura3.7).TABLA3.23Estabilidad internadelosdos primerosejes yel plano1-2Marcacara 0,2903 8,2408 0,1715 1,2798 0,6597 20,3387ProductomasIvo 0,0841 1,9899 0,1440 3,9538 0,1912 5,4475Poca variedad 0,0384 1,0883 0,0352 0,0697 0,0874 2,4912Seanuncia en TV 0'.2887 6,8253 0,0812 0,6770 0,6561 19,7832Acabadoperfecto 0,0650 0,4950 0,1447 3,6036 0,1477 3,7577Marca noconocida 0,1759 4,5965 0,0884 1,1200 0,3997 10,9675Ahorra tiempo 0,0946 2,0012 0,1742 1,1272 0,2149 4,3956Dura tiempo 0,2190 5,9040 0,2881 1,5100 0,4977 12,4359Innovadora 0,0794 2,1005 0,1189 0,6265 0,1805 4,6464ExclUSIVa 0,1399 3,7022 0,2015 4,4450 0,3180 9,2189Fcilde encontrar 0,1638 4,5828 0,2002 3,2330 0,3723 10,6856Imitacin 0,1239 3,5106 0,1013 2,4554 0.2815 5,9075Marca econlllica 0,0556 1,5772 0,0508 0,5085 0,1263 3,5914Anticuada 0,1162 3,3223 0,1288 3,3258 0,2641 6,5513Artesanal 0,1574 4,3764 0,1980 4,7171 0,3578 10,3854Demoda 0,0463 0,1328 0,1050 1,6856 0,1053 1,7105LUjosa 0,5008 1,5917 1,1303 -41,9060 1,1381 -40,9310Buendiseo 0,1936 3,9172 0,0441 0,5300 0,4399 8,8255Buen rendinuento 0,1712 2,8613 0,3405 9,9514 0,3890 11,1764Barata 0,1422 3,5617 0,0657 0,4708 0,3231 8,7457Para clasealta 0,0753 2,0728 0,1036 2,5255 0,1712 4,8497Buen servicIO 0,1046 2,6851 0,1616 0,2295 0,2376 5,7765ProporcIOnaorgullo 0,0708 1,9852 0,0916 0,6111 0,1608 4,4683Ofrece regalos 0,1166 3,2436 0,0855 1,4710 0,2649 7,1275Marca decalidad 0,3263 6,4269 0,0501 0,4085 0,7416 21,6791ECUA 0,2806 6,6094 0,4392 2,2366 0,6376 13,0657JACKDA 0,4707 8,7611 0,8238 13,1915 1,0696 32,5751MARLBO 0,1086 3,0941 0,0953 1,0616 0,2468 7,1216EMPRES 0,7845 22,7844 0,5705 5,8339 1,7829 -38,5195ABSOR 0,7770 10,9583 1,4429 -42,0812 1,7658 -22,2629IMATI 1,3682 -31,0783 0,1448 0,7578 3,1095 -14,9736NECESI 0,1702 3,9967 0,2818 3,7805 0,3867 9,3032COLOCA 0,3388 9,8378 0,2963 4,4079 0,7699 23,3474NOVOCLA 0,2104 1,9288 0,4599 10,4943 0,4781 11,3682EdiCIOnes Pirmide 127Tcnicasdeanlisisdedatoseninvestigacindemercados0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 -0,1 -0,2 -0,3 -0,4';;' 0,4 " " t ! I I , I , I I.s 0,3 0,2 '$. 0,1 0,0 nbcono:: +: : : + : : : :t!.- -0,1 -- ------- -..:- __ ..NE5ES.L ---- -..:- --- - - -\...-- ----- -- ---..:- - ---- -:...---- --- - -...:-------l,f) .l.: I : : :: : :09-0,2 ----------f- ---- -WV0f:K---f -t ----+----- _'" I I , I I I I , , ,I I I I I I I I I ,-0,3 ------r----- -:- ------:------r-------r-------r- -----r--- ---r- ---- --r-- ----.9 -0,4 ------f------+-----+------f------+-----+---7--f------+------t------f------+------

-0,5 - ---- --;---------- ---- - --------- I I I I I I lIT I II I I I I I lIT I I-0,6 ------t---- --1-------:- -----:---- --1---- ---------- t--------------:--- ---t----- -1--- ----,5 -0,7 ---- -4J3.S.0R-:-----+---- ---:-------l------- +- ------:- ---- ---+- ------:--- -----0,8 -__ ---1--- __ - -------1-- _----I I I I I , I I 1 I II I I I I , lIT I Ii:l -0,9 1-+-r-+-i---r-,---+-i-+-+-+----+-+-r-+-+-+-+-+-r-+--e}./:Co6rderiadas,1;1

Buen diseo 0,44368 -0,04046Buen rendimiento 0,14292 0.26986Barata -0,37274 0,13291Para clase alta -0,16656 -0,07981Buen servicIO -0,18702 0,10157ProporcIOna orgullo 0,17966I0,04643Ofrece regalos -0.30077 -0,18393Marca de calidad 0,58042 -0,01931ECUA -0,17527 0,03048JACKDA -0,21246 -0,37603MARLBO -0,28729 -0,06975EMPRES -0.30610 0,05095ABSOR -0,44645 0,44769IMATI 0,32279 -0,00289NECESI -0,21739 -0,06661COLOCA 0,52576 0,22563NOVOCLA 0,07776 0,00945LUjosa 0,01463 0,50732Si representamoslascoordenadasdelascolumnasenunmapaaSlmtnco(va-se figura3.8)seobservaqueson competidoras, por unlado, lasmarcasMARLBOy EMPRESlOy, por otro, losonentreellasIMATIyCOLOCA. LamarcasJACK-DAy ABSORsonpercibidascomomuydiferentesy opuestas, estandomuyaleJa-da la unadela otra.Del posIcIOnamiento dela figura3.8se desprendecmo son percibidas lasmar-casporlosconsumidores, mostrandoquesloprimeroquevienealamentedelconsumidor en relacina talesmarcas.Loscomentanos realizadosse completan analizando elmapa Simtrico conjuntode filasy columnas. Para ello utilizamos la mterpretacin angular.Los resultadosdeesteanliSISsemuestranenelfigura3.9, dondeslosehanrecogidolosatributosque tlenenaltascontribucionesabsolutasy que estnbien representados. ASimismo,semuestra, comoilustracin, losngulosquefonuanlasmarcasIMATIyCOLO-CA con el atributo marca cara. De la parte derecha de la figura3.9 se desprende quelasmarcasIMATIyCOLOCAseencuentranasociadasa losatributosmarcacara,se anuncia en teleVisin, buen diseo y marca de calidad. Esto mdica que estas mar-casson percibidascomo diferentesdebidoa su calidad y a un precioalto. A veces,10 PrXimas aellas estnECUAyNECESI, peroS]l defiCientecalidadderepresentacindesacon-seJa extraer conclusiones.131Tcnicasdeanlisisdedatoseninvestigacindemercados0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 -0,1 -0,2 -0,3 -0,4 -0,5:I I I I , I I I I I , I .l} I I I , I 1 , I I I: +: : : : : : : : : : :_____ -' .J J. L L .J ..I J. L L .J .I. _I , , I I I I , I I I II I I I , I I , I I I II I I I , I I , , I I I, I , , , , I , I I I I I , , , , 1 I , , I +- I: : : : : : : : : : : + :-----..... - ... .... -----_t------.. _I , , , r I I , I I I I, , I I I I I , , I I II , ,lit I , 1 I I II I , I I I I 1 , I I I-----..,------..,------T------r------,...------,------,------T------,------,...-----,------"T------, r ' , ------...eoc.1ll I- ... -l _1 1 1 J-\. f-\. 1 1 1 1 i 1 1 11 1 1 1 1 , 1 1 1 1 1, 1 1 +' , 1 , 1 1 1 , 1 1 1 1 1 1 1 1 1 1 1 1 11 , 1 1 1 1 I 1 , 1 1 11 : 1 1 1 1 " 1 1 10,30,20,10,00,40,60,5-0,1-0,5-0,6-0,2-0,3-0,4Dimensin1; Autovalor: 0,09016 (58,09% de ia inercia)Figura3.9. Mapaslmtncoparalosatributosy lasmarcas,132EdicIOnes PirmideEdiciones PirmideAnlisIsdecorrespondencIassimple y mltipleen sItuacIOnesdondela mformacin esescasa, se utiliza este ltImo como referentedela calidad delproducto. Tambin aparecenasociadoslosatributosundiseo quegusta a losconsumidoresy una comumcacin masiva a travs dela publicidad.Aparentemente, lamarcaNOVOCLAtambinseencuentraasociadaconestosatributos, peronohayqueprecipItarse, yaqueestamarcaseencuentramal repre-sentadaenel pnmer factor. Adems, NOVOCLAsesIta muycercadel ongendecoordenadas, lo quemdica que es la marca quemsseparece al perfil medio oba-rcentro.EnlaparteIzqUIerdadelafigurasededucequeEMPRESestasociadaconmarcanoconocida ybarata, loquellevaa pensar quesigueuna estrategia deaho-rroen costes. MARLBO se relacIOna con mutacin, ofrece regalosy,en menor me-dida, conbarata y marca no conocida. Su pnncipal diferencIa con la antenor radicaen queesunamarca seguidora que realiza promocIOnescomo unadesusprmcipa-lesarmasenel marketmg-llllx. AunqueMARLBOformaunnguloagudoconelatributoantIcuado, hayqueser prudenteal establecer unacorrespondenciacontalatributopuesto quenoestbIen representado en elprimer factor.Enrelacinconel segundofactor, lamarcaJACKDAsecorrespondeconlosatributosproducto masivoy acabado perfecto, mIentras que se opone (forma unn-gulo de180) a exclusiva y no se encuentra muyaSOCIada con fcilde encontrar. DeloantenorsedesprendequeJACKDAemplea unaproduccinmasIvayestandan-zada,pero con un buen acabado. Esta marca presenta una contradiccin puesto que,por unlado, se percibe comoopuesta a exclusIva, mIentrasque, por otro, no esf-cilde encontrar.ABSOR se asocIa con artesanal y se opone a fcil de encontrar. En pnncipio es-tas relacIOnesparecen coherentes, ya quese trata de unamarca cuya produccin noes masIvaquepermIteadoptarunaestrategIadedistribucinselectIvaoexclusIva.NoparecequeestaltImaopcinsealaelegidaporlosdirectIvosdeABSOR, yaque prcticamente forma un ngulode 90 con el atributo exclusiva. Esto ltImo re-qUIeredeunamvestIgacinmsprofundaparadetectar posiblesdefiCIenciasensureddedistribucin.Las conclusiones anterioresse corroboranSI se utiliza la estandarizacin canm-ca (figura 3.10).Finalmente, se analiza la estabilidad externa de los datos utilizando la estImacinsufiCIente (bootstrapping). Para ello se ha replicado la matnz de datos onginales100vecesylosresultadossehanintroducidoenel anliSISdecorrespondencIascomopuntossuplementanos. La figura 3.11contIene la representacin de las simulacIOnespara lascolumnas. Las marcas ECUA, IMATI YEMPRESson las quemenor VarIa-cin presentandadoquelaformaconvexadibUjadaeslaquemenortamaotIene.Por el contrarIO, COLOCA, MARLBO y ABSORson lasque mayor variacin pre-sentan. UnpuntomtermedioloconstItuyeJACKDA, NECESI y NOVOCLA. Noobstante, mngunamarcamodificasensiblementesuposIcinenlassImulaCIOnesefectuadas, y aunque hay algunas marcas con un rango de varIacin mayor que otras,en general la estabilidad externa delas marcaspuede considerarse aceptable.133Tcnicasdeanlisisdedatoseninvestigacindemercados1,4 1,2 1,0 0,8 0,6 0,2 0,0 -0,2 -0,4 -0,6 -0,8 -i,O: Luj i:i l, ,I ' I , I______ I I 1 I I ' I 1 II,:, '" I I ' I , I: : : :bue eic i : : ii : : i j i +: i ;---------I " 'f , 'pro+, ' I I I______J______ _____l _1 _: Re +da: : i i : ,. +: + :: '+ +ano aem, I I I I :: : +: :+ : : : I I :, I I , I I I I II , I , I I ' I I----------r---- ------i-aa--i------ i----I\9-------;---- ---- ------------I I I \ I I I , I: : : : : : : : :I I , 1 , I I I I::: 1 : : : :I , I ;x I , , I 1 I J I------,-------,------.,-- - ---r- -- --r -- ----,-------,-------,-------.L------T, ..1 __ ----t 1 t ! I I I IlIt1 1 I 1 1 1 1 1 1 1 11 1 t t 1 t 1 1 , I 1: :: :.::: : : lit 1 I Ilit I 1: :: ::: I : : 1

1,5!l.S.!'l 1,0

>?oo

0,5'.5., ... > >"'si >.... ../ ;ji :Xi i.... ... >. . ......../ >1 0,7673 0,5888 49,0638 49,0638 694,50882 0,4428 0,1961 16,3375 65,4013 231,26123 0,3433 0,1178 9,8186 75,2199 138,98494 0,2978 0,0887 7,3897 82,6096 104,60265 0,2747 0,0755 6,2894 88,8990 89,02756 0,2080 0,0433 3,6042 92,5032 51,01827 0,1853 0,0343 2,8615 95,3647 40,50518 0,1387 0,0192 1,6025 96,9671 22,68339 0,1237 0,0153 1,2749 98,2420 18,046410 0,0939 0,0088 0,7354 98,9774 10,410011 0,0834 0,0070 0,5797 99,5571 8,205312 0,0729 0,0053 0,4429 100,0000 6,2694El pnmer factorexplicael 49%delainerCIayel segundoel 16%. Entreellosdostotalizancasiel 65%dela mercia.Latabla3.30muestralascoordenadasdelasmodalidadesenlosdospnmerosfactores, ascomolamasaofrecuencIamargmal, lacalidaddelarepresentaciny140EdiCIOnesPirmideEdicionesPirmideAnlisIsdecorrespondenciassimple y mltipleTABLA 3.30Coordenadas, masas, calidad derepresentacineinerczaCasado -D,5125 0,1430 0,0706 0,6793 0,0245Soltero 1,2299 -0,3432 0,0294 0,6793 0,0588IngresosbaJos 1,0803 -0,3419 0,0412 0,8988 0,0490Ingresosmedios -D,7404 -D,2490 0,0235 0,1878 0,0637Ingresosaltos -D,7668 0,5649 0,0353 0,4948 0,0539>40 -D,8650 -0,8021 0,0294 0,5798 0,058830-40 -0,1290 0,9370 0,0324 0,4278 0,056440 0,0374 0,3118 0,0965 0,268130-40 0,0009 0,0080 0,1449 0,4199- --- ----e--1--------- ---:---------- - ---- ---- ---1------- ------ --+-- ---------I " " II I I 1 I II I 1 I I ,I I I I I ,1 I I I I Indice de capacidad de compraFigura4.1. Ejemplo derepresentacin deciudades.como los de linealidad o nonnalidad.La representatlvidad condicIOna elpropio an-lisisy losresultadosobtenidos estn supeditadosa ella. LasconclUSIOnessobre unatipologa deconsumidoresa la quese ha llegadocon unamuestra poco representa-tivatendrnescasofundamento, ydesdeluegonotendrnmngnvalorparagene-ralizar. Por otro lado, nuestrasconclUSIOnessernmuycriticablesSI sebasan enunanliSISquehayaconsideradomuchasvariablesqueestnmidiendosolamenteunadimensinconcretadeloscasos yningunaopocas vanablesquemidanotrasdi- de inters.Estas deficIenciasse superantrabllJandocon una muestra representativa y consI-derandoparael anlisIs unconjuntodevanablesenel quesetengaunamedidaequilibradarespectodelasdimensIOnesrelevantes.Hayotrastcnicasquetambinconducena la fonnacindegrupos. El anlisisdiscnminante a travsde casosconocidos llega a establecer una regla deaSIgnacindeloselementosa losgrupos, distingUIendoentre lapertenencIaaungrupocomovarIable a explicar y las otras caracterstIcas o varIables como explicatIvas; mIentrasque elcluster llega a gruposhomogneosperonoestablecIendouna nonna deasig-nacin, y tampocohacedistincinentrevanablesexplicativasy a explicar.Por lo que respecta a la distincIn con el anlisIsfactorial, elcluster agrupa va-nables(obIen casos)consIgUIendogruposdevanablesasocIadaspOSItivamente, entantoqueel factonal SintetIza vanablesenunfactor, queest relaCIOnadoconellasposItIvaonegativamente. Las variablesrelacIOnadasposItivamenteylasrelaCIOna-dasnegativamente conunfactornoapareceran enun mIsmogruposi aplicamos elanliSIScluster.154 EdicionesPirmideAnlisiscluster3. PROCESODEANLISISCLUSTERComocualqUIertcmcadeanlisIs dedatos, el anlisIs cluster conStItuyeunafasedentrode un proceso de mvestIgacin en el que ya se habran fijadolos obJetI-vos, lashiptesIs olosprocedimIentosdeobtencindedatos queseconsideraranpertinentes. Inclusopara la obtencin de la informacin ya se deben contemplar losrequenmientos delos anlisis dedatos quesepiensanadecuados segnnuestrosobjetIvosde investIgacin. Cuando estosobjetIvossupongan la divisinola clasifi-cacindeelementos, yaseaconmtenclOnesexploratoriasyaseaconmtenclOnesdescriptIvas, omclusopara apoyarlaexistenCIa deunadeterminada estructura, en-toncespodemosrecurnr alanlisIscluster.En tal caso cabe distIngUir vanasetapas.3.1. Fase de preparacinDada una base dedatos, enpnmer lugar hayqueseleCCIOnar ypreparar lasva-nablesy loscasoscon losquevamosa trabajar.Lasconclusionesquesealcancensiempre estnsupeditadasa lasvariablesconlasqueseha trabajado. Por tanto, la seleccin de lasvariablesdebe hacerse de ma-neraquestassirvan para describIrla relacinentre loscasosu objetosy queseanpertmentesparalaspretensIOnesdelamvestIgacin. EncasocontrarIOpuedendis-torsionar losresultados. As, esconvemente para la eleccin recurnra:Losplanteamientostencosquesobreel fenmenoencuestInsetengan.El conocImIentoempncodeestudiosrealizados.El conocImIentobasadoensuposiciones sufiCIentementefundadas oenm-vestIgaclOnesexploratoriasprevias.En este anliSIS,como en el factonal, el analista puede repetIr el proceso con va-nables oespecificaCIOnesdiferentes yvalorarlasdiferentesconclUSIOnesalcanza-das. En el caso del cluster la posibilidad deinfluenCIa delanalista en losresultadosesconsiderable, entantoquevendrncondicionadospor susdecisiones.EsfrecuentequelasvarIablesvenganendiferentesunidadesodiferentesesca-las de medida, por lo que conviene normalizarlaspara evitar talesmcidencias. OtrascircunstancIaspocodeseablesquesepresentansonquelasvariablesestncorrela-CIOnadasomclusoquesunmeroseaexcesivo, loquetendracomoconsecuencIadificultar elanliSISy/ounefecto redundante para detenninadasdimenSIOnesoatrI-butossimilares. ParacorregIrloscaberecurnr aalgunatcmcaquesmtetIcelam-fonnaciny nosproporcIOne vanables incorrelaclOnadas como el anliSISfactonal oen componentesprinCIpales.Porotrolado, tambindebenespecificarseloscasosoelementosaconsiderar,bIen todosobien slouna parte. Losvaloresextraos o extremosreqUIerenuntra-tamIentoespecial. EstosvaloresconstItuyenunaverdadera excepcinpero, smem-EdiCIOnes Pirmide 155Tcnicasdeanlisisdedatoseninvestigacindemercadosbargo, distorsIOnanla estructura, la representacingrfica y hasta la mterpretacin,por loqueseraaconsejablesu exclusin del anlisis.3.2. Determinacin delas especificacionesComoyasehacomentado, sepretendeformar gruposdeelementoshomog-neos;por tanto, y en prImer lugar, se reqUIere una forma demedir el 'parecido entredos elementosy, en segundo lugar, hay que defilllr un procedimiento para constltUlrlosgruposentre losquemsadelante se comentan.Para medir la semejanza o parecidoentre dosobjetosse utilizan medidasdeSI-militudodistanCIa; dosobjetos sonmsparecidoscuantomssImilaresson, ocuantomspequeaesladistanCiaentreellos. Estasmedidasseagrupanentresclasesque exammamosa contmuacin.a) MedidasdecorrelacinSe trata de una medida emnentemente cuantltatlva, aunque tambin puedan cal-cularsecoeficIentesdecorrelacin paravariablesnomtrIcasquevengan enescalanommalu ordinal;esel caso deloscoeficientes de correlacin de rangosde Spear-man o deKenda1l2Para unasvanablesdadas, dosobjetosson muy simlaresSI tIe-nencorrelacIOnesaltas ynosernparecidossi tienencorrelacIOnesbajas. Aunquehay que advertlr que la correlacin nosinforma sobre la forma en la que varan dosvariables ms que sobre la magllltud delas mismas. Por ejemplo, en la tabla adjun-talasvariables1 y 2 tlenenuna correlacin muy alta y lomIsmo ocurre con la 3 yla 4;sin embargo, nada tlenen que ver en cuanto a las magllltudes desus valores,yen tal casose pareceran msla varIable1 a la 3 y la varIable 2 a la4.TABLA 4.1DiferenclGentrecorrelacinymagnitud12345100110200160150101220171511012090150140111091514156b) MedidasdedistanciasSonlasmsutilizadas. La distanCIa entredosObjetos Ay BdeunmIsmocon-Junto esuna medida quesatlsface lassIgUIentescondiciones:2 Para msdetalle deestosyotroscoeficIentesdecorrelacin, vase Luque(1997).EdiCIones Pirmide EdicIOnes PirntideAnlisisclusterLa distancIa de Aa B, d(A, B), esunvalorPOSItiVO. Si escero entonces AyBsonIguales.LadistancIade Aa B esigual quelade Ba A.Si C esunobjeto que perteneceal mIsmoconjunto que Ay B, entonces:d(A, B):'> d(A, C) + d( C, B)LadistancIaentredos elementosdeunconjuntoseobtieneporlaproxImidadquetaleselementostienenencada unadelasvanablesconsideradas. EnreferencIaa estasvarIableshayqueadvertir quela relacineXIstente entre ellascondicIOna elresultadofinal. As, SI una parte importante delasvanablesestn correlacIOnadasomiden diferentesaspectos de una misma caracterstIca, ser esta caracterstica la quemayor mfluenclatenga enlosgruposobtenidos.Por ejemplo, SI setratadeidentifi-car tiposdeautomvilesutilizandoseIsvarIablesdelasquecuatrose refierena ca-pacidad, unaaestiloyotra atecnologa, nocabedudadequelosgruposresultan-tessern consecuencia, sobre todo, de la mcidencla que tengan lascaractersticas decapacidad. UnaformadecorregIr esteefectoconsisteenponderarlasvanablesdemaneradiferente, peroentoncessurgeelproblemadecmoestablecer los cntenospara laponderacin. Comosehadicho, unaalternativaesel anlisIsfactonal, quenosproporcIOna lasdimensionesfundamentalesyademslasestablececomomco-rrelaclOnadas.Ante la seleccin de una medida dela distanCIa debencontemplarsesuspropIe-dadesy la formadeagrupara loselementos. Por otro lado, seha detener presentequecuandoseagrupautilizandomedidasdedistanCiaseestconsIderandolasi-militud delasmagnitudesdelasvariables, aunquesuvariabilidad notengamuchoquever, mIentrasqueSI serecurreamedidasdecorrelacinloque predomznasonlos patronesdevarzacinynotantolasmagnztudesdelasvariables.AlgunasmedidasdedistanciasonlassIgUIentes:Distanciaeucldea. EsladistanCIageomtrica enunespacIOdeunasdimensIO-nesdeterminadas. LadistanciaeucldeaesespeCIalmenteadecuadaparaejesorto-gonales. Condos dimenSIOnes eslahIpotenusadel tringulorectngulo, mientrasque parai dimensiones la distancia entre dos elementos X eY esla razcuadrada delasuma delasdiferencIasalcuadradopara cada dimensin:d(X, Y) =~ ~ ( X - r:?Ademsde esta distanCIa eucldea denommada simple, se utiliza la distancia eu-cldeaal cuadradoqueesIgual. perosmhacerlarazcuadrada; oladistanciaeu-cldeamediaqueseobtIenedividiendopor el nmerodesumandosovanablesso-bre lasquese calculan lasdiferencias.Veamosunejemplo: SI conocemoslosndicesdenquezaydecapacidaddecompra deCIncocmdadesladistanCIaeucldea entre laciudad1 y la 2es:157TcnicasdeanlisisdedatoseninvestigacindemercadosTABLA 4.2EjemplodecaracterstIcasdecincociudades123454,006,008,005,007,001,201,400,900,801,50158d(l,2) =~ ( 6 - 4)2+ (1,4 _1,2)2=2,01La distanCIaeucldeaal cuadradoesd2(1, 2) =(6 - 4)2 + (1,4) - (1,2? = 4,04; Yla distanda media:d(l 2) = d(l, 2) =1005, 2 'La distanCIaeucldeapara cada pareja decasossera:TABLA 4.3Distanclaentreciudades0,00 2,01 4,01 1,08 3,012,01 0,00 2,06 1,17 1,004,01 2,06 0,00 3,00 1,171,08 1,17 3,00 0,00 2,123,01 1,00 1,17 2,12 0,00Ahorabien, si el ndicedecapacidaddecompravlmesedadoenporcentajes,por ejemplo: 120para ladudad1, 140paralacIUdad2yas respectIvamente, lasdistanCIasentreCIUdadescambIaransensiblemente.Enamboscasosla distanCIamenor sedaenla pareja(2, 5), peromIentrasqueen elprimer casoa contmuacin estaban lasparejas(1, 4); (2,4)Y(3, 5); en la se-gundastuadnsonlasparejas(3, 4) Y(1, 2). Lgicamenteestoafectara la for-macindelosgrupos, aunquesenoesunproblema especficodela distanciaeu-cldea, smo quese presentan en otras. En estas cIrcunstanCIaSconviene estandarizarlosdatos.Ediciones PirmideEdiclOnes PirmideAnlisIsclusterTABLA 4.4DistanczaentrecIudadesEnnotaciI!matnclallaexpresindeladistanciasera:d2(X, Y) =(X, - Y;)' (X, - Y;) =d' dDistanczade Minkowski. Seexpresacomod(X, Y) =[ ~ ( X , - Y;)nrpara nmayoroiguala1.Para n = 2, esla distancIa eucldea.Para n = 1, setratadeunadistancIadenommadadecity-blockodeManhattan,querepresentaladistancIaarecorrerentredos puntosconuntrazadourbansticoperpendicular. Consisteensumarlas diferencias absolutas entrelas variables; enmuchasocasIOnesproporcIOnaresultados similares aladistanciaeucldea. Suex-presines:d(X, Y)= LIX, -1;1La tabla 4.5recoge losvaloresdelasdiferentesmedidasdedistanCIa ypara lasdiferentesescalasenlasquesemidelavarIablecapacidaddecompra.DistanciadeChebychev. Suexpresines:d(X, Y) =maxlX, - 1;1DistanCiadeMahalanobis. EstadistanCIatJeneunamtncadistmtaaladelaeucldea. Es recomendable parasituacionesen lasque se produce multlcolinealidad.Comcideconla eucldea paravariablesestandarJzadascuando lascorrelacionessonnulas. Seobtienea partirdelaexpresind(X, Y) =(X, - Y;)' W-' (X, - Y;)W: Matnzdecovarianzas.159TcnicasdeanlisisdedatosenInvestigacindemercadosTABLA4.5Diferenciaentretiposdedistanciautilizandodiferentesescalasl. '. . Distancia" Distancia' Distanciaeucldea2 eucldea ManhattnDistancia*

eucldea . Manhattan16012 404 20,1 22 4 2,01 2,21-3 916 30,2 34 16,1 4,01 4,31-4 1.601 40 41 1,2 1,08 1,41-5 909 30,1 33 9,1 3,01 3,32-3 2.504 50 52 4,25 2,06 2,52-4 3.601 60 61 1,36 1,17 1,62-5 101 10 11 1,01 1 J,3-4 109 10,4 13 9 3 3,13-5 3.601 60 611,4 1,17 1,64-5 4.904 70 72 4,49 2,12 2,7* DistanCIascuando el ndicede capacidaddecompraest expresado en porcentajes.c) MedidasdeasociacinTienenuncarctercualitativo, seobtIenenapartirdelaexistenciadecomcl-denclas, deacuerdosodesacuerdos. Lamedidadel parecidoentreobjetosatravsdesuscaractersticascualitatIvastambinsesueledenommarmedidasdesImilitudque,al contrano de la distanCia,a mayor sImilitud mayor parecido. La medida de lasImilitud debesatIsfacer lassIgUIentescondicIOnes:- La sImilitud entre AyBes Igual quela eXIstente entre By A: SAB =SBA'- LasimilituddeAconsigomIsmoodeBconsIgoID1smoesIgual ymayorquela sImilitud existente entre Ay B: SAA =SBB > SAB' para A *- B.- Al igual queen la distancia, a vecesseaade una tercera condicin conocI-da como la deSIgualdad deltringulo: SI SAB ySBC son grandes, entoncesSACtambin loes.Lautilizacindeestasmedidasenel anlisIscluster estcondicIOnadaporlosprogramasmformticos; enrealidadlosprogramasconvencIOnalesdemayordifu-sin ofrecenunasposibilidadeslimitadaspara lasmedidasdeasocIacIn.LasmedidasdesImilitudse obtienenbIen mterrogandodirectamente a personassobre supercepcin, bIenmidiendolascaracterstIcas o la posesin deatributos.Eneste sentido,un caso partIcular es la utilizacin devanablesbmanas(con valoresO,noposesIndeunatributo, y1, posesindeunatributo) apartIrdelascualesseconstruyen ndicessabIendo quelasposibilidadesquesepueden presentar son:- p = NmerodecomcidenclaspositIvas(1, 1).- n = NmerodecoincidencIasnegativas (O, O).- d = NmerodediferenCias(1, O).EdiCIOnes PirmideAnlisIscluster- e =Nmerodediferencias (O, 1).- t=p+n+d+e.La combmacin deestassituacIOnes da lugar o unaamplia gama de ndices, se-gnsepnmelascomcidenclaspositivasy/onegatIvasolasdiferencias deunouotrotIpo. Algunosdeestos ndicesson:- ndicedeSokal y Michener = (p + n)/t. t-(d+e) p+nIndice de Rogers y Tammoto = = ,t+(d+e) (p+n)+2(d+e)ndice de Sokal y Sneath = pp+2(d+e)En algunosprogramasse proporcIOnanmedidasdeestetIpo, comoelporcenta-je dedesacuerdoonmerodediferencIasentre lascaracterstIcas dedosobjetos.Dadas las medidas para conocer la proxImidad o el parecido de los elementos deunapoblacin, losIguienteesdetenmnarcmoprocedera laagrupacin, es decir,decidircundodos elementosvanaformarpartedeunmIsmogrupoodegruposdiferentes. Tambinahoraexisteunabamcoampliodeposibilidades, losprocedi-mientosdeagrupacinseclasificanendosgrandes tIpOS: procedimientos jerrqUI-cosy procedimIentosno JerrqUICOS.a) ProcedimIentos JerrquicosComosupropIOnombremdica, suponen desarrollaruna jerarqua,la formacindegruposconstituyeunprocesosecuencIal queserepresentagrficamente. Dadauna poblacin, se trata de establecer una jerarqua de partes, delirmtandoun nmerodesubconjuntosdeformaqueentreellosnotenganelementoscomunes(seandis-juntos)y quecadasubconjuntoestmcluido enotroGerarqua). Elnmerodegru-posidentificadosdependedelasecuenCIaenlaquenos detengamos aconsiderar.DentrodelosprocedimIentos JerrqUIcosse distmgueentre:- Ascendentes (jozning), que comienzan contantosgruposcomo mdividuos, sevanformandogruposentrelosmdividuosmsparecidossegnundetermi-nadocnterioy termmacon unsolo grupoqueintegra a todosloselementosde la poblacin. En este caso se disponede la secuencIa deagrupacin: ade-ms, una vez formadoun grupo permanecer, nose divide aunque algn ele-mento tenga ms parecido con algn grupo nuevo.Estos procedimientos sue-len considerar muchasvariablespara la formacindelosgrupos, y deah ladenormnacinde polittIcos.- Descendentes(divislve), queconsisten justamenteenlocontrario, partIr delconjuntopoblaclOnal eIr dividiendoensubconjuntoshastallegaral ele-mento.EdiCIOnesPirmide 161TcnicasdeanlisisdedatoseninvestigacindemercadosEn los mtodos JerrqUicos se recurre a representaciones grficas para facilitar lamterpretacin de la formacin de los grupos;sobre todo se utilizan dos tiposde gr-ficosdenommadosdendrogramaygrficodetmpanos(iclele), cuya mterpretacines muyslllular.Dentro de los Jerrquicosascendentes eXIsten diversasmaneras o reglas para de-termlllarcmoseformanlosgrupos. Unodelosprimerosalgontmosfueel deJohnson, queprocedealaagrupacinsecuencIal considerandolasImilitudparalacual utiliza la distanCIa eucldea. En DYANE (Santesmases, 1997) se encuentra unaaplicacin.Entre los procedinuentos msutilizados destacan los denonunados de unin,losbasadosen el centroide y los quelohacen en la vananza.1. Vnculomco o vecino ms prximo (singlelinkage o nearest neighbor). EnesteprocedimIentoladistanciaentredosgruposdetermmadosesladistanCIaentrelosdosobjetosmscercanos, pertenecIentescada uno a ungrupodistmto. Losdospnmerosobjetosa agruparson losquetienenla distanCIa mspequea entreellos.A continuacinseidentifica la distanCIamnima sigUiente y habr unterCer indivI-duoqueseIllcorporeal grupoobIenseformarunnuevogrupocondosnuevoscomponentes;asse contma hasta que todoslosobjetos estn comprendidosenunsolo grupo. Los grupos deben estar ntidamente definidos para que proporcione bue-nosresultados.Ejemplo: DadalaSIgUientematrIzdedistanCIas, paraformar grupos poresteprocedimientoenpnmerlugarseagruparanloselementosmsprximos, queeneste casosonel 2 yel 5.TABLA 4.6MatrizdedistanciasUna vez agrupados estos dos elementos, se calcula la distanCIa mnima a los de-mselementos. As, la distanCIammma entre el nuevo grupoy el elemento3 esladistancia mmma eXIstente entre el 3 y el 2 o entre el 3 y el5. TalesdistanCIasson5y8, respectIvamente, ypor tantoladistanCIammmaes 5. EnconsecuencIalanuevamatnz dedistanCIases comosIgue.162Edictones PirmideAnlisisclusterTABLA 4.7Matrizdedistancias1(2, 5)344 75623Ahora la distancia menor es la que hay entre el grupo (2, 5) Yel elemento 4; es-toselementossern losquese agrupenyse calcula la distancia mmma entre 2,5y4Yloscasosrestantes. Porejemplo, conrespectoal elemento1 ladistanciaser:d(z,s,4)1 = min(dz, l'ds, j d4, 1) = 4De la mIsma formase operaraSI la distancia fueseentre dosgrupos; seescogela mmma entre las distancias por pares de elementos, La matriz de distancias queda:TABLA 4.8MatriZdedistancias1(2, 5, 4)34 73EdicIOnes PirmideAs sucesivamente hastaquetodosloselementossemtegranenunsologrupo.2, Vnculocompleto(complete linkageo furthest neighbour), Es sImilaralanteriorsalvoqueahoracomodistancIaentredosgrupossetomalamayorexis-tente(vecmomsalejado)entredosobjetoscualquiera, cada unodeungrupodi-ferente,Si aplicamosesteprocedimIentoal ejemploantenor, lospnmeroselementosaagrupar volveranaser el 2 y el5 quesonlosmsprxImos; peroahorasecalcu-la la distancIamxIma, esto es:- DistancIa entre(2, 5)conel 1:mxImo(dz l' ds1)quees 10.- DistancIa entre(2, 5) con el 3: mxImo(dz, 3; ds, 3) que es8.- Distancia entre(2, 5)conel 4: mximo(d24'ds Jque es 7,163TcnicasdeanlisIsdedatoseninvestigacindemercadosLa nueva matnzdedatoses:TABLA 4.9Matrizdedistanczas1(2, 5)3410 78673164EnestecasoloselementosmsprxImossonel3 yel4, quesonlosquehayqueagrupar. Se sigue calculando la distancIa mxIma como en el caso antenor. As,la distancIaentre(2, 5) Y(3, 4)es lamxIma entre: d2, 3' d2 4; ds, J YdS,4' Se conti-naelprocesohasta queseagrupaenunsologrupo.3. Vnculomedio (averagelinkage). En este caso no solamente IntervIenen dosIndividuos o elementos;para calcular la distanCIa entre grupos se recurrea la mediaperoesto adopta muchasvarIantes. As, puedeser la distancia media entreparesdeobjetosdelosdos grupossinponderar(unwelghted pazr-groupaverage), oponde-randopor el tamaodelosgruposonmerodeelementosdecada uno, sobretodoenel casodegruposdetamaomuydiferente(wetghted pair-groupaverage). ConesteprocediIlllentoseconsiderams informacin, nosolamenteladenvadadelassituacionesextremasdedistanCIamnimaomxima. LosgruposobtemdostIenenunavarianza SImilar yademspequea.4. Mtododel centroide. El centroide de un grupo es el punto medio en unes-pacIOmultidimensIOnal determinadoporlasdimensIOnes ovarIablesqueseconsi-deranennuestroanliSIS. Amedidaqueseproducen Incorporacionesaungrupoyel nmero de elementos que lo integran vara, el centroide tambin se modifica. Losmtodosquesebasan enel centroidetomanla distancIaentregruposcomola dis-tanciaentresus centroidesocentrosdegravedad. Precisamenteal considerarunpunto medio, los valores extraos o raros no Influyen tanto en este mtodo.TambintIenevariantessegn se pondere, esdecir, segn se considere eltamaodelosgru-posono. Seutilizael ponderadocuandolosgruposseestImanquesonsensible-mentediferentes.5. Mtodode Ward. FormapartedelosdenomInados mtodos delavarIanzaporque utiliza unanliSISdela vananza para evaluar las distancIasentre grupos. EnestecasoseIntentamInImizarlasuma deloscuadradosdelosgruposquesepue-den formar en cada paso, losgrupossevan formandode manera quese produzca elmenoraumentoenlassumasdeloscuadrados. EsunprocedimientoquetIendeaproducIr grupospequeosy equilibradosen cuantoal nmerodeelementosquelosmtegran.EdicIOnes PirmideEdicIOnes PirmideAnlisIscluster6. AlgoritmodeHoward-Harris. Adiferenciadelosantenoressteesunpro-cedilll1ento de tipo descendente, en tanto que fonna grupos a partir de otrosy de for-ma secuencIal utilizando el criteno de mmilll1zar la varianza intragrupos en cada sub-divIsin3Esadecuado para grandesmuestras. La fonnadeoperar es como SIgue:l. SelecconalavariablequetIenemayorvarIanza, distmguiendodos grupossegn estnporenCIma o por debajodela media.2. Compruebaquecadaelementoformapartedel grupoqueleesms afn.Para ello calcula la distanCIa eucldea delelemento a losvaloresmediosdelgrupo para aSIgnarloal msprXImo, aunque nosea al que provIsonalmen-teseasign; entalcasosetratadeuna reasIgnacin. As se consolidanlosdosprimerosgrupos.3. Calculadalasumadecuadradosparacadagrupoolasumadelasdiferen-CIas entre losvaloresdelasvanables y losvaloresmediosdelgrupo, sese-lecconael quetengadichasumamayoryseeligelavanableconmayorvarianzadividiendo, comoantessecoment, endos grupossegnlosele-mentostenganvaloressupenoreso mfenoresa la mediadetal vanable.4. Ahora con tresgrupos se procede Igual que en el punto 2 para comprobar y,siesnecesano, reasIgnar hastaquenoseproduzca reasignaconeso se lle-guea unnmerodeiteraconesestablecido.5. Para obtener ungrupomsseprocede deIgual fonna(punto 3).6. El proceso finalizacuando:- Seconsigueuunmerodegruposdeterminado.- Eltamaode losgruposnollega a unmmmo establecido.- Noseconsigue !lna reduccinSIgnificatIva dela suma decuadrados, ensuma, delavariabilidaddelosgrupos.En el programa DYANE, para llevar a cabo unanliSIS cluster aplicando este al-goritmo, se reqUIerenal menosdosvanablesnumricaso de mtervalos.Una vez se-leccionadoel archIvoyel modulodeanlisIsdegrupos(anliSIs cluster) descen-dentes -algontmode Howard-Hams- se presentan las opcionesde:Estandanzar lasvanables, loqueesnecesanoSInoestn en la misma esca-la. PuestoqueenotrocasoSIemprepesaranmslas vanablesconmayorrangode varIacin, esdecIr, conmayor variacinabsoluta. Sila escala fue-rala mismanoocurrira as.Fijarel nmerodegruposaretener; obviamentehadeserdososupenor.Estoseestablececomounadcimapartedel tamaodelamuestra, fijandounlmite de10 grupos.Guardarla pertenencIaal grupoenunanuevavanable. Esta opcinpermiteguardar la identificacinal grupodepertenencIa comounavanablecateg-eSegUImos a Santesmases(997).165Tcnicasdeanlisisdedatoseninvestigacindemercadosrica(clusters) parapoderutilizarenpostenoresanlisIs comotabulaconescruzadas oanlisIsdiscnmmante.b) Procedimientos no JerrquicosA partir deunnmerodemdividuos, n, hayquefonnarKgrupos, siendo Kunnmeroqueel analista detennina, para locualse guiar por conocnll1entosy expe-nenCIaSprevias o por los resultadosde los procedimientos JerrqUicosqueayudanaidentificar unnmerodegrupos justificado. Fijar unnmeromuy reducdodegru-pospuedellevaraconclusonesdemasiadopobres, mientrasque SI setratadeunnmeroelevadocomplicalamterpretacin. Es necesanodeterminar unnmeroequilibradoentreesosextremos, para locual repetirel anliSISporprocedimientosdistintosoconnmerodegruposdiferentespuedeser degranayuda. En este casoel nmerodegrupos seestablecea priori, mientrasqueenlosjerrquicosascen-dentesse decda a posteriori.Para llegar a la fonnacnde losgrupos se sigue un proceso Iterativo de aSigna-cin. Unavez establecido el nmerodegruposse seleccona el ongen decada gru-poy despusseefectanlasasignaconesdeloselementosa losdiferentesgrupos.Por otro lado, en certoscasosresultara interesante dejar fuerade la clasificacinaalgunoselementos extraos o raros, o bien definir una clasificacin en la quealgnelementopuedapertenecerams deungrupoparaevitarlanormadrsticadelapertenencia a unosolo quea vecesmducea forzarla pertenencia.Con respectoa losanteriores, losprocedimientos no JerrqUiCOSmtentanunp-timoglobal ynosucesivossubptimosencadafasedeagrupacin, ya lavezqueagilizan el proceso deagrupacn. Pennite reaslgnar un elemento en pasosposterio-ressiprocede agruparloenungrupodiferenteallll1cIalmenteaSignado.Los no jerrquicos tambin se denominan de k-medias y se distinguen tres tipos:Umbralsecuencial (secuential threshold). Dado un centro de ungrupo todosloselementosdeunapoblacindentrodeunvaloroumbral preestablecdose agrupan en un mismogrupo; as se contma eligiendo otros centros y for-mandootrosgrupos. Ahora bien,una vezqueunelementoha sido aSignadoa ungruponose considera para otros.Umbral paralelo (paralellthreshold). Con esta opcn se fijanvanoscentrosdegruposdesdeel princpio. Losobjetosseasignanal grupo, dentrodelumbral establecido, cuyo centro est ms prximo. Las distanCias pueden serajustadasamedidaquesedesarrolleel procesooinclusodejarfueraa ele-mentosquenoestn dentrodelumbralestablecidopara nmgncentro.- Mtodos de optimizacin. SediferenCiaenquepermitelareaslgnacndelosobjetos, demaneraqueunobjetoaSignadoaungrupopuedepasaraotro, SI as se consigueuna menor distanCia media dentrodelgrupo.Existen otrosprocedirmentos como el que facilita el programa STATISTICA de-nominadotwo-way Joinzng, queconsisteenagruparcasosyvariablesslmultnea-166Ediciones PirmideEdiciones PirmideAnlisIsclustermente, peroclaroestquedebentenerunsentidoyunaexplicacinlaconsidera-cin conjunta decasosy vanables. Sin embargo, este procedimiento tienecomo in-convemente la dificultaddeinterpretacinEsrecomendableutilizarvariosprocedimientos(jerrqUicos yno jerrquicos)para que lasconclUSIOnes a las quese llegue tengan mayor garanta. Como elk-me-diastienesupnncipalproblema en ladelirmtacin delnmerodegrupos, seacon-sejautilizar algnmtodo JerrqUicoprimeropara identificarunnmerodegruposrazonabley lgicOUnavezdetenmnadastodasestasespecificaciones, esdecir, la eleccindeunadistancia y de un procedirmento deagrupacin, el programa ejecuta todoel procesoynosproporcIOnaunosresultadosen fonnadegrficos,matricesdedistancias, es-quema secuencial de la agrupacin,estadsticas descnptIvas por gruposy anliSISdela vananza, entre otras lllfonnaclOnes.3.3. Interpretacinde los gruposParaprocedera lalllterpretacindelosgrupos, enpnmer lugarhayquecono-cer algotanobvIO comoelnmero y composicin delosmismos. Siseha seguidounprocedimientonojerrquicoestoeslllmediato, puestoqueinclusosedefineelnmerode gruposa pnon. Esto lleva a una solucin pero nose puede comprobar sies la mejor entrelasposibles.Ahora bien, en caso de haber optadopor un procedimiento JerrqUico, elnme-ro (le losgruposnoes algo tanevidente. Nonnalmente, la representacingrfica decmosefonnanlosgruposponeenrelacinladistanciadeuninentredosele-mentoscon la distanCia mayor eXistente;por tantoel nmero de gruposdependedela distanCiaa la quesehagael corteparaanalizar. Si el cortesehacea distanciaspequeasel nmerodegrupossermayor queSI setomandistanciasgrandes. por-queentoncestodosloselementosestarn comprendidosen pocos grupos.Concretadoel nmerodegrupos ysucompOSicin, lalllterpretacindecadaunodeellos seefectaconsiderandolascaractersticasdeloselementos quelocomponeny analizando si poseen o representandetennllladascaractersticas en ma-yor medida queotras.recurriendoa las estadsticas descnptIvas por grupo de lasva-nablesde partida. El centroide de un grupo es unbuen referente para la descnpcin,Slll olvidarqueenrealidadlosgrupos muestrantendenCiasdentrodelapoblacinquese estudia y noes fcilquesean agrupacIOnesincuestIOnables o puras. Por otrolado, reCUrrIr a vanables diferentesde lasutilizadas para el anlisis, por ejemplo re-laCIOnadas con caractersticas soclOeconrmcas o pSlcogrficas de los llltegrantes delgrupo, ayudaala lllterpretacinyaextraerconclusiones. Todoloantenor perrmtecalificar o poner nombresa losgrupos.La lllterpretacinen losno JerrqUicosseennquece reCUrrIendoa unanlisisdela vananza para exarmnar las diferenCiasentre losgrupos. Si el anlisis hacumplidoconsuobjetivodeconseguirunabuenaclasificacindeelementos. lavariabilidad167Tcnicasdeanlisisdedatoseninvestigacindemercadosdentrode un gruposer pequea y la vanabilidad entre gruposser grande.La com-paracin delasdiferenciasalcuadrado entre gruposcon las dedentro delgruponosperrrute obtener unratIOFy unniveldesIgnificacin. Lasvanablescon unFgran-dey elniveldesIgnificacin pequeo difieren entre los distintosgrupos. Sin embar-go, debequedar claro queaqu el test Fdebe utilizarse con precauciny, desdelue-go, con unsentidodescnptivo, puesto quelosgrupossehancalculadoprecIsamenteparamaXImIzarladiferencIaentreellosynoa partIrdemngunahIptesis apnori.Ensuma,nose debe utilizar como prueba dela igualdad de la media delosgrupos.3.4. Valoracindel anlisisComprobar que la solucin obtenida mediante anlisIscluster es la mejor, cono-cer SI esrepresentatIvadela poblacin, oqueesgeneralizablea otraspoblaciones,y probar suestabilidad eneltIempo, sontareasquenoestnresueltas. NosetieneunprocedimientodisponibleparaevaluarlafiabilidadestadstIca. TodoestotIenequeverconladificultadparafonnular hIptesis, puestoqueel contenidodel uni-versonoesconoCIdo. AdemsseadmItelaeXIstenciadeheterogeneidadparcIalmIentras que lasdistribucIOnesde objetos yvanablesson desconocidasen gran par-te. Por tanto, sera osadoadlllitir que lasvanablesseajustana algnmodelo.Por su opcionalidad a la hora de elegIr distancIas y procedimiento de agrupacin,este anlisIsnosproporcIOna solUCIOnes que varan segn la eleccin que realicemos.Qusepuedehacer paragarantIzar unasolucinmnimamenteaceptable?Hayva-rias recomendacIOnesparaavalaroreforzarlabondaddelosresultados obtenidos:- RepetIrel procesocondiferentes medidas yprocedimIentosdeagrupacinparacomprobarlaestabilidadenlosgrupos identificados. Esconvemente,mcluso, compagmar procedimIentos jerrquicoscon otrosno JerrqUIcos.- Dividir la poblacin deestudio en dosmItades, aleatonamente, proceder a laagrupaciny comprobar el grado decoincidencIa en losresultados.- Una fonnadeaproxImarsea labondad dela solucin en losprocedilllientosno JerrqUIcosesla comparacin delavarIanza dentrodelgrupoconlava--fianzaentre grupos.4. ESQUEMADEL PROCEDIMIENTOEnlaprctIca, y enlosprogramasinformtIcosusuales, lamaneradeprocederesSImilar, aunquesIempre hayaalgn matIzsegn la filosofadelprograma queseutilice. La secuenCIa podemosresulllirla en lossigUIentespasos:L SeleCCIOnar el ficherodedatosymodulodeanlisIscluster.2. SeleCCIOnarel mtododeagrupacin, normalmentealgunavarIantedelosdeunino vnculo(joining) o delosno jerrquicos(K-medias).168 Ediciones PirmideAnlisIscluster3. Indicarlasespecificaciones: seleccindevariables, SI seagrnpancasosovarIables, fijar laregladeagrnpacin(vnculomco, completo, etc.) yeltipodedistancIaautilizar. Paralosmtodosno Jerrquicos: indicar el n-merodegrnposy la formade identificar los centrosmlclales delosgrnpos.4. Ordenar las salidas que se conSIderen de mters. Para los JerrqUIcossern:- RepresentacIOnesgrficas: dendrogramasy grficosdetmpanos.- MatricesdedistanCias.- Esquema dela secuencia deagrnpacin.- EstadsticasdescrIptivas.Para losno JerrqUIcos:- MatricesdedistanCIas.- Grficosdemedias.- Anlisisdela varIanza.- Estadsticasdescnptivaspor grnpoymIembrosqueloscomponen.5. AnJislsy descripcindelosgrupos.6. Interpretacin delosresultados.5. EJEMPLODEANLISISC o ~ losdatosdel ejemploutilizado en el captulo del anlisIsfactonal vamosaefectuar unanlisIscluster. Recordemosquedisponemosde una sene decaracters-ticasdelasdiferentescapitalesdeprovmcla espaolas(AnUarIO del MercadoEspa-ol, ejemploAME)*yparaobtener conjuntosdeCIUdades concaractersticasSImI-laresrecurriremos a formar grnpos. Postenormente, seidentificanparacadagrupolaCIUdadquemejorrepresentelascaracterstlcasdel nusmodemaneraqueSIrvacomo laboratoriode pruebasdeaccionesdemarketing.Utilizaremosdiferentesprocedinuentospara comprobar la comcidencla onodelaagrupacinobtenida.Utilizando la distancia eucldea, en los dos procedinuentos Jerr-qUICOSquese exponen para una distancianomuyalta (aproxImadamente15.000 parael caso del vnculo nico y 30.000 para el de Ward) ya se identifican cmco grupos; estoha sidoloquesehatenidoencuentapara .fijarencmcolosgruposparaelprocedi-mientono jerrqUICO. En losrespectivosdendrogramasse comprueba la formacindelosgrupos, esdecir, cmosevanagrupandolasdiferentesCIUdades. El esquemadeagrupacinproporcionaladistanCIay la secuenciadeagrupacin, aunquelosprogra-masproporcIOnantodoel extensolistadodelasdiferentessecuenciasdeagrupacin.Por razonesobVIas, slo se detalla en la tabla una partede las fasesiniciales deagru-pacin.MantenemoslasimClales delascapitales de proVincia parasurepresentacin.*Vase ficheroen ladireccinwww.ugr.es/-tluque.EdiCIOnes Pirmide169JALHGRMAPOCAMUCOABSEBAORTOHUSG TEAVCCBUVAPSACUCRZALUGUL ZLO SOTFLENAGC OS ABI TC VPM SSGI BMTcnicasdeanlisisdedatoseninvestigacindemercadosAnlisis jerrquicosDistancIas eucldeasr-.-.f-----'!===Jo..t:::=-, i-f--::::;--LJ"j

tih ir.,, , ,,:,,, , , ,,o 10.000 20.000 30.000 40.000 50.000DistancIa de uninFigura4.2. Diagrama enrbol (dendrograma). Vnculomco.DistancIas eucldeas1,6e5 r--------------------------_l,4e5 .1,2e5 .. . .leS . .:::: .. ... ...;:::.= .. .. ... ,..J,."bJI

60.000.gro 80.000'ji5............... Figura4.3. Diagrama derbol (icicleo detmpanos). Mtodo deWard.17O EdicIOnes PirmideTABLA4.10Esquemadeagrupacin(parcw!)AnlisisclusterEdicIOnes PirmideI)istlUlcll. 3958.8561 BU VA1.054.355 P eu1.124.155 SO LO1.423,079 LE NA1.685,390 AV ce1.867,305 TF es1.991,032 eR OU2.045,468 HU SO2.059,959 AL J2.081,675 eo AB2.426,400 TO OR2.576,864 eR OU LU2.588,337 L SO LO2.865,859 L SO LO VI2.890,805 TF es LE NA2.942.123 HU SO TE3.009,021 BU VA P eu3.054,581 MA PO3.359,847 AV ce SA3.370,807 O S3.508,177 ZA eR OU LU3.527.898 AL J OR3.636.181 A BI3.736,633 eo AB BA4.320,025 T e4.673,889 AL J OR H171TcnicasdeanlisIsdedatoseninvestigacindemercados50 45 40 35 30 25Paso20 15 lO 5O1,8e5, I I I , lit, I , I I I I I1,6e5 l-------i--- -----r--- ----i--- ----- t--------r-------f-- ------r------------ ---r-------I I I I I I I I, I I I , I I ,1,4e5 I-------i--------r-------i-------- t------ --------- -t--------r------------- --r-- -- --I I I , , I I II I , , I " I1,2eS ------ -i- --- --- -t- --- ---i--------t-------i--- -----i--------r------- -- ----- -t------I I I , I " II 1 I I I I I ,leS ------i--------t-------i--------t----------------f--------t------- --------t------I , , I I !, ,I , I I Il' I80.000 -------i-------- t-------i--- ---- -t- --- ----i----- ---t --------t----------- ----t------, I , I , I I 1I I 1 I I I I I60.000 --------{--- ----- -- ---- -+--------:------ --+- -------:- ---- -------- ---f--- - ---1 1 1 1 1 1 1 11 1 , 1 1 1 1 1) 1 1 1 1 1 1 140.000 +- ---- --1--------r------ -1---- ----t----------------t--------r------- ----- ---, -----1 1 1 1 1 1 11 lIt 1 1 120.000 t-- --+------ -i-- ------+--------:--- ---- -+--- -----:------------ -:--- -----1 1 1 1 1 1 1 11 1 1 1 1 1 1 11 1 1 1 1 1-r-------,--------T-------,--------f--------:----------------:--------1 1 1 1 1 1 1) 1 1 1 1 1 1, 1 1 1 1 1 1-20.000OFigura4.4. Representacindelasdistanciasdeunin.Anlisisno jerrquicoTABLA4.11Mediasdelosgruposi> /bb. Apartirdelasrespuestas aestaspreguntasesposibletrazarungrficoquerevelealgntipode pauta eXistente en lasmismas. Elsiguienteejemplo ilustra esteproceso.Conel findesimplificarlatareadel mdividuoentrevistado, sepreparan15tarjetas, cadaunadeellasrepresentativadeunpardeproductos(el nmerototalde pares distmtos se calcula mediante la Siguiente expresin: Nmero depares = n[n - 1]12). Hechoesto, sepideaunencuestadoqueordenelas 15tarjetasaSignandoelvalor1 alpar deproductosmssimilaresy el valor 15alpar depro-ductosmsdiferentesentres. Supongamos quelosresultadospara determmado in-dividuoson lospresentadosen la tabla 5.1:TABLA 5.1Matrizdediszmilitudes'1.o2134382O1265735101O1587111415O EdiclOnes PirmideParaestemdividuo, losproductosDyEsonlosdos msparecidosentres,mientrasque Ey Fformanelpar msdistmtodeentre los 15posibles. Intentemosrepresentarel gradodesimilitudentrelos seiSproductosenunespaclOunidimen-sional. Para ellotomamoscomoreferenCia la escala arbitraria representadaen la fi-gura5.1, quemuestralasdistanciasAB, BCy AC deformaordenada. Seobservaque(A, B)esel par mscercano mientrasqueel(A,C)est constiluido por los dosproductosmsdistantesentres. EsteposlclOnaffilentodeA, BY Cseajustaper-fectamentea laordenacindelostresparescorrespondientes, ofrecidapor el mdi-viduoobjetodeestudio.191Tcnicasdeanlisisdedatoseninvestigacindemercados-10 -9-8 _7 -6-5-4-3-2 -1 OI 2 3 4 5 6 711II III!II I I.......8 9 1011. ~ .I I192Figura5.1. Configuracincon una dimensin.Tratemosahora de inclUir un cuarto producto,D,en la escala representada en lafigura5.1. Considerandolasrespuestasdel mdividuoencuestado, laposicindeDdeberasertalque:d(A, D) < d(B, D) < d(C, D) < d(B,C) < d(A, C)Si posicionamosDen el lugarpropuestoenla figura5.1, observaremosquesecumple que:d(A, D) < d(B, D) < d(C, D)Sin embargo, noesposible lograr quesimultneamente secumpla que:d(C, D) < d(B,C) < d(A, C)Independientemente de la posicin que aSignemosa D, nunca lograremos que secumplantodoslostrmmosdela desigualdadantenor.Parece claroquesiunmdividuo, a la horade Juzgar el gradodesimilitud entrelosproductos, hahechousodeunareglasimpledesimilitud(basadaenunmcoatributo), todoslosparesposiblespuedenrepresentarsesobreunaescalaunidimen-sional arbitrariaquereproducirafielmenteladimensinempleadaparallevaracabotales JUICioS.Puesto quenoesposible representarlos JuiCIOSdesimilitud de nuestroejemplomedianteunaescalaunidimensional, podemos mtentarlomedianteunaescalabidi-mensional. La figura5.2 muestra una posible solucin.Un examen detenido de esta solucin nos permitir comprobar que las distanciasentrelosseisproductosenel espaciobidimensional reproducenfielmentelasrela-Cionesdesimilitud expresadasporel mdividuoencuestado, a saber:d(D, E) < d(A, B) < d(A, E) < .,. < d(D,F) < d(E,F)EdiCiOnes PirmideEdiCIOnes PirmideEscalamientomultidimenslonalcz 00EDimensin 1D'"d'o0'D()s . :1>23 ,c./1I>! ,Potencia/5- ",rDimensin1 1,000 -0,007 0,034 0,999 0,028 0,022 -0,999 -0,997 0,053 -0,246Dimensin2 -0,007 1,000 0,034 -0,017 0,999 0,073 0,001 0,025 0,949 0,012Dimensin 3 0,034 0,034 1,000 0,044 0,033 0,983 -0,031 -0,027 0,135 -0.938Dimensin1 0,999 -0,017 0,044 1,000 0,017 0,031 -0.999 -0,997 0,047 -0.258Dimensin2 0,028 0,999 0,033 0,017 1,000 0,075 -0,034 -0,012 0,950 0,006Dimensin 3 0,022 0,073 0,983 0,031 0,075 1,000 -0,020 -0,021 0,179 -0,928PrecIO -0,999 0,001 -0,031 -0,999 -0,034 -0,020 1,000 0,997 -0,064 0,241PotencIa -0,997 0,025 -0,027 -0,997 -0,012 -0,021 0,997 1,000 -0,042 0,233Tamao 0,053 0,949 0,135 0,047 0,950 0,179 -0,064 -0,042 1,000 -0,059Consumo -0,246 0,012 -0,938 -0,258 0,006 -0,928 0,241 0,233 -0,059 1,0004.4. Escalamiento multidimensional ponderado(EMDPlEl escalaffilentomultidimensional ponderadoconstItuyeunageneralizacindelmodelodedistanCIaseucldeas en el quese supone que lasdistmtasmatrIcesdedi-similitudesSkdifierenentres defOrIllaSIstemticamente nolineal onomonotm-ca. MientrasqueelEMDreplicadoconsideramcamentelasdiferenCIasmdividua-lesenel sesgoderespuesta, el EMDponderadoconsideratambinlasdiferenciasindividualesenlosprocesoscogmtIvosoperceptualesquedanlugaralasrespues-tas. Por estaraznelEMDPescomnmenteconocidocomoescalamientodedife-renciasmdividuales(INDSCAL).El EMDPestbasadoenel modeloeuclidianoponderado. Enestemodelo, denuevo tenemosel espacio deestmulos X (comoen el modeloeuclidianono ponde-rado), pero ademstenemosunespacIO de pesos o ponderaCIOnesW. Podemos con-siderar que el espacio deestmulosrepresenta la mformacinque escompartida portodoslosmdividuosacercadelaestructuradelosestmulos, del mIsmomodoqueocurra en EMDR.El espacIO de pesos o ponderaCIOnes representa la VIsin de cadamdividuoacercadela estructura delosestmulos.EdicionesPirmide 217TcmcasdeanfisisdedatoseninvestigacindemercadosA contmuacin nos centraremos en una presentacin detallada del EMDP.En lastresseccIOnessiguientesdiscutiremoslageometra, el lgebraescalaryel lgebramatricial deestemodelo. Enlacuartaseccinanalizaremos unasenededetallesacercadel EMDP. Postenonnentepresentamosunejemployfinalmenteanalizare-mosdosestadsticosdesarrolladosespecficamente para elEMDP.Unaaproximacina la geometra delmodeloeuclidiano ponderadoEl modelo euclidiano ponderado supone que los mdividuos presentan diferenciasrespectoa laImportancIa queatribuyena lasdimensIOnesdelespaciodeestmulosX. Esta importante nocin es mcorporada al modelo por medio de los pesos wka paracadaindividuokrespectoa ladimensina. Estospesos varanentreO y1. Si unpesoesgrande(cercanoa uno), diremosquela dimensincorrespondienteesrela-tivamente importante para el mdividuoen cuestin. Lo contrarIO ocumrSIunpesoes pequeo(cercano acero).Lafigura5.5muestraunesquema delageometradel modeloeuclidianopon-derado. EnlapartesupenordedichogrficosemuestrandoshIpotticasmatncesMatrices de datosS,Patlits' O 4 2EspiJiacas 4 O 6Lechuga 2 O SAtn 6 S OSspatatas Espinacas Lechuga AMoPatatilS O 3 3Espinacas O,6Lechuga 3 2 O SAtn 6 S 4 OMatnz Wde pesos._+--t-..j..._.j_..... _...-f_.l.-l.-- ..._+._._.. .._..L..Patatas Espinacas Lechuga Atn1 W;0,9 + -rwt--t--1+- _ .0,8 --. -9- -1 --j-- 1- : , I0,1 0,3 0,5 0,7 0,9 0,2 0,4 0,6 0,8Patatas O 3,16 3,61 6,32Espmacitil 3,16 O 2,24 7,07Lechuga 3,61 2,24 O 5,00Atn 6,32 7,07 5,00 OMatriz D de distancias para el grupo',. JI long.O 0,9 0,900,2 0,8 0,820,6 0,6 0,850,4 0,4 0,560,8 0,2 0,82

21-1-2 f-;_"'_j--'1-1-+-+--+..H-31"-;-+,-+-"-;--'+"+-'''-+ +-1-4H,'''-I,'+, +'+-1--;"+-+,--1-S L...L--'---'--'-L..L-l....+....1.....J-S -4-3 -2-1 1 2 3 4 SMatnzXdecoordenadaspara el grupo..X JIXL -2Figura5.5.Geometra delmadeja euclidianoponderado.218EdicionesPirmideEdiCIOnes PirmideEscalamientomultidimenslonalde datos referentes a cuatro estmulos (patatas, espmacas, lechuga y atn). Estas ma-triceshansido etiquetadascomoS2 y Ss' mdicandoquese trata delasmatncesn-mero2y 5 respectivamentedeuntotal de5(paraesteejemplo). Hemosdedesta-carqueSPSSnoanalizamatricesdedatosconmcamentecuatrofilas ycuatrocolumnas, dadoqueresultanexcesivamentepequeaspara ofrecer resultadosslgm-ficativos.Enel centro dela figura5.5se representan dosespacIOs, ambosdedosdimen-sIOnes. El espacIOdela Izquierda sera el espacio X Iupottico de estmulos para elgrupo. En l encontramos cuatro puntos que se corresponden con los cuatro estmu-los. ElespacIO de la derecha sera el espacIO Wde pesos o ponderacIOnes. En l en-contramoscmco vectoresquese corresponden con las cinco matncesdedatos. Ob-srvese queen EMDP el nmerodedimensionesde X essiempre el mismoqueeldeW.Enla parte inferior dela figura5.5se muestra la mformacinnumrica corres-pondientealos diagramaspresentadosenel centrodelamisma. Enlaparteiz-qUierdapodemosver lamatnzX decoordenadasdelosestmulosparael grupoyen el centro la matnzW de pesos. Las columnas 1 y11 dela matriz X se correspon-dencon lasdosdimensionesdelespacIO de estmulos. Las filasdedicha matriz es-pecifican lasposIcIOnesdelosdistmtospuntosen elespacIOdeestmulos. Lasdospnmerascolumnasdela matnzW se corresponden con las dosdimensIOnesdel es-pacIO de pesos. Losvalores decada filadedichascolumnasespecifican la posicindelosextremos delosvectoresde pesos en elespacIO depesos. La cuarta columnamuestralalongituddecadavectordepeso, queesIgual alarazcuadradadelasumadeloscuadradosdelosdosrestantesvaloresdesufila. Enlapartemfenorderecha delgrficose presenta la matnz Ddedistanciaseucldeasentre lospuntosen el espacio X de estmulos.El espacioX deestmulostieneunamterpretacinsimilaralaquetendraenEMDC y en EMDR. Llamamosa steespacIO deestmulos parael grupo. Las dis-tancias contenidas en la matnz DdedistanCias para el grupo tienen tambin la mis-mamterpretacinquelasdistanCiaseucldeascalculadasenel modeloeuclidianono-ponderado, aunqueenestecasodichasdistanciasestnreferidas al espacIOdeestmulosdel grupo, por loquesedenominandistanciasparael grupo. El espacIOdel grupoysusdistanCiasnosmformanacercadel modoenelqueelgrupoensuconjuntoestructuralosdistmtosestmulosysumterpretacineslamismaqueenEMDR, conalgunasexcepcIOnesimportantesqueserndiscutidaspostenormente.Hay que destacar,no obstante, que esta mformacin sobre el grupo no representa laestructura deningnmdividuoconcreto, ya quecada estructura individualesel re-sultadodela modificacin dela estructura delgrupo considerando los pesos mdivi-dualeswk ElespacIOdelgrupo representa la mformacin acerca dela estructura delosestmulosqueescompartida por el conjuntodemdividuos.VolViendo a la matriz Wde pesos, cada mdividuo (cada matriz de datos) est re-presentadoporunvector depesoswk Obsrvesequeenel espacIOdepesostodoslosvectoresseencuentranenel cuadrantePOSitiVO. Generalmente, slolospesos219TcnicasdeanlisisdedatosenInvestigacindemercadosPOSItiVOSsonmterpretables. PorestaraznSPSSrestnngepordefectoel valordelospesosdemodoquetodosellosseanPOSltlVOS. ObsrvesetambinquenoeXIs-tenpesosmayoresque l. Estosedebea quehansidonormalizadosdeformaquesu longitud sea igual a laproporcin devananza delosdatosmdividualesrecogidapor el modelo.Enel modeloeuclidianoponderado, lasdiferenciasmdivldualesenlaspercep-cIOnessonrepresentadaspor diferencIasenla orientaciny lalongituddelosvec-toreswk en elespacIOW de pesos. La orientacin delvector de pesos essu caracte-rstlca msimportante,ya que sta refleja las diferencias en la ImportancIa otorgadapor losindividuos a lasdistmtasdimensIOnesdelespacIO X. Si dosindividuos estnrepresentadosporvectorescon lamismadireccin, ellosIgnifica questosotorganla mIsma importancIa a las distmtas dimensIOnes, mdependientemente de la longituddedichosvectores. Las diferenciasenlalongituddelosvectoresmdicansImple-mentequelasrespuestasdeunmdividuoestnmejorrepresentadasporel espaciodeestmulos paraelgruporesultante. Losvectoresmslargos(ylospesosmayo-res)representana aquellosmdividuoscuyos datoshansidomejorajustados. La na-turalezadelasdiferenciasmdividualespuedeversemsfcilmentecomparandolosespacIOspersonalesdelosestmulosparavanosindividuos. stossonel resultadodeaplicarlarazcuadrada delospesosdeunindividuoal espacIOdel grupo. Lospesosencogen lasdimensIOnesdelespacio del grupodependiendodesuvalor. Lospesoscercanosalaunidadrepresentandimensiones importantesyencogenmuypocoel espacIOdel grupo, al contrarIOdeloqueocurreconlospesoscercanos acero. Portanto, enlosespacIOspersonales, lasdimensIOnes ms Importantessonmslargasquelas menosImportantes. Laideadelos espacIOsindivIdualessere-presenta enla figura5.6para losmdividuos2 y 5.EnlapartemfenorizqUIerdadelafigura5.6podemosverlamatnzmdividualdecoordenadasX2 ObsrvesequeX2eslamatrizquecontlenelascoordenadaspara todos los estmulos en el espacIO personal del individuo 2, nuentrasque X2 es lafilade coordenadaspara elestmulo 2 en el espacIO delgrupo. Enla parte IzqUIerdadel centrodedichogrficopodemosencontrar elespacIOpersonalpara el mdivlduo2, cuyascoordenadasseencuentranrepresentadasen lamatnzX2 Enla partesupe-nor izqUIerda se presenta la matriz de distancias personales entre los puntos en el es-pacio personal X2, esdeCIr, lasdistanCIaseuclidianasponderadas(por la razcuadra-da de los pesos w2 del individuo 2) entre los puntos del espacIO X del grupo.La partederechadela figuramuestra estosnusmosresultadospara elmdividuo 5.ResultamteresantecompararlasestructurasdelosespacIOspersonalescorres-pondientes a estosdosindividuos. Los pesosdel individuo 2 respectoa cada una delasdimenSIOnesson 0,2y 0,8,respectlvamente, como puede observarse en la figura55.Por tanto, este individuo otorga cuatrovecesmsImportancia a la dimensin2quealadimensin1. Estosevereflejadoensumapapersonal, enel queladi-mensin 2 es relatlvamente ms larga que la dimensinl (su mapa presenta una dis-pOSIcin msvertlcal que honzontal).Los pesos correspondientesal mdividuo 5 sonjustamente opuestos, esdeC