TIPOS DE TÉCNICAS MULTIVARIANTES - BIENVENIDO A LA … lineal/ACP DEFINITIVO.pdf · TIPOS DE...
Transcript of TIPOS DE TÉCNICAS MULTIVARIANTES - BIENVENIDO A LA … lineal/ACP DEFINITIVO.pdf · TIPOS DE...
1
TIPOS DE TÉCNICAS MULTIVARIANTES
• Factoriales:
1. Análisis de Componentes Principales. Para tablas de
medidas o de escalas métricas.
2. Análisis de Correspondencias Simple y Múltiple. Para tablas
de contingencia o de frecuencias
• Clasificación:
1. Análisis Clúster
2. Análisis Discriminante
2
Métodos Predictivos:
1)Regresión multivariado
2) MANOVA Y MANCOVA
3) Análisis Discriminante
Métodos Reductivos:
1) Componenentes principales
2)Análisis Factorial, Correlación Canónica
3) Análisis de Cluster, de Correspondencia
Métodos de Análisis Multivariado
3
VARIABLES ....notación .....
__________________________________________________________
Individuos V1 V2 ... Vj .... Vp
__________________________________________________________
1 X11 X12 ... X1j ... X1p
2 X21 X22 ... X2j ... X2p
3 X31 X32 ... X3j ... X3p
..
n Xn1 Xn2 ... Xnj ... Xnp
______________________________________________________________________________________
_____________________________________________________________________________
4
Reducción de Dimensión
Análisis de Interdependencia
ANÁLISIS DE COMPONENTES PRINCIPALES
(Análisis exploratorio)
5
Reducción de Dimensión
“mirar a los datos para ver que pretenden decir” (John Tukey ,1977)
Podemos ver en 3D pero no más allá!!!!
Para entender que está pasando en dimensiones mayores
Técnicas de reducción de dimensión
Una proyección de los datos a un espacio en el que podemos visualizarlos
6
2. Análisis de Componentes Principales
Objetivo:
Transformar un conjunto de variables en un nuevo conjunto, componentesprincipales, incorrelacionadas entre sí. Se consigue una representaciónsimplificada, más sencilla y fácil de ver.
Metodología:
Los datos se presentan en una tabla rectangular con n líneas (individuos) y pcolumnas (variables) (matriz R, nxp). Puede ser disimétrica y con variablesheterogéneas. Hay dos espacios:
Rp : n individuos con los valores que toman para cada una de las p variables.
Rn : p variables para cada individuo.
Finalidad:
Buscar un subespacio Rq, q<p que contenga la mayor cantidad posible deinformación de la nube primitiva, y que mejor se ajuste a la nube de puntos y ladeforme lo menos posible. El criterio de ajuste es el de mínimos cuadrados. Seobtendrán nuevas variables, combinaciones lineales de las variables originalesllamadas factores o componentes.
7
Gráficamente:
ui es el vector unitario o propio y zi es la proyección de xi en Fi.
Como medida de la cantidad de información incorporada en una componente se utiliza su
varianza. Cuanto mayor sea, mayor es la información incorporada a dicha componente. La
primera componente será la de mayor varianza.
Para obtener los factores o componentes que diferencian al máximo a los individuos entre sí,
medidos a través de caracteres métricos, la extracción se realiza sobre variables tipificadas, con
matriz X, para evitar problemas de escala. La suma de las varianzas es igual a p, ya que la de
cada una de ellas es igual a 1 y habrá tantas componentes como número de variables originales.
Mientras más correlacionadas estén las variables originales entre sí, más alta será la variabilidad
que se pueda explicar con menos componentes. Si existiera incorrelación, el ACP carecería de
sentido, ya que las variables originales y las componentes o nuevas variables coincidirían.
9
10
11
12
13
14
15
16
17
18
MATRIZ DE DATOS
Cálculo de medias y
desviaciones típicas
X: MATRIZ DE DATOS TIPIFICADOS
R =X´X
MATRIZ DE CORRELACIONES
Diagonalización de R, cálculo de
valores propios, varianza
explicada y correlaciones
COMPONENTES PRINCIPALES
Algebra del Análisis
1) Matriz de n observaciones con p variables cuantitativas porobservación, X
2) Matriz de covarianzas o correlación (pxp), S o R
3) Descomposición Espectral (obtiene autovalores y autovectoresde S)
4) Construye las CP = Combinaciones lineales de las variablesoriginales usando como coeficiente de la combinación loselementos de un autovector. Si se usa el primer autovector, setiene la CP1 , si se usa el segundo autovector, se tiene la CP2, yasí hasta la CP número p.
5) Quedarse con las primeras k CPs si la proporción de varianzaexplicada acumulada por esas k CPs es alta.
Algebra del Análisis
La CP1 se obtiene encontrando la recta que minimiza la suma de loscuadrados de las distancias de los puntos a sus proyeccionesortogonales sobre esa recta. Su dirección está dada por el autovectorasociado al mayor autovector de S.
La proyección de una observación sobre esa recta es una CL de lasobservaciones que tiene como coeficientes a los elementos del primerautovector normalizado
La recta maximiza la suma de los valores de la componente al cuadrado(maximiza las varianzas de las proyecciones ortogonales de los datossobre la recta)
La CP1 se define como la CL normalizada de las variables originales quetiene máxima varianza.
La segunda CP se construye con el segundo autovector, es decir esortogonal a la primera por lo que ambas conforman el plano que mejor(mínima distancia al cuadrado) aproxima a la nube de puntosmultidimensional
Algebra del Análisis
Se demuestra que el hiperplano (subespacio) de dimensión r queminimiza la suma de las distancias al cuadrado entre cada dato ysu proyección ortogonal sobre dicho hiperplano se determinamaximizando la varianza total (varianza en las r dimensiones) yqueda definido por los r autovectores normalizados asociados alos r autovalores de S.
Estas direcciones se denominan direcciones principales de losdatos y las nuevas variables por ellas definidas son las rprimeras CP muestrales.
Consecuencias del Algoritmo
La CP1 permite visualizar más variabilidad en los datosque cualquier otra CP.
La CP2 no esta correlacionada con la CP1 (aportanueva información) y explica mayor variabilidad quecualquier otra CP que no sea la CP1.
Un gráfico de dispersión construido a partir de la CP1y la CP2 proyecta la nube de datos en el sentido demáxima variación. Ideal para estudiar variación.
Un número k de CPs , con k mucho menor a p, puedeexplicar la variabilidad de la información con pocapérdida de información.
Consecuencias del Algoritmo
Cuando un CP tiene todos sus coeficientes (relevantes)positivos, es decir es un promedio ponderado de todaslas variables que lo integran, se dice que es un factorglobal de tamaño. Esto ocurre, por ej., con la CP1cuando todos los pares de variables originales tienenuna alta correlación positiva.
Cuando un CP tiene coordenadas positivas y negativas,está contraponiendo un grupo de variables con otrogrupo. Se dice que es un factor de forma.Frecuentemente, éstos pueden expresarse comopromedios ponderados de dos grupos de variables condistinto signo
Selección del Número de ACP
Gráfico de autovalores. Se busca un “quiebre” a partirdel cual todos los autovalores posteriores son igualesentre sí.
Fijar la proporción de la varianza explicada
Cota inferior para los autovalores (por ej., la varianzamedia - autovalor promedio para S o 1 para R.
25
Cuando los puntos en la gráfica tienden a nivelarse, estos autovalores
suelen estar suficientemente cercanos a cero como para que puedan
ignorarse
MÉTODOSPARA ESTIMAR EL NÚMERO DE CP
0
10
20
30
40
50
60
70
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
# CP
Eig
en
valu
e
Autovalor Proporción Acumulada
CP1 66.53 54.30 54.30
CP2 18.18 14.84 69.14
CP3 10.59 8.64 77.78
CP4 6.77 5.52 83.30
CP5 3.98 3.25 86.55
CP6 3.63 2.96 89.52
CP7 2.91 2.38 91.90
CP8 2.84 2.31 94.21
CP9 1.95 1.59 95.80
CP10 1.61 1.32 97.12
CP11 1.14 0.09 98.05
CP12 0.87 0.07 98.76
CP13 0.71 0.06 99.32
CP14 0.51 0.04 99.75
CP15 0.30 0.01 100.00
ACP sobre R
Cuando las variables originales tienen unidades demedida distinta, la maximización de las varianzas delas proyecciones ortogonales depende de esta escalade medida y las variables con valores más grandestienen más peso en el análisis de componentes que lasrestantes.
Conviene estandarizar = trabajar con autovalores yautovectores de R
27
Resumen
Las componentes principales son combinaciones lineales de las variablesoriginales.
Los coeficientes de las combinaciones lineales son los elementos de losvectores característicos asociados a la matriz de covarianzas de las variablesoriginales. Por tanto, la obtención de componentes principales es un caso típicode cálculo de raíces y vectores característicos de una matriz simétrica.
La primera componente se asocia a la mayor raíz característica a que vaasociada.
Si se tipifican las variables originales, su proporción de variabilidad total captadapor una componente es igual a su raíz característica dividida por el número devariables originales.
La correlación entre una componente y una variable original se determina con laraíz característica de la componente y el correspondiente elemento del vectorcaracterístico asociado, si las variables originales están tipificadas
28
Objetivo: Posicionamiento del producto turístico deTenerife según nacionalidades.
Metodología:
Cuestionario: Fichero base turistas curso.sav.
Caso de ACP: Se han elegido noches, nº visitas, nºpersonas, gasto y edad
Se crea una nueva variable: Gasto/persona/noche.
Se obtienen las medianas por nacionalidad para lasvariables.
CASO:
Posicionamiento de turistas en Tenerife
29
Datos. MedianasNacionalidad Nº
Noches Nº visitas anteriores
Gasto noche/persona
Edad
Alemana 14,00 ,00 76,6290 42,00
Austriaca 7,00 ,00 35,7452 33,00
Belga 7,00 1,00 46,2028 35,00
Británica 14,00 2,00 37,5633 39,00
Española 7,00 ,00 85,8589 31,00
Europa exc 7,00 ,00 41,7811 24,50
Finlandesa 32,00 50,00 46,9541 73,00
Francesa 7,00 ,00 75,1265 38,00
Holandesa 14,00 ,00 18,9410 26,00
Italiana 7,00 ,00 72,9800 28,00
R. América 29,00 1,00 19,1990 22,50
R. Europa 7,00 ,00 89,0786 34,00
R. mundo 6,00 ,00 117,9486 30,00
Sueca 7,00 ,00 123,5552 30,00
Suiza 7,00 ,00 80,3639 37,00
Fuente: Encuesta a turistas. Base turistas.sav
Tabla de datos:
Matriz con 15 filas, correspondientes a las nacionalidades, y 4columnas, correspondientes a las 4 variables. Dentro, medianas
30
SPSS versión 22 para windows
Analizar Reducción de datos Análisis Factorial
31
Elección del numero de ejes
Criterio de la media aritmética:
Se seleccionan las componentes cuya varianza (valor propio) o inercia
asociada a cada componente, exceda de la media de las raíces
características. Por tanto, se debe verificar que
Si las variables originales están tipificadas, , por lo que la media
de la inercia es igual a 1. Se retendrán los factores cuya inercia sea
mayor que 1.
p
λλλ
p
1ii
h
pλp
1jj
32
Resultados ACP 1
Estadísticos descriptivos más importantes de las variables utilizadas
El perfil promedio de los turistas de la muestra tiene un estancia promedio
de 11 o 12 días, han visitado con anterioridad la isla entre 3 y 4 ocasiones, el
gasto persona/día de sus vacaciones ha sido de 64,53€, la edad es
aproximadamente 35 años.
La variable con mayor grado de dispersión relativa es el nº de visitas
anteriores (357%).
Estadísticos descriptivos
11,47 8,27 15
3,60 12,85 15
34,87 11,92 15
64,53 32,54 15
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Media
Desviac ión
típica N del análisis
33
Resultados ACP 2
Matriz de coeficientes de correlación para todos los pares de variables
originales.
Niveles de significación unilaterales de cada uno de los coeficientes.
Para un nivel del 5% de significación, resultaron significativos 4 de los 6
(67%), porcentaje de índices de correlación adecuado para el análisis.
Matriz de correlaciones
1,000 ,702 ,509 -,508
,702 1,000 ,887 -,170
,509 ,887 1,000 -,016
-,508 -,170 -,016 1,000
,002 ,026 ,027
,002 ,000 ,272
,026 ,000 ,478
,027 ,272 ,478
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Correlac ión
Sig. (Unilateral)
Nº Noches
Nº v is itas
anteriores
Edad del
turista
Gasto por
persona y día
34
Resultados ACP 3
La adecuación de los datos al análisis factorial de componentes principales se contrasta
mediante KMO y prueba de Bartlett
KMO y prueba de Bartlett
,572
32,762
6
,000
Medida de adecuación muestral de
Kaiser-Mey er-Olkin.
Chi-cuadrado
aproximado
gl
Sig.
Prueba de esf ericidad
de Bartlet t
35
Resultados ACP 4
KMO:
Estadístico de prueba de la hipótesis de que las correlaciones parciales entre las
variables son pequeñas. Indica la proporción de varianza de las variables originales que
es común, y que podría ser explicada por factores subyacentes. Valores cercanos a 1: un
análisis factorial puede ser útil para los datos. Valores menores de 0,5: los resultados
probablemente no sean muy útiles.
KMO = 0,6: Los datos muestran ser adecuados para el análisis ACP.
ji
2ij
ji
2ij
ji
2ij
ar
r
KMO rij : coeficiente de correlación lineal de Pearson entre las variables i,j
aij: coeficiente de correlación parcial entre las variables i,j
Prueba de esferidad de Bartlett:
Indica si la matriz de correlaciones es una matriz identidad, por lo que que las variables
no están relacionadas
Hay evidencia suficiente para rechazar que la matriz de correlaciones es una matriz
identidad. Existe un cierto nivel de relación entre las variables.
36
Resultados ACP 5
Covarianzas y correlaciones parciales negativas. Índice de las correlaciones no debidas a los
factores. Valores pequeños: las variables están relativamente libres de correlaciones no
explicadas. La mayoría de los valores fuera de la diagonal principal deberían ser muy pequeños
(próximos a cero). En nuestro caso, parece existir una parte importante de las correlaciones entre
las variables que los factores extraídos no consiguen explicar.
Elementos de la diagonal principal de la matriz de correlación anti-imagen: medida de adecuación
muestral para cada variable. Valores inferiores a 0,5: Las variables no se ajustan a la estructura
de las otras. Deberíamos eliminarlas del análisis. En nuestro caso todas las variables presentan
una medida de adecuación muestral superior a 0,5.
Matrices anti-imagen
,333 -,117 ,057 ,236
-,117 ,128 -,130 -,013
,057 -,130 ,184 -,047
,236 -,013 -,047 ,661
,617a -,567 ,229 ,503
-,567 ,556a -,850 -,043
,229 -,850 ,569a -,136
,503 -,043 -,136 ,513a
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Cov arianza anti-imagen
Correlac ión anti-imagen
Nº Noches
Nº v is itas
anteriores
Edad del
turista
Gasto por
persona y día
Medida de adecuación muestrala.
37
Resultados ACP 6
Indican la cantidad de varianza de cada variable que es explicada. En el método de
extracción Componentes Principales, las comunalidades iniciales son siempre 1.
Las comunalidades de la extracción son estimaciones de la varianza de cada variable
que es explicada por los factores incluidos en la solución factorial.
Para todas las variables la cantidad de varianza explicada por los factores de la
solución factorial es alta.
Todas las variables se ajustan bien a la solución factorial.
Comunalidades
1,000 ,835
1,000 ,954
1,000 ,918
1,000 ,926
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Inic ial Extracción
Método de extracción: Análisis de Componentes principales.
38
Resultados ACP 7
Las tres primeras columnas se refieren a la solución inicial, y hay tantos valores como
componentes o factores posibles.
Total: Cantidad de varianza explicada por cada componente en las variables observadas.
“% de varianza”: Porcentaje de varianza explicada por las componentes.
“% de varianza acumulado”: Porcentaje acumulado de varianza explicada por la componente
correspondiente y las anteriores.
En nuestro caso los dos primeros factores consiguen explicar prácticamente el 91% de la
varianza de las variables originales, lo que indica un buen modelo factorial.
También se muestran las cantidades de varianza explicada por cada factor extraído una vez
realizada la rotación de los mismos. En ese caso, el factor 1 explica más del 56% de la
varianza, mientras que el segundo factor explica el 34.63%.
Varianza total explicada
2,511 62,772 62,772 2,511 62,772 62,772 2,248 56,190 56,190
1,122 28,047 90,819 1,122 28,047 90,819 1,385 34,628 90,819
,291 7,265 98,084
,077 1,916 100,000
Componente
1
2
3
4
Total
% de la
v arianza % acumulado Total
% de la
v arianza % acumulado Total
% de la
v arianza % acumulado
Autov alores iniciales
Sumas de las saturaciones al cuadrado
de la ex tracción
Suma de las saturaciones al cuadrado
de la rotac ión
Método de extracción: Análisis de Componentes princ ipales.
40
Resultados ACP 8
Matriz de casos
Cargas factoriales para cada variable
sobre las componentes no rotadas.
Cada valor representa la correlación
entre la variable y la componente.
Pueden ayudar a formular una
interpretación de los factores.
La mayoría de las variables originales
presentan una correlación alta con el
primero de los factores, lo que dificulta
la interpretación de los mismos.
Nacionalidad F1 F2
Alemana 0,142 0,380
Austriaca -0,201 -0,666
Belga -0,167 -0,331
Británica 0,309 -0,619
Española -0,505 0,466
Europa excomunista -0,471 -0,805
Finlandesa 3,374 0,988
Francesa -0,254 0,443
Holandesa -0,026 -1,534
Italiana -0,526 0,058
Resto América 0,524 -2,126
Resto Europa -0,436 0,643
Resto mundo -0,734 1,234
Sueca -0,720 1,335
Suiza -0,308 0,535
Matriz de componentesa
,943 ,254
,860 -,309
,848 ,447
-,404 ,873
Nº v is itas anteriores
Nº Noches
Edad del turista
Gasto por persona y día
1 2
Componente
Método de extracción: Análisis de componentes principales.
2 componentes extraídosa.
41
Resultados ACP 9Correlaciones reproducidas y residuos
Patrón predictivo de las relaciones. Si la solución es correcta, las correlaciones
reproducidas están próximas a los valores observados, Los residuos indican la
diferencia entre valores reproducidos y observados. La mayoría de estos valores
deberán ser pequeños.
a. Hay 3 (50,0%) residuales no redundantes con valores absolutos mayores que 0,05.
Los valores residuales son pequeños. La bondad del modelo factorial estimado es
bastante alta
Correlaciones reproducidas
,835b ,733 ,591 -,617
,733 ,954b ,913 -,159
,591 ,913 ,918b ,047
-,617 -,159 ,047 ,926b
-,030 -,082 ,109
-,030 -,026 -,011
-,082 -,026 -,063
,109 -,011 -,063
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Correlac ión reproducida
Residuala
Nº Noches
Nº v is itas
anteriores
Edad del
turista
Gasto por
persona y día
Método de extracción: Análisis de Componentes princ ipales.
Los residuos se calculan entre las correlaciones observadas y reproduc idas. Hay 3 (50,0%)
residuales no redundantes con v alores absolutos may ores que 0,05.
a.
Comunalidades reproducidasb.
42
Resultados ACP 10
Valores utilizados para el cálculo de las puntuaciones para cada caso. Para cada
nacionalidad, la puntuación factorial se calcula multiplicado los valores de la variable
por los coeficientes de la puntuación factorial.
Matriz de coeficientes para el cálculo de las
puntuaciones en las componentes
,189 -,397
,437 ,040
,477 ,211
,194 ,771
Nº Noches
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
1 2
Componente
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
43
Gráfico ACP: Diagrama de dispersión
44
Rotación de los ejes: ProcedimientosObjetivo:
Obtener nuevos factores más fáciles de interpretar. Cada variable originaltendrá una correlación lo más próxima a 1 con uno de los factores y lo máspróximas a 0 con el resto. Cada factor tendrá correlación alta con un grupo devariables y baja con el resto.
1. Rotación ortogonal: Queda preservada la incorrelación entre los factores.
VARIMAX. Los ejes de los factores rotados se obtienen maximizando la sumade varianzas de las cargas factoriales al cuadrado dentro de cada factor.Problema: Las variables con mayores comunalidades tienen mayor influenciaen la solución final. Para evitarlo: normalización de Kaiser: Cada carga factorialal cuadrado se divide por la comunalidad de la variable correspondiente(VARIMAX normalizado). Ventaja: queda inalterada tanto la varianza totalexplicada por los factores como la comunalidad de cada una de las variables
EQUAMAX y el QUARTIMAX
2. Rotación oblicua: Factores no incorrelacionados. Se compensarse si seconsigue una asociación más nítida de cada variable con el factorcorrespondiente.
OBLIMIN: Se utilizan algoritmos para controlar el grado de no ortogonalidad.Tampoco se ve modificada la comunalidad en la rotación oblicua
45
Resultados Rotación VARIMAX 1
Las cargas factoriales quedan más repartidas
Para la componente 1 las variables con mayores cargas factoriales son: “nº de
visitas anteriores” (+), “edad del turista” (+) y “nº de noches” (+), aunque ésta
última, también presenta una alta carga factorial con la componente 2.
Con la componente 2 además de el “nº de noches” (-), se da una alta
correlación con : “gasto por persona y día” (+).
Explicación:
Componente 1: Los turistas de más edad son los que más veces han repetido
visita a Tenerife, y los que más alargan su estancia durante sus vacaciones.
Componente 2: Los que más gastan por persona y día son los que menor
tiempo de estancia tienen.
Matriz de componentes rotadosa
,960 -,182
,958 ,033
,017 ,962
,640 -,652
Nº v is itas anteriores
Edad del turista
Gasto por persona y día
Nº Noches
1 2
Componente
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
La rotación ha conv ergido en 3 iteraciones.a.
46
Resultados Rotación VARIMAX 2
Factor 1:
Cuadrante positivo:
Nacionalidades: Finlandesa, Alemana y
Británica.
Nº visitas anteriores, edad, nº noches
Cuadrante negativo:
Nacionalidades: Resto
Factor 2:
Cuadrante positivo:
Nacionalidades: Alemana, Española, Francesa,
Italiana, Resto de Europa, Resto del Mundo,
Sueca y Suirza.
Gasto noche persona
Cuadrante negativo:
Nacionalidades: Resto.
Nº noches
MATRIZ DE CASOS ROTADOS
Nacionalidad F1 F2
Alemana 0,293 0,280
Austriaca -0,471 -0,512
Belga -0,294 -0,226
Británica 0,008 -0,692
Española -0,252 0,640
Europa excomunista -0,775 -0,520
Finlandesa 3,467 -0,580
Francesa -0,036 0,510
Holandesa -0,691 -1,370
Italiana -0,449 0,281
Resto América -0,454 -2,142
Resto Europa -0,112 0,769
Resto mundo -0,123 1,430
Sueca -0,067 1,515
Suiza -0,044 0,616
47
Gráfico ACP rotado: Diagrama de dispersión
48
La marca de ropas St. John no es muy conocida en Europa. Procede de EEUU.Allí es adquirida por mujeres de nivel socioeconómico alto. St. John fabricaprimordialmente trajes de chaqueta, empleando fibras naturales que mezcla conuna pequeña parte de un polímero sintético que impide que la ropa se arrugue.Muchas mujeres compran ropa de este fabricante, especialmente si realizan untrabajo en el que la imagen sea importante, pues los trajes presentan un aspectoimpecable después de muchas horas de llevarlos puestos. Se puede llegar alfinal de la jornada casi sin que sea necesario tener que plancharlos.
En 1991 se realizó un estudio sobre el posicionamiento de marcas de fabricantesde ropa (Dishener y Grande, 1991) para detectar cómo era percibida esta marcay encontrar el segmento en el que podría ser incluida y decidir sobre laoportunidad de penetrar en el mercado español.
Fase cualitativa:
Como la marca no era conocida en España, no tenía mucho sentido obtenerinformación en el mercado. Se optó por consultar con expertos del mundo de lamoda para que posicionaran las marcas. Tras una serie de entrevistas condirectores de escuelas de diseño de moda se consideraron las variables másimportantes para juzgar una serie de marcas. En un principio se pensó que,debido al perfil socioeconómico de las compradoras de St. John en EEUU, elsegmento dentro del cual podría penetrar la marca podría ser el de Loewe oChanel.
Caso a resolver:
Imagen de fabricantes de modas para
penetración en un mercado extranjero
49
Objetivo del estudio:
Averiguar en qué medida se situaba cada una de las marcas respecto a unamarca media. Se intenta obtener las valoraciones de cada marca; no sóloestudiar qué aspectos destacan en su imagen, sino si se encuentran por debajoo por encima de la media.
Metodología:
Se consideró que la técnica más adecuada para este caso era el Análisis deComponentes Principales, que trabaja con datos métricos. Se diseñó uncuestionario en el que debían valorarse de 0 a 100 las características citadaspara cada una de las marcas.
La valoración que debía darse era en términos positivos: cuanto más cara fuerala marca, mayor su calidad, prestigio, exclusividad, etc., mayor tenía que ser lapuntuación asignada. La aparente dificultad de las valoraciones - obliga a pensary fatiga - quedó mitigada por el reducido número de atributos a valorar y la grancualificación de los encuestados, todos ellos expertos en moda.
Muestra:
El cuestionario se distribuyó a 256 directores de centros de diseño de moda, 30distribuidores y 10 importadores. La información se recogió a lo largo de mayo yjunio de 1991. Los valores medios de cada marca en cada atributo son lossiguientes:
50
CASAS P1 P2 P3 P4 P5 P6 P7
ÚNGARO 79 87 87 87 82 72 62
ARMANI 69 89 96 92 91 72 75
GENNY 63 77 73 91 72 73 90
VERINO 64 72 68 56 55 69 62
ESCADA 70 91 82 76 82 75 72
FERRAUD 60 78 70 71 72 59 53
VERSACE 78 83 92 91 66 87 79
ST. JOHN 72 87 54 75 85 59 81
DIOR 69 83 85 81 74 53 77
KENZO 68 78 82 79 65 81 65
A. DOMINGUEZ 65 76 75 77 72 68 44
BURBERRYS 69 77 74 63 72 30 48
MOSCHINO 71 81 89 87 44 92 91
YVES ST.LAURENT 62 82 79 80 81 63 72
P.CARDIN 66 71 75 69 72 37 53
RODIER 65 62 60 58 48 30 28
LOEWE 74 91 97 92 91 48 90
CHANEL 73 92 99 97 97 64 94
ESCORPION 71 63 52 48 52 32 27
BENETTON 70 53 77 64 30 62 51
P1 PRECIO
P2 CALIDAD
P3 PRESTIGIO
P4 EXCLUSIVIDAD
P5 ELEGANCIA
P6 VANGUARDIA
P7 COMPLEMENTOS