ANÁLISIS MULTIVARIADO INTRODUCCIÓN

download ANÁLISIS MULTIVARIADO INTRODUCCIÓN

of 47

Transcript of ANÁLISIS MULTIVARIADO INTRODUCCIÓN

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    1/47

    Prof. Grabiela Montes Q.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    2/47

    DEFINICIN:El anlisis multivariante es el conjunto detcnicas estadsticas que analizansimultneamente ms de dos variables enuna muestra de observaciones.

    Su razn de ser radica en un mejorentendimiento del fenmeno objeto deestudio obteniendo informacin que los

    mtodos estadsticos univariantes ybivariantes son incapaces de conseguir.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    3/47

    Los mtodos de anlisis multivariable se

    aplican a la investigacin comercial con lafinalidad de resumir y sintetizar, amplios

    conjuntos de datos, para obtener las

    informaciones ms vlidas y podercomprender mejor el problema que se est

    estudiando.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    4/47

    APLICACIONES AL MARKETING

    Permite analizar gran nmero de encuestas,lo que suministra a las empresas granvolumen de informacin sobre los

    mercados actuales y futuros.Hace posible comprender una gran cantidadde datos con una mnima prdida de la

    informacin, proporcionando algunas vecesimgenes grficas.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    5/47

    Permite analizar simultneamente toda la

    informacin sobre el fenmeno,considerando todos los factores queintervienen en l.

    Permite utilizar tanto variables continuascomo discretas, nominales u ordinales en elanlisis.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    6/47

    Se pueden clasificar en dos grandes grupos:Mtodos de dependencia y deinterdependencia.Mtodos de dependencia:Suponen que las variables analizadas estndivididas en dos grupos: las variablesdependientes y las variables independientes.

    El objetivo de los mtodos de dependenciaconsiste en determinar si el conjunto devariables independientes afecta al conjuntode variables dependientes y de qu forma.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    7/47

    Mtodos de interdependencia:

    Estos mtodos no distinguen entre variablesdependientes e independientes y su objetivoconsiste en identificar qu variables estn

    relacionadas, cmo lo estn y por qu.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    8/47

    Se pueden clasificar en dos grandessubgrupos segn que la variable (s)dependiente (s) sea (n) cuantitativas o

    cualitativas.Si la variable dependiente es cuantitativa,algunas de las tcnicas que se puedenaplicar son las siguientes:

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    9/47

    1. Anlisis de Regresin Es la tcnica adecuada si en el anlisis hayuna o varias variables dependientesmtricas cuyo valor depende de una o variasvariables independientes mtricas. Por

    ejemplo, intentar predecir el gasto anual encine de una persona a partir de su nivel deingresos, nivel de estudios , sexo y edad.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    10/47

    2. Anlisis de Supervivencia

    Es similar al anlisis de regresin pero con ladiferencia de que la variable independiente esel tiempo de supervivencia de un individuo objeto. Por ejemplo, intentar predecir eltiempo de permanencia en el desempleo deun individuo a partir de su nivel de estudios yde su edad.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    11/47

    3. Anlisis de la varianzaSe utilizan en situaciones en las que la

    muestra total est dividida en varios gruposbasados en una o varias variablesindependientes no mtricas y las variablesdependientes analizadas son mtricas. Suobjetivo es averiguar si hay diferenciassignificativas entre dichos grupos en cuanto alas variables dependientes se refiere. Porejemplo, hay diferencias en el nivel decolesterol por sexos? afecta, tambin, el tipode ocupacin?

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    12/47

    4. Correlacin Cannica Su objetivo es relacionar simultneamentevarias variables mtricas dependientes eindependientes calculando combinacioneslineales de cada conjunto de variables quemaximicen la correlacin existente entre losdos conjuntos de variables. Por ejemplo,analizar cmo estn relacionadas el tiempodedicado al trabajo y al ocio de una personacon su nivel de ingresos, su edad y su nivelde educacin.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    13/47

    Si la variable dependiente es cualitativa, lastcnicas que se pueden aplicar son lassiguientes:

    1. Modelos de regresin logstica

    Son modelos de regresin en los que lavariable dependiente es no mtrica. Seutilizan como una alternativa al anlisisdiscriminante cuando no hay normalidad.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    14/47

    2. Anlisis Discriminante Esta tcnica proporciona reglas de

    clasificacin ptimas de nuevasobservaciones de las que se desconoce sugrupo de procedencia basndose en lainformacin proporcionada los valores que

    en ella toman las variables independientes.Por ejemplo, determinar los ratiosfinancieros que mejor permiten discriminarentre empresas rentables y poco rentables.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    15/47

    3. Anlisis Conjunto Conjoint Analysis) Es una tcnica que analiza el efecto de

    variables independientes no mtricas sobrevariables mtricas o no mtricas. Ladiferencia de Conjoint con el Anlisis de laVarianza radica en que las variables

    dependientes pueden ser no mtricas y losvalores de las variables independientes nomtricas son fijadas por el analista.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    16/47

    Una aplicacin de la tcnica Conjoint es lasiguiente. Por ejemplo, una empresa quiere

    disear un nuevo producto y, para ello,necesita especificar la forma del envase, suprecio , el contenido por envase y sucomposicin qumica. Presenta diversas

    composiciones de estos cuatro factores. 100clientes proporcionan un ranking de lascombinaciones que se le presentan. Se quieredeterminar los valores ptimos de estos 4factores.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    17/47

    Se pueden clasificar en dos grandes grupossegn que el tipo de datos que analicen seanmtricos o no mtricos.

    Si los datos son mtricos, se pueden utilizar,entre otras, las siguientes tcnicas:

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    18/47

    1. Anlisis Factorial AF) y Anlisis deComponentes Principales ACP) Se utiliza para analizar interrelaciones entreun nmero elevado de variables mtricasexplicando dichas interrelaciones en trminos

    de un nmero menor de variablesdenominadas factores (si son inobservables)o componentes principales (si son

    observables).

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    19/47

    As, por ejemplo, si un analista financiero

    quiere determinar cul es el estado de salud

    financiero de una empresa a partir del

    conocimiento de un nmero de ratios

    financieros, construyendo varios ndicesnumricos que definan su situacin, el

    problema se resolvera mediante un ACP.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    20/47

    Si un psiclogo quiere determinar los factoresque caracterizan la inteligencia de unindividuo a partir de sus respuestas a un testde inteligencia, utilizara para resolver esteproblema un AF.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    21/47

    2. Escalas Multidimensionales Su objetivo es transformar juicios de

    semejanza o preferencia en distanciasrepresentadas en un espaciomultidimensional. Como consecuencia, seconstruye un mapa en el que se dibujan las

    posiciones de los objetos comparados deforma que aquellos percibidos como similaresestn cercanos unos de otros y alejados deobjetos percibidos como distintos.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    22/47

    Por ejemplo, analizar, en el mercado derefrescos, las percepciones que un grupo deconsumidores tiene acerca de una lista derefrescos y marcas con el fin de estudiar qufactores subjetivos utiliza un consumidor a lahora de clasificar dichos productos.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    23/47

    3. Anlisis Cluster Su objetivo es clasificar una muestra de

    entidades (individuos o variables) en un

    nmero pequeo de grupos de forma que las

    observaciones pertenecientes a un gruposean muy similares entre s y muy disimilares

    del resto.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    24/47

    A diferencia del Anlisis Discriminante, en elAnlisis Cluster se desconoce el nmero y lacomposicin de dichos grupos. Por ejemplo,clasificar grupos de alimentos (pescados,carnes, vegetales y leche) en funcin de susvalores nutritivos.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    25/47

    Si los datos fuesen no mtricos, se podranutilizar, adems, las siguientes tcnicas:

    1. Anlisis de Correspondencias Se aplica a tablas de contingencia ypersigue un objetivo similar al de lasescalas multidimensionales perorepresentando simultneamente las filas ycolumnas de las tablas de contingencia.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    26/47

    2. Modelos log-lineales Se aplican a tablas de contingenciamultidimensionales y modelizan relaciones dedependencia multidimensional de lasvariables observadas que buscan explicar lasfrecuencias observadas.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    27/47

    Las etapas de un anlisis multivariantepueden sintetizarse en las seis siguientes:

    1. Objetivos del anlisis Se define el problema especificandolos objetivos y las tcnicas multivariantesque se van a utilizar. El investigador debeestablecer el problema en trminos

    conceptuales, definiendo los conceptos ylas relaciones fundamentales que se van ainvestigar.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    28/47

    Se deben establecer si dichas relaciones vana ser relaciones de dependencia o de

    interdependencia. Con todo esto sedeterminan las variables a observar.

    2. Diseo del anlisis

    Se determina el tamao muestral, lasecuaciones a estimar (si procede), lasdistancias a calcular (si procede) y lastcnicas de estimacin a emplear. Una vezdeterminado todo esto, se proceden aobservar los datos.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    29/47

    3. Hiptesis del anlisis

    Se evalan las hiptesis subyacentes a latcnica multivariante. Dichas hiptesispueden ser de normalidad, linealidad,independencia, homocedasticidad, etc.Tambin se debe decidir qu hacer con losdatos missing.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    30/47

    4. Realizacin del anlisis Se estima el modelo y se evala el ajuste a losdatos. En este paso pueden aparecerobservaciones atpicas (outliers) o influyentescuya influencia sobre las estimaciones y labondad de ajuste se debe analizar.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    31/47

    5. Interpretacin de los resultados

    Dichas interpretaciones pueden llevar areespecificaciones adicionales de las variables

    o del modelo con lo cual se puede volver de

    nuevo a los pasos 3 y 4.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    32/47

    Matriz de Datos. Se observan p variablesnumricas en un conjunto de n elementos.

    npn2n1

    2p2221

    1p1211

    xxx

    xxxxxx

    X

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    33/47

    Vector de Medias: Es una medida decentralizacin de los datos.

    n

    xx,

    x

    x

    X

    n

    1iij

    j

    p

    1

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    34/47

    Matriz de Varianzas y Covarianzas (S): Esuna matriz cuadrada y simtrica que

    contiene en la diagonal las varianzas yfuera de la diagonal las covarianzas entrelas variables.

    2 j j j

    n

    1ik ik jij

    jk

    2 p p1

    1p21

    ssy,n

    xxxxs

    donde

    ss

    ss

    S

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    35/47

    Matriz de Correlaciones (R): Cada elementode esta matriz se obtiene de la siguientemanera:

    Donde s i es la desviacin estndar de lavariable X i.

    ji

    ijij ss

    sr

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    36/47

    Marcas

    Caractersticas

    Elegancia Comodidad Deportivo

    ABCDEF

    234589

    325597

    644467

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    37/47

    Para los datos anteriores tenemos que elvector de medias est dado por:

    5.167

    5.167

    5.167

    X

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    38/47

    Y la matriz de Varianzas y Covarianzas estdada por:

    1.47234723.18056.1

    4723.15.47235.3056

    8056.15.30566.4722

    S

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    39/47

    Y la matriz de Correlaciones est dada por:

    1519.0585.0

    519.010.892

    585.00.8921

    R

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    40/47

    Este anlisis tiene como objetivo representarla informacin contenida en una matriz dedatos de n observaciones y p variables, con

    un nmero menor de variables construidascomo combinaciones lineales de lasoriginales.

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    41/47

    El espacio de dimensin r que mejorrepresenta a los puntos viene definido porlos vectores propios asociados a los rmayores valores propios de S.Se calculan los valores propios o races

    caractersticas, 1 , , p , de la matriz devarianzas y covarianzas de las variables, S,mediante:

    0IS

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    42/47

    Y los vectores propios asociados son los a itales que:

    Los trminos

    i son nmeros reales.Llamando Z a la matriz cuyas columnas sonlos vectores de los p componentes en los nindividuos, estas nuevas variables estn

    relacionadas con las originales mediante:Z = XA

    donde A A=I.

    0aI S ii

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    43/47

    Observacin:

    Si las variables que se quieren estudiar estnen diferentes unidades, se debe reemplazaren el anlisis, la matriz de Varianzas-

    Covarianzas (S) por la matriz de Correlaciones(R).

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    44/47

    0 3 1.59 -0.54

    00

    0 0

    00

    10.520.58

    0.5210.89

    0.580.891

    0I-R ecuacinladeraceslasson propiosvaloresLos

    152.058.0

    52.010.8958.00.891

    R

    32

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    45/47

    Las races de este polinomio son:

    1 = 2.3447,

    2 = 0.5508,

    3 = 0.1045La varianza total es ( 1+ 2+ 3) = 3.

    El vector propio asociado a 1 nos da los

    pesos de la primera componente principal.Para calcularlo se resuelve el sistema

    Ra1= 1 a 1

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    46/47

    5054.0a ,603.0a ,622.0a

    :tantolo poruno,normatenga

    vector elqueimponiendoobtienesesolucinLa

    00

    0

    a34.10.52a.58a00.52aa34.10.89a

    0.58a0.89aa34.1

    aa

    a

    3447.2aa

    a

    152.058.052.010.89

    58.00.891

    131211

    131211

    131211

    131211

    13

    12

    11

    13

    12

    11

  • 7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN

    47/47

    5054.0

    603.0

    622.0

    a1

    Y el primer componente es:

    Z1 = 0.622X 1 + 0.603X 2 + 0.5054X 3

    Repitiendo el proceso con los otros dos autovalorestenemos los otros dos componentes:

    Z2 = -0.29X 1 0.419X 2 + 0.861X 3Z3 = 0.73X 1 0.678X 2 0.084X 3