1. Profincyt - Análisis de Datos II

download 1. Profincyt - Análisis de Datos II

of 16

Transcript of 1. Profincyt - Análisis de Datos II

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    1/16

    Programa de Formacin en Investigacin,Ciencia y Tecnologa (ProFInCyT)

    Anlisis de Datos II:Anlisis bivariados y multivariados

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    2/16

    Unidad 1:

    Introduccin a las tcnicasbivariadas y multivariadas

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    3/16

    Introduccin1El origen histrico del anlisis multivariado o

    multivariante, se encuentra a principios del sigloXX.

    Surge en el marco de la psicologa aplicada comouna teora matemtica que trata de explicar elconcepto de inteligencia.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    4/16

    A diferencia de lo que sucede con los mtodos y anlisisbivariados, los multivariados son herramientasestadsticas que estudian el comportamiento de tres oms variables al mismo tiempo.

    Se usan principalmente para buscar lasvariables menosrepresentativas para poder eliminarlas y paracomprender la relacin entre varios grupos de variables.

    Es decir, si trabajamos con personas no medimos solo unaspecto (e.g. edad), sino que consideramos varios (e.g.altura, peso, sexo, clase social) y tratamos de determinarla relacin entre estas medidas.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    5/16

    1. Mtodos Dependientes

    Interesa la asociacin entre las distintas variables.

    Algunas de estas variables dependen o se miden enfuncin de las otras.

    Inters predictivo.2. Mtodos Independientes

    Interesa la asociacin entre variables. No dependen unas de otras. Inters descriptivo.

    3. Mtodos Estructurales

    Clasificacin2

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    6/16

    1. Mtodos Dependientesa. Regresin mltiple: Estudia la dependencia de una variable en funcin de

    otras. A diferencia del modelo de regresin lineal simple,utiliza ms de una variable como explicacin de otra.

    Ventaja de utilizar ms informacin para laconstruccin del modelo y realizar estimaciones msprecisas.

    de un conjunto de variables explicativas(independientes), cules son las que ms influyen enla variable dependiente?

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    7/16

    b. Anlisis discriminante

    Identificar la combinacin de caractersticas o variablesque mejor permitan diferenciar (discriminar) a dos oms grupos.

    La pertenencia a los grupos se utiliza como variabledependiente.

    Las variables en las que suponemos que se diferencian

    los grupos se utilizan como variables independientes(tambin denominadas de clasificacin odiscriminantes).

    Solo admite variables cuantitativas.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    8/16

    c. Mtodos log-lineales

    Los modelos log-lineales son una alternativa deanlisis estadstico para datos categricos.

    Un modelo log-lineal pretende explicar elcomportamiento de una variable respuesta, comoresultado del efecto de un conjunto de variablescategricas independientes.

    Son muy utilizados para la realizacin de tablas decontingencia.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    9/16

    d. Anlisis de correlacin cannica

    til en situaciones donde se tienen mltiples variablesdependientes.

    Se utiliza si las varianzas predictoras o independientesson numricas.

    Permite la valoracin de la relacin entre variablespredictoras numricas y mltiples medidasdependientes.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    10/16

    e. Anlisis multivariante de la varianza(MANOVA)

    El anlisis de la varianza multivariante es una

    generalizacin del anlisis de la varianza univariante(ANOVA) para el caso de ms de una variabledependiente.

    Se trata de contrastar la significacin de uno o msfactores (variables independientes) para el conjunto devariables dependientes.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    11/16

    2. Mtodos Independientes

    a. Anlisis de componentes principales

    Tcnica estadstica de sntesis de la informacin, o dereduccin del nmero de variables, perdiendo la menor

    cantidad de informacin posible.

    Los nuevos componentes principales o factores sernuna combinacin lineal de las variables originales, y

    adems sern independientes entre s.

    La interpretacin de los factores no viene dada a priori,sino que ser deducida tras observar la relacin de los

    factores con las variables iniciales.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    12/16

    b. Anlisis Factorial

    Tcnica de reduccin de datos que sirve para encontrargrupos homogneos de variables a partir de un conjuntonumeroso de las mismas.

    Esos grupos homogneos se forman con las variables quecorrelacionan mucho entre s.Su propsito ltimo consiste en buscar el nmero

    mnimo de dimensiones capaces de explicar el mximode informacin contenida en los datos.

    A diferencia de lo que ocurre en otras tcnicas, en elanlisis factorial todas las variables son independientesyaque no existe a prioriuna dependencia conceptual deunas variables sobre otras.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    13/16

    c. Tcnicas de EscalamientoMultidimensional

    Para un conjunto de similitudes (o distancias)observadas entre un par de objetos, se trata deencontrar una representacin grfica de estos en pocas

    dimensiones, de modo que sus posiciones casi ajustenlas similitudes (o distancias) originales.

    Si se usan las magnitudes originales de las distancias(o similitudes), se tiene el llamado escalamientomultidimensional mtrico.

    Si se usan rangos (orden de las observaciones), en vezde distancias, se tiene el escalamientomultidimensionalno mtrico.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    14/16

    d. Anlisis de correspondencias

    Tcnica descriptiva o exploratoria cuyo objetivo esresumir una gran cantidad de datos en un nmeroreducido de dimensiones, con la menor prdida de

    informacin posible.

    Objetivo similar al de los mtodos factoriales, pero estese aplica solo sobre variables categricas u ordinales.

    El anlisis de correspondencias se utiliza a menudo enla representacin de datos que se pueden presentar enforma de tablas de contingencia de dos variablesnominales u ordinales.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    15/16

    e. Anlisis de cluster

    Tcnica cuya idea bsica es agrupar un conjunto deobservaciones en un nmero dado de clusters o grupos.

    Este agrupamiento se basa en la idea de distancia o

    similitud entre las observaciones y su obtencindepende del criterio o distancia considerado.

    Por ejemplo, una baraja de cartas espaolas se podra

    dividir de distintos modos: en cuatro clusters (loscuatro palos), en ocho clusters (los cuatro palos y segnsean figuras o nmeros), en dos clusters (figuras ynmeros), siempre dependiendo de lo que

    consideremos como similar.

  • 7/27/2019 1. Profincyt - Anlisis de Datos II

    16/16

    3. Mtodos Estructurales

    Analizan las relaciones existentes entre un grupo devariables representadas por sistemas de ecuacionessimultneas, en las que se supone que algunas de ellas

    (constructos) se miden con error a partir de otrasvariables observables (indicadores).

    Los modelos utilizados constan de dos partes: un modelo

    estructuralque especifica las relaciones de dependenciaexistente entre las constructos latentes y un modelo demedida que especifica como los indicadores serelacionan con sus correspondientes constructos.