ANÁLISIS MULTIVARIADO PARA RIESGOS -...

23
TRIMESTRE 1: ANÁLISIS MULTIVARIADO PARA RIESGOS PROFESOR: LUIS E. NIETO BARAJAS EMAIL: [email protected] URL: http://allman.rhon.itam.mx/~lnieto Maestría en administración de riesgos

Transcript of ANÁLISIS MULTIVARIADO PARA RIESGOS -...

Page 1: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

TRIMESTRE 1:

ANÁLISIS MULTIVARIADO PARA RIESGOS

PROFESOR: LUIS E. NIETO BARAJAS

EMAIL: [email protected]

URL: http://allman.rhon.itam.mx/~lnieto

Maestría en administración de riesgos

Page 2: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 2

Análisis Multivariado para riesgos

OBJETIVO: Presentar los principales métodos del análisis multivariado,

haciendo énfasis en el área de administración de riesgos. Discutir casos

prácticos que involucren el tratamiento de grandes bases de datos.

TEMARIO (EXTENDIDO):

1. Introducción.

1.1 Aplicaciones de los métodos multivariados

1.2 Organización de los datos

1.3 Variables, vectores y matrices aleatorias

1.4 Repaso de álgebra matricial

2. Análisis exploratorio multivariado

2.1 Estadística multivariadas descriptivas

2.2 Análisis gráfico

3. La distribución normal multivariada

3.1 Propiedades

3.2 Estimación máximo verosímil

3.3 Validación del supuesto de normalidad

3.4 Transformaciones para conseguir normalidad

4. Análisis de componentes principales

4.1 Componentes principales poblacionales

4.2 Reducción de la variabilidad muestral con CP

4.3 Gráficas de los componentes principales

4.4 Inferencias asintóticas para λi y ei.

5. Análisis de clasificación (discriminante)

5.1 Clasificación de dos poblaciones

Page 3: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 3

5.2 Análisis discriminante de Fisher

5.3 Modelo logístico

5.4 Árboles de clasificación

5.5 Redes neuronales

6. Análisis de cúmulos

6.1 Medidas de similaridad

6.2 Métodos jerárquicos

6.3 Métodos no jerárquicos

7. Temas opcionales

7.1 Análisis de factores

7.2 Cópulas

7.3 Análisis de correlación canónica

7.4 Escalamiento multidimensional

7.5 Análisis de correspondencias

REFERENCIA BÁSICA:

Johnson, R. A. & Wichern, D. W. (2002). Applied Multivariate Statistical

Analysis. Prentice Hall: London.

REFERENCIAS ADICIONALES:

Anderson, T.W. (2003). An Introduction to Multivariate Statistical

Analysis. Wiley: New York.

Bluhm, C., Overbeck, L. & Wagner, C. (2003). An Introduction to Credit

Risk Modelling. Chapman & Hall: London.

Elizondo, A. (2003). Medición integral del riesgo de crédito. Limusa:

México.

Hand, D. J. & Jacka, S. D. (1998). Statistics in Finance. Wiley: New York.

Page 4: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 4

Jobson, J. D. (1991). Applied Multivariate Data Analysis. Springer: New

York.

Johnson, D. E. (2000). Métodos multivariados aplicados. ITP International

Thomson Editores: México.

Mardia, K., Kent, J.T. & Bibby, J.M. (1980). Multivariate Analysis.

Academic Press.

Morrison, D. F. (1978). Multivariate Statistical Methods. McGraw-Hill:

Japan.

Press, S. J. (1982). Applied Multivariate Analysis. Krieger Publishing

Company: Florida.

Venables, W. N. & Ripley, B. D. (1998). Modern Applied Statistics with

S-PLUS. Springer: New York.

Seber, G.A.F. (1984). Multivariate Observations. Wiley: New York.

PAQUETES ESTADÍSTICOS: En el curso habrá un paquete estadístico básico,

el cual servirá como herramienta para comprender mejor los conceptos

presentados en clase. Este paquete básico no es exclusivo, si el alumno así

lo desea, puede auxiliarse de cualquier otro paquete estadístico.

Paquete básico: R

Paquetes auxiliares: Splus, SPSS, Statgraphics, Minitab, Matlab

EVALUACIÓN: El curso se avaluará de la siguiente manera:

Examen Parcial - 40%

Trabajo Final - 20%

Examen Final - 40%

Tareas

Page 5: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 5

1. Introducción

¿Qué es el análisis multivariado?

Definición: Análisis Multivariado. Es la parte de la Estadística que se

dedica al estudio de mediciones simultáneas de varias variables. Provee

una metodología para el análisis de este tipo de datos.

El análisis multivariado es mucho más complicado que el análisis

univariado y muchas veces no existe una generalización directa.

Generalmente en análisis multivariado el investigador se dedica a analizar

una base de datos ya existente sin haber controlado el proceso de obtención

de los datos ni la elección de variables a analizar (diseño de experimentos y

diseño muestral).

Algunos de los métodos multivariados están basados en un modelo

probabilístico (normal multivariada), sin embargo existen algunos otros

que sólo están basados en argumento intuitivos.

1.1 Aplicaciones de los métodos multivariados

Las aplicaciones de los métodos multivariados se han incrementado

tremendamente en los últimos años y han expandido las áreas de

aplicación.

Page 6: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 6

Los objetivos para los cuales se han usado los métodos multivariados más

comúnmente son:

1) Reducción de datos o simplificación estructural

2) Clasificación y agrupación: tanto individuos como variables

3) Investigar la dependencia entre variables

4) Predicción

5) Pruebas de hipótesis

Aplicaciones de los métodos multivariados al análisis de riesgos:

1) Z−Score: Análisis de clasificación o análisis discriminante.

Se usa para determinar cuando una empresa es sana o tiene alta

probabilidad de quiebra.

Ref: Elizondo (2003), Cap. 1.

2) Scoring: Componentes principales.

Se usa para evaluar (calificar) el riesgo de una empresa o una cartera o

un individuo.

Ref: Elizondo (2003), Cap. 3.

3) Probabilidad de incumplimiento: Modelos logísticos.

Se usa para modelar la probabilidad de incumplimiento en carteras de

crédito.

Ref: Elizondo (2003), Cap. 2.

4) Modelos de correlaciones (CreditMetrics, KMV-Model): Análisis de

factores.

Se usa para determinar factores comunes en un grupo de variables.

Ref: Bluhm, et al. (2003).

5) Distribuciones de pérdida conjuntas: Cópulas.

Expresar pérdidas conjuntas en términos de pérdidas marginales.

Page 7: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 7

Ref: Bluhm, et al. (2003).

1.2 Organización de los datos

Los datos multivariados surgen cuando un investigador selecciona un

número p≥1 de variables o características a medir.

Los valores de estas variables están medidas para cada individuo, elemento

o unidad experimental.

NOTACIÓN:

p = número de variables

n = número de individuos

Xij = j-ésima variable del i-ésimo individuo

xij = valor observado de la j-ésima variable del i-ésimo individuo

⇒ Si tenemos n mediciones de p variables, es decir, i=1,...,n y j=1,....,p

=

np2n1n

p22221

p11211

xxx

xxxxxx

X

L

MOMM

L

L

X=matriz de datos

Los renglones de la matriz X corresponden a las medicines de las p

variables para cada individuo i, , i=1,...,n. Es decir,

( )ip2i1i'i x,...,x,xx = .

Nota: Todos los vectores son vectores columna.

Page 8: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 8

A lo largo de este curso usaremos dos (o más) bases de datos financieras

para ilustrar los métodos multivariados:

1) Datos de precios de acciones (Stock-Price data):

Consiste de tasas de retorno semanales para 5 acciones que cotizan en la

bolsa de Nueva York, de enero de 1975 a diciembre de 1976.

Xij = Tasas de retorno en la semana i de la acción j

Yij = Precio de cierre de la acción j en la semana i (en viernes)

⇒ j,1i

j,1iijij Y

YYX

−−=

2) Datos financieros de compañías de servicio (Public Utility Data):

Consiste de mediciones financieras de 22 compañías de servicio público

en E. U. en 1975.

3) Datos de “Credit Scoring” (Credit Data):

Consiste de 113 observaciones de 10 características para el

otorgamiento de crédito hipotecario.

o Nota: Las observaciones de datos multivariados deben de ser

independientes de un individuo a otro.

1.3 Variables, vectores y matrices aleatorias

Recordemos:

o X es una variable aleatoria si X es una función medible con dominio en el

espacio muestral (Ω) y contradominio en los números reales (ℜ ), i.e.,

Page 9: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 9

(Ω, ℑ ,P)→X(ℜ ,ß,Px)

X es medible ⇔ Para todo B ∈ ß, ℑ∈∈ωΩ∈ω=− B)(X:)B(X 1

o X es un vector aleatorio de dimensión p si ( ) pp1 :X,,X'X ℜ→Ω= K

medible.

En Estadística, generalmente obtenemos una muestra aleatoria de la

variable de interés. Si la variable de interés es un vector aleatorio, entonces

una m.a. es una colección (X1,…,Xn) de vectores aleatorios independientes

e idénticamente distribuidos tal que ( )ip2i1ii X,,X,X'X K= , i=1,…,n.

En forma matricial, la m.a. se puede expresar como:

=

np2n1n

p22221

p11211

XXX

XXXXXX

X

L

MOMM

L

L

,

donde cada Xij es una v.a., i=1,…,n, j=1,…,p.

NATURALEZA de las v.a.’s:

Sabemos que una v.a. X puede ser tanto continua como discreta. En el caso

ultivariado los vectores aleatorios ( )p1 X,,X'X K= pueden ser:

I. Continuos: Si Xj es una v.a. continua para todo j=1,…,p

II. Discretos: Si Xj es una v.a. discreta para todo j=1,…,p

III. Mixtos: Si Xj es una v.a. continua para algún j’ y Xj es discreta para j≠j’

o Nota: El término mixto también se usa en el contexto de una sola v.a. en

donde una parte es discreta y otra parte es continua.

Page 10: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 10

DISTRIBUCIONES DE VECTORES Y MATRICES ALEATORIAS:

o Sea ( )p1 X,,X'X K= un vector aleatorio de dimensión p×1, entonces

( )p1X,,X x,,xfp1

KK es la función de densidad conjunta

( ) ( )pp11p1X,,X xX,,xXPx,,xFp1

≤≤= KKK es la función de distribución

conjunta

o Independencia: X1,…,Xp son v.a. independientes si y solo si

( ) ( ) ( )pXp1Xp1X,,X xfxfx,,xf1p1

LKK = , ó

( ) ( ) ( )pXp1Xp1X,,X xFxFx,,xF1p1

LKK =

o Sea

=

'X

'X'X

X

n

2

1

M una matriz aleatoria tal que ( )ip2i1ii X,,X,X'X K= son

vectores aleatorios independientes, entonces la función de densidad

conjunta es

( ) ( ) ( )∏∏==

==n

1iip1iX,,X

n

1ii'XX x,,xf'xfxf

ip1iiKK

y la función de distribución conjunta es

( ) ( )∏=

=n

1ii'XX 'xFxF

i

Page 11: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 11

VALORES ESPERADOS Y VARIANZAS:

o Recordemos: Sea X una v.a. de dimensión 1×1, entonces

( )

==µ∑

∫∞

∞−

discreta es X si ,)x(xf

continua es X si ,dx)x(xfXE

x

X

( )( ) ( )

( ) ( )

µ−

µ−==σ

∫∞

∞−

discreta es X si ,xfx

continua es X si ,dxxfxXVar

x

2

2

2X

Nota: ( ) ( ) ( ) 222 XEXEXVar µ−=µ−=

o Sea ( )21 X,X'X = un vector aleatorio de dimensión 2×1, entonces

Covarianza:

( ) ( )( ) ( ) 212122112112 XXEXXEX,XCov µµ−=µ−µ−==σ ,

donde, ( )jj XE=µ , j=1,2

( )( ) ( )

( )( ) ( )

µ−µ−

µ−µ−=σ∑

∫∞

∞−

discretasson Xy X si ,x,xfxx

continuasson Xy X si ,dxdxx,xfxx

21x

21X,X2211

212121X,X2211

12

21

21

¿Qué pasa cuando X1 es continua y X2 es discreta?

Coeficiente de correlación:

2211

1212 σσ

σ=ρ , con 112 ≤ρ

o Si X1 y X2 son v.a.’s independientes ⇒ ( ) 0X,XCov 21 = ( ρ12=0 )

Page 12: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 12

Nota: La implicación inversa no es cierta generalmente, sólo en el caso

normal bivariado.

o Sea ( )p1 X,,X'X K= un vector aleatorio de dimensión p×1, entonces

Vector de medias:

µ

µµ

=

==µ

p

2

1

p

2

1

)X(E

)X(E)X(E

)X(EMM

Matriz de varianzas y covarianzas:

( )

µ−µ−µ−

µ−

µ−µ−

=Σ pp2211

pp

22

11

X,...,X,X

X

XX

EM

( ) ( )( ) ( )( )( )( ) ( ) ( )( )

( )( ) ( )( ) ( )

µ−µ−µ−µ−µ−

µ−µ−µ−µ−µ−

µ−µ−µ−µ−µ−

2pp22pp11pp

pp222

221122

pp1122112

11

XXXXX

XXXXXXXXXX

E

L

MOMM

L

L

σσσ

σσσσσσ

pp2p1p

p22221

p11211

L

MOMM

L

L

Nota: Σ=Var(X) =Cov(X,X) y Σ’ =Σ

o Es importante reescribir la información dada por Σ en términos

estandarizados

Page 13: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 13

( )iii XVar=σ y ( )jiij X,XCov=σ

⇒ ( )jjii

ijjiij X,XCorr

σσ

σ==ρ , i,j=1,...,p.

Esta información se puede escribir en una matriz:

Matriz de correlaciones:

ρρ

ρρρρ

==Ρ

1

11

)X(Corr

2p1p

p221

p112

L

MOMM

L

L

o Si definimos a V1/2, la matriz de desviaciones estándar, como

σ

σσ

=

pp

22

11

2/1

00

0000

V

L

MOMM

L

L

⇒ 2/12/1

2/12/1

VVVV

−− Σ=ΡΡ=Σ

PROPIEDADES DE ESPERANZAS Y VARIANZAS:

Sean X y Y dos vetores aleatorios de dimensión p×1 y sean A y B

matrices constantes de dimensión p×p, entonces

1) E(A)=A

2) E(AX+BY) =AE(X)+BE(Y)

3) E(AXb’) =AE(X)b’, b=vector de constantes de dimensión p×1

4) E(X’AX)=E(X)’AE(X)+trAVar(X)

5) Var(A) =0

6) Var(AX) =AVar(X)A’

7) Cov(AX,BY) =ACov(X,Y)B’

Page 14: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 14

1.4 Repaso de álgebra matricial

Sugerencia: Ver apéndice de conocimientos básicos de álgebra matricial

(Suplemento 2A de Jonson & Wichern, 2002).

Algunos resultados importantes que necesitaremos a lo largo del curso son:

o Descomposición espectral de una matriz: A(p×p)

∑=

λ=ΡΛΡ=p

1iiii 'ee'A ,

donde ( )p21 e,,e,e K=Ρ , ei = i-ésimo eigenvector de A

I'' =ΡΡ=ΡΡ (i.e., Ρ es ortonormal)

λ

λλ

p

2

1

00

0000

L

MOMM

L

L

, λi=i-ésimo eigenvalor de A

o Inverso de una matriz: A(p×p)

∑=

−−

λ=ΡΡΛ=

p

1iii

i

11 'ee1'A

debido a que ( )( ) ( ) I''I''AA 11 =ΡΡ=ΡΡ=ΡΛΡΡΡΛ= −−

Nota: Otra forma de calcular A−1 es:

)A(Adj)Adet(

1A 1 =− , donde )'A(Cofac)A(Adj =

Page 15: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 15

o Raíz cuadrada de una matriz: A(p×p), λi > 0, para i=1,...,p (i.e., A definida

positiva)

∑=

λ=ΡΡΛ=p

1iiii

2/12/1 'ee'A

tal que ( )( ) ( ) A'''AA 2/12/12/12/1 =ΡΛΡ=ΡΡΛΡΡΛ=

o Desigualdad de Cauchy Schwartz: Sean x, y dos vectores de dimensión

p×1, entonces

( ) ( )( )y'yx'xy'x 2 ≤

con igualdad si y solo si x=cy, para algun c escalar.

DEM...

o Teorema: Maximización de formas cuadráticas en la esfera unitaria.

Sea B(p×p) una matriz definida positiva con eigenvalores 0p21 >λ≥λ≥λ L

y correspondientes eigenvectores e1,e2,...,ep. Entonces,

10x x'xBx'xmax λ=

≠ (se alcanza cuando x=e1)

p0x x'xBx'xmin λ=

≠ (se obtiene cuando x=ep)

Más aún,

1ke,,ex x'xBx'xmax

k1+

⊥λ=

K (se obtiene cuando x=ek+1, k=1,...,p−1)

donde ⊥=ortogonal (perpendicular).

DEM...

Page 16: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 16

o Nota: Para un x≠0, si x'x

xxxx0 == , i.e. x0 es el vector normalizado de x

(x0 se encuentra en el círculo unitario) ⇒ 00 Bx'xx'x

Bx'x=

Page 17: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 17

2. Análisis exploratorio multivariado

2.1 Estadísticas multivariadas descriptivas

Las estadísticas multivariadas descriptivas sirven para apreciar la

información contenida en un conjunto de datos mediante el cálculo de

ciertos números resumen (estadísticas).

Nos concentraremos en estadísticas descriptivas de localización, dispersión

y de relación lineal.

Formalmente, un conjunto de datos es una realización de una muestra

aleatoria n21 X,...,X,X de tamaño n de una distribución multivariada. Es

decir,

( )ip2i1i'i X,...,X,XX = para i=1,...,n.

Cada Xi es un vector aleatorio de dimensión p×1.

o Finalmente, el conjunto de datos X se puede escribir como:

=

np2n1n

p22221

p11211

XXX

XXXXXX

X

L

MOMM

L

L

,

donde X es una matriz aleatoria.

Page 18: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 18

MEDIA MUESTRAL: Vector de dimensión p×1

∑=

=n

1iiX

n1X ,

es decir,

++

=

=

np

2n

1n

p1

12

11

p

2

1

X

XX

X

XX

n1

X

XX

XM

LMM

.

Esto implica que, para j=1,...,p

∑=

=n

1iijj X

n1X .

Propiedades:

( ) µ=XE ,

donde µ es el vector de medias poblacional de dimensión p×1

( ) ( ) Σ==n1XVar

n1XVar i ,

donde Σ es la matriz de varianzas y covarianzas de Xi.

DEM...

R: mean, colMeans, apply−mean

VARIANZA MUESTRAL: Matriz de dimensión p×p

( )( )

−−−

= ∑=

n

1i

'ii XXXX

1n1S ,

que en términos matriciales se puede escribir como:

Page 19: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 19

( ) ( )'X1X'X1X1n

1S ' −−−

= ,

donde ( )1,,1'1 1n K=× . Alternativamente,

=

pp2p1p

p22221

p11211

SSS

SSSSSS

S

L

MOMM

L

L

,

donde, ( )∑=

−−

=n

1i

2jijjj XX

1n1S , para j=1,2,...,p, y

( )( )∑=

−−−

=n

1ijijkikkj XXXX

1n1S , para k≠j=1,2,...,p.

Propiedades:

( ) Σ=SE ,

donde Σ es la matriz de varianzas y covarianzas poblacional

DEM...

R: var

o Varianza generalizada: Existen dos formas para resumir la información de

la matriz S:

1) )Sdet(S =

2) tr(S)

Casos particulares:

a) Si n≤p ⇒ |S|=0

b) Si Var(a’X)>0 para todo a≠0 y p<n ⇒ Rango(S)=p y |S|>0, c.p.1

Page 20: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 20

CORRELACIÓN MUESTRAL: La correlación muestral no tiene una expresión

en forma de producto de matrices, pero

=

1rr

r1rrr1

R

2p1p

p221

p112

L

MOMM

L

L

donde, jjkk

kjkj SS

Sr = , para k≠j=1,2,...,p.

Propiedades:

1) -1 ≤ rkj ≤ 1

2) ( ) Ρ≠RE .

R: cor

OTRAS ESTADÍSTICA DESCRIPTIVAS: Cuantiles, cuartiles, coeficientes de

variación, etc. pueden ser calculados para cada una de las variables como

en el caso univariado.

R: summary

Page 21: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 21

2.2 Análisis gráfico

DIAGRAMAS DE DISPERSIÓN (bidimensional).

Este tipo de diagrama consiste en graficar simultáneamente en dos

dimensiones diagramas de dispersión entre todas las posibles parejas de

variables.

R: plot, pairs

DIAGRAMAS DE DISPERSIÓN (tridimensional)

Este tipo de diagrama consiste en graficar en tres dimensiones tres

variables simultáneamente.

R: brush, Graph > 3D Plot > 3D Scatter Plot

DIAGRAMA DE BURBUJAS (tridimensional)

Este tipo de diagrama consiste en graficar en dos dimensiones tres

variables en forma de burbujas de la siguiente manera: El eje de las X's

corresponde a una de las variables, el eje de las Y's corresponde a otra de

las variables, y la tercer variable quedará representada por el tamaño de la

burbuja.

R: symbols

DIAGRAMA DE ESTRELLAS (multidimensional)

Suponga que los datos toman valores no negativos con p≥2. En dos

dimensiones se pueden construir círculos (imaginarios) de una radio fijo

con p rayos igualmente espaciados saliendo del centro del círculo. Las

longitudes de los rayos representan el valor de las variables. Los rayos

pueden ser conectados para formar una estrella. Cada estrella representa

Page 22: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 22

una observación multivariada. El orden de las variables es en contra de las

manecillas del reloj empezando a las 3 horas (esto varia dependiendo del

paquete). Es recomendable estandarizar las variables antes de hacer el

diagrama:

jj

jijijij S

XXZX

−=→ , i=1,...,n, j=1,...,p.

R: stars

CARAS DE CHERNOFF (multidimensional)

Chernoff sugirió representar observaciones p−variadas como una cara

bidimensional, cuyas características (forma de la cara, curvatura de la boca,

largo de la nariz, tamaño del ojo, posición de la pupila, etc.) están

determinadas por los valores de las p variables. Distinto ordenamiento de

las variables dan una representación diferente.

R: faces

DIAGRAMA DE ANDREWS (multidimensional)

Este tipo de diagrama consiste en representar a la observación i-ésima de

un vector aleatorio p-variado ( )ip2i1i'i x,...,x,xx = como una función, i.e.,

L+++++= )t2cos(x)t2(senx)tcos(x)t(senx2

x)t(f 5i4i3i2i1i

i

para π<<π− t .

El diagrama de Andrews se construye graficando las n funciones fi(t),

i=1,...,n sobre una misma gráfica en dos dimensiones. Es recomendable

estandarizar las variables. Distintos ordenamientos de las variables dan

representaciones diferentes.

Page 23: ANÁLISIS MULTIVARIADO PARA RIESGOS - ITAMallman.rhon.itam.mx/~lnieto/index_archivos/NotasAMR1.pdf · Consiste de tasas de retorno semanales para 5 acciones que cotizan en la bolsa

PROFESOR: LUIS E. NIETO BARAJAS

Maestría: Administración de riesgos Análisis multivariado para riesgos 23

NOTAS FINALES:

Los diagramas de estrellas, las caras de Chernoff y el diagrama de

Andrews nos sirven para resolver los siguientes objetivos:

o Encontrar una agrupación inicial de individuos

o Detectar observaciones multivariadas extremas

o Verificar o validar una agrupación obtenida por algún método de obtención

de cúmulos (cluster analysis).