FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la...

46
UNIVERSIDAD VERACRUZANA FACULTAD DE ESTADÍSTICA E INFORMÁTICA Modelación de los Retornos del Índice de Precios y Cotizaciones de México con la Distribución Pareto y Censura de Tipo II TESIS Que para obtener el Título de: Licenciado en Ciencias y Técnicas Estadísticas PRESENTA: Genoveva Lorenzo Landa ASESOR: Dr. Héctor F. Coronel Brizio Xalapa-Enríquez, Ver. Diciembre 2011

Transcript of FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la...

Page 1: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

UNIVERSIDAD VERACRUZANA

FACULTAD DE ESTADÍSTICA E INFORMÁTICA

Modelación de los Retornos del Índice de Precios y Cotizaciones de

México con la Distribución Pareto y Censura de Tipo II

TESIS

Que para obtener el Título de:

Licenciado en Ciencias y Técnicas Estadísticas

PRESENTA:

Genoveva Lorenzo Landa

ASESOR:

Dr. Héctor F. Coronel Brizio

Xalapa-Enríquez, Ver. Diciembre 2011

Page 2: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

ii

AGRADECIMIENTOS

Este trabajo fue realizado bajo la supervisión del Dr. Héctor Fco Coronel Brizio. A él

quiero agradecerle profundamente, haber aceptado dirigir esta tesis, todos los

conocimientos que de él he recibido y lo más importante: su entrañable amistad.

Finalmente agradezco a mis sinodales por haber dedicado tiempo a la revisión de

este trabajo:

Dr. Sergio Fco Juárez Cerrillo

M. en C. Jesús Hernández Suarez

Page 3: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

iii

Para Ximena Desirée

Page 4: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

iv

RESUMEN

En el presente documento se demuestra que la distribución Pareto es un modelo

adecuado para los retornos del Índice de Precios y Cotizaciones (IPC) de México.

Lo adecuado de esta distribución se evalúa con la prueba de bondad de ajuste de

Anderson-Darling para la distribución Pareto con datos con censura de tipo II. Esta

prueba fue desarrollada por Coronel-Brizio y Hernández-Montoya (2010). La

distribución Pareto ajustada a los retornos del IPC proporciona un instrumento de

análisis de riesgo del mercado accionario y bursátil de México.

Page 5: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

v

CONTENIDO

1.INTRODUCCIÓN ..................................................................................................... 1

1.1 El IPC de México ................................................................................................ 1

1.2 Riesgo Financiero ................................................................................................ 4

1.3 Ley de Potencia para el IPC ................................................................................ 8

1.4 Pruebas de Bondad de Ajuste ............................................................................ 11

1.4.1 Prueba Ji-Cuadrada ..................................................................................... 12

1.4.2 Prueba de Kolmogorov-Smirnov ................................................................ 15

1.4.3 Prueba de Anderson-Darling ...................................................................... 18

1 . 5 Objetivo de la Tesis ......................................................................................... 19

1.6 Estructura de la Tesis ........................................................................................ 19

2.PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN PARETO .... 21

2.1 La Distribución Pareto ...................................................................................... 21

2.2 Estimación de Máxima Verosimilitud con Censura Tipo II ............................. 23

2.3 Prueba de Anderson-Darling ............................................................................. 25

2.4 Procedimiento de Prueba................................................................................... 26

3.MODELO PARA EL IPC MEXICANO ................................................................. 28

3.1 Resultados ......................................................................................................... 28

3.2 Valor en Riesgo VaR ........................................................................................ 32

3.2 Conclusiones ..................................................................................................... 34

REFERENCIAS ......................................................................................................... 35

RUTINAS EN S-PLUS .............................................................................................. 36

Page 6: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

Capítulo 1

INTRODUCCIÓN

El propósito de este capítulo es introducir el problema que motiva a este

trabajo: proporcionar un instrumento de manejo de riesgo financiero en el medio

bursátil mexicano. Este problema se traduce en ajustar una distribución de

probabilidad a las colas de la distribución de los retornos del Índice de Cotizaciones y

Precios de México. Se presenta una justificación de la distribución Pareto como

modelo para las colas de los retornos. También se presenta brevemente la

metodología básica de las pruebas de bondad de ajuste. La discusión en las Secciones

1.1 y 1.2 está basada en Cano (2010).

1.1 El IPC de México

Los índices de precios se integran por muestras de acciones del mercado que

se consideran representativas de éste debido a diversos factores, entre los que

destacan el tamaño de las empresas emisoras de las acciones así como su importancia

dentro del sector económico. En el medio bursátil, los índices sirven como medio de

pronóstico de precios. En el mercado financiero internacional destacan los índices de

las economías más fuertes, entre estos el Standard & Poors (S&P), el Índice Industrial

(Dow Jones), y el Nikkei de Japón.

En México el principal indicador que calcula la Bolsa Mexicana de Valores

(BMV) es el Índice de Precios y Cotizaciones (IPC). El IPC expresa el rendimiento

del mercado accionario en función de las variaciones de precios de una muestra de 35

Page 7: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

2

acciones que cotizan en la BMV (véase la Tabla 1.1) y operan en diferentes sectores

de la economía. Esta muestra de emisiones es una muestra balanceada, ponderada y

representativa del conjunto total de acciones cotizadas en la Bolsa.

El IPC es un fiel indicador de las fluctuaciones del mercado accionario

mexicano y tiene como principal objetivo ser un indicador representativo de este

considerando dos conceptos fundamentales: 1) Representatividad.- La muestra que lo

compone, refleja el comportamiento y la dinámica operativa del mercado mexicano.

2) Invertibilidad.- Las series accionarias que lo integran cuentan con las cualidades de

operación y liquidez que facilitan las transacciones de compra y venta para responder

a las necesidades del mercado mexicano.

El IPC se calcula con la siguiente fórmula:

(∑

∑ )

donde:

índice en el día

Precio de la serie accionaria en el día

Acciones de la serie accionaria en el día

Factor de ajuste por acciones flotantes de la serie accionaria

Factor de ajuste por ex-derechos de la serie accionaria en el día

La siguiente tabla muestra las 35 series accionarias que conforma la muestra del IPC

al cierre del 8 de diciembre del 2011.

Page 8: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

3

Emisora Serie Precio Anterior Ultimo PPP

AC * 60.38 59.53 59.69

ALFA A 164.59 161.50 161.73

ALSEA * 13.91 13.91 13.88

AMX L 15.97 15.55 15.61

ARA * 3.86 3.79 3.77

ASUR B 78.25 77.69 77.69

AXTEL CPO 4.37 4.29 4.30

AZTECA CPO 8.73 8.75 8.67

BIMBO A 28.24 28.00 28.00

BOLSA A 24.04 23.84 23.83

CEMEX CPO 6.86 6.54 6.54

CHDRAUI B 33.98 33.25 33.26

COMERCI UBC 21.22 21.09 21.06

COMPARC * 18.21 18.10 18.13

ELEKTRA * 1,389.41 1,390.00 1,389.60

FEMSA UBD 92.29 91.30 91.25

GAP B 47.50 47.84 47.82

GEO B 17.38 16.95 17.04

GFNORTE O 45.28 44.10 44.26

GMEXICO B 37.90 37.50 37.45

GMODELO C 88.90 88.95 88.48

GRUMA B 27.58 27.25 27.24

HOMEX * 32.34 32.10 31.88

ICA * 18.78 18.09 18.09

KIMBER A 73.60 74.00 73.62

LAB B 28.72 28.00 27.96

LIVEPOL C-1 98.03 98.97 98.96

MEXCHEM * 46.57 46.50 46.30

MFRISCO A-1 53.46 54.56 54.14

OHLMEX * 22.17 21.59 21.70

PE&OLES * 616.97 613.00 612.69

SORIANA B 33.31 32.07 32.24

TLEVISA CPO 56.84 56.69 56.66

URBI * 16.58 16.35 16.31

WALMEX V 36.99 37.45 37.29

Tabla 1.1 Emisoras que se usan para calcular el IPC, al cierre de 8/12/2011.

Page 9: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

4

1.2 Riesgo Financiero

Dentro de un mercado financiero los instrumentos financieros se valoran de

acuerdo a su rendimiento y riesgo. El rendimiento o rentabilidad de un instrumento

financiero (ya sea un bono, una acción) en un período de tiempo dado ,

denotado por , se determina por el incremento del precio de la acción entre el

período final y el período inicial , con respecto al periodo inicial

El retorno en el tiempo t es el rendimiento expresado en relación al tiempo anterior

Las políticas económicas de una economía de mercado, es decir una economía

donde gobierna el mercado, poco pueden hacer ante la volatilidad de los mercados en

un corto plazo, ya que esta volatilidad se determina fuera del área de influencia

directa de estas políticas. Es así como, junto a la integración financiera global, la

volatilidad en los mercados financieros se ha convertido en un tema de particular

relevancia para los diferentes agentes económicos.

Para anticipar la volatilidad de los mercados, se ha desarrollado metodología

estadística para cuantificar el riesgo. Esta metodología se denomina Valor en Riesgo

(VaR). Sin embargo, la metodología VaR no considera a los eventos extremos ya que

se enfoca en toda la distribución de los retornos. Por lo que se requiere de

metodología para un mejor manejo del riesgo financiero, en particular, de modelos

Page 10: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

5

que permitan analizar el comportamiento de los retornos extremos de los diversos

instrumentos financieros.

Bajo el supuesto de que los inversionistas son adversos al riesgo, tendríamos

que estos estarían dispuestos a asumir cierto nivel de riesgo siempre y cuando

obtengan compensaciones adicionales por este riesgo. Es decir, existe un efecto de

trade-off entre el riesgo y la utilidad esperada. En situaciones de crisis financiera,

como la que está ocurriendo actualmente desde el 2008, dicha compensación se eleva

aún más. En este contexto de trade-off entre el riesgo y la utilidad, los instrumentos

financieros se valoran de acuerdo con el rendimiento que ofrecen y el riesgo que se

deriva de ellos. La volatilidad de los precios financieros principales se percibe como

principal medida del riesgo financiero y, por lo tanto, se utiliza para tomar decisiones

de inversión.

Uno de los objetivos del manejo del riesgo financiero es el cálculo adecuado

de las magnitudes y probabilidades de grandes pérdidas así como anticipar eventos

extremos tales como choques financieros y crisis monetarias. En este sentido, el

manejo del riesgo se traduce en estimar el VaR, el cual es básicamente el cuantil de

una distribución o un proceso subyacente.

La importancia del manejo del riesgo financiero está en que permite estimar

posibles movimientos extremos del mercado financiero. El objetivo del análisis del

riesgo financiero es cuantificar el movimiento probabilístico de grandes pérdidas

inusuales y desarrollar herramientas para el manejo de riesgos extremos.

En este trabajo nos enfocamos en el análisis del riesgo financiero derivado de

la volatilidad del mercado de valores medido a través del IPC. Este tipo de riesgo se

Page 11: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

6

conoce como riesgo de mercado, y es el riesgo de que el valor de una inversión

disminuya al mismo tiempo que los movimientos en el mercado.

En el panel superior de la Figura 1.1 observamos el comportamiento del IPC

al cierre, desde el 11 de noviembre de 1991 hasta el 29 de noviembre del 2011. Se

excluyen sábados y domingos, ya que en estos días no labora el mercado mexicano.

En total se tienen 5012 observaciones. Se puede apreciar un pronunciado crecimiento

del valor promedio de las acciones a partir del año 2003. Esto es producto de

reformas financieras realizadas principalmente durante el gobierno de Carlos Salinas

de Gortari cuando se realizó la desregulación del sistema financiero. De este proceso

de desregularización cabe mencionar la Ley de Instituciones de Crédito y la Ley

Reguladora para Grupos Financieros en 1990 y la autonomía del Banco de México a

partir de 1994. Así también, el sistema financiero mexicano, una vez sentadas las

bases para su modernización, se ve beneficiado por la puesta en marcha del Tratado

de Libre Comercio para Norte América.

Los retornos para el IPC se definen por

donde es el valor de cierre del IPC en el tiempo . En el panel inferior de la Figura

1.1 se presentan los retornos diarios del IPC para el mismo período de tiempo.

Podemos observar que el retorno negativo más elevado fue de –0.143 y se alcanzó

durante los últimos meses de 1997. En 1999 hubo otro salto importante y a

continuación se redujo la volatilidad en el mercado accionario. Debido al choque

financiero global que desde el 2008 y hasta la actualidad afecta a las economías del

mundo, vemos que la volatilidad volvió a aumentar significativamente desde finales

de 2008, alcanzó sus niveles más extremos en el 2009, para bajar un poco en el 2010

Page 12: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

7

y el 2011. La Figura 1.2 muestra a los retornos del IPC estandarizados, que son

propiamente los datos que se analizan en el Capítulo 3.

En los retornos del IPC se puede observar mejor la volatilidad del mercado

accionario. Por lo que el análisis en este trabajo se enfoca al estudio del

comportamiento de los retornos diarios del IPC. En concreto, buscamos estimar el

VaR de estos retornos utilizando la distribución de ley de potencia también llamada

distribución de Pareto.

Tiempo

IPyC

Cie

rre

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

50

00

15

00

03

50

00

Tiempo

Reto

rnos

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

-0.0

60

.02

0.1

0

Figura 1.1. IPC de México, del 8/11/1991 al 29/11/2011. Arriba: Cierres. Abajo:

Retornos. Fuente: http://mx.finance.yahoo.com/q/hp?s=%5EMXX

Page 13: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

8

-4 -2 0 2 4 6 8

02

00

40

06

00

80

01

00

01

20

0

Retornos del IPyC

Figura 1.2. Retornos estandarizados del IPC de México, de 8/11/1991 a 29/11/2011.

Fuente: http://mx.finance.yahoo.com/q/hp?s=%5EMXX

1.3 Ley de Potencia para el IPC

Se dice que una cantidad sigue la ley de potencia cuando la probabilidad de medir un

valor de esta cantidad varía inversamente como una potencia del valor. Para entender

esto, veamos el histograma a la izquierda en la Figura 1.3. Este histograma presenta

la población de los municipios de México con una población mayor a 1,000

habitantes. Vemos que el histograma tiene un pronunciado sesgo hacia la derecha.

Esto indica que la mayoría de los municipios en México tiene una población

relativamente pequeña mientras que son unos cuantos municipios que tiene población

mucho mayor que la mayoría de los municipios. Sea la fracción de

municipios que tiene una población entre y habitantes. El histograma a la

izquierda en la Figura 1.3 muestra los mismos datos que en le histograma de la

derecha pero en una escala log-log. Vemos que un interesante patrón sale a relucir,

este histograma es aproximadamente una línea recta en la escala log-log. Es decir

Page 14: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

9

, donde y son constantes. Si exponenciamos ambos lados

de esta última expresión tenemos donde . Esto motiva a las

distribuciones de probabilidad de la forma

(1)

Las distribuciones de probabilidad que siguen la forma (1) se llaman distribuciones

de la ley de potencia. La constante se llama el exponente de la ley de potencia. La

constante es sólo una contante normalizadora para que integre 1.

Poblacion

Por

cent

aje

5*10^5 10^6 1.5*10^6

020

4060

80

log(Poblacion)

log(

Por

cent

aje)

11.5 12.0 12.5 13.0 13.5 14.0 14.5

-20

24

Figura 1.3. Izquierda: Histograma de las poblaciones de los 2322 municipios de

México con una población mayor a 1,000 habitantes. Derecha: Histograma con los

mismos datos pero una escala log-log. Fuente: Censo de Población INEGI 2000.

Page 15: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

10

Las distribuciones de ley de potencia aparecen en una gran cantidad de

fenómenos en física, biología, demografía, ciencias de la Tierra, economía, finanzas,

por mencionar sólo algunas de las áreas en que aparece. En este trabajo se formula

la hipótesis de que las colas de la distribución de los retornos del IPC, véase el

histograma en la Figura 1.2, se describen adecuadamente por distribuciones de ley de

potencia.

Para explorar la hipótesis de ley de potencia para los retornos utilizamos los

histogramas en las figuras 1.4 y 1.5. Vemos el comportamiento lineal en los

histogramas en escala log-log, lo cual da evidencia de soporte empírico de que la ley

de potencia es un modelo que describe adecuadamente a los retornos del IPC.

Retornos

Por

cent

aje

3 4 5 6 7 8 9

020

4060

log(Retornos)

log(

Por

cent

aje)

1.2 1.4 1.6 1.8 2.0 2.2

01

23

4

Figura 1.4 Izquierda: Histograma de los retornos positivos del IPC. Derecha:

Histograma de los mismos datos pero en una escala log-log.

Page 16: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

11

Retornos

Por

cent

aje

2.5 3.0 3.5 4.0 4.5 5.0

1020

3040

50

log(Retornos)

log(

Por

cent

aje)

1.0 1.2 1.4 1.6

1.5

2.0

2.5

3.0

3.5

4.0

Figura 1.5 Izquierda: Histograma de los retornos negativos (valor absoluto) del IPC.

Derecha: Histograma de los mismos datos pero en una escala log-log.

1.4 Pruebas de Bondad de Ajuste

Como ya se mencionó en la sección anterior, en este trabajo se busca ajustar

una distribución de ley de potencia a los retornos del IPC. Esto se hará postulando

como modelo a la distribución Pareto, ajustándola a los retornos y evaluando la

bondad del ajuste obtenido. Esto nos conduce a las llamadas pruebas de bondad de

ajuste. Estas pruebas son procedimientos que permiten decidir si un conjunto de datos

observados es consistente con una distribución de probabilidad dada. Generalmente

estas pruebas miden el grado de ajuste que existe entre la función de distribución de

los datos y la distribución teórica que se supone debe seguir esa muestra.

Una forma de obtener una muestra con censura tipo II a partir de una muestra,

es seleccionando a los r estadísticos de orden más grandes de la muestra. Este

procedimiento es precisamente el que se llevará a cabo cuando centremos la atención

en la cola derecha (izquierda) de la distribución de los retornos.

Page 17: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

12

Formalmente una prueba de bondad de ajuste es un procedimiento para probar

la siguiente hipótesis: Sea una muestra aleatoria de una distribución y

sea es una distribución completamente especificada a excepción posiblemente de

sus parámetros. Una prueba de bondad de ajuste es una pruebe estadística de la

siguiente hipótesis nula

(2)

Algunas de las pruebas de bondad de ajuste más utilizas son la prueba ji-cuadrada, la

prueba de Kolmogorov-Smirnov, y la prueba de Anderson-Darling. La primera

prueba se emplea tanto para distribuciones continuas como discretas, mientras que la

de Kolmogorov-Smirnov y la de Anderson-Darling son para distribuciones

absolutamente continuas.

1.4.1 Prueba Ji-Cuadrada

La distribución ji-cuadrada tiene muchas aplicaciones en inferencia

estadística, por ejemplo se utiliza en la estimación de varianza y para probar

homogeneidad e independencia en tablas de contingencia.

Para probar la hipótesis (1) el rango de se particiona en intervalos y se

calculan las frecuencias observadas en cada intervalo. Luego se calculan

las frecuencias esperadas en cada intervalo bajo la distribución . El

estadístico de prueba está dado por

Page 18: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

13

Tenemos que donde es la probabilidad de que una observación caiga en

el intervalo . Por ejemplo, si es continua y es su densidad, entonces

Vemos que la prueba ji-cuadrado se basa en la comparación entre la frecuencia

observada en un intervalo y la frecuencia esperada en dicho intervalo, esta frecuencia

esperada se calcula de acuerdo con la distribución formulada en la hipótesis nula. El

estadístico de prueba determina si las frecuencias observadas en la muestra están lo

suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula. Vemos que

cuanto más se aproxima a cero el valor de , mejor será el ajuste de a los datos

observados. Si las diferencias entre las frecuencias observadas y esperadas son

significativas, entonces el valor del estadístico será grande indicando que se

debe rechazar.

La distribución asintótica de es la ji-cuadrada con grados de libertad

si está completamente especificada. Por otro lado, si se tienen que estimar

parámetros de , entonces la distribución asintótica de es la ji-cuadrada con

grados de libertad. Generalmente se requiere la condición de que todas las

frecuencias observadas sean mayores o iguales a cinco. Cuando no se dé esta

condición hay que proceder a un reagrupamiento con otros intervalos hasta que se

cumpla la condición.

Como ya se mencionó, la prueba ji-cuadrada se puede aplicar para cualquier

distribución ya sea discreta o continua. También es recomendable, para una mejor

calidad de la aproximación a través de la distribución asintótica, que los intervalos se

construyan de tal manera que sus probabilidades sean aproximadamente iguales.

Page 19: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

14

Para ilustrar a la prueba ji-cuadrada, consideremos a la Tabla 1.2 que presenta

los pesos de 61 estudiantes hombres de la licenciatura en Geografía de la U.V. La

Figura 1.6 muestra el histograma de los pesos de la Tabla 1.1.

____________________________________________________________________

90 63 60 63 62 78 80 70 59 55 70 74 49 57 74 69 74 68 86 64 95 72

85 70 65 60 72 68 40 50 66 59 68 75 83 70 71 63 55 69 74 68 60 53

50 80 63 63 78 86 64 95 72 85 60 70 68 68 83 69 71

____________________________________________________________________

Tabla 1.2 Pesos de 61 hombres estudiantes de Geografía.

Interesa probar si los pesos pueden ser bien representados por una distribución

normal con media kg y desviación estándar kg. De modo que la

hipótesis nula es

es una distribución normal con y .

40 50 60 70 80 90

05

10

15

Peso

Figura 1.6. Pesos de 61 hombres estudiantes de Geografía.

Page 20: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

15

Las probabilidades están dadas por

√ ,

(

)

-

Al realizar la prueba con S-Plus, se obtiene los resultados presentados en la siguiente

tabla.

____________________________________________________________________________

Chi-square Goodness of Fit Test

data: Peso in HombresGeog

Chi-square = 3.1803, df = 4, p-value = 0.5281

alternative hypothesis: True cdf does not equal the normal Distn. for at

least one sample point.

____________________________________________________________________________

Tabla 1.3 Resultados de la prueba ji-cuadrada arrojados por S-Plus.

El estadístico de prueba es y el valor-p es , por lo que no se

rechaza y se concluye que se puede usar una distribución normal con media 68 y

desviación estándar 11 para describir a los pesos de los estudiantes.

1.4.2 Prueba de Kolmogorov-Smirnov

Sea una muestra aleatoria de la distribución . La función de

distribución empírica se define por

donde

Page 21: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

16

{

Sean los estadísticos de orden observados de la muestra

aleatoria. El estadístico de prueba de la prueba de Kolmogorov-Smirnov (KS) es

| | { [ ( ) (

)

]}

Vemos que el estadístico de prueba es la distancia vertical más grande entre la

función de distribución empírica y la distribución . La hipótesis nula se rechaza

para valores grandes de . Se demuestra que

(√ ) ∑

De modo que la prueba de KS es de distribución libre en el sentido de que los valores

críticos no dependen de la distribución La hipótesis nula (2) se rechaza con un

nivel de significancia si , donde el valor crítico se encuentra tabulado

en las tablas de la prueba de KS. La prueba de KS es aplicable para variables

aleatorias continuas; y es de especial interés para muestras pequeñas en las cuales no

es factible aplicar la prueba ji-cuadrada.

Ilustramos a la prueba K-S con los mismos datos de la Tabla 1.1 y la misma

hipótesis de normalidad. La Figura 1.7 muestra la función de distribución empírica

de los datos de la Tabla 1.1 (función escalonada) junto con la función de distribución

de la normal con media 68 y desviación estándar 11.

Page 22: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

17

Peso

40 50 60 70 80 90

0.0

0.2

0.4

0.6

0.8

1.0

Figura 1.7. Función de distribución empírica de los pesos junto con la distribución

normal con media 68 kg y desviación estándar 11 kg.

Al realizar la prueba de KS con S-Plus se obtienen los siguientes resultados.

____________________________________________________________________

One-sample Kolmogorov-Smirnov Test

Hypothesized distribution = normal

data: Peso in HombresGeog

ks = 0.1066, p-value = 0.4927

alternative hypothesis: True cdf is not the normal distn. with the specified

parameters

____________________________________________________________________________

Tabla 1.4 Resultados de la prueba KS arrojados por S-Plus.

El valor observado del estadístico de prueba es y el valor-p es 0.4927,

por lo que no se rechaza , y se concluye que los pesos se pueden representar

adecuadamente con una distribución normal con media y desviación estándar

.

Page 23: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

18

1.4.3 Prueba de Anderson-Darling

La prueba de Anderson-Darling (ver Stephens, 1986) se utiliza para probar si

una muestra de los datos proceden de una distribución absolutamente continua con

vector de parámetros . El estadístico de prueba de Anderson-Darling pertenece a una

clase de medidas de discrepancia, conocidas como estadísticas cuadráticas

donde es la función de distribución empírica de la muestra aleatoria y

es una función que pondera a las discrepancias cuadradas. Cuando , el

estadístico se conoce como la estadística de Cramér-von Mises. La estadística de

Anderson-Darling (1954) se obtiene con { } La

estadística de Anderson-Darling utiliza a la distribución para el cálculo de valores

críticos. Esto tiene la ventaja de que se obtiene una prueba más sensible que la de KS.

Sin embargo, tiene la desventaja de que los valores críticos deberán calcularse para

cada distribución .

El estadístico de prueba de Anderson-Darling está dado por

∑ [ ( ) ( )]

donde . Cuando la distribución está completamente especificada

(no hay parámetros que estimar) la distribución de no depende de aunque si

depende de . Cuando el parámetro se estima La distribución además de depender de

, también depende de la estimación del parámetro.

Page 24: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

19

Probamos la hipótesis de normalidad del Ejemplo 1 pero ahora usando la

prueba de Anderson-Darling. El valor observado del estadístico de prueba es

, el cual es menor que el valor crítico , con , tomado de

la Tabla 4.2 de D’Agostino y Stephens (1986). Por lo que no se rechaza la hipótesis

nula .

1 . 5 Objetivo de la Tesis

El objetivo de esta tesis es proporcionar un modelo (una distribución de probabilidad)

que describa a los retornos del IPC. La distribución que se postula es la Pareto, por lo

que, después de haberla ajustado a los retornos, se evalúa la bondad del ajuste con la

prueba de Anderson-Darling para la distribución Pareto cuando ésta se ajusta a la cola

derecha de la distribución empírica de los retornos. Esta prueba fue desarrollada por

Coronel-Brizio y Hernández-Montoya (2010).

Otro objetivo que se persigue con este trabajo, es hacer disponible para estudiantes y

profesores de la Facultad de Estadística e Informática un documento introductorio

sobre bondad de ajuste. También se desarrolló código en S-Plus para implementar la

prueba de Anderson-Darling para muestras censuradas por la izquierda.

1.6 Estructura de la Tesis

El resto de este trabajo está estructurado de la siguiente forma. En el Capítulo

2 se presenta a la distribución Pareto así como los detalles de la estimación por

máxima verosimilitud de sus parámetros con muestras con censura de tipo II. Se

explica detalladamente el procedimiento de prueba de bondad de ajuste de Anderson-

Darling para la distribución Pareto, Coronel-Brizio y Hernández-Montoya (2010). En

el Capítulo 3 se ajusta la distribución Pareto a los retornos del Índice del IPC.

Page 25: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

20

Finalmente, en el apéndice se expone con detalle el uso de los programas

desarrollados con S-Plus. También en el apéndice se incluye el código fuente S-Plus

de estos programas.

Page 26: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

21

Capítulo 2

PRUEBA DE BONDAD DE AJUSTE PARA LA DISTRIBUCIÓN PARETO

En este capítulo se presenta a la distribución Pareto. También se presenta la

prueba de bondad de ajuste de Anderson-Darling para esta distribución cuando se

tienen muestras censuradas por la izquierda y los parámetros se estiman con máxima

verosimilitud. Esta prueba fue desarrollada por Coronel-Brizio y Hernández-Montoya

(2010).

La teoría asintótica para una muestra doblemente censurada cuando los parámetros

son conocidos se desarrolló en Pettitt y Stephens (1976). Pettitt (1976) modificó la

teoría de Durbin para probar normalidad con muestras censuradas y parámetros

estimados por máxima de verosimilitud. Coronel-Brizio y Hernández-Montoya

(2010), utilizan estos resultados para obtener la distribución asintótica de la

estadística de Anderson-Darling para la distribución Pareto bajo censura tipo II.

2.1 La Distribución Pareto

La distribución Pareto fue formulada por el profesor de economía Vilfredo

Pareto (1848-1923) originalmente para modelar distribuciones de ingreso, Pareto

(1897). A partir del trabajo de Pareto se han propuesto una gran variedad de

generalizaciones de esta distribución incluyendo algunas versiones discretas y

extensiones multivariadas.

Page 27: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

22

Se dice que la variable aleatoria sigue la distribución Pareto con parámetros

y , denotado esto , si su función de distribución es

(

)

donde es un parámetro positivo de escala y es un parámetro positivo de

pendiente. Al parámetro se le conoce como índice de Pareto y corresponde al

negativo de la pendiente de vs . La función de densidad de la

Pareto es

La Figura 2.1 muestra la distribución y la densidad de la Pareto para distintos valores

del parámetro .

0 5 10 15 20 25 30

0.0

0.2

0.4

0.6

0.8

1.0

alfa=2alfa=1.5alfa=1alfa=.5

5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

alfa=2alfa=1.5alfa=1alfa=.5

Figura 2.1 Funciones de distribución y densidad de la Pareto para diferentes

valores del parámetro y .

Page 28: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

23

El valor esperado de una variable aleatoria con distribución Pareto es

La varianza de es

2.2 Estimación de Máxima Verosimilitud con Censura Tipo II

Consideremos a las observaciones más grandes

de una muestra aleatoria de la distribución Pareto. La función de

log-verosimilitud basada en esta muestra censurada por la izquierda es

* (

)

+

Los estimadores de máxima verosimilitud de los parámetros y son la solución de

las ecuaciones

(

)

(

)

(

)

* (

)

+

Page 29: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

24

Al resolver las ecuaciones anteriores se obtienen los estimadores de máxima

verosimilitud

[∑

]

Consideremos a la matriz de información de Fisher

[

]

Supongamos que la proporción de censura por laaizquierda se mantiene

constante conforme . Entonces

[

]

Por lo que la matriz asintótica de varianza-covarianzas de los estimadores de máxima

verosimilitud es , donde

[

]

Page 30: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

25

Para el caso de muestras completas ( ), el estimador es muy eficiente

en el sentido de que su varianza asintótica es , de modo que

( ) . De hecho, para , ( )

. En aplicaciones prácticas, esto significa que los resultados

distribucionales serán idénticos al caso cuando el parámetro es conocido. Por otra

parte, ⁄ ⁄ .

2.3 Prueba de Anderson-Darling

Para probar la hipótesis de que las observaciones provienen de la

distribución Pareto en base a las observaciones más grandes, se supondrá que la

proporción de censura de la muestra , permanece constante conforme el tamaño de

muestra tiende a infinito. Denotemos por el estimador de máxima

verosimilitud de los parámetros de la distribución Pareto y a la distribución con los

parámetros estimados. Recordemos que denota a la función de distribución

empírica. El proceso √ { }, evaluado en , converge a un

proceso Gaussiano { }, con cierta función de covarianza . Los

límites de la distribución dependerán de la forma funcional de y de los parámetros

estimados. Se puede demostrar que la estadística

con { } , es asintóticamente una funcional del proceso

y converge débilmente a ∫

donde (√ )

Los

procesos y son Gaussianos definidos en , con funciones de

covarianza y , respectivamente, para

Page 31: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

26

. Se sabe que la distribución límite es la de ∑ , donde son

variables aleatorias independientes ji-cuadrada, con un grado de libertad y son los

eigenvalores de la ecuación integral

donde denota la función de covarianza correspondiente al proceso límite sobre la

cual se basó la prueba estadística, para este caso .

2.4 Procedimiento de Prueba

Para probar la hipótesis nula de que las observaciones , provienen de la

distribución Pareto basándonos en las observaciones más grandes

de la muestra, seguimos los siguientes pasos:

1. Obtenemos los estimadores de máxima verosimilitud de los parámetros

y de la Pareto.

2. Con los estadísticos de orden más grandes

, se calcula para .

3. Se calcula el valor de la estadística de Anderson-Darling para una muestra

con censura tipo II

∑ { } ∑

Page 32: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

27

4. Utilizando el valor de la proporción de censura , se compara el valor

observado de con el valor adecuado de la Tabla 1.

5. Si el valor calculado de la estadística excede el valor correspondiente de la

Tabla 1, se rechaza la hipótesis nula y se concluye que, para el nivel de

significancia elegido existe evidencia estadística de que la cola derecha de la

distribución de la cual se extrajo la muestra no sigue la distribución Pareto.

La tabla 2.1 presenta los valores críticos de . Esta tabla se obtuvo numéricamente

en Coronel-Brizio y Hernández-Montoya (2010), y se reproduce a continuación con

permiso de los autores.

Proporción censurada Nivel de significancia

0.15 0.01 0.05 0.025 0.01

0.00 0.9123 1.0588 1.3181 1.5873 1.9554

0.05 0.7364 0.8566 1.0695 1.2905 1.5925

0.10 0.6354 0.7388 0.9217 1.1114 1.3706

0.15 0.5584 0.6489 0.8087 0.9743 1.2005

0.20 0.4950 0.5748 0.7157 0.8616 1.0607

0.25 0.4406 0.5114 0.6361 0.7652 0.9414

0.30 0.3928 0.4557 0.5663 0.6808 0.8368

0.35 0.3500 0.4058 0.5039 0.6054 0.7436

0.40 0.3111 0.3606 0.4474 0.5372 0.6594

0.45 0.2755 0.3191 0.3957 0.4748 0.5825

0.50 0.2425 0.2808 0.3480 0.4173 0.5117

0.55 0.2118 0.2451 0.3036 0.3639 0.4460

0.60 0.1830 0.2118 0.2621 0.3141 0.3847

0.65 0.1559 0.1804 0.2232 0.2673 0.3273

0.70 0.1303 0.1507 0.1864 0.2231 0.2731

0.75 0.1060 0.1226 0.1515 0.1813 0.2219

0.80 0.0829 0.0958 0.1184 0.1417 0.1732

0.85 0.0608 0.0703 0.0868 0.1039 0.1270

0.90 0.0397 0.0459 0.0567 0.0677 0.0828

0.95 0.0195 0.0225 0.0278 0.0332 0.0405

Tabla 2.1 Valores críticos de la distribución asintótica de la estadística para

diferentes proporciones de censura.

Page 33: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

28

Capitulo 3

MODELO PARA EL IPC MEXICANO

En este capítulo se ajusta la distribución Pareto a los retornos estandarizados

del IPC. Se evalúa la bondad del ajuste con la prueba de Anderson-Darling y

concluimos que el ajuste es adecuado. Con la distribución Pareto ajustada a los

retornos se dispone ya de un instrumento con el que calculamos el valor en riesgo del

IPC.

3.1 Resultados

Una forma de medir el riesgo de mercado financiero es mediante lo que se

conoce como valor en riesgo, VaR, el cual se define por

donde es la función de distribución de las pérdidas. Por ejemplo, el 1% del VaR

diario sobre un portafolio es el cuantil 0.99 de . Esto significa

que con una probabilidad de 0.01, se tendrá una pérdida de . De tal manera que

en finanzas se requiere estimar el valor en riesgo financiero, VaR, de manera que la

probabilidad de exceder tal valor sea pequeña. El VaR permite que los reguladores

financieros pongan un número a su peor escenario y así planear de acuerdo a este

escenario. El VaR está basado en un cuantil que mide la pérdida esperada de un

portafolio sobre un período específico de tiempo para un nivel de probabilidad dado.

Un modelo VaR permite cuantificar el riesgo al determinar cuánto caería el

valor del portafolio en un período de tiempo dado y dada la probabilidad . La

mayoría de los modelos VaR utilizan la distribución normal para modelar la

Page 34: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

29

distribución de la variable de mercado. Sin embargo, los cambios en esta variable

exhiben en muchos casos un marcado sesgo, por lo que se deben usar otras

distribuciones en lugar de la normal. En la Sección 1.3 vimos una justificación

empírica para usar a la distribución Pareto como modelo para los retornos del IPC.

En la Figura 3.1 se muestran los retornos del IPC que se analizan en este

trabajo y en la Tabla 3.1 se presenta los resultados del ajuste, mediante máxima

verosimilitud, de la distribución Pareto a los retornos del IPC.

0 2 4 6 8

020

040

060

080

010

00

Retornos positivos del IPyC

0 1 2 3 4 5

020

040

060

080

010

0012

00

Retornos negativos (valor absoluto) del IPyC

Figura 3.1 Izquierda: Retornos positivos del IPC. Derecha: Retornos negativos (en

valor absoluto) del IPC.

Retornos positivos 0.85 389 2.397 0.596

0.9 260 2.617 0.664

Retornos negativos 0.9 259 3.149 0.737

0.95 130 3.973 0.943

Tabla 3.1 Parámetros estimados a los retornos del IPC.

Page 35: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

30

Para los retornos positivos, el estadístico de Anderson-Darling es con

, mientras que para es . De la inspección de la Tabla 2.1

en el capítulo anterior, vemos que ninguno de los valores observados del estadístico

de prueba es mayor que el valor crítico asociado con un nivel de significancia del

0.15. Por lo que no se rechaza la distribución Pareto para ninguna de las fracciones de

censura.

¿Cuál distribución se debería elegir para los retornos positivos? Ambas distribuciones

Pareto proporcionan una descripción adecuada de la cola derecha de los retornos.

Para responder esta cuestión, supongamos que sigue la distribución Pareto con

parámetros y ; sea un valor fijo y calculemos la distribución de

probabilidad de la variable aleatoria |

|

(

)

[ ( )

]

( )

(

)

De manera que si sigue la distribución Pareto con parámetros y , entonces la

variable aleatoria | también es Pareto con el mismo parámetro y

parámetro de escala . De acuerdo a esto, es conveniente elegir como modelo para la

cola derecha de los retornos positivos a la distribución con menor fracción de

censura. Para los retornos negativos (en valor absoluto) se tiene que para

, y para , los cuales no resultan ser significativos a un

nivel de significancia del 0.15. De la misma manera que para los retornos positivos

Page 36: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

31

elegimos a la distribución Pareto con menor fracción de censura. La Figura 3.2

muestra el ajuste de de las distribuciones de Pareto a las colas de las distribución de

los retornos estandarizados del IPC. Vemos que la distribución Pareto proporciona un

muy buen ajuste a la distribución de los retornos.

Retornos estandarizados del IPyC

2 4 6 8

0.8

50.9

00.9

51.0

0

(a)

Retornos estandarizados del IPyC

2 4 6 8

0.9

00.9

40.9

8

(b)

Retornos estandarizados del IPyC

2 3 4 5

0.9

00.9

40.9

8

(c)

Retornos estandarizados del IPyC

2.0 2.5 3.0 3.5 4.0 4.5 5.0

0.9

50.9

70.9

9

(d)

Figura 3.2 (a) y (b) ajuste de la Pareto a los retornos negativos con y

, respectivamente. (c) y (b) ajuste de la Pareto a los retornos negativos en

valor absoluto con y , respectivamente.

Page 37: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

32

3.2 Valor en Riesgo VaR

Supongamos que y denotemos por la función de distribución de

. Sea el valor tal que para . Tenemos que

Por lo que la cola derecha de que excede a , , está dada por

|

Si , entonces una estimación de basada en los estadísticos de

orden más grandes está dada por . En la sección anterior vimos que es Pareto

con el mismo exponente que y con parámetro de escala . De modo que si se

dispone de estimaciones de y basadas en las estadísticas de orden más grandes,

una estimación de la cola derecha de es

(

)

De tal manera que un estimador del cuantil de se obtiene resolviendo la

ecuación para , es decir, resolviendo para a la ecuación

( ) ( )

(

)

Page 38: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

33

Lo que resulta en

(

)

Si , entonces

(

)

es el nivel que es excedido en promedio una vez cada observaciones. Este valor

particular de VaR se llama nivel de retorno .

Para los retornos negativos (en valor absoluto) estandarizados del IPC y con

tenemos, de la Tabla 3.1, que el valor en riesgo es

(

)

donde . La Figura 3.3 muestra

las estimaciones del valor en riesgo de los retornos negativos desestandarizados

donde y son la media y la desviación estándar muestrales de los retornos

negativos.

Page 39: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

34

m

Va

R

0 200 400 600 800 1000

-0.0

26

3-0

.026

2-0

.026

2

Figura 3.3. Valor en riesgo VaR estimado para los retornos negativos del IPC.

3.2 Conclusiones

En este trabajo se ha demostrado empíricamente que la distribución Pareto

proporciona un muy buen ajuste a los retornos máximos y mínimos estandarizados

del IPC. Es interesante notar el hecho de que los índices de Pareto estimados para

el IPC son muy similares a los estimados para el índice Dow Jones en Coronel-Brizio

y Hernández-Montoya (2010). El criterio de evaluación de la bondad del ajuste del

modelo fue la prueba de bondad de ajuste de Anderson-Darling para muestras

censurada tipo II que se obtiene al analizar sólo la cola derecha de la distribución.

Page 40: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

35

REFERENCIAS

Cano Medina, J.L. (2010). Valor en Riesgo del IPC de México, 1991-2008. Tesis de

Maestría en Estadística Aplicada, Facultad de Estadística e Informática,

Universidad Veracruzana.

Coronel-Brizio, H.F., and Hernández-Montoya, A.R. (2010). The Anderson-Darling

Test of Fit for the Power-law distribution from Left-Censored Samples.

Physica A 389, 3508-3515.

Coronel-Brizio, H.F., and Hernández-Montoya, A.R. (2010). On fitting the Pareto

Levy Distribution to Stock Market Index Data. Physica A 389, 3508-3515.

D’Agostino, R.B., and Stephens, M. A., eds. (1986). Goodness of Fit Techniques.

Marcel Dekker: New York.

Pareto, V. (1897). Cours d´ Economie Politique. Paris: Rouge et Cie.

Pettitt, A.N., and Stephens, M.A. (1976) Modified Cramér-von Mises Statistics for

Censored Data. Biometrika 63 (2), 291-298.

Pettitt, A.N. (1976). Cramér-von Mises Statistics for Testing Normality with

Censored Samples. Biometrika 63 (3), 475-481

Page 41: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

36

Apéndice

RUTINAS EN S-PLUS

Todos los cálculos y gráficas en este trabajo se hicieron con S-Plus. Los datos del IPC

están disponibles con la autora de la tesis. Los programas desarrollados se

proporcionan a continuación.

fd Función que calcula la función de distribución de la Pareto.

fdp Función que calcula la función de densidad de la Pareto.

fde Función que calcula la función de distribución de la Pareto.

fdp.x Función que calcula la función de distribución empírica de un vector de

datos.

fde.pl Función que grafica la función de distribución empírica de un vector de

datos.

genpareto Función que genera un valor de la distribución Pareto.

censura Función que censura por la izquierda y deja a las observaciones más

grandes.

A2 Función que calcula el estadístico de Anderson-Darling

emv Función que calcula a los estimadores de máxima verosimilitud de la Pareto con

censura a la izquierda.

A2.normal.a Función que calcula el estadístico de Anderson-Darling para la

distribución normal.

Page 42: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

37

Para ilustrar las funciones, inicializamos el generador de números aleatorios de S-

Plus y generamos una muestra de tamaño de la Pareto con y .

> set.seed(432)

> x <- genpareto(100,2,1)

> x

[1] 1.687216 2.667046 1.017458 1.069660 1.152603 1.431605

[7] 3.799420 1.195529 1.705044 2.121521 1.553031 1.051674

[13] 1.151596 1.556263 5.117358 1.233053 2.003647 2.283544

[19] 1.736541 1.123736 1.082231 1.154423 1.033706 1.152212

[25] 1.126433 1.167067 1.373517 8.114096 1.513935 1.252752

[31] 1.154932 1.286329 1.527050 1.092684 1.121349 1.308099

[37] 2.898308 1.689457 4.128898 1.356980 1.738313 1.102319

[43] 1.168519 1.227944 2.452619 2.334055 1.782781 1.520594

[49] 6.941220 1.214688 1.274487 2.979003 1.497816 5.451926

[55] 1.194129 1.064556 2.459160 2.216537 2.680982 1.770505

[61] 1.093560 1.338959 2.216390 1.082154 1.105839 4.519783

[67] 1.571613 1.045683 1.312738 1.550378 6.184972 1.107790

[73] 1.162152 1.259858 3.795919 1.188155 1.165379 1.089060

[79] 2.038047 1.074481 1.313160 3.249544 1.138232 1.124086

[85] 1.462360 1.137820 1.070920 1.393945 1.129202 3.613703

[91] 2.466538 1.073348 1.900893 1.071854 1.716322 2.803998

[97] 4.465105 1.016972 1.192603 1.051170

Graficamos la función de distribución empírica y el histograma de los datos x

> fde.pl(x)

x

2 4 6 8

0.0

0.2

0.4

0.6

0.8

1.0

Page 43: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

38

> hist(x)

2 4 6 8

02

04

06

0

x

Las estimaciones de máxima verosimilitud de la muestra con 50 observaciones

censuradas por la izquierda son

> emv(x,50)

$alfa:

[1] 1.794845

$teta:

[1] 0.9100138

Finalmente, calculamos el estadístico de Anderson-Darling

> A2(x,50)

[1] 0.0987323

El código fuente de los programas en S-Plus se presenta a continuación.

# Funcion de distribucion de la Pareto

# Entrada: y, parametros alfa y teta

# Salida: Funcion de distribucion en y

fd <- function(y,alfa,teta)

{

p <- 1 - (teta/y)^alfa

return(p)

}

Page 44: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

39

# Funcion de densidad de la Pareto

# Entrada: valor y, parametros alfa y teta

# Salida: Funcion de densidad en y

fdp <- function(y,alfa,teta)

{

z <- (alfa*(teta^alfa))/(y^(alfa+1))

return(z)

}

# Funcion de ditribucion empirica en el punto x

# Entrada: valor x, vector de observaciones datos

# Salida: Funcion de distribucion en x

fde <- function(x,datos)

{

n <- length(datos)

length(datos[datos<=x])/n

}

# Funcion de distribucion empirica del vector x

# Entrada: vector de observaciones x

# Salida: Funcion de distribucion empirica del vector x

fde.x <- function(x)

{

p <- 0

x <- sort(x)

for(i in 1:length(x)) p[[i]] <- fde(x[[i]],x)

p

}

# Grafica de la funcion de distribucion empirica

# Entrada: vector de observaciones d

# Salida: Funcion de distribucion empirica del vector d

fde.pl <- function(d)

{

y <- 0

d <- sort(d)

for(i in 1:length(d)) y[[i]] <- fde(d[[i]],d)

plot(stepfun(d,y,type="right"), type="l",xlab="x",ylab=" ")

}

# Funcion que genera un valor de la Pareto

# Entrada: tamaño de muestra n, parametros alfa y teta

# Salida: vector de datos generados de la distribucion Pareto

genpareto <- function(n,alfa,teta)

{ y <- teta/(runif(n))^(1/alfa)

return(y) }

Page 45: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

40

# Funcion que censura por la izquierda

# y deja a a las r observaciones mas grandes

# Entrada: vector de datos y, numero de observaciones que se

censura r

# Salida: muestra con las r observaciones más grandes

censura <- function(y,r)

{

n <- length(y)

x <- sort(y)

if(r < n)

{x <- x[-c(seq(1,(n-r)))]}

return(x)

}

# Funcion que calcula el estadistico de Anderson-Darling para

muestras

# censuradas por la izquierda

# Entrada: vector de observaciones y, numero de observaciones

se censura r

# Salida: Estadistico de Anderson-Darling para la Pareto

A2 <- function(y,r)

{

n <- length(y)

estimaciones <- emv(y,r)

alfa <- estimaciones$alfa

teta <- estimaciones$teta

# Aqui se censura a la muestra y

x <- censura(y,r)

# Aqui se calcula el estadistico de A-D

z <- fd(x,alfa,teta)

i <- seq(r,1)

a <- -(1/n)*sum((2*i - 1)*(log(1-z)-log(z)))

b <- -2*sum(log(z))

c <- -(1/n)*((r - n)^2*log(z[1]) - r^2*log(1 - z[1]) +

n^2*(1 - z[1]))

AD <- a + b + c

return(AD)

}

# Estimadores de maxima verosimilitud de la Pareto

# con censura a la izquierda

# Entrada: vector de observaciones y, numero de observaciones

se censura r

# Salida: Estimaciones de maxima verosimilitud de los

parametros de la Pareto

Page 46: FACULTAD DE ESTADÍSTICA E INFORMÁTICA - uv.mx · RESUMEN En el presente ... 1.6 Estructura de la Tesis ... 2.3 Prueba de Anderson-Darling..... 25 2.4 Procedimiento de Prueba ...

41

emv <- function(y,r)

{

n <- length(y)

x <- censura(y,r)

a <- sum(log(x)-log(x[1]))

alfa <- r/a

teta <- ((r/n)^(1/alfa))*x[1]

return(alfa,teta)

}

# Anderson-Darling para la normal sin estimar los parametros

# Entrada: vector de observaciones x, parametros de la normal

media y desv

# Salida: Estadistico de Anderson-Darling para la normal

A2.normal.a <- function(x,media,desv)

{

n <- length(x)

z <- (x - media)/desv

z <- sort(z)

# Aqui se calcula el estadistico de A-D

p <- pnorm(z)

i <- seq(1,n)

a <- -n - (1/n)*sum((2*i - 1)*(log(p)) + (2*n + 1 -

2*i)*log(1-p))

return(a)

}

# Anderson-Darling para la normal estimando los parametros

# Entrada: vector de observaciones x

# Salida: Estadistico de Anderson-Darling para la normal

A2.normal.b <- function(x)

{

n <- length(x)

media <- mean(x)

desv <- sqrt(var(x))

z <- (x - media)/desv

z <- sort(z)

# Aqui se calcula el estadistico de A-D

p <- pnorm(z)

i <- seq(1,n)

a <- -n - (1/n)*sum((2*i - 1)*(log(p)) + (2*n + 1 -

2*i)*log(1-p))

return(a)

}