Series Temporales

12
TEMA 5. Descripci´on de series temporales 1 Introducci´ on Una serie temporal es una serie estad´ ıstica cuyos valores se observan a lo largo del tiempo, por ejemplo a lo largo de d´ ıas, semanas, meses, estaciones, a˜ nos, etc. Los valores se denotar´ an por Y 1 , Y 2 , Y 3 , etc. Por ejemplo, si se observa una cantidad a lo largo de los meses, y se empieza en Enero de 2001, Y 1 ser´ ıa el valor observado para Enero de 2001, Y 2 para Febrero de 2001,..., Y 15 ser´ ıa el valor para Marzo de 2002, y as´ ı sucesivamente. Ejemplo 1.1 La tienda online de una papeler´ ıa, abierta el 1 de Abril de 2002 ha registrado las siguientes ventas por trimestre (miles de EUROS), 2002 2003 2004 2005 ------------------------------------------------ Trimestre 1 -- 18.7 22.9 30.4 Trimestre 2 15.1 22.6 26.3 32.1 Trimestre 3 8.3 14.0 18.5 24.2 Trimestre 4 20.3 24.8 28.7 -- ------------------------------------------------ 2 Componentes de una serie temporal Usualmente, una serie temporal es la resultante de la interacci´on de varios factores, (a) Tendencia secular. Es el comportamiento b´ asico de la serie, a largo plazo. Se denotar´ a por T s . (b) Variaciones estacionales. Son alteraciones que se repiten de forma peri´ odica y que est´ an relacionadas con el problema considerado. Se denotar´a por V e . Ejemplo 2.1 En la observaci´ on de la producci´ on de un producto agrario, habr´ a una in- fluencia decisiva de la estaci´ on (Primavera, Verano, Oto˜ no, Invierno). Aqu´ ı la palabra estacional estar´ ıa precisamente referida a la estaci´ on astron´ omica. En la observaci´ on de los precios a lo largo de los a˜ nos, cada mes tiene unas particularidades que los hacen variar de forma distinta. Aqu´ ı la palabra estacional se referir´ ıa a los meses. Denotaremos por r al n´ umero de estaciones, en sentido amplio. Si son estaciones as- tron´ omicas o trimestres del a˜ no, ser´ a r = 4, si son meses, r = 12, si son d´ ıas de la semana, r = 7, etc. 1

description

Análisis Descriptivo de Series Temporales

Transcript of Series Temporales

  • TEMA 5. Descripcion de series temporales

    1 Introduccion

    Una serie temporal es una serie estadstica cuyos valores se observan a lo largo del tiempo, por

    ejemplo a lo largo de das, semanas, meses, estaciones, anos, etc.

    Los valores se denotaran por Y1, Y2, Y3, etc. Por ejemplo, si se observa una cantidad a lo largo de

    los meses, y se empieza en Enero de 2001, Y1 sera el valor observado para Enero de 2001, Y2 para

    Febrero de 2001,..., Y15 sera el valor para Marzo de 2002, y as sucesivamente.

    Ejemplo 1.1 La tienda online de una papelera, abierta el 1 de Abril de 2002 ha registrado las

    siguientes ventas por trimestre (miles de EUROS),

    2002 2003 2004 2005

    ------------------------------------------------

    Trimestre 1 -- 18.7 22.9 30.4

    Trimestre 2 15.1 22.6 26.3 32.1

    Trimestre 3 8.3 14.0 18.5 24.2

    Trimestre 4 20.3 24.8 28.7 --

    ------------------------------------------------

    2 Componentes de una serie temporal

    Usualmente, una serie temporal es la resultante de la interaccion de varios factores,

    (a) Tendencia secular. Es el comportamiento basico de la serie, a largo plazo. Se denotara por

    Ts.

    (b) Variaciones estacionales. Son alteraciones que se repiten de forma periodica y que estan

    relacionadas con el problema considerado. Se denotara por Ve.

    Ejemplo 2.1 En la observacion de la produccion de un producto agrario, habra una in-fluencia decisiva de la estacion (Primavera, Verano, Otono, Invierno). Aqu la palabra

    estacional estara precisamente referida a la estacion astronomica.

    En la observacion de los precios a lo largo de los anos, cada mes tiene unas particularidadesque los hacen variar de forma distinta. Aqu la palabra estacional se referira a los meses.

    Denotaremos por r al numero de estaciones, en sentido amplio. Si son estaciones as-

    tronomicas o trimestres del ano, sera r = 4, si son meses, r = 12, si son das de la semana,

    r = 7, etc.

    1

  • (c) Variaciones cclicas. Es una componente de la serie que recoge oscilaciones periodicas de

    mayor amplitud que las anteriores. Por ejemplo, ciclos bursatiles, ciclos economicos en los que

    se dan de forma alternada etapas de prosperidad y de depresion, cambios en la moda,.... Su

    estudio escapa al objetivo de este curso.

    (d) Variaciones accidentales. Son cambios imprevistos en la serie de datos. Por ejemplo, un

    pedido inesperado a una empresa es una variacion accidental en las ventas de esa empresa, una

    huelga es una variacion accidental en la serie de transportes de pasajeros de un aeropuerto,

    una ola de calor en una serie de temperaturas, etc.

    En el siguiente grafico se ha representado la serie del Ejemplo 1.1. Recordemos que los datos son

    trimestrales, es decir tenemos 4 observaciones por ano, r = 4. En este grafico se puede apreciar

    la componente estacional (hay un patron similar en las ventas que se repite de ano a ano). En el

    grafico se ha esbozado tambien lo que sera la tendencia de la serie, justificaremos en los siguientes

    apartados como obtener aproximaciones a esta componente.

    2.1 Modelos

    Podemos considerar principalmente dos modelos o formas de mezclarse las componentes anteriores,

    Modelo Aditivo.Y = Ts + Ve + Vc + Va

    Modelo Multiplicativo.Y = Ts Ve Vc Va

    Observacion. En la practica para proponer un modelo para una serie de datos, es util el grafico

    de la serie.

    2

  • Un modelo multiplicativo es adecuado si en ese grafico observamos que la amplitud de la oscilacionde la componente estacional aumenta con la tendencia. En el Ejemplo 2.2 se puede observar de forma

    clara este hecho.

    En cambio, un modelo aditivo sera adecuado si en el grafico de la serie observamos que laamplitud de la oscilacion de la componente estacional se mantiene aproximadamente constante con

    la tendencia.

    Ejemplo 2.2 En la siguiente tabla se ha recogido la entrada de turistas en millones en una determi-

    nada region durante 7 anos. Los datos son trimestrales: Primavera, Verano, Otono, Invierno (r=4).

    En el grafico de la serie se aprecia claramente la componente estacional y como la amplitud de la

    oscilacion de esta componente aumenta con la tendencia. Por tanto, un modelo multiplicativo sera

    adecuado.

    En nuestro desarrollo supondremos que el modelo es multiplicativo, es decir, que el resultado

    final procede de mezclar las componentes mediante multiplicacion o producto.

    Nos proponemos los siguientes

    OBJETIVOS: Estudiar una serie temporal de forma descriptiva, haciendo aflorar la tendencia

    secular, es decir, el comportamiento basico de la serie, y las variaciones estacionales, que son las que

    mas influencia pueden tener a corto y medio plazo.

    3

  • 3 Metodologa

    La metodologa que seguiremos se divide en varias fases, en cada una de las cuales se van separando o

    aislando las distintas componentes. Finalmente, se pueden realizar predicciones del valor que tendra

    la serie en estaciones futuras.

    3.1 Investigacion de la Tendencia Secular

    Promediaremos, con la media aritmetica, las observaciones agrupandolas en grupos de r valores

    consecutivos. Las cantidades obtenidas se denominan medias moviles. Estos valores se pueden

    considerar como una primera aproximacion de la tendencia. Segun r sea par o impar, el metodo

    vara un poco.

    Si r es impar: Se hace el promedio directamente y se asigna al instante o estacion intermedio. Si r es par: Se hace el promedio, pero los resultados no corresponden exactamente a las estaciones,es decir, no estan centrados, por lo que a continuacion se promedian otra vez de dos en dos. Veamos

    estas dos situaciones en el siguiente ejemplo.

    Ejemplo 3.1 Calculo de las medias moviles para el caso de das de la semana, es decir, r = 7, osea, impar; y para estaciones astronomicas, o sea, r = 4, esto es, par.

    Y Medias Moviles Centradas Y M.M.No Cent. M.M. Centradas

    -----------------------------------------------------------------------------------------------

    Lunes 1

    Martes 2 P 5

    Miercoles 2 V 3

    Jueves 3 (1+2+2+3+5+2+2)/7 = 2.43 O 1 11/4=2.75 (2.75+3.00)/2=2.875

    Viernes 5 (2+2+3+5+2+2+2)/7 = 2.57 I 2 12/4=3.00 (3.00+3.00)/2=3.000

    Sabado 2 (2+3+5+2+2+2+2)/7 = 2.57 P 6 12/4=3.00 (3.00+3.25)/2=3.125

    Domingo 2 (3+5+2+2+2+2+3)/7 = 2.71 V 3 13/4=3.25 (3.25+3.25)/2=3.250

    Lunes 2 (5+2+2+2+2+3+3)/7 = 2.71 O 2 13/4=3.25 (3.25+3.25)/2=3.250

    Martes 2 (2+2+2+2+3+3+6)/7 = 2.86 I 2 13/4=3.25 (3.25+3.50)/2=3.375

    Miercoles 3 (2+2+2+3+3+6+3)/7 = 3.00 P 6 14/4=3.50

    Jueves 3 (2+2+3+3+6+3+1)/7 = 2.86 V 4

    Viernes 6

    Sabado 3

    Domingo 1

    ------------------------------------------------------------------------------------------------

    Notese que para los das, como r = 7 que es impar, se han promediado de 7 en 7 asignando directamente al da

    correspondiente. Por ejemplo, al primer Jueves se le asigna la media de Lunes, Martes, Miercoles, Jueves, Viernes,

    Sabado y Domingo.

    Por el contrario, para las estaciones, tenemos r = 4 que es par. Entonces las primeras medias moviles correspon-

    deran a instantes intermedios y por ello se dice que no estan centradas. Por ejemplo al promediar Primavera (P),

    Verano (V), Otono (O) e Invierno (I), el resultado correspondera a un punto intermedio entre Verano y Otono. Por

    ello hay que volver a promediar, ahora de dos en dos, para centrar.

    4

  • 3.2 Investigacion de las Variaciones Estacionales

    Dividiremos los datos originales por sus correspondientes medias moviles (donde sea posible). Seguida-

    mente promediaremos los valores obtenidos para cada una de las estaciones, empleando la media

    aritmetica. Obtendremos as r valores que denotaremos s1, s2,..., sr. Llamemos S a su suma total.

    Finalmente calculamos las cantidades,

    ei =r

    S si = si

    sque representan la variacion estacional aportada por cada estacion. Estas cantidades se denominan

    ndices de variacion estacional.

    Multiplicando por cien se obtienen estas cantidades como porcentajes, quizas mas faciles de inter-

    pretar en algunas ocasiones.

    3.3 Calculo de la Tendencia Secular

    Ya hemos visto que la tendencia secular esta implcita en las medias moviles. Para su calculo

    concreto eliminamos la estacionalidad de la serie original, divididiendo los datos originales por

    las variaciones estacionales, ei, (suponiendo que el modelo es multiplicativo) . Obtenemos as

    una serie de valores que se denomina serie desestacionalizada y que supondra una aproximacion

    de la tendencia, mejor que la dada por las medias moviles.

    Mediante un ajuste de regresion de la serie desestacionalizada, sera posible plasmar la tendencia

    en una recta del tipo tendencia = b t + a, donde tendencia representa la tendencia secular y tel tiempo, y donde a y b se calculan como se ha visto en el tema anterior de regresion y correlacion

    (tema 4).

    3.4 Predicciones

    Es posible predecir el valor de la serie para una estacion futura. Para ello se siguen los siguientes

    pasos,

    (a) Se predice la tendencia en dicha estacion, a partir de la recta de regresion que representa dicha

    tendencia. Para ello se sustituye la t en tendencia = b t + a, por el instante del tiempocorrespondiente a la estacion donde se quiera realizar la prediccion.

    (b) El valor obtenido se multiplica por la variacion estacional, ei, correspondiente a la estacion

    donde se quiera la prediccion, es decir se estacionaliza la prediccion. El resultado es la prediccion

    buscada. Esta prediccion sera mas o menos fiable dependiendo del ajuste de la recta y del

    perodo de tiempo transcurrido. Obviamente sera mas fiable una prediccion a dos anos vista

    que a 15 anos vista.

    NOTA: En el documento denominado Ejemplo completo de series temporales, se desarrolla

    lo anterior con todo detalle. Se recomienda estudiar el tema y dicho documento de forma paralela.

    5

  • 4 Problemas

    1. Estudie la evolucion de los datos proporcionados, apoyandose en la representacion grafica de los

    mismos, y calcule las medias moviles.

    Cuatrimestres\Anos 1890 1891 1892 18931o 20 30 10 30

    2o 10 20 30 20

    3o 10 10 20 30

    2. Las ventas trimestrales online de una fabrica de calzado expresadas en miles de euros, para los

    anos 2012, 2013 y 2014 fueron las siguientes:

    Trimestres \ Anos 2012 2013 20141o 150 155 160

    2o 165 170 180

    3o 125 135 140

    4o 170 165 180

    Suponiendo un modelo multiplicativo:

    (a) Obtenga la serie de tendencia por el metodo de las medias moviles.

    (b) Obtenga los ndices de variacion estacional por el metodo de la razon a la media movil.

    (c) Desestacionalice con dichos ndices la serie observada.

    (d) Obtenga la tendencia lineal ajustando mediante una recta por el metodo de mnimos cuadrados.

    Representela graficamente.

    (e) Estime las ventas que se realizaran en cada trimestre de 2016. Estudie la fiabilidad de las

    predicciones.

    3. Suponiendo un modelo multiplicativo y que los ndices de variacion estacional son respectiva-

    mente 1.02, 1.20, 1.10, 0.68 para las distintas estaciones del ano, desestacionalice la siguiente serie

    temporal relativa al numero de incidencias registradas en un servicio tecnico informatico entre 2005

    y 2008:

    6

  • Estaciones\Anos 2005 2006 2007 2008Primavera 8 7 9 10

    Verano 10 11 12 13

    Otono 9 8 9 10

    Invierno 5 4 6 5

    4. El numero de paginas web cerradas por no cumplir la legislacion vigente, a lo largo de los tres

    cuatrimestres de los anos 2009, 2010 y 2011, fueron:

    Cuatrimestres\Anos 2009 2010 20111o 6 10 14

    2o 12 15 25

    3o 4 7 12

    Suponiendo un modelo multiplicativo:

    (a) Obtenga los ndices de variacion estacional.

    (b) Desestacionalice la serie observada yt.

    (c) Calcule la tendencia general aplicando el metodo de mnimos cuadrados. Estudie la adecuacion

    del ajuste.

    (d) Prediga el numero de paginas web que se cerraron en cada cuatrimestre de 2013.

    7

  • 5 Utilizacion en R

    5.1 Entrada de datos

    Introducimos los datos del Ejemplo 1.1

    datos1 = c(15.10,8.30,20.30,18.70,22.60,14.00,24.80,22.90,

    26.30,18.50,28.70,30.40,32.10,24.20)

    datos1

    ## [1] 15.1 8.3 20.3 18.7 22.6 14.0 24.8 22.9 26.3 18.5 28.7 30.4 32.1 24.2

    Creamos la serie temporal con el comando ts(data,frequency,start) donde: data es la serie de datos,

    frequency es el numero de estaciones, y start es un vector cuyas componentes indican el ano y la

    estacion de inicio, respectivamente.

    serie1=ts(data=datos1,frequency=4,start=c(2002,2))

    serie1

    ## Qtr1 Qtr2 Qtr3 Qtr4

    ## 2002 15.1 8.3 20.3

    ## 2003 18.7 22.6 14.0 24.8

    ## 2004 22.9 26.3 18.5 28.7

    ## 2005 30.4 32.1 24.2

    5.2 Descomposicion de la serie en componentes

    El comando decompose almacena en una lista informacion relacionada con las componentes de una

    serie temporal que siga un modelo determinado (en nuestro caso multiplicativo)

    componentes=decompose(serie1,type=c("multiplicative"))

    La serie de medias moviles centradas ha quedado almacenada en el valor trend.

    mmcent=componentes$trend

    mmcent

    ## Qtr1 Qtr2 Qtr3 Qtr4

    ## 2002 NA NA 16.5375

    ## 2003 18.1875 19.4625 20.5500 21.5375

    ## 2004 22.5625 23.6125 25.0375 26.7000

    ## 2005 28.1375 NA NA

    8

  • Los ndices de variacion estacional han quedado almacenados en el valor figure.

    varest1=componentes$figure # Indice para cada estacion

    varest1

    ## [1] 1.1262295 0.7030354 1.1398804 1.0308547

    Los ndices de variacion estacional repetidos para cada ano han quedado almacenados en el valor

    seasonal.

    varest2=componentes$seasonal # Indice para cada estacion repetidos para cada a~no

    varest2

    ## Qtr1 Qtr2 Qtr3 Qtr4

    ## 2002 1.1262295 0.7030354 1.1398804

    ## 2003 1.0308547 1.1262295 0.7030354 1.1398804

    ## 2004 1.0308547 1.1262295 0.7030354 1.1398804

    ## 2005 1.0308547 1.1262295 0.7030354

    5.3 Calculo de la tendencia secular

    Serie desestacionalizada

    serie_des=serie1/varest2 #serie desestacionalizada

    serie_des

    ## Qtr1 Qtr2 Qtr3 Qtr4

    ## 2002 13.40757 11.80595 17.80889

    ## 2003 18.14029 20.06696 19.91365 21.75667

    ## 2004 22.21457 23.35226 26.31447 25.17808

    ## 2005 29.49009 28.50218 34.42217

    Para calcular la recta de tendencia tendremos en cuenta que la serie de instantes de tiempo no viene

    dada en R como T = {1, 2, 3, 4, ..., 14} sino como T = {2002.25, 2002.50, 2002.75, 2003.00, ..., 2005.50}

    Time=time(serie_des)#Me da los tiempos en los que ha sido medida la serie

    Time

    ## Qtr1 Qtr2 Qtr3 Qtr4

    9

  • ## 2002 2002.25 2002.50 2002.75

    ## 2003 2003.00 2003.25 2003.50 2003.75

    ## 2004 2004.00 2004.25 2004.50 2004.75

    ## 2005 2005.00 2005.25 2005.50

    La tendencia secular es la recta tendencia = a + b t donde a y b son los coeficientes de la rectade regresion de la serie desestacionalizada:

    rYT=lm(serie_des~Time) #recta de regresion

    rYT

    ##

    ## Call:

    ## lm(formula = serie_des ~ Time)

    ##

    ## Coefficients:

    ## (Intercept) Time

    ## -11485.744 5.743

    coef=as.vector(rYT$coefficients) #extraigo los coeficientes

    coef

    ## [1] -11485.743626 5.742901

    a=coef[1]

    b=coef[2]

    a

    ## [1] -11485.74

    b

    ## [1] 5.742901

    5.4 Representacion grafica de la serie

    Pintamos la serie y su tendencia. Para configurar el grafico tendremos en cuenta que lty es el tipo

    de lnea, col el color de la lnea e ylim el rango.

    10

  • plot(serie1,type="l",ylim=c(min(serie1),max(serie1)))

    par(new=TRUE) #comando para hacer un plot encima de otro

    plot(a+b*Time,type="l",lty=2,col=2,ylab="",ylim=c(min(serie1),max(serie1)))

    Time

    serie

    1

    2002.5 2003.0 2003.5 2004.0 2004.5 2005.0 2005.5

    1015

    2025

    30

    Time

    2002.5 2003.0 2003.5 2004.0 2004.5 2005.0 2005.5

    1015

    2025

    30

    5.5 Predicciones

    Seleccionamos un instante t donde queremos realizar la prediccion. Por ejemplo, el trimestre siguiente

    al ultimo de nuestra serie.

    11

  • t=length(serie1)+1

    serie1 termina en el tercer trimestre. El trimestre siguiente a predecir sera el cuarto, por lo que la

    estacion y el instante de tiempo a utilizar en la prediccion seran frec = 4 y t = 2005.75.

    frec=4

    t=2005.75

    tsecular=a+b*t #calculo la tendencia secular

    prediccion=tsecular*varest1[frec] #predigo

    12