Dialnet-DosAplicacionesEmpiricasDeLasRedesNeuronalesArtifi-2304884

27
REVISTA ASTURIANA DE ECONOMÍA - RAE Nº 28 2003 61 DOS APLICACIONES EMPÍRICAS DE LAS REDES NEURONALES ARTIFICIALES A LA CLASIFICACIÓN Y LA PREDICCIÓN FINANCIERA EN EL MERCADO ESPAÑOL Jorge de Andrés Sánchez* Universidad Rovira i Virgili En muchos problemas de carácter financiero, la relación entre las variables implicadas es más compleja de lo que hacen suponer los modelos teóricos habituales (por otra parte, de utilidad incues- tionable); o bien la información viene dada de forma poco estruc- turada. Numerosos autores han mostrado la utilidad que presen- ta en estas circunstancias los instrumentos que proporciona la Inteligencia Artificial. El objeto del presente trabajo es arrojar evi- dencias de la utilidad de uno de estos instrumentos, las Redes de Neuronas Artificiales, en dos problemas clásicos de clasificación y predicción financiera: la predicción de la quiebra y la estimación de los rendimientos de carteras de valores, por lo cual compara- mos su capacidad predictiva con la de los métodos multivariantes utilizados habitualmente en dichos contextos. Palabras clave: inteligencia artificial, redes neuronales artificiales, predicción de la quiebra, modelos multifactoriales, CAPM, APT. 1. INTRODUCCIÓN Ha sido ampliamente contrastada la efectividad que proporcionan los instrumentos de la denominada Inteligencia Artificial en diversas áreas del análisis financiero. Una de estas herramientas son las Redes Neuro- nales Artificiales (RNAs), basadas en la imitación de la estructura y activi- (*) El autor agradece los útiles comentarios efectuados por un evaluador anónimo sobre una versión preliminar del trabajo, que han permitido mejorarlo notablemente. También agradece las constructivas aportaciones y la ayuda proporcionada por Cristian Vidal de Ventós.

description

Redes neuronales y su aplicaciones

Transcript of Dialnet-DosAplicacionesEmpiricasDeLasRedesNeuronalesArtifi-2304884

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    61

    DOS APLICACIONES EMPRICAS DELAS REDES NEURONALES

    ARTIFICIALES A LA CLASIFICACINY LA PREDICCIN FINANCIERA

    EN EL MERCADO ESPAOL

    Jorge de Andrs Snchez*Universidad Rovira i Virgili

    En muchos problemas de carcter financiero, la relacin entre lasvariables implicadas es ms compleja de lo que hacen suponerlos modelos tericos habituales (por otra parte, de utilidad incues-tionable); o bien la informacin viene dada de forma poco estruc-turada. Numerosos autores han mostrado la utilidad que presen-ta en estas circunstancias los instrumentos que proporciona laInteligencia Artificial. El objeto del presente trabajo es arrojar evi-dencias de la utilidad de uno de estos instrumentos, las Redes deNeuronas Artificiales, en dos problemas clsicos de clasificaciny prediccin financiera: la prediccin de la quiebra y la estimacinde los rendimientos de carteras de valores, por lo cual compara-mos su capacidad predictiva con la de los mtodos multivariantesutilizados habitualmente en dichos contextos.

    Palabras clave: inteligencia artificial, redes neuronales artificiales,prediccin de la quiebra, modelos multifactoriales, CAPM, APT.

    1. INTRODUCCIN

    Ha sido ampliamente contrastada la efectividad que proporcionan losinstrumentos de la denominada Inteligencia Artificial en diversas reasdel anlisis financiero. Una de estas herramientas son las Redes Neuro-nales Artificiales (RNAs), basadas en la imitacin de la estructura y activi-

    (*) El autor agradece los tiles comentarios efectuados por un evaluador annimo sobreuna versin preliminar del trabajo, que han permitido mejorarlo notablemente. Tambinagradece las constructivas aportaciones y la ayuda proporcionada por Cristian Vidal deVents.

    ANDRES 17/5/04 12:22 Pgina 61

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    62

    dades del cerebro humano. Dos de sus caractersticas ms relevantes sonsu capacidad para aproximar funciones complejas, tal como muestranHornick et. al. (1989), y su utilidad para agrupar elementos correctamentea partir de determinadas variables. Por ello, las RNAs pueden considerar-se un instrumento alternativo a numerosos mtodos multivariantes clsi-cos, lo que las hace aptas, tal como exponen Hawley et. al. (1990) y Serra-no y Gallizo (1997), para ser aplicadas en un amplio espectro de proble-mas financieros.

    Entre dichas aplicaciones podemos remarcar la calificacin de riesgoscrediticios y rating de bonos a partir de las caractersticas de los emisores(Dutta y Shekhar, 1988; Richeson et. al., 1994; Jensen, 1992 y Castromny Porto, 2000); la valoracin de derivados financieros (Trippi y DeSieno,1992, en la prediccin de precios de los futuros sobre el el ndice S&P 500;y Hutchinson et. al., 1994 y Lechn et. al., 1997 en la valoracin de opcio-nes sobre acciones); la prediccin del tipo de inters futuro a partir de lainformacin que contiene la estructura temporal de los tipos de inters(Swanson y White, 1995 y Prez et. al., 2000); o en el anlisis de seriestemporales financieras, en contraprosicin a instrumentos economtricosms convencionales como la modelizacin ARIMA o ARCH (Refenes, 1996y Bonilla et. al., 2000). En nuestro trabajo son objeto de estudio dos de lasaplicaciones que han tenido un mayor desarrollo en la literatura financie-ra: la prediccin del fracaso empresarial y la prediccin burstil. En amboscasos, la tipologa de RNA ensayada es la denominada como PerceptrnMulticapa (PMC).

    En este artculo contrastamos, en el mercado financiero espaol, lautilidad de la aplicacin de RNAs para un problema de clasificacin yotro de prediccin financiera. En la primera de ellas, aplicamos una RNAal problema clsico de la prediccin de la quiebra, comparando los resul-tados que ofrece con los derivados de la utilizacin de la regresin logs-tica (RL) y el anlisis discriminante (AD), dos instrumentos usualmenteutilizados en este contexto. Por tanto, en esta primera aplicacin, el esce-nario de modelizacin es uniecuacional, con datos de corte transversal.Nuestro estudio est en la lnea de los trabajos de Serrano y Martn(1993) y Lpez y Flrez (2000), donde tambin se evala la utilidad de lasRNAs en la prediccin de la quiebra a una base de datos de los estadoscontables de 66 bancos espaoles en el periodo 1977-1982, pero tienealgunos aspectos que la diferencian de estos trabajos. Nosotros, paraaumentar los grados de libertad de los mtodos que evaluamos (RNA,AD y RL), no tomamos un nmero menor de los 9 ratios contables ini-cialmente considerados en Serrano y Martn (1993), tal como hacenLpez y Flrez (2000), sino que son reducidos a un nmero menor devariables mediante anlisis factorial, propuesta acorde con la de West(1985) para un modelo logit. Ello nos permitir, de facto, trabajar con los9 ratios inicialmente seleccionados.

    Otro campo de estudio donde el empleo de las RNAs han encontradouna gran aplicacin ha sido la prediccin del precio de las acciones, sien-do los enfoques normalmente empleados, el del anlisis tcnico en estalnea encuentra el trabajo seminal de White (1988)- y el anlisis funda-mental un trabajo representativo es Yoon y Swales (1991). El enfoque

    ANDRES 17/5/04 12:22 Pgina 62

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    63

    que utilizaremos en nuestra aplicacin es diferente a los dos anteriores.Nosotros nos basaremos en el marco conceptual que proporcionan losmodelos factoriales de valoracin de activos tipo Capital Asset PricingModel (CAPM) de Sharpe (1964) o Arbitrage Pricing Theory (APT) deRoss (1976). En este sentido, Ahmadi (1996) sugiere (aunque no realizaninguna aplicacin emprica) que, dado que la relacin rendimiento-fac-tores sea posiblemente no lineal, al contrario de lo que proponen dichosmodelos, una forma viable de implementar el APT es mediante el uso deRNAs; sugerencia que puede generalizarse a cualquier otro modelo mul-tifactorial. Nosotros, partiendo de una especificacin multifactorial, utili-zamos un PMC para la estimacin de los rendimientos de las carterassectoriales en que se divida la bolsa de Madrid durante el periodo 1990-2001 y comparamos los resultados obtenidos con los que se derivan dela aplicacin de la regresin sistemas de ecuaciones lineales aparente-mente no relacionadas (SUR)1, metodologa economtrica utilizadacomnmente en la estimacin simultnea para varios activos o carterasde este tipo de modelos de valoracin. Este segundo caso supone unescenario de modelizacin diferente, ya que es multiecuacional y se dis-pone de series temporales.

    El resto del trabajo lo hemos estructurado de la siguiente forma. En elapartado que sigue, realizamos un repaso de los antecedentes ms rele-vantes sobre la utilizacin de las RNAs en los dos problemas que aborda-mos. Posteriormente, exponemos el funcionamiento de una RNA del tipoPMC, que ser el utilizado en nuestras aplicaciones empricas y algunosaspectos relativos a la estimacin y diseo de dicho tipo de RNAs. En losapartados cuarto y quinto analizamos los resultados que nos ofrece la uti-lizacin de las RNAs en la prediccin de la quiebra y la estimacin de ren-dimientos burstiles, respectivamente, contrastndolos en ambos casoscon los de instrumentos economtricos que habitualmente son utilizados.En el ltimo apartado, sealamos las conclusiones del trabajo realizadoque entendemos que son ms relevantes.

    2. APLICACIN DE LAS REDES NEURONALES A LA PREDICCIN DE LAQUIEBRA Y LA PREDICCIN BURSTIL

    Desde la publicacin de los trabajos de Beaver (1967) y Altman (1968),la prediccin de la quiebra empresarial a partir de un conjunto de ratiosque emanan de los estados contables ha devenido un tema clsico en laliteratura contable. Diversos trabajos han mostrado la utilidad de lasRNAs. En el mercado norteamericano, Tam y Kiang (1992) en el sectorbancario y Wilson y Sharda (1994) y Rahimian et. al. (1996) en el indus-trial, arrojan evidencias de la superior capacidad predictiva de las RNAtipo PMC respecto a instrumentos ms clsicos como el AD, la RL y los

    (1) La abreviatura comnmente utilizada, SUR, corresponde al nombre ingls SeeminglyUnrelated Regression.

    ANDRES 17/5/04 12:22 Pgina 63

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    64

    rboles de decisin. No obstante, Altman et. al. (1994), tomando una basede datos compuesta por 1000 PYMES italianas, si bien, vuelven a aportaruna evidencia sobre la superioridad predictiva de las RNAs sobre el AD,sta no es tan clara. As, consideran que las RNAs deben ser consideradascomo un instrumento complementario a los mtodos ms tradicionales,ya que stos, al contrario que las RNAs, permiten no slo realizar predic-ciones relativamente fiables, sino tambin determinar qu ratios son losms determinantes para predecir la quiebra en empresas de una determi-nada tipologa.

    En el mbito espaol, es posiblemente la crisis bancaria del periodo1977-1985, que afect a un gran nmero de entidades de crdito, el suce-so ms estudiado desde la perspectiva de los modelos de prediccin dela quiebra. As, son remarcables los trabajos de Laffarga et. al. (1986) yPina (1989), realizados con instrumentos multivariantes convencionales.Tomando como referencia este suceso y la base de datos utilizada endichos trabajos y como variables explicativas, los mismos 9 ratios quePina (1989), Serrano y Martn (1993) disean un modelo neuronal quecombina el uso de PMCs y redes autoorganizadas. Si bien, los resultadosque obtienen son satisfactorios, dado que logran clasificar correctamentea los bancos en un 94% de ocasiones, no ofrecen una comparacin de losresultados que se obtendran en el caso de utilizar otros mtodos. No obs-tante, afirman que han constatado previamente que los resultados queofrecen las RNAs son superiores a los que ofrece una RL. Lpez y Flrez(2000), utilizando aproximadamente la misma base de datos (de la mues-tra original de 66 bancos, nicamente toman 52, la mitad de los cualesquebraron) observan mejores resultados en las predicciones efectuadaspor una RNA del tipo PMC que las que realiza la RL y el AD. Asimismo,nicamente utilizan 6 ratios contables para clasificar las entidades banca-rias en solventes y fracasadas.

    Otro campo donde las redes neuronales han encontrado una intensi-va aplicacin es la prediccin burstil. As, podemos encontrar dos tiposbsicos de enfoques. En primer lugar, el basado en el anlisis tcnico. Eneste caso, se busca predecir los rendimientos y, por tanto, generar estra-tegias de negociacin, a partir de los precios que en el pasado han toma-do las acciones. La otra perspectiva utilizada por la literatura es el anlisisfundamental, basado en la utilizacin de informacin contable.

    Dentro del primer enfoque podemos mencionar a White (1988). stemuestra la capacidad de las RNAs para predecir la rentabilidad de accio-nes (concretamente de IBM), a partir de los rendimientos pasados, com-parando los resultados obtenidos con los de un modelo de series tempo-rales autoregresivo. Mientras que el modelo autoregresivo no formulapredicciones estadsticamente significativas, la RNA s lo hace. As, mues-tra que el anlisis tcnico es relevante, en contra de lo que indica la hip-tesis del mercado eficiente en cualquiera de sus formas; y que la relacinintertemporal de los rendimientos tiene un fuerte carcter no lineal quepuede ser captado por las RNAs y no mediante un modelo de series tem-porales al uso. En esta lnea, Robles y Naylor (1996) en el mercado burs-til de Chile y Yao y Poh (1996) en el de Malasia, muestran que a partir dePMCs (o en el caso de Robles y Naylor (1996), versiones ligeramente ms

    ANDRES 17/5/04 12:22 Pgina 64

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    65

    sofisticadas como las redes de Elman), es posible generar estrategias mseficientes que la simple de comprar y mantener, tomando como variablespredictivas diversos osciladores tcnicos.

    En el mercado espaol, Fernndez et. al. (2000) muestran la capacidadpredictiva de los PMCs en el ndice General de la Bolsa de Madrid (IGBM).Las estrategias generadas por las RNAs (comprar si el ndice sube y ven-der si ste baja), en ausencia de costes de transaccin, se muestran mseficientes que las de comprar y mantener en escenarios estables o bajis-tas de la bolsa, si bien ello no se manifiesta en el episodio alcista analiza-do. Por otra parte, Prez y Torras (2001) contrastan, en el IBEX-35, la capa-cidad predictiva de diversos modelos no lineales economtricos de seriestemporales (series del tipo ARCH, LSTAR, etc.) y de diversas arquitecturasde RNAs (PMCs, redes de Elman y redes de Jordan). Observan que esposible efectuar predicciones del IBEX-35 a partir de su comportamientopasado, mostrndose las RNAs como un instrumento de prediccin sen-siblemente superior.

    Utilizando como enfoque el anlisis burstil fundamental, Yoon ySwales (1991) parten de la opinin de analistas sobre la direccin de laempresa y sus estados contables para realizar predicciones sobre el ren-dimiento de las acciones en 10 sectores industriales diferentes. Observanuna mayor capacidad predictiva de los PMCs que en el AD. Harvey et. al.(2000), utilizando como variables predictivas, los ratios PER y book-to-market y la rentabilidad por dividendo observan, en diferentes mercadosemergentes, que los PMCs generan estrategias de compra y venta deacciones ms eficientes que las efectuadas por una regresin lineal o unaestrategia de comprar y mantener. Kanas (2001) compara, en el mercadoingls y alemn, el comportamiento de los PMCs y de la regresin linealen la estimacin de rendimientos a partir de la rentabilidad media pordividendo del mercado y del volumen negociado en anteriores periodos,con un resultado favorable a las RNAs.

    Finalmente, debemos remarcar que la aportacin de los instrumentosde inteligencia artificial a la prediccin de la quiebra y de los rendimien-tos burstiles, no se limita al uso de las RNAs. Respecto a la prediccin dela quiebra, han sido ensayados diferentes mtodos, los cuales presentan,en general, unos resultados prometedores. As, Matsatsinis et. al. (1997)muestran la utilidad de los sistemas expertos y Kingdon y Feldman (1993)observan un buen comportamiento de los algoritmos genticos. Por otraparte, Dimitras et. al. (1999), utilizando instrumentos de la teora de con-juntos toscos (rought sets) y Matsatsinis et. al. (2003) con un sistemaexperto borroso, obtienen una mayor eficiencia predictiva que con mto-dos multivariantes convencionales.

    En un contexto de prediccin burstil, la mayor parte de trabajos queutilizan instrumentos de inteligencia artificial, suelen partir, de nuevo, delmarco analtico que ofrecen el anlisis fundamental y/o el anlisis tcni-co. As, John et. al. (1996) y Trippi y Lee (1996) muestran la utilidad de lossistemas expertos; mientras que Mahfoud y Mani (1996) obtienen buenosresultados con la utilizacin de algoritmos genticos. Por otra parte, Spa-nos et. al. (2000) contrastan, con relativo xito, la capacidad predictiva de

    ANDRES 17/5/04 12:22 Pgina 65

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    66

    los sistemas expertos borrosos en el mercado de Atenas y Lam et. al.(1996) disean un sistema borroso experto basado en indicadores tcni-cos. Algunos autores proponen combinar ms de un instrumento de inte-ligencia artificial en este problema, como Wong et. al. (1993), que diseanun sistema experto borroso apoyado por una RNA y Kuo et. al. (2001), queproponen un modelo que combina los algoritmos genticos, los sistemasborrosos y las redes neuronales.

    3. REDES NEURONALES ARTIFICIALES: LOS PERCEPTRONES MULTICAPA

    Las RNAs son instrumentos de procesamiento de datos con unaestructura y funciones que imitan al cerebro humano. De forma muy sim-plificada, se puede conceptualizar una RNA como la conexin de diversasunidades bsicas de procesamiento de informacin, las neuronas,mediante tres tipos de capas: de entrada, ocultas y de salida. Una neuro-na recibe la informacin que le suministran las neuronas de la capa pre-cedente, que vendr dada por la combinacin lineal de la informacinproveniente de cada una ponderada por unos coeficientes denominadospesos sinpticos. Asimismo, una neurona proporciona una salida hacialas neuronas de capas posteriores, que se hallan con una funcin detransferencia o activacin las ms usuales pueden consultarse en Martny Sanz (1997, p.18). Ello viene representado en el grfico 1, donde xi repre-senta la salida de la i-sima neurona precedente, wij el peso sinptico queliga a dicha neurona con la que es objeto de representacin, la neuronajsima y f() la funcin de activacin, que determina la salida de la j-sima neurona (yj) hacia el resto de neuronas.

    Grfico 1ARQUITECTURA Y FUNCIONAMIENTO DE UNA NEURONA

    DE UNA RNA

    Debemos remarcar que existe una gran variedad de RNAs, depen-diendo de su arquitectura, la forma en que se determinan los pesos sinp-ticos, denominada entrenamiento, y de la habilidad del cerebro humano

    wnj

    wij

    w1jw2j

    xi

    xn

    x2

    x1

    Neurona 2

    Neurona i

    Neurona n

    Neurona 1

    Neurona j

    yj =f(())yj

    ANDRES 17/5/04 12:22 Pgina 66

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    67

    imitada. Una amplia panormica sobre los diferentes tipos de RNAspuede encontrarse en Kuan y White (1994) y Martn y Sanz (1997). Los pri-meros centran su exposicin en los PMCs o versiones ligeramente mssofisticadas como las redes de Elman y las de Jordan, poniendo nfasisen su similitud y las interacciones que pueden observarse con los mode-los de regresin no lineal; y su capacidad aproximativa de procesos din-micos no lineales. En cambio, Martn y Sanz (1997) realizan un anlisisdescriptivo, desde una perspectiva convencional en la literatura sobreRNAs, de una amplia variedad de tipologas (PMCs, mapas autoorganiza-dos, redes de Hopfield, etc.).

    El tipo de RNA que empleamos en este trabajo es el Perceptrn Mul-ticapa (PMC), por otra parte, muy utilizado en aplicaciones financieras. UnPMC es una RNA que imita la capacidad humana de generalizar la infor-macin suministrada en una muestra compuesta por inputs y outputs yasociar, a un input no proporcionado anteriormente, un output. Este tipode redes ajustan los pesos mediante entrenamiento2 supervisado. A la redse le indica, para cada input suministrado, cul es el output deseado, bus-cndose minimizar una funcin de error (normalmente, el error cuadrti-co) entre el output real y el output que ofrece la red.

    Grfico 2ESTRUCTURA DE UN PMC

    En el grfico 2 puede observarse que un PMC consta de una capa deentrada, a la cual se suministra las observaciones de las variables inde-pendientes. Esta capa est conectada a un grupo de capas denominadascomo capas ocultas (dos en el grfico 2); las cuales, estn unidas con lacapa de salida, que proporcionar el valor estimado para las variablesendgenas. La entrada a una neurona j, netj, viene dada por:

    Capa de entrada Capas ocultas Capa de salida

    (2) Por el contrario, la RNAs que ajustan los pesos con aprendizaje no supervisado no nece-sitan conocer los outputs deseados, de tal forma que organizan la informacin presen-tada a partir de las regularidades que se observan en los datos de entrada. Un ejemplotpico de estas redes son los mapas autoorganizados, muy tiles en la agrupacin (clus-tering) de datos.

    ANDRES 17/5/04 12:22 Pgina 67

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    68

    netj = iwij xi + j

    donde j es trmino conocido como umbral (bias) de la neurona j. Asi-mismo, para la salida de la neurona j, yj, la funcin de transferencia msutilizada es la funcin sigmoidal:

    yj =1

    1 + exp(-netj)

    Los pesos y los umbrales, que deben minimizar el error cuadrtico delas salidas que proporciona la red, se hallan mediante el algoritmo back-propagation descrito en Rummelhart y McClelland (1986), basado en laoptimizacin no lineal mediante el descenso del gradiente, que puedeconsiderarse, tal como indican Prez et. al. (2000), como una versinrecursiva de la tcnica economtrica de mnimos cuadrados no lineales.

    El nmero de neuronas que deben existir en cada capa oculta (quedeterminar el nmero de parmetros a estimar) y el nmero de capasocultas, deber ser suficiente para que la red aprenda los ejemplos de lamuestra de entrenamiento. No obstante, su nmero no debe ser excesi-vo, ya que se puede producir un sobreparametrizaje que implique que,aunque la red ajusta muy bien la muestra de entrenamiento, no es capazde generalizar el conocimiento adquirido, proporcionando muy malasestimaciones cuando se la proporciona inputs no suministrados duranteel aprendizaje. Desgraciadamente, no existe un mtodo claramente esta-blecido para determinar la dimensin ptima de una red neuronal (nme-ro de capas, nmero de pesos, etc.) que proporcione el equilibrio ptimoentre el ajuste a la muestra de entrenamiento y la capacidad de generali-zacin; aunque s que existen criterios heursticos y procedimientos decarcter emprico que pueden ser de ayuda.

    Un criterio que sirve de gua para establecer la dimensin de la red, esla regla de Baum. sta indica que el error medio de generalizacin de unPMC es directamente proporcional al nmero de parmetros que debenser ajustados e inversamente proporcional al nmero de ejemplos deentrenamiento. Respecto al nmero de capas ocultas, tal como apuntanMartn y Sanz (1997, p.216), no es comn disear redes con ms de dos.En cualquier caso, tal como muestran analticamente Hornick et. al.(1989), un PMC con una nica capa oculta constituye, en efecto, un apro-ximador universal de funciones. Por otra parte, algunos procedimientosmuy utilizados en la determinacin final de la red ptima consisten enestablecer pesos comunes para grupos de neuronas, el podado de lared y el decaimiento de los pesos. El objetivo final de estas tcnicas con-siste en mejorar la capacidad de generalizacin de la red sin menoscabodel ajuste obtenido con la muestra de entrenamiento. Una explicacindetallada de la implementacin de estos procedimientos puede encon-trarse en Martn y Sanz (1997, p. 75).

    Por otra parte, Refenes (1995) aconseja realizar un anlisis de sensibi-lidad, tanto en la fase de entrenamiento como en la de testeo para deter-minar cul es la arquitectura final. Tambin apunta la conveniencia demanipular el ratio de aprendizaje de la red (velocidad con que se produce

    ANDRES 17/5/04 12:22 Pgina 68

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    69

    la convergencia de la red hacia el error mnimo), a medida que transcurreel proceso de ajuste de los parmetros. Se debe elegir aquella arquitectu-ra que requiera ajustar un menor nmero de parmetros, si ofrece unerror de ajuste en el entrenamiento similar a otras de mayor dimensin.

    Finalmente, tal como indican Adya y Collopy (1998), a la hora de esta-blecer si el ajuste proporcionado por una RNA es satisfactorio o no, esnecesario comparar los resultados que ofrece con los que se obtienen conlas tcnicas que habitualmente se utilizan en el problema de prediccinanalizado. En este sentido, deben ser tenidas en cuenta, tanto la calidaddel ajuste obtenido dentro de la muestra utilizada para el ajuste de losparmetros de los modelos como, sobre todo, la calidad de las prediccio-nes efectuadas por los modelos en la submuestra utilizada para medir sucapacidad de generalizacin; ya que la utilidad esencial de las RNAs es supotencia para realizar predicciones.

    4. PREDICCIN DE LA QUIEBRA CON REDES NEURONALES ARTIFICIALES

    En este epgrafe, contrastamos la capacidad predictiva de la RNA tipoPMC con dos de los instrumentos utilizados habitualmente en el proble-ma de la prediccin de la quiebra: la RL y el AD; siendo el hecho estudia-do, la crisis bancaria espaola producida a principios de los aos 80, pro-blema ya abordado desde nuestra perspectiva en Serrano y Martn (1993)y Lpez y Flrez (2000). No obstante, a diferencia de los trabajos anterio-res, reducimos el conjunto de ratios seleccionados (los 9 utilizados en lostrabajos de Pina, 1989 y Serrano y Martn, 2000) mediante el anlisis fac-torial, lo cual, como ya anticipamos, permitir obtener modelos conmenos parmetros a ajustar, lo cual es especialmente interesante en estaaplicacin, dado el pequeo tamao de la muestra disponible.

    4.1. Base de datos y metodologa

    La muestra analizada comprende los 66 bancos utilizados en los estu-dios de Serrano y Martn (1993) y Laffarga et. al. (1986), entre los quehaba 29 quebrados y 37 no quebrados durante el periodo 1977-1982. Los9 ratios contables de los que partiremos para realizar las predicciones sonlos que se muestran en el cuadro 1, ya utilizados por Pina (1989) y Serra-no y Martn (1993).

    Cuadro 1RATIOS EMPLEADOS POR PINA (1989)

    Y SERRANO Y MARTN (1993)

    Activo Circulante/Activo Total (R1) Beneficio Neto/Neto (R6)(Activo Circulante-Tesorera)/Activo Total (R2) Beneficio Neto/Pasivo Exigible (R7)Activo Circulante/Pasivo Exigible (R3) Coste de Ventas/Ventas Brutas (R8)Reservas/Pasivo Exigible (R4) Cash-Flow/Pasivo Exigible (R9)Beneficio Neto/Activo Total (R5)

    ANDRES 17/5/04 12:22 Pgina 69

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    70

    Dado que la muestra utilizada no es excesivamente amplia, optamospor reducir el nmero de las variables explicativas utilizando el anlisisfactorial. Los resultados obtenidos vienen dados en el cuadro 2.

    Como variables explicativas hemos tomado finalmente los tres factoresque presentan un valor propio mayor que 1 (los nicos que aparecen en elcuadro 2), ya que stos explican el 93,39% de la varianza de los 9 ratios. Sepuede comprobar que aunque el coeficiente de Kaiser-Meyer-Olkin no indi-ca que el anlisis factorial sea especialmente adecuado, tampoco lo recha-za; y, asimismo, el test de Barlett rechaza la hiptesis de que la matriz decorrelaciones sea la unidad. Tambin se muestran las cargas factoriales delos ratios con un nivel de significacin de al menos el 95% en cada factor,por lo que se muestran aqullas que presentan un valor absoluto superioral 0,5. Asimismo, hemos empleado la rotacin varimax en la determinacinde los factores. Se puede comprobar que los tres factores tienen una fcilinterpretacin contable. El primero (F1) est relacionado con la rentabilidady la productividad de la entidad, el segundo (F2) con su liquidez, mientrasque el tercero (F3) refleja el grado de autofinanciacin del banco.

    Cuadro 2RESULTADOS DEL ANLISIS FACTORIAL

    Kaiser-Meyer-Olkin (KMO)=0,667

    Test de esfericidad de Barlett: 2=1425,86. Sign: 0,000%

    Ratios Factor 1 (F1) Factor 2 (F2) Factor 3 (F3)

    R1 0,965R2 0,888R3 0,942R4 0,938R5 0,977R6 0,962R7 0,975R8 -0,908R9 0,898

    El hecho de que los 3 factores seleccionados contengan un porcenta-je realmente elevado de la varianza de las variables explicativas, as comoel hecho de que stos presenten una fcil interpretacin contable, reafir-man que es adecuado utilizar dichos factores en la realizacin de los ajus-tes de los modelos neuronales y estadsticos en lugar de los ratios inicial-mente seleccionados. Adems, debemos tener en cuenta el bajo tamaode la muestra de que partimos. De esta forma, el nmero de variablesexplicativas (o inputs en terminologa neuronal) queda reducido notable-mente respecto a trabajos anteriores: en Serrano y Martn se utilizaban los9 ratios del cuadro 1, mientras que Lpez y Flrez (2000) utilizaban losratios R1, R4 y R8 del cuadro 1, a los que aadan: Ventas/Activo total,Reservas/Neto y Tesorera/Activo Circulante.

    ANDRES 17/5/04 12:22 Pgina 70

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    71

    Para contrastar la capacidad predictiva del PMC respecto a los mto-dos ms convencionales, hemos dividido nuestra muestra en dos sub-muestras. La primera comprende 40 bancos, de los cuales, la mitad que-braron, y todos fueron seleccionados al azar. Con sta entrenamos a laRNA y estimamos los parmetros de las funciones logstica y discrimi-nante. Posteriormente, con la segunda submuestra, que consta de 26 enti-dades (9 quebradas y 17 solventes), predecimos su grupo de pertenenciaa partir de los parmetros estimados con anterioridad, contrastndose asla capacidad de extrapolacin de cada metodologa.

    4.2. Resultados

    Los resultados del ajuste de los modelos discriminante y logit vienendados en el cuadro 3. As, el modelo discriminante propuesto puede escri-birse como:

    Zi= 0+1F1i + 2F2i+3F3i (1)

    Donde Zi es la puntuacin o Z-score otorgada a la entidad de crdi-to i-sima en funcin de los valores que toma su nivel de rentabilidad(F1i), su liquidez (F2i) y autofinanciacin (F3i); mientras que j, j=0,1,2,3,son los parmetros a estimar. stos han sido ajustados mediante el pro-cedimiento de Fisher, que busca maximizar la variabilidad de la puntua-cin Z entre los grupos (2 en esta aplicacin) respecto a la variabilidad delZ-score dentro de los grupos. Dado que el valor de Zi -Z-score del i-simobanco - es una variable de carcter continuo, es preciso determinar elpunto de corte, Z*, a partir del cual la puntuacin obtenida por una empre-sa lleva a clasificarla como solvente o quebrada. Para determinar dichopunto de corte partimos de una puntuacin Z media correspondiente acada grupo (centroide). Dado que se ha utilizado una muestra de estima-cin con el mismo nmero de empresas quebradas y solventes (20 encada caso), Z* se determina sin ms que hallar la media aritmtica de loscentroides, que es 0. De esta forma, si Zi>0, clasificaramos a la i-simaentidad de crdito como solvente; mientras que en caso contrario, laempresa sera clasificada como quebrada.

    Puede observarse en el cuadro 3 que el modelo discriminante espe-cificado es aceptable, dado que tal como indica la lambda de Wilks3 detodo el modelo y el contraste 2 asociado, la diferencia del Z-scoremedio de los dos grupos es significativa a un nivel de inferior al 1%. Porotra parte, el signo de los coeficientes estimados para (1) indica la exis-tencia de una relacin positiva entre la salud de una entidad de crdito

    (3) La lambda de Wilks es un estadstico cuyo rango de variacin es el intervalo [0,1] y seutiliza para contrastar, en el marco del anlisis discriminante, si la media de las puntua-ciones Z, o del valor de las variables utilizadas para discriminar es significativamentediferente. Un valor cercano a 1 indicara la inexistencia de diferencias significativas entregrupos mientras que su alejamiento de este valor indicara una mayor diferencia entrestos.

    ANDRES 17/5/04 12:22 Pgina 71

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    72

    y su rentabilidad y autofinanciacin; y una relacin negativa de la liqui-dez de la entidad bancaria con su supervivencia. No obstante, respectoal factor liquidez, puede observarse que su lambda de Wilks es prcti-camente 1, por lo que el valor de su estadstico 2 indica que la dife-rencia del mismo entre grupos no es significativa. Respecto a los otrosdos factores, F1 y F3, su nivel de significacin para explicar las diferen-cias entre grupos se sita por debajo del 10%, lo que nos permite norechazar a dichos factores como significativos en la explicacin de laquiebra.

    Cuadro 3RESULTADOS DE LA ESTIMACIN DISCRIMINANTE Y LOGIT

    ANLISIS DISCRIMINANTE REGRESIN LOGIT

    Funcin discriminante cannica no tipificada: R2 de Cox y Snell: 0,646Zi=0,027+1,181F1i-0,039F2i+0,321F3i R2 de Nagelkerke: 0,861

    Centroides cannicos no tipificados. Significacin global del modelo:Quebradas: -0716. Solventes: 0716 Chi-Cuadrado: 41,519 (0,000)

    Signific. Del modelo: - Lambda de Wilkins: 0,649 Anlisis de las variables explicativas- Chi-Cuadrado equivalente 15,752 (0,001)

    Anlisis ANOVA de los factores Factor Coeficiente Chi-Cuadrado

    Factor Lambda de Wilks Estadstico F Constante -2,0441 2,739 (0,098)F1 0,681 17,783 (0,000) F1 21,2012 3,670 (0,055)F2 1 0,009 (0,926) F2 -1,9609 1,435 (0,231)F3 0,928 2,935 (0,095) F3 0,5939 0,152 (0,697)

    Nota: Entre parntesis, el nivel de significacin

    Por otra parte, el modelo logit especificado es:

    P(Yi =1) =e 0+1F1i + 2F2i+3F3i

    1 + e0+1F1i + 2F2i+3F3i (2)

    donde P(Yi=1) denota la probabilidad de que el banco i-simo pertenezca,dadas sus puntuaciones en los factores F1, F2 y F3, al grupo de bancossolventes. Por tanto, tal como es habitual en la prctica, tomaremos comoprobabilidad de corte para clasificar a un banco como solventeP(Yi =1)>1/2. Los coeficientes del modelo (2) han sido estimados con elmtodo de mximo-verosimilitud, utilizando un algoritmo de introduc-cin. Si el coeficiente asociado a un factor es positivo, ello ser indicativode que un incremento de dicho factor producir un aumento en la proba-bilidad de supervivencia de la empresa; mientras que si el coeficientefuera negativo, un aumento de dicho factor conllevara un aumento de laprobabilidad de fracaso.

    En el cuadro 3 se ofrece el resultado obtenido con la estimacin de laRL. El valor obtenido con los coeficientes de determinacin de Cox y Snell

    ANDRES 17/5/04 12:22 Pgina 72

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    73

    y de Nagelkerke4, que son los habitualmente utilizados para evaluar lacapacidad de ajuste de una RL, indican que el ajuste global del modelo hasido bastante satisfactorio. Ello es confirmado por el valor del estadstico2, que seala que el ajuste global es significativo para niveles inferioresal 1%. La interpretacin del signo de los coeficientes estimados para lasvariables F1, F2 y F3 es anlogo al que podemos deducir de la funcin dis-criminante ajustada. La relacin entre la autofinanciacin y la rentabilidades positiva respecto a la probabilidad de supervivencia del banco, mien-tras que la probabilidad de supervivencia y la liquidez se relacionan deforma inversa. No obstante, el test de Wald sugiere que nicamente es unfactor significativo para explicar la quiebra de un banco F1 (asociado consu rentabilidad y productividad).

    A la hora de aplicar los modelos seleccionados, tanto en la muestra deentrenamiento como en la de testeo, hemos optado por mantener dentrode los modelos discriminante y logit las variables explicativas que no semostraban estadsticamente significativas con el coeficiente que ha sidoestimado para las mismas. Entendemos que la muestra utilizada en elajuste de los parmetros es bastante pequea, por lo que los tests de sig-nificacin efectuados adolecen de potencia de contraste. En segundolugar, nuestro principal inters se centra en contrastar la capacidad deajuste a la muestra y la capacidad predictiva de las metodologas ensaya-das. En este sentido, nos parece ms adecuado partir de los coeficientesque proporcionan un mejor ajuste a la muestra, cuyos valores vienendados en el cuadro 3.

    La RNA que finalmente hemos empleado consta de una capa deentrada con 3 neuronas (una para cada factor) y una neurona en la capade salida, que seala si la empresa quebrar, proporcionando una sali-da de 0; o tendr xito, tomando entonces como valor 1. La capa ocultafinalmente utilizada consta de 4 neuronas, mientras que el nmero depocas utilizadas en el entrenamiento de la RNA se situaba entorno a las7.500, ya que a partir de entonces, la red disminua muy lentamente sucapacidad de aprendizaje. En la RNA, dado que la neurona de salida pro-porciona valores entre 0 y 1, la puntuacin de corte elegida es, como enla RL, 1/2, de tal forma que si la salida fuera superior a 1/2, clasificara-mos al banco dentro del grupo de los que no quebraron. Respecto a lasneuronas de la capa de entrada asociados a la liquidez y la autofinan-ciacin, sobre los que haba dudas en el AD y la RL de su significacinestadstica, hemos observado que varios de los pesos que las conectancon las neuronas de la capa oculta difieren notablemente de 0, lo quepuede ser indicativo de la conveniencia de seguir utilizando tambinestas variables en la prediccin de la quiebra. Asimismo, ello podraindicar que los mtodos estadsticos ensayados han captado con una

    (4) La interpretacin de dichos coeficientes es anloga a la del coeficiente de determinacinconvencional. Su construccin, en cambio, es diferente. sta se basa en la razn de losvalores que toma la funcin de verosimilitud cuando el valor de los coeficientes de lasvariables explicativas es 0 y su valor mximo-verosmil.

    ANDRES 17/5/04 12:22 Pgina 73

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    74

    menor precisin que la RNA el carcter de la relacin entre F2 y F3 y lacontingencia de quiebra.

    En el cuadro 4 se muestran los resultados de la clasificacin que rea-lizan las funciones discriminante y logit y el PMC, en la muestra de ajustey en la de prediccin. Tanto en la muestra de entrenamiento como en lamuestra de comprobacin puede observarse que el porcentaje de acier-tos de la RNA es superior al de los dos mtodos tradicionales. En la mues-tra de estimacin, la RNA ofrece una fiabilidad del 100%, mientras que laregresin logit acierta el 95% de casos y el anlisis discriminante, el92,5%. En la muestra de comprobacin, la RNA se contina manteniendocon un porcentaje de aciertos ms elevado que los otros mtodos, aun-que en todos los casos, la fiabilidad disminuye. No obstante, la RNA sigueproporcionando un error del tipo A del 0%, mientras que el porcentaje deerrores del tipo B se sita en un nivel idntico al de los mtodos multiva-riantes clsicos.

    Cuadro 4RESULTADOS DE LA CLASIFICACIN DE LOS MTODOS

    ENSAYADOS

    AD RL RNA

    Acierto Error A Error B Acierto Error A Error B Acierto Error A Error B

    Muestra de ajuste(40 bancos) 92,5% 5% 10% 95% 5% 5% 100% 0% 0%

    Muestra test(26 bancos) 76,92% 22,33% 23,53% 76,92% 22,33% 23,53% 84,61% 0% 23,53%

    Nota: Error A corresponde a clasificar una empresa quebrada como sana, mientras queel error B corresponde a clasificar una empresa sana como quebrada. Aunque laliteratura referente a la prediccin de la quiebra normalmente los denomina comoerror I y error II respectivamente, hemos preferido no mantener esta nomen-clatura para evitar la confusin que ello puede producir respecto al concepto deerror del tipo I y error del tipo II en el contraste de hiptesis estadsticas.

    Debemos mencionar que nuestros resultados son similares a los obte-nidos en Serrano y Martn (1993) y Lpez y Flrez (2000). Serrano y Mar-tn (1993) obtienen un xito con el PMC en las predicciones de la muestratest del 89% y un xito en el global de la muestra del 94%, si bien, sumuestra de ajuste es ligeramente inferior (toman 32 bancos). Por su parte,la red ajustada por Lpez y Flrez (2000) muestra un xito de un 89% enla muestra de testeo y un 96% para toda la muestra que utilizan (estima-cin y testeo), que se compone nicamente por 52 bancos (no por los 66nuestros) y tambin encuentran evidencias de la superioridad predictivade la RNA respecto al AD y la RL. La ligera discrepancia entre nuestrosresultados y los obtenidos en trabajos anteriores puede ser imputable aque hayan sido utilizados diferentes bancos a los nuestros en las fases deentrenamiento/test (ya que stos, en todos los casos, son seleccionadosaleatoriamente) de tal forma que, en nuestra muestra de testeo, hayamosincluido los bancos con mayor dificultad para ser clasificados, mientrasque stos hayan sido incluidos en la muestra de entrenamiento en los

    ANDRES 17/5/04 12:22 Pgina 74

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    75

    anteriores trabajos. Respecto al trabajo de Lpez y Flrez (2000), tambinpodra ocurrir que alguna de las entidades de crdito que nuestra red noha sido capaz de clasificar correctamente no haya sido incluida en sumuestra.

    En cualquier caso, debemos remarcar el hecho de que nuestra RNApresenta una menor dimensin y obtiene unos resultados muy similares.De hecho, segn la regla de Baum, el error de generalizacin medio denuestra RNA debe ser ostensiblemente menor. Mientras que las neuronasde entrada tomadas en Serrano y Martn (1993) eran 9, considerndoseuna capa oculta con 10 neuronas, en Lpez y Flrez (2000) la RNA utiliza-da constaba de 6 neuronas en la capa de entrada y 4 en la capa oculta.

    5. ESTIMACIN MULTIFACTORIAL DEL RENDIMIENTO DE LAS CARTERAS DEVALORES CON REDES NEURONALES

    Los modelos multifactoriales de valoracin de activos tipo CAPMSharpe (1964) o APT Ross (1976) postulan la existencia de una relacinlineal entre el rendimiento de los activos y la evolucin de diferentesvariables financieras y macroeconmicas. Entre las variables financieraspodemos mencionar el rendimiento de una cartera de activos representa-tiva del mercado burstil (en el caso del CAPM es la nica contemplada),determinados ratios fundamentales, etc. Respecto a las variables macro-econmicas, son especialmente utilizadas la variacin no esperada de lainflacin y el crecimiento de la actividad econmica.

    Es indudable que estos modelos presentan varios atractivos. En pri-mer lugar, los parmetros implicados, las betas, que miden la sensibilidaddel precio de un ttulo ante variaciones de los factores, pueden ser obte-nidos a partir de datos histricos mediante regresin lineal y es fcil esta-blecer su capacidad explicativa. Por otra parte, tras determinarse la rela-cin lineal rendimiento-factores, la proyeccin del rendimiento futuro delos ttulos se reduce a la prediccin de unas pocas variables que puedenser estimadas con cierto grado de verosimilitud en horizontes temporalescortos.

    Por otra parte, si aceptamos que el valor de una accin es el valor des-contado de los dividendos que proporcionar en el futuro, deberemosconcluir que los factores relevantes en la formacin de su precio (y, portanto, desde un punto de vista dinmico, de los rendimientos) son todosaqullos que repercutan en los dividendos y la tasa de descuento. No obs-tante, la relacin de estos factores con los precios es compleja y de difcilprecisin analtica. Tambin debe remarcarse que es un hecho bien cono-cido que las betas no se mantienen invariables en el tiempo, lo cual difi-culta la proyeccin futura de los rendimientos a partir de los coeficientesobtenidos previamente. Tampoco debemos olvidar que entre dichos fac-tores existen mltiples interacciones difciles de cuantificar analticamen-te. Por estas razones, Ahmadi (1996) sugiere que una forma viable deimplementar el APT es el uso de RNAs, sugerencia que creemos quepuede generalizarse a cualquier otra formulacin factorial. En este apar-

    ANDRES 17/5/04 12:22 Pgina 75

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    76

    tado exploramos las posibles ventajas de la estimacin de un modelomultifactorial mediante RNAs, respecto a la utilizacin de los instrumen-tos de regresin lineal.

    5.1. Base de datos y metodologa

    El objeto de anlisis es el rendimiento mensual de las carteras secto-riales de la bolsa de Madrid durante el periodo 1990-2001 (144 observa-ciones). En este caso, entendemos que la muestra empleada, aunque noexcesivamente elevada, tiene un tamao al menos, bastante aceptablerespecto a la utilizada en el caso de la prediccin de la quiebra. En el cua-dro 5 recogemos estos sectores5 y la abreviatura que se les asigna. Comoindicadores del comportamiento de estas carteras, hemos tomado el ren-dimiento de los ndices sectoriales de la bolsa de Madrid, medido comotanto efectivo mensual. Todos los datos han sido obtenidos de las seriestemporales del banco de Espaa.

    Cuadro 5SECTORES DE LA BOLSA DE MADRID DE 1990-2001

    Nmero (j) Abreviatura Sector

    1 BAN Bancos y Financieras2 ELEC Elctricas3 AL Alimentacin4 CON Construccin5 CAR Cartera e Inversin6 MET Metal-Mecnica7 PETR Petroqumico8 COM Comunicaciones9 OTR Otras Industrias y Servicios

    Debemos remarcar que, en los modelos multifactoriales, la determi-nacin de las variables conducentes a dar una explicacin de las rentabi-lidades burstiles pasa por elegir aqullas que, de manera razonable o porinvestigaciones previas, puedan explicar dichas rentabilidades. Nosotrospartimos de que el rendimiento de las carteras puede explicarse a partirde las siguientes variables:

    El rendimiento de la cartera de mercado (RM), que hemos supuestoque es la correspondiente al ndice General de la Bolsa de Madrid.

    (5) En el ao 2002 la bolsa de Madrid ha cambiado el nmero de sectores para los que ela-bora los ndices, as como su composicin y su nombre. Ms detalles de dicho cambiopueden consultarse en la web de la bolsa de Madrid .

    ANDRES 17/5/04 12:22 Pgina 76

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    77

    El rendimiento de los ttulos de Deuda Pblica a ms de dos aos(DPMLP). Tal como apunta Iglesias (2000), cuando los tipos de inters dela deuda pblica aumentan, la demanda de acciones disminuye, por loque es una variable relevante en la formacin de los precios burstiles.

    La prima de riesgo que incorporan los ttulos de renta fija con unvencimiento a ms de dos aos de las emisiones corporativas respecto altipo de inters de la deuda pblica con dicho vencimiento (PR). Reflejar,siguiendo a Ferson y Harvey (1991), la probabilidad de quiebra percibidapor los inversores.

    La variacin de la pendiente de la ETTI desde el mes anterior hastael mes objeto de anlisis (PEND). Dicha pendiente, tal como proponenFerson y Harvey (1991), la medimos por la diferencia relativa del rendi-miento de la deuda pblica con vencimiento en el medio y largo plazo (ennuestro caso, a ms de dos aos) y el rendimiento de los repos a 1 mes.Las variaciones en la pendiente de la ETTI anticipan los ciclos econmi-cos, tal como muestra Harvey (1988, 1991) y Rico (2001) en Espaa.

    La variacin no esperada del IPC (IPC), que medimos como la dife-rencia entre el IPC del mes anterior y el IPC del mes siguiente, tal comoproponen Prez y Aranda (2000), de forma que aceptamos, implcitamen-te, la Teora de las Expectativas Adaptativas. Un incremento de la inflacinsupone un aumento del tipo de inters con el que se descuentan los divi-dendos. Por otra parte, un incremento de la inflacin puede ser debido aun aumento de la demanda agregada, con el consiguiente incremento delos beneficios empresariales que ello supone. As, se pone de manifiestola relevancia, al menos a priori, de esta variable, lo cual justifica su inclu-sin habitual en los trabajos empricos. No obstante, los comentariosanteriores nos llevan a remarcar que el signo que debe presentar la rela-cin rendimiento-inflacin no es fcil de precisar a priori.

    La variacin en trminos relativos del ndice de Produccin Industrial(IPI), que siguiendo a Prez y Aranda (2000), hemos tomado como proxypara cuantificar el crecimiento econmico. Dada la fuerte estacionalidadque presenta este ndice en el mes de agosto, como valor del IPI en undeterminado momento hemos tomado su media mvil de orden 12. Elcrecimiento econmico estimula los beneficios empresariales y, por tanto,supone un estmulo para el aumento del precio de las acciones; por lo queen principio, debe ser tambin una variable relevante.

    En la determinacin de la relacin rendimiento-factores hemos utiliza-do dos mtodos:

    La utilizacin de la regresin de sistemas de ecuaciones aparente-mente no relacionadas (SUR) estimada por mnimos cuadrados generali-zados factibles, tambin conocido como estimador de Zellner, en lugar deestimar el modelo individualmente en cada cartera. En este caso, el mode-lo a estimar es:

    Rj,t= 0,j + 1,j RMt+2,j DPMLPt+3,j PRt+4,j PENDt +5,j IPCt+6,j IPIt +j,t, j=1,2...,9 (3)

    ANDRES 17/5/04 12:22 Pgina 77

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    78

    El subndice j denota el sector al que se refiere la ecuacin (3) vercuadro 5-, mientras que t denota el nmero de observacin al que hace-mos referencia y j,t, es el trmino de error asociado a la t-sima observa-cin del j-simo sector. La utilizacin de SUR estara motivada porque, enla prctica, los trminos de error de los modelos de estimacin de rendi-mientos como el que presentamos, suelen estar correlacionados para losdiferentes activos o carteras para los que son estimados dichos modelos.Por esta razn, la utilizacin de modelos SUR se ha mostrado como unaprctica comn cuando se estima un modelo multibeta para varias carte-ras o valores simultneamente, siendo ejemplos Roll y Ross (1980), queutilizan mnimos cuadrados generalizados en la estimacin de los par-metros del sistema o Thorbeke (1998). En esta lnea, y en Espaa, pode-mos mencionar los trabajos de Prez y Aranda (2000) y Bruno et. al.(2002). Asimismo, acerca de la conveniencia de la utilizacin de la meto-dologa SUR en este problema, tambin se manifiesta Greene (1999, p.561) refirindose al CAPM. Obsrvese que, al utilizar un modelo SUR, seasume que el rendimiento del mercado es una variable exgena respectoal de cada cartera en particular, lo cual, por otra parte, es una hiptesis departida dentro del marco de los modelos de valoracin de activos en elque nos movemos.

    El mtodo alternativo que ensayamos es la utilizacin de un PMCcon seis neuronas en la capa de entrada (las 6 variables exgenas) y 9neuronas de salida (los rendimientos de los 9 sectores).

    Para comparar el poder de ajuste y prediccin de ambos mtodoshemos dividido la muestra total (que abarca desde 1990 a 2001) en dossubmuestras. La primera abarca los aos 1990-1999 (por tanto, contiene120 observaciones) y con ella estimamos los parmetros del sistemamediante SUR y a la vez, entrenamos la RNA. Ello nos permitir compa-rar la capacidad de ajuste a ambas metodologas. La segunda submues-tra abarca el periodo 2000-2001. Con ella comparamos los rendimientosque predicen la regresin lineal y el PMC con los parmetros obtenidosen el primer subperiodo.

    5.2. Resultados

    En el cuadro 6 se ofrecen los resultados que ofrece la estimacin SURpara el periodo 1990-1999, el coeficiente de determinacin de cada regre-sin (R2), el error cuadrtico medio (ECM) y el ndice de consistencia deTheil (Theil), que expresamos como la diferencia entre 1 y el ndice dedesigualdad de Theil.

    A excepcin del rendimiento de la cartera de mercado (RM), que essignificativo siempre y proporciona, como era de esperar, betas positivas,el resto de variables explicativas no son en bastantes ocasiones estadsti-camente significativas segn los niveles de presuncin estndar y, cuan-do lo son, pueden presentar signos diferentes entre carteras. No obstan-te, remarcamos que excepto en el caso de IPC (que, no obstante, es sig-nificativa en la explicacin del rendimiento del sector de empresasconstructoras con un nivel del 11%), no hay ninguna variable que no sea

    ANDRES 17/5/04 12:22 Pgina 78

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    79

    significativa en la explicacin del rendimiento de al menos una de las car-teras sectoriales. Tambin debemos reconocer que IPI slo es significa-tiva para explicar los rendimientos del sector de Alimentacin.

    Cuadro 6RESULTADOS DE LA ESTIMACIN SUR

    DURANTE EL PERIODO 1990-1999

    BAN ELEC AL CONS CAR MET PETR COM OTR

    Constante 0,003 -0,002 0,006 0,003 0,031 -0,018 -0,005 0,016 -0,027(0,805) (0,890) (0,674) (0,829) (0,102) (0,336) (0,705) (0,333) (0,096)

    RM 1,082 0,836 0,966 1,187 0,691 1,105 0,888 0,901 1,051(0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,000)

    DPMLP 0,046 0,136 0,187 (0,200 -0,198 -0,111 -0,083 -0,248 0,168(0,617) (0,217) (0,111) (0,131) (0,219) (0,498) (0,447) (0,073) (0,231)

    PR -0,524 -0,266 -1,925 -1,958 -0,888 1,297 0,897 1,274 -0,074(0,251) (0,629) (0,001) (0,003) (0,270) (0,112) (0,102) (0,066) (0,916)

    PEND -0,050 0,055 -0,135 -0,285 -0,143 -0,063 -0,029 0,268 -0,232(0,237) (0,274) (0,012) (0,000) (0,054) (0,404) (0,561) (0,000) (0,000)

    IPC 0,448 0,156 -1,254 2,666 -2,771 -2,873 -0,137 -1,107 1,391(0,695) (0,910) (0,393) (0,109) (0,169) (0,160) (0,920) (0,524) (0,427)

    IPI 0,431 -0,821 1,526 1,212 0,543 -1,099 -1,132 0,250 0,512(0,485) (0,269) (0,054) (0,176) (0,618) (0,319) (0,126) (0,790) (0,588)

    R2 84,16% 69,60% 72,60% 75,38% 44,70% 63,29% 71,42% 66,26% 66,98%

    ECM 0,000824 0,001194 0,001359 0,001739 0,002561 0,002638 0,001184 0,001903 0,001934

    Theil 79,56% 70,94% 71,87% 73,54% 55,92% 66,36% 71,58% 69,76% 68,41%

    Nota: Entre parntesis viene dado el nivel de significacin

    Una razn que podra explicar la poca significacin de IPC e IPI es laexistencia de colinealidad entre stas variables y el resto, ya que entre lasvariables explicativas propuestas existen unas claras interacciones. Talcomo ya apuntamos en el epgrafe dedicado al anlisis de la prediccin dela quiebra, nuestro fin primordial consiste en contrastar la capacidad deajuste y predictiva de la RNA que proponemos respecto a la metodologaeconomtrica ensayada; y la colinealidad no supone un problema en estecontexto. Por esta razn, entendemos conveniente de nuevo mantenertodas las variables explicativas inicialmente seleccionadas con los valoresestimados para sus coeficientes pues, en cualquier caso, stos puedenconsiderarse como los mejores a partir de la experiencia muestral dis-ponible, ya que la existencia de colinealidad no supone la existencia desesgo en las estimaciones de los coeficientes realizadas con SUR. Tambindebemos recordar que, excepto la variable IPC, todas las variables selec-cionadas se han mostrado relevantes en la explicacin de los rendimien-tos de al menos una de las carteras sectoriales. Asimismo, con indepen-

    ANDRES 17/5/04 12:22 Pgina 79

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    80

    dencia de que pueda haber ciertos problemas de colinealidad, tambinpuede existir un notable componente no lineal en la relacin entre el ren-dimiento de las carteras y la variacin del IPC y del IPI que no puede sercaptado con el modelo de regresin. Este aspecto supone una razn adi-cional para seguir considerando estas variables en la prediccin de rendi-mientos, ya que las RNAs s son capaces de captar dicho componente.

    En el cuadro 7 se ofrece el resultado de la calidad del ajuste del PMCde los rendimientos burstiles para el periodo 1990-1999. En su especifi-cacin final, se han introducido 6 neuronas en una capa oculta, ya que seha observado que aadir una capa adicional y/o ms neuronas no dismi-nua sustancialmente el error de la RNA. Asimismo, en la fase de entre-namiento, el nmero de pocas ha sido 5.000, ya que a partir de sta, elerror que proporcionaba no disminua. Hemos observado que variospesos sinpticos asociados a las dos neuronas de la capa de entrada querecogen el valor de IPC e IPC estn notablemente alejados de cero, loque puede ser indicativo de que estas variables son relevantes para expli-car los rendimientos burstiles. El hecho de que su significacin en elmodelo de regresin fuera dudosa, puede ser debido a que la dependen-cia de los rendimientos de las carteras respecto a la inflacin y el nivel deactividad industrial tiene un componente no lineal de cierta importancia,que con la regresin no ha sido captado.

    Cuadro 7RESULTADOS DE LA RNA PARA EL PERIODO 1990-1999

    BAN ELEC AL CONS CAR MET PETR COM OTR

    R2 85,47% 73,82% 71,19% 79,72% 55,38% 62,48% 72,71% 72,80% 73,96%

    ECM 0,000852 0,001257 0,002139 0,00158 0,002085 0,00338 0,001145 0,001962 0,001801

    Theil 79,43% 69,72% 66,00% 75,38% 62,26% 63,34% 72,00% 71,37% 70,53%

    Un anlisis comparativo de los cuadros 6 y 7 sugiere que hay ciertaevidencia de la superioridad en el ajuste obtenido de la RNA respecto aSUR. Puede observarse que en 7 de las 9 carteras sectoriales, el coefi-ciente de determinacin de la RNA es superior. No obstante, dicha afir-macin queda en cierta forma diluida, ya que slo en 5 carteras el ndicede Theil muestra un mejor comportamiento de la RNA, mientras que hay5 carteras en las que se produce un menor ECM cuando se utilizan mto-dos de regresin.

    En el cuadro 8 se observan los resultados de las predicciones de losrendimientos de los sectores en los aos 2000-2001 con las especificacio-nes SUR y neuronal. En este caso es donde se observa, de forma ntida,la superioridad de la capacidad predictiva de la RNA respecto a SUR.Mientras que el coeficiente de determinacin slo es mejor con la especi-ficacin SUR en una cartera (la de empresas de alimentacin), podemosobservar que el ECM cometido es, en todas las carteras, inferior en laRNA. Asimismo, el ndice de Theil indica que la RNA produce prediccio-nes ms consistentes que la metodologa SUR excepto en el caso de las

    ANDRES 17/5/04 12:22 Pgina 80

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    81

    carteras de alimentacin y la de otras industrias.

    Cuadro 8RESULTADOS DE LA PREDICCIN MEDIANTE SUR VERSUS RNA

    PARA EL PERIODO 2000-2001

    SUR RNA

    R2 ECM Theil R2 ECM Theil

    BAN 54,34% 0,002386 62,83% 67,89% 0,001576 69,35%ELEC 19,61% 0,005901 42,02% 48,14% 0,002176 49,22%AL 7,14% 0,016552 34,48% 0,04% 0,007577 26,16%CON 21,38% 0,010786 42,69% 38,27% 0,003866 49,64%CAR 19,66% 0,005100 44,63% 29,89% 0,003877 47,40%MET 4,97% 0,016017 34,03% 17,88% 0,006110 44,68%PETR 0,05% 0,015137 30,00% 16,81% 0,004746 41,25%COM 42,76% 0,006074 48,66% 48,63% 0,004621 53,59%OTR 27,77% 0,004553 51,34% 27,99% 0,003009 50,36%

    5. CONCLUSIONES

    En este trabajo hemos realizado un anlisis comparativo de la capaci-dad de ajuste y prediccin de los mtodos economtricos convencionalesrespecto al empleo de las RNAs del tipo PMC en un problema clsico declasificacin financiera, la prediccin de la quiebra; y en la estimacin delos rendimientos de carteras de valores a partir de una formulacin mul-tibeta. En la primera aplicacin debemos realizar una modelizacin unie-cuacional, trabajndose con datos de carcter transversal, mientras queen la segunda, los datos utilizados son series temporales, siendo la mode-lizacin de los rendimientos de las carteras, de carcter multiecuacional.Aunque se trata de escenarios de modelizacin diferentes, en amboscasos, los resultados son favorables a las RNAs.

    En el problema de la prediccin de la quiebra, los resultados obte-nidos evidencian la superioridad de las RNAs respecto a los mtodosmultivariantes habituales, tanto desde el punto de vista del ajuste obte-nido como desde el punto de vista predictivo. Asimismo, los resultadosque obtenemos con nuestra RNA son similares a los que obtienen lasRNAs de Serrano y Martn (1993) y Lpez y Flrez (2000) con la mismabase de datos. No obstante, en nuestro trabajo, al reducir las variablesexplicativas inicialmente elegidas a un nmero limitado de factores,hemos utilizado un PMC de dimensin sustancialmente inferior a la deestos trabajos.

    En la segunda aplicacin hemos comparado, desde el punto de vistade una formulacin multibeta de los rendimientos de las acciones, lacapacidad predictiva de la metodologa SUR y un PMC. Tanto con la

    ANDRES 17/5/04 12:22 Pgina 81

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    82

    muestra de ajuste como con la de comprobacin, la evidencia apuntaba aque era ms eficiente el PMC. No obstante, debemos reconocer que ellono se mostraba de forma ntida en la fase de ajuste, pero s que era muchoms evidente en la muestra de testeo.

    Entendemos que los positivos resultados que obtenemos con lasRNAs respecto al resto de mtodos ensayados en las dos aplicacionesefectuadas, pueden ser imputados a la mayor capacidad de las RNAs paraaproximar relaciones no lineales y, paralelamente, tener en cuenta lasinterrelaciones que existen entre las variables explicativas.

    No obstante, tal como apuntan Altman et. al. (1994), no pensamos quelas RNAs sean un instrumento sustitutivo de los mtodos convencionales,sino ms bien un complemento, ya que presentan ciertas carencias. Enprimer lugar, los coeficientes obtenidos con los mtodos convencionalesson ms fciles de interpretar, ya que son comprensibles intuitivamente yel contraste de su significacin es sencillo. En cambio, la comprensin delos resultados que ofrece un PMC es ms compleja, ya que la capa ocultaacta como una caja negra, mientras que tampoco es sencillo determi-nar el significado de los pesos sinpticos.

    Por otra parte, los mtodos multivariantes convencionales son msfciles de implementar y estimar que una RNA ya que, en esta ltima, elproceso de entrenamiento es relativamente lento. Adems, no existe unafrmula generalmente aceptada sobre cmo determinar la dimensinptima de una RNA, aunque tal como apuntamos en el tercer epgrafe,existen algunos criterios y tcnicas que pueden ayudar a disear una RNAcon una dimensin adecuada. No obstante, este aspecto depender, enltima instancia, de la subjetividad y experiencia del investigador.

    REFERENCIAS BIBLIOGRFICAS

    Adya, M. y Collopy, F. (1998): How Effective are Neural Networks at Fore-casting and Prediction? A Review and Evaluation, Journal of Fore-casting, vol. 17, n 5-6, pp. 89-94.

    Ahmadi, H. (1996): Testability of Arbitage Pricing Theory by Neural Net-works, en Trippi; R.R y Turban, E. (coords.), Neural Networks in Finan-ce and Investing, Irwing, Chicago, pp. 543-554.

    Altman, E.I. (1968): Financial Ratios, Discriminant Analysis and the Pre-diction of Corporate Bankrupcy, Journal of Finance, vol. 23, n 4,pp. 589-609.

    Altman, E.I.; Marco, G. y Varetto, F. (1994): Corporate Distress Diagnosis:Comparisons Using Linear Discriminent Analysis and Neural Net-works, Journal of Banking and Finance, vol. 18, n 3, pp. 505-529.

    Beaver, W. (1967): Financial Ratios as Predictors of Failure, SelectedStudies, 1966. The Journal of Accounting Research, vol. 4, suplemen-to, pp. 71-111.

    ANDRES 17/5/04 12:22 Pgina 82

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    83

    Bonilla, M.; Marco, P.P. y Olmeda, I. (2000): Forecasting Exchange RatesVolatilities Using Artificial Neural Networks, en Bonilla; M.; Casass,T. y Sala, R. (coords.), Financial Modelling, Physica-Verlag, Heidelberg,pp. 57-68.

    Bruno, N.; Medina, U. y Morini, S. (2002): Contraste factorial del arbitat-ge pricing theory en el mercado burstil espaol, Anlisis Financiero,n 88, pp. 58-63.

    Castromn, J.L. y Porto, N. (2000): Asistencia Neuronal en la toma dedecisiones: una aplicacin al credit scoring en un ambiente de incerti-dumbre, VII Congreso de la Sociedad Internacional de Gestin y Eco-noma Fuzzy (SIGEF), septiembre, Chania (Grecia).

    Dimitras, A.I.; Slowinski, R.; Susmaga, R. y Zopounidis, C. (1999): Busi-ness Failure Prediction Using Rough Sets, European Journal of Ope-rational Research, vol. 114, n 2, pp. 263-280.

    Dutta, S. y Shekhar, S. (1988): Bond Rating: A Nonconservative Applica-tion of Neural Networks, Proceedings of the IEEE International Con-ference of Neural Networks, pp. II443-II450.

    Fernndez, F.; Gonzlez, C. y Sosvilla, S. (2000): On the Profitability ofTechnical Trading Rules Based on Artificial Neural Networks: Evidencefrom Madrid Stock Market, Economic Letters, vol. 69, n 1, pp. 89-94.

    Ferson, W.E. y Harvey, C.R. (1991): The Variation of Economic Risk Pre-miums, Journal of Political Economy, vol. 99, n 2, pp. 385-415.

    Greene, W.H. (1998): Anlisis economtrico, Prentice-Hall, Madrid, 1999.

    Harvey, C.R. (1988): The Real Term Structure and Consumption Growth,Journal of Financial Economics, vol. 22, n 2, pp. 305-333.

    Harvey, C.R. (1991): The Term Structure and World Economic Growth,The Journal of Fixed Income, vol. 1, n 1, pp. 7-19.

    Harvey, C.R; Travers, K.E. y Costa, M.J. (2000): Forecasting EmergingMarket Returns Using Neural Networks, Emerging Markets Quarterly,vol. 4, n 2, pp. 1-12.

    Hawley, D.D; Johnson, J.D. y Raina, D. (1990): Artificial Neural Systems:A New Tool for Financial Decision-Making, Financial Analysts Jour-nal, vol. 46, n 6, noviembre-diciembre, pp. 63-72.

    Hornick, K.; Stinchcombe, M. y White, H. (1989): Multilayer Feedfor-ward Networks Are Universal Approximators, Neural Networks,vol. 2, n 5, pp. 359-366.

    Hutchinson, J.M.; Lo, A.W. y Poggio, T. (1994): A non Parametric Appro-ach to Pricing and Hedging Derivative Securities Via Learning Net-works, The Journal of Finance, vol. 39, n 3, pp. 851-889.

    ANDRES 17/5/04 12:22 Pgina 83

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    84

    Iglesias, S. (2000): La valoracin de activos con riesgo: modelos de fac-tor nico vs. modelos multifactoriales. Un enfoque emprico, XIVCongreso Nacional y X Congreso Hispano-Francs de la AsociacinEuropea de Direccin y Economa de la Empresa (AEDEM), junio,Jan.

    Jensen, H.L. (1992): Using Neural Networks for Credit Scoring, Mana-gerial Finance, vol. 18, n 6, pp. 15-26.

    John, G.H.; Miller, PP. y Kerber, R. (1996): Stock Selection Using RECON,en Refenes, A.P; Mostafa, Y.A., Moody, J. y Weigend, A. (coords.),Neural Networks in Financial Engineering, World Scientific, NuevaJersey, pp. 303-316.

    Kanas, A. (2001): Neural Networks vs Linear Models of Stock Returns:An Application to the UK and German Stock Market Indexes, enZopounidis; C.; Pardalos, P. y Baourakis, G. (coords.), Fuzzy Sets inManagement, Economics and Marketing, World Scientific, New Jer-sey, pp. 181-193.

    Kingdon, J. y Feldman, K. (1995): Genetic Algorithms for Bankruptcy Pre-diction, Research Report n. 01-95, SearchSpace Ltd., Londres.

    Kuan, C. y White, H. (1994): Artificial Neural Networks: An EconometricPerspective, Econometric Reviews, vol. 13, n 6, pp. 1-91.

    Kuo, R.J; Chen, C.H. y Hwang, Y.C. (2001): An Intelligent Stock TradingDecision Support System Through Integration of Genetic AlgorithmBased Fuzzy Neural Network and Artificial Network, Fuzzy Sets andSystems, vol. 118, n 1, pp. 47-52.

    Laffarga, J.; Martn, J.L. y Vzquez, J. (1986): El pronstico a largo plazodel fracaso en las instituciones bancarias: metodologa y aplicacionesdel caso espaol, Esic-Market, n 54, pp. 113-123.

    Lam, K. P.P.; Chiu, K.C. y Chan, W.K. (1996): Stock Selection UsingRecon, en Refenes, A.P; Mostafa, Y.A., Moody, J. y Weigend, A.(coords.), Neural Networks in Financial Engineering, World Scientific,New Jersey, pp. 317-329.

    Lechn, P.P.; Ruiz, F.J. y Santamara, R. (1997): Valoracin de opcionesmediante inteligencia artificial: Contraste emprico con las opcionesIBEX-35, Actualidad Financiera, n 2, pp. 35-44.

    Lpez, E. y Flrez, R. (2000): Aplicacin de dos modelos de redes neuro-nales artificiales para el anlisis econmico-financiero empresarial,Revista Europea de Direccin y Economa de la Empresa, vol. 9, n 2,pp. 141-166.

    Mahfoud, S. y Mani, G. (1996): Financial Forecasting Using Genetic Algo-ritms, Applied Artificial Intelligence, vol. 10, n 6, pp. 543-565.

    Martn, B. y Sanz, A. (1997): Redes neuronales y sistemas borrosos, Ra-Ma, Madrid.

    ANDRES 17/5/04 12:22 Pgina 84

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    85

    Matsatsinis, N.; Doumpos, M. y Zopounidis, C. (1997): Knowledge Acqui-sition and Representation for Expert Systems in the Field of FinancialAnalysis, Expert Systems with Applications: An International Jour-nal, vol. 12, n 2, pp. 247-262.

    Matsatsinis, N.; Kosmidou, K.; Doumpos, M. y Zopounidis, C. (2003): AFuzzy Decision Aiding Method for the Assestment of Corporate Ban-krupcy, Fuzzy Economic Review, vol. 8, n 1, pp. 13-24.

    Prez, F. y Aranda, C. (2000): Las intervenciones del Banco de Espaa yla reaccin del mercado burstil, Anlisis Financiero, n 80, pp. 26-33.

    Prez, J.; Torra, S. y Borrell, M. (2000): Modelos para la prediccin de lostipos de inters en el mercado interbancario: estructuras lineales,GARCH y redes neuronales artificiales, Revista Asturiana de Econo-ma, n 18, pp. 123-139.

    Prez-Rodrguez, J. y Torras, S. (2001): Diversas formas de prediccin nolineal y contrastes de seleccin de modelos en la prediccin de rendi-mientos del IBEX-35, Fedea, Documento de trabajo, serie de Econo-ma Internacional, Monetaria y Financiera n 94, Madrid.

    Pina, V. (1989): La informacin contable en la prediccin de la crisis ban-caria, Revista Espaola de Financiacin y Contabilidad, vol. 18, n 58,pp. 309-338.

    Rahimian, E.; Singh, S.; Tammachote, T. y Rivmani, R. (1996): BankrupcyPrediction by Neural Network, en Trippi; R.R y Turban, E. (coords.),Neural Networks in Finance and Investing, Irwing, Chicago, pp. 243-259.

    Refenes, A.N. (1995): Neural Network Design Considerations, en Refe-nes; A.N. (coord), Neural networks in capital markets, John Willey,Nueva York, pp. 10-25.

    Refenes, A.N. (1996): Constructive Learning and its Application toCurrency Exchange Rate Forecasting, en Trippi; R.R. y Turban, E.(coords.), Neural Networks in Finance and Investing, Irwing, Chicago,pp. 777-805.

    Richeson, L.; Zimmermann, R.A. y Barnett, K.G. (1994): Predicting Con-sumer Credit Performance: Can Neural Networks Outperform Traditio-nal Statistical Methods?, International Journal of Applied Expert Sys-tems, vol. 2, n 2, pp. 116-130.

    Rico, PP. (2001): Estructura temporal de los tipos de inters y crecimien-to econmico en Espaa, Revista Espaola de Financiacin y Conta-bilidad, vol. 30, n 108, pp. 393-407.

    Robles, J. y Naylor, C. (1996): Applying Neural Networks in Cooper Tra-ding: A Technical Analysis Simulation, en Refenes, A.P; Mostafa, Y.A.;Moody, J. y Weigend, A. (coords.), Neural Networks in Financial Engi-neering, World Scientific, New Jersey, pp. 234-240.

    ANDRES 17/5/04 12:22 Pgina 85

  • JORGE DE ANDRS SNCHEZ. DOS APLICACIONES EMPRICAS DE LAS REDES NEURONALES ARTIFICIALES...

    86

    Roll, R. y Ross, S. A. (1980): An Empirical Investigation of the Arbrbitrat-ge Pricing Theory, The Journal of Finance, vol. 35, n 5, pp. 1073-1103.

    Ross, S.A. (1976): The Arbitrage Theory of Capital Pricing, Journal ofEconomic Theory, vol. 13, n 3, pp. 341-360.

    Rummelhart, D. y Mcclelland J. (1986): Parallel distributed processing,MIT Press, Cambrigde.

    Serrano, C. y Gallizo, J.L. (1997): Las redes neuronales artificiales en el tra-tamiento de la informacin financiera, ,Consulta en julio de 1997.

    Serrano, C. y Martn, B. (1993): Prediccin de la quiebra bancaria median-te el empleo de redes de neuronas artificiales, Revista Espaola deFinanciacin y Contabilidad, vol. 22, n 74, pp. 153-171.

    Sharpe, W. (1964): Capital Asset Prices: A Theory of Market EquilibriumUnder Conditions of Risk, The Journal of Finance, vol. 19, n 3, pp.425-442.

    Spanos, M.; Kosmidou, K. y Doumpos, M. (2000): Portfolio Selection withFuzzy Logic, VII Congreso de la Sociedad Internacional de Gestin yEconoma Fuzzy (SIGEF), Chania (Grecia): pp. 91-101.

    Swanson, R. y White, H. (1995): A Model-Selection Approach to Assesingthe Information in the Term Structure Using Linear Models and Artifi-cial Neural Networks, Journal of Business and Economic Statistics,vol. 13, n 3, pp. 265-275.

    Tam, K.-Y. y Kiang, M.-Y. (1992): Predicting Bank Failures: A Neural Net-work Approach, Management Science, vol. 38, n 7, pp. 926-947.

    Thorbeke, W. (1997): On Stock Market Returns and Monetary Policy,The Journal of Finance, vol. 52, n 2, pp. 629-658.

    Trippi, R.R. y Desieno, D. (1992): Trading Equity Index Futures with a Neu-ral Network, Journal of Portfolio Management, vol. 18, n 5 pp. 27-33.

    Trippi, R.R. y Lee, J. K. (1996): Artificial intelligence in finance & investing,Irwin, Chicago.

    West, R. G. (1985): A Factor-Analytic Approach to Bank Condition, Jour-nal of Banking and Finance, vol. 9, n 2, pp. 253-266.

    White, H. (1988): Economic Prediction Using Neural Networks: the Caseof IBM Daily Stock Prices, Proceedings of the IEEE International Con-ference of Neural Networks, pp. II451-II458.

    Wilson, R.L. y Sharda, R. (1994): Bankruptcy Prediction Using Neural Net-works, Decision Support Systems, vol. 11, n 5, pp. 545-557.

    ANDRES 17/5/04 12:22 Pgina 86

  • REVISTA ASTURIANA DE ECONOMA - RAE N 28 2003

    87

    Wong, F.S.; Wang, Pp.-Z.; Goh, T-H. y Quek, B. K. (1992): Fuzzy NeuralSystems for Stock Selection, Financial Analysts Journal, vol. 48, n 1,enero-febrero, pp. 47-52.

    Yao, J.-T. y Poh, H.L. (1996): Equity Forecasting: A Case Study in the KLSEIndex, en Refenes, A.P; Mostafa, Y.A.; Moody, J. y Weigend, A.(coords.), Neural Networks in Financial Engineering, World Scientific,Nueva Jersey, pp. 341-253.

    Yoon, Y. y Sales, G. (1991): Predicting Stock Price Performance: A NeuralNetwork Approach, Proceedings of the IEEE 24th annual Internationalconference of Systems Sciences, pp. 156-162.

    ABSTRACT

    In many financial problems the relation between relevant varia-bles is more complex than theoretical models suppose (despitetheir clear usefulness). Moreover, in these problems the relevantinformation is usually ill-structured. In this respect, many authorshave shown the suitability of Artificial Intelligence instruments.The aim of this paper is to provide evidence about the usefulnessof Artificial Neural Networks in two classic topics of financialclassification and financial prediction: failure business predictionand estimation of the stock portfolios return. In our applications,we compare the performance of the RNAs with the performanceof classical multivariate methods that are used frecuently in theanalysis of those problems.

    Key words: artificial intelligence, artificial neural networks, failureprediction, multiple factor pricing models, CAPM, APT.

    ANDRES 17/5/04 12:22 Pgina 87