Antologia de Redes Neuronales Entregado

40
1 Índice 2.- Aplicaciones de las redes neuronales. El caso de la Bibliometría Sotolongo, G.*; Guzmán, María Victoria* Introducción …………………………................................................................ ......................................................................... 9 Redes Neuronales Artificiales…………………………………………………………………………………………………... 1 0 Estructura de una Red Neuronal Artificial…………………………………………………………………………………….. 1 1 Modelo Kohonen............................................................. ……………………………………………………………. 1 3 Aplicaciones…………………………………….…………………………………………………………………………………………. 1 5 3.-Nuevos modelos de redes neuronales evolutivas Tesis Doctoral de: Pedro Antonio Gutiérrez Peña Redes Neuronales Artificiales……………………………………………………………………………………………………… 2 0 1.- Damián Jorge Matich, Universidad Tecnológica Nacional – Facultad Regional Rosario Introducción…………………………….……………………………………………………………………………………………... 2 Historia de las redes neuronales……………………………………………………………………………………………... 3 Definiciones de una red neuronal……………………………………………………………………………………………… 4 Ventajas que ofrecen las red neuronal………………………………………………………………………………………. 4

Transcript of Antologia de Redes Neuronales Entregado

Page 1: Antologia de Redes Neuronales Entregado

1

Índice

2.- Aplicaciones de las redes neuronales. El caso de la Bibliometría Sotolongo, G.*; Guzmán, María Victoria*

Introducción …………………………......................................................................................................................................... 9

Redes Neuronales Artificiales…………………………………………………………………………………………………... 10

Estructura de una Red Neuronal Artificial…………………………………………………………………………………….. 11

Modelo Kohonen.............................................................……………………………………………………………. 13

Aplicaciones…………………………………….…………………………………………………………………………………………. 15

3.-Nuevos modelos de redes neuronales evolutivas Tesis Doctoral de: Pedro Antonio Gutiérrez Peña

Redes Neuronales Artificiales……………………………………………………………………………………………………… 20

Redes Neuronales de Unidad Sigmoide…………………………………………………………………..………………..........

22

Modelo Funcional de La RNAs………………………….…………………………………………………………………………... 24

4.- Introducción a las Redes Neuronales de Iván Martínez

Introducción……………..………………….……………………………………………………………………………………………... 28

Redes Artificiales………………………………………………………………………………………………………………………... 30

1.- Damián Jorge Matich, Universidad Tecnológica Nacional – Facultad Regional Rosario

Introducción…………………………….……………………………………………………………………………………………... 2

Historia de las redes neuronales……………………………………………………………………………………………... 3

Definiciones de una red neuronal……………………………………………………………………………………………… 4

Ventajas que ofrecen las red neuronal………………………………………………………………………………………. 4

Page 2: Antologia de Redes Neuronales Entregado

1

1.1 Introducción.

El hombre se ha caracterizado siempre por su búsqueda constante de nuevas vías para mejorar sus condiciones de vida. Estos esfuerzos le han servido para reducir el trabajo en aquellas operaciones en las que la fuerza juega un papel primordial. Los progresos obtenidos han permitido dirigir estos esfuerzos a otros campos, como por ejemplo, a la construcción de máquinas calculadoras que ayuden a resolver de forma automática y rápida determinadas operaciones que resultan tediosas cuando se realizan a mano.

Uno de los primeros en acometer esta empresa fue Charles Babbage, quien trató infructuosamente de construir una máquina capaz de resolver problemas matemáticos.

Posteriormente otros tantos intentaron construir máquinas similares, pero no fue hasta la Segunda Guerra Mundial, cuando ya se disponía de instrumentos electrónicos, que se empezaron a recoger los primeros frutos. En 1946 se construyó la primera computadora electrónica, ENIAC. Desde entonces los desarrollos en este campo han tenido un auge espectacular.

Estas máquinas permiten implementar fácilmente algoritmos para resolver multitud de problemas que antes resultaban engorrosos de resolver. Sin embargo, se observa una limitación importante: ¿qué ocurre cuando el problema que se quiere resolver no admite un tratamiento algorítmico, como es el caso, por ejemplo, de la clasificación de objetos por rasgos comunes? Este ejemplo demuestra que la construcción de nuevas máquinas más versátiles requiere un enfoque del problema desde otro punto de vista. Los desarrollos actuales de los científicos se dirigen al estudio de las capacidades humanas como una fuente de nuevas ideas para el diseño de las nuevas máquinas. Así, la inteligencia artificial es un intento por descubrir y describir aspectos de la inteligencia humana que pueden ser simulados mediante máquinas. Esta disciplina se ha desarrollado fuertemente en los últimos años teniendo aplicación en algunos campos como visión artificial, demostración de teoremas, procesamiento de información expresada mediante lenguajes humanos... etc.

Las redes neuronales son más que otra forma de emular ciertas características propias de los humanos, como la capacidad de memorizar y de asociar hechos. Si se examinan con atención aquellos problemas que no pueden expresarse a través de un algoritmo, se observará que todos ellos tienen una característica en común: la experiencia. El hombre es capaz de resolver estas situaciones acudiendo a la experiencia acumulada. Así, parece claro que una forma de aproximarse al problema consista en la construcción de sistemas que sean capaces de reproducir esta característica humana. En definitiva, las redes neuronales no son más que un modelo artificial y simplificado del cerebro humano, que es el ejemplo más perfecto del que disponemos para un sistema que es capaz de adquirir conocimiento a través de la experiencia. Una red neuronal es “un nuevo sistema para el tratamiento de la información, cuya unidad básica de procesamiento está inspirada en la célula fundamental del sistema nervioso humano: la neurona”.

Page 3: Antologia de Redes Neuronales Entregado

1

2.1 Historia de las redes neuronales.

1936 - Alan Turing. Fue el primero en estudiar el cerebro como una forma de ver el mundo de la computación. Sin embargo, los primeros teóricos que concibieron los fundamentos de la computación neuronal fueron Warren McCulloch, un neurofisiólogo, y Walter Pitts, un matemático, quienes, en 1943, lanzaron una teoría acerca de la forma de trabajar de las neuronas (Un Cálculo Lógico de la Inminente Idea de la Actividad Nerviosa - Boletín de Matemática Biofísica 5: 115-133). Ellos modelaron una red neuronal simple mediante circuitos eléctricos.

1949 - Donald Hebb. Fue el primero en explicar los procesos del aprendizaje (que es el elemento básico de la inteligencia humana) desde un punto de vista psicológico, desarrollando una regla de como el aprendizaje ocurría. Aun hoy, este es el fundamento de la mayoría de las funciones de aprendizaje que pueden hallarse en una red neuronal. Su idea fue que el aprendizaje ocurría cuando ciertos cambios en una neurona eran activados. También intentó encontrar semejanzas entre el aprendizaje y la actividad nerviosa. Los trabajos de Hebb formaron las bases de la Teoría de las Redes Neuronales.

1950 - Karl Lashley. En sus series de ensayos, encontró que la información no era almacenada en forma centralizada en el cerebro sino que era distribuida encima de él.

1956 - Congreso de Dartmouth. Este Congreso frecuentemente se menciona para indicar el nacimiento de la inteligencia artificial.

1957 - Frank Rosenblatt. Comenzó el desarrollo del Perceptron. Esta es la red neuronal más antigua; utilizándose hoy en día para aplicación como identificador de patrones. Este modelo era capaz de generalizar, es decir, después de haber aprendido una serie de patrones podía reconocer otros similares, aunque no se le hubiesen presentado en el entrenamiento. Sin embargo, tenía una serie de limitaciones, por ejemplo, su incapacidad para resolver el problema de la función OR-exclusiva y, en general, era incapaz de clasificar clases no separables linealmente.

1959 - Frank Rosenblatt: Principios de Neurodinámica. En este libro confirmó que, bajo ciertas condiciones, el aprendizaje del Perceptron convergía hacia un estado finito (Teorema de Convergencia del Perceptron).

1960 - Bernard Widroff/Marcian Hoff. Desarrollaron el modelo Adaline (ADAptative LINear Elements). Esta fue la primera red neuronal aplicada a un problema real (filtros adaptativos para eliminar ecos en las líneas telefónicas) que se ha utilizado comercialmente durante varias décadas.

1961 - Karl Steinbeck: Die Lernmatrix. Red neuronal para simples realizaciones técnicas (memoria asociativa).

Page 4: Antologia de Redes Neuronales Entregado

1

1969 - Marvin Minsky/Seymour Papert. En este año casi se produjo la “muerte abrupta” de las Redes Neuronales; ya que Minsky y Papert probaron (matemáticamente) que el Perceptrons no era capaz de resolver problemas relativamente fáciles, tales como el aprendizaje de una función no-lineal. Esto demostró que el Perceptron era muy débil, dado que las funciones no-lineales son extensamente empleadas en computación y en los problemas del mundo real.

1974 - Paul Werbos. Desarrolló la idea básica del algoritmo de aprendizaje de propagación hacia atrás (backpropagation); cuyo significado quedó definitivamente aclarado en 1985.

1977 - Stephen Grossberg: Teoría de Resonancia Adaptada (TRA). La Teoría de Resonancia Adaptada es una arquitectura de red que se diferencia de todas las demás previamente inventadas. La misma simula otras habilidades del cerebro: memoria a largo y corto plazo.

1985 - John Hopfield. Provocó el renacimiento de las redes neuronales con su libro: “Computación neuronal de decisiones en problemas de optimización.”

1986 - David Rumelhart/G. Hinton. Redescubrieron el algoritmo de aprendizaje de propagación hacia atrás (backpropagation).

A partir de 1986, el panorama fue alentador con respecto a las investigaciones y el desarrollo de las redes neuronales. En la actualidad, son numerosos los trabajos que se realizan y publican cada año, las aplicaciones nuevas que surgen (sobre todo en el área de control) y las empresas que lanzan al mercado productos nuevos, tanto hardware como software (sobre todo para simulación).

3.1 Definiciones de una red neuronal.

Existen numerosas formas de definir a las redes neuronales; desde las definiciones cortas y genéricas hasta las que intentan explicar más detalladamente qué son las redes neuronales. Por ejemplo:

1) Una nueva forma de computación, inspirada en modelos biológicos.

2) Un modelo matemático compuesto por un gran número de elementos procesales organizados en niveles.

3) un sistema de computación compuesto por un gran número de elementos simples, elementos de procesos muy interconectados, los cuales procesan información por medio de su estado dinámico como respuesta a entradas externas.

4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptativos) y con organización jerárquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico.

3.2 Ventajas que ofrecen la red neuronal.

Debido a su constitución y a sus fundamentos, las redes neuronales artificiales presentan un gran número de características semejantes a las del cerebro. Por ejemplo, son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer

Page 5: Antologia de Redes Neuronales Entregado

1

características esenciales a partir de entradas que representan información irrelevante, etc. Esto hace que ofrezcan numerosas ventajas y que este tipo de tecnología se esté aplicando en múltiples áreas. Entre las ventajas se incluyen:

_ Aprendizaje Adaptativo. Capacidad de aprender a realizar tareas basadas en un entrenamiento o en una experiencia inicial.

_ Auto-organización. Una red neuronal puede crear su propia organización o representación de la información que recibe mediante una etapa de aprendizaje.

_ Tolerancia a fallos. La destrucción parcial de una red conduce a una degradación de su estructura; sin embargo, algunas capacidades de la red se pueden retener, incluso sufriendo un gran daño.

_ Operación en tiempo real. Los cómputos neuronales pueden ser realizados en paralelo; para esto se diseñan y fabrican máquinas con hardware especial para obtener esta capacidad.

_ Fácil inserción dentro de la tecnología existente. Se pueden obtener chips especializados para redes neuronales que mejoran su capacidad en ciertas tareas. Ello facilitará la integración modular en los sistemas existentes.

3.2.1 Aprendizaje adaptativo.

La capacidad de aprendizaje adaptativo es una de las características más atractivas de redes neuronales. Esto es, aprenden a llevar a cabo ciertas tareas mediante un entrenamiento con ejemplos ilustrativos.Como las redes neuronales pueden aprender a diferenciar patrones mediante ejemplos y entrenamientos, no es necesario elaborar modelos a priori ni necesidad de especificar funciones de distribución de probabilidad.

Las redes neuronales son sistemas dinámicos autoadaptativos. Son adaptables debido a la capacidad de autoajuste de los elementos procesales (neuronas) que componen el sistema.

Son dinámicos, pues son capaces de estar constantemente cambiando para adaptarse a las nuevas condiciones.

En el proceso de aprendizaje, los enlaces ponderados de las neuronas se ajustan de manera que se obtengan ciertos resultados específicos. Una red neuronal no necesita un algoritmo para resolver un problema, ya que ella puede generar su propia distribución de pesos en los enlaces mediante el aprendizaje. También existen redes que continúan aprendiendo a lo largo de su vida, después de completado su período de entrenamiento.

La función del diseñador es únicamente la obtención de la arquitectura apropiada. No es problema del diseñador el cómo la red aprenderá a discriminar. Sin embargo, sí es necesario que desarrolle un buen algoritmo de aprendizaje que le proporcione a la red la capacidad de discriminar, mediante un entrenamiento con patrones.

3.2.2 Auto-organización.

Page 6: Antologia de Redes Neuronales Entregado

1

Las redes neuronales emplean su capacidad de aprendizaje adaptativo para autoorganizar la información que reciben durante el aprendizaje y/o la operación.

Mientras que el aprendizaje es la modificación de cada elemento procesal, la autoorganización consiste en la modificación de la red neuronal completa para llevar a cabo un objetivo específico.

Cuando las redes neuronales se usan para reconocer ciertas clases de patrones, ellas autoorganizan la información usada. Por ejemplo, la red llamada backpropagation, creará su propia representación característica, mediante la cual puede reconocer ciertos patrones.

Esta autoorganización provoca la generalización: facultad de las redes neuronales de responder apropiadamente cuando se les presentan datos o situaciones ha las que no había sido expuesta anteriormente. El sistema puede generalizar la entrada para obtener una respuesta. Esta característica es muy importante cuando se tiene que solucionar problemas en los cuales la información de entrada no es muy clara; además permite que el sistema dé una solución, incluso cuando la información de entrada está especificada de forma incompleta.

3.2.3 Tolerancia a fallos.Las redes neuronales fueron los primeros métodos computacionales con la capacidad inherente de tolerancia a fallos. Comparados con los sistemas computacionales tradicionales, los cuales pierden su funcionalidad cuando sufren un pequeño error de memoria, en las redes neuronales, si se produce un fallo en un número no muy grande de neuronas y aunque el comportamiento del sistema se ve influenciado, no sufre una caída repentina.

Hay dos aspectos distintos respecto a la tolerancia a fallos:a) Las redes pueden aprender a reconocer patrones con ruido, distorsionados o incompletos. Esta es una tolerancia a fallos respecto a los datos.b) Las redes pueden seguir realizando su función (con cierta degradación) aunque se destruya parte de la red.

La razón por la que las redes neuronales son tolerantes a los fallos es que tienen su información distribuida en las conexiones entre neuronas, existiendo cierto grado de redundancia en este tipo de almacenamiento. La mayoría de los ordenadores algorítmicos y sistemas de recuperación de datos almacenan cada pieza de información en un espacio único, localizado y direccionable. En cambio, las redes neuronales almacenan información no localizada. Por lo tanto, la mayoría de las interconexiones entre los nodos de la red tendrán sus valores en función de los estímulos recibidos, y se generará un patrón de salida que represente la información almacenada.

3.2.4 Operación en tiempo real.

Una de las mayores prioridades, casi en la totalidad de las áreas de aplicación, es la necesidad de realizar procesos con datos de forma muy rápida. Las redes neuronales se adaptan bien a esto debido a su implementación paralela. Para que la mayoría de las redes puedan operar en un entorno de tiempo real, la necesidad de cambio en los pesos de las conexiones o entrenamiento es mínima.

3.2.5 Fácil inserción dentro de la tecnología existente.

Una red individual puede ser entrenada para desarrollar una única y bien definida tarea (tareas complejas, que hagan múltiples selecciones de patrones, requerirán sistemas de redes

Page 7: Antologia de Redes Neuronales Entregado

1

interconectadas). Con las herramientas computacionales existentes (no del tipo PC), una red puede ser rápidamente entrenada, comprobada, verificada y trasladada a una implementación hardware de bajo coste. Por lo tanto, no se presentan dificultades para la inserción de redes neuronales en aplicaciones específicas, por ejemplo de control, dentro de los sistemas existentes. De esta manera, las redes neuronales se pueden utilizar para mejorar sistemas en forma incremental y cada paso puede ser evaluado antes de acometer un desarrollo más amplio.

4.1 Elementos básicos que componen una red neuronal.A continuación se puede ver, en la Figura 4.1, un esquema de una red neuronal:

La misma está constituida por neuronas interconectadas y arregladas en tres capas (esto último puede variar). Los datos ingresan por medio de la “capa de entrada”, pasan a través de la “capa oculta” y salen por la “capa de salida”. Cabe mencionar que la capa oculta puede estar constituida por varias capas.

Antes de comenzar el estudio sobre las redes neuronales, se debe aprender algo sobre las neuronas y de cómo ellas son utilizadas por una red neuronal. En la Figura 4.2 se compara una neurona biológica con una neurona artificial. En la misma se pueden observar las similitudes entre ambas (tienen entradas, utilizan pesos y generan salidas.

Mientras una neurona es muy pequeña en sí misma, cuando se combinan cientos, miles o millones de ellas pueden resolver problemas muy complejos. Por ejemplo el cerebro humano se compone de billones de tales neuronas.

Bibliografía_ Neuronal Networks: Basics and Applications, by R. Lackes and D. Mack, in collaboration with J. Ziola and K. Ahern. CBT (Computer Based Training) Springer, Verlag Berlin Heidelberg 1998.

Page 8: Antologia de Redes Neuronales Entregado

1

_ Proyecto Final de la Carrera Ingeniería Electrónica, Facultad de Ciencias Exactas, Ingeniería y Agrimensura – Universidad Nacional Rosario, por Daniel Giardina. Directora del proyecto: Marta Basualdo. Año: 1995. Argentina._ NOL Studio Applications – Ruiz y Sonnet. (www.soteica.com.ar)_ Tutorial de Redes Neuronales. Universidad Politécnica de Madrid, España (www.gc.ssr.upm.es/inves/neuronal/ann2/anntuto.htm)._ Introducción a las redes neuronales artificiales, por Alfredo Catalina Gallego (www.gui.uva.es)._ Control de procesos mediante redes neuronales, por Cristian F. Garrido Cisterna (http:\\melquiades.dic.udec.cl/∼cgarrido).

Referencias:_ Frawley W., Piatetsky-Shapiro G., Matheus, C. (1992), "Knowledge Discovery in Databases: An Overview". AI Magazine, Fall 1992, 213-228._ Leonides, C. T. (1998), "Neural Network Systems Techniques and Applications", Volumes 1 to 7, Academic Press, San Diego, California, USA._ Gensym Corporation (1999), “NeurOn-Line Studio User’s Guide”, Cambridge, Massachusetts.

Page 9: Antologia de Redes Neuronales Entregado

1

Introducción

Las técnicas computacionales, desde sus inicios, marcaron un paradigma en la creación. Sus aplicaciones, hoy día, van desde la industria de los juegos hasta las cadenas de producción de varias empresas. Para ello se han desarrollado múltiples técnicas como las relacionadas con la inteligencia artificial. Las más conocidas son la lógica difusa (aprendizaje inductivo), algoritmos genéticos y redes neuronales.

En la década de los 50, existían grandes aspiraciones respecto a las investigaciones relacionadas con la inteligencia artificial, sobre todo con aquellas que tenían como objeto principal las redes neuronales artificiales (RNA). Los trabajos Principles of neurodynamic y The perceptron: A probabilistic model for information storage and organization in the brain, desarrollados por Rosenblatt1, abren nuevas perspectivas sobre la temática. Sin embargo, las teorías desarrolladas durante este período son arruinadas por Minsky y Papert2, pues ambos publican una obra titulada Perceptrons donde se hace una crítica al modelo neural y se trata de plasmar lo estériles que eran las investigaciones en esta línea [10].

Unos veinte años después, en la década de los 70, resurgen estas teorías y se despierta el interés en sus aplicaciones. Actualmente las redes neuronales se emplean en diferentes campos, estos se agrupan según varios criterios. Uno de ellos es el propuesto por Deboeck

[3], quien los agrupa en:

Modelación financiera y económica.

Perfiles de mercado y clientes.

Aplicaciones médicas.

Gerencia del conocimiento y “descubrimiento de datos”.

Optimización de procesos industriales y control de calidad.

Investigación científica.

El objetivo del presente trabajo es utilizar la base teórica de las redes neuronales artificiales como una herramienta práctica que permita realizar análisis exploratorios de datos o minería de datos vinculados con los indicadores bibliométricos. Para el logro de este objetivo se utiliza y caracteriza un software llamado Viscovery SOMine [4] que

1 Rosenblatt, F. The perceptron: A probabilistic model for information storage and organization in the brain. Psychol. Rev. 65(3):386-408.

2 Minsky, M.; Papert, S. Perceptrons. Massachusetts: Cambridge University; 1969; 226 p.

Page 10: Antologia de Redes Neuronales Entregado

1

retoma, para su funcionamiento, el concepto y los algoritmos de los mapas auto-organizativos.

1. Redes neuronales artificiales.

Una red neuronal, según Freman y Skapura [5], es un sistema de procesadores paralelos conectados entre sí en forma de grafo dirigido. Esquemáticamente cada elemento de procesamiento (neuronas) de la red se representa como un nodo. Estas conexiones establecen una estructura jerárquica que tratando de emular la fisiología del cerebro busca nuevos modelos de procesamiento para solucionar problemas concretos del mundo real. Lo importante en el desarrollo de la técnica de las RNA es su útil comportamiento al aprender, reconocer y aplicar relaciones entre objetos y tramas de objetos propios del mundo real. En este sentido, se uilizan las RNA como una herramientas que podrá utilizarse para resolver problemas difíciles.

La posibilidad de resolver problemas difíciles es dable gracias a los principios de las redes neuronales, los cinco más importantes son citados por Hilera y Martínez [6]. Estos son enunciados a continuación:

Aprendizaje adaptativo: Esta es quizás la característica más importante de las redes neuronales, pueden comportarse en función de un entrenamiento con una serie de ejemplos ilustrativos. De esta forma, no es necesario elaborar un modelo a priori, ni establecer funciones probabilísticas. Una red neuronal artificial es adaptativa porque puede modificarse constantemente con el fin de adaptarse a nuevas condiciones de trabajo.

Autoorganización: Mientras que el aprendizaje es un proceso donde se modifica la información interna de la red neuronal artificial, la autoorganización consiste en la modificación de la red completa con el fin de llevar a cabo un objetivo específico.

Autoorganización significa generalización, de esta forma una red puede responder a datos o situaciones que no ha experimentado antes, pero que puede inferir sobre la base de su entrenamiento. Esta característica es muy útil sobre todo cuando la información de entradaes poco clara o se encuentra incompleta.

Tolerancia a fallos: En la computación tradicional la pérdida de un fragmento pequeño de información puede acarrear comúnmente la inutilización del sistema. Las redes neuronales artificiales poseen una alta capacidad de tolerancia a fallos. Se entiende por ello que las redes pueden reconocer patrones de información con ruido, distorsión o incompletos, pero que, además, pueden seguir trabajando aunque se destruya parte de la red (con cierta degradación). La explicación de este fenómeno se encuentra en que mientras la computación tradicional almacena la información en espacios únicos, localizados y direccionables, las redes neuronales lo hacen de forma distribuida y con un alto grado de redundancia.

Operación en tiempo real: Las redes neuronales artificiales, de todos los métodos existentes, son las más indicadas para el reconocimiento de patrones en tiempo real, debido a que trabajan en paralelo actualizando todas sus instancias simultáneamente. Es importante destacar que esta característica solo se aprecia cuando se implementan redes con hardware especialmente diseñados para el procesamiento paralelo.

Page 11: Antologia de Redes Neuronales Entregado

1

Fácil inserción en la tecnología existente: Es relativamente sencillo obtener chips especializados para redes neuronales que mejoran su capacidad en ciertas tareas. Ello facilita la integración modular en los sistemas existentes.

Al profundizar en los principios de las RNA y observar continuamente el término neurona no es de extrañar que se piense por analogía en el cerebro humano, este hecho quizás se deba a que las RNA están basadas en la inspiración biológica. El hombre posee cerca de 10 000 000 000 de neuronas masivamente interconectadas, la neurona es una célula especializada que puede propagar una señal electroquímica. Las neuronas tienen una estructura ramificada de entrada (las dendritas) y una estructura ramificada de salida (los axones). Los axones de una célula se conectan con las dendritas de otra, por vía de la sinapsis la neurona se activa y excita una señal electroquímica a lo largo del axón. Esta señal transfiere la sinapsis a otras neuronas, las que a su vez pueden excitase. Las neuronas se excitan sólo sí la señal total recibida en el cuerpo de las células, por conducto de las dendritas, es superior a cierto nivel (umbral de excitación) [11].Las redes neuronales artificiales tratan de imitar este principio de funcionamiento cerebral.

1.2. Estructura de una red neuronal artificial.

Las redes neuronales artificiales están formadas por una gran cantidad de neuronas, estas no suelen denominarse neuronas artificiales sino nodos o unidades de salida. Un nodo o neurona cuenta con una cantidad variable de entradas que provienen del exterior(X1, X2, ......, Xm). A su vez dispone de una sola salida (Xj) que transmitirá la información al exterior o hacia otras neuronas. Cada Xj o señal de salida tiene asociada una magnitud llamada peso este se calculará en función de las entradas, por lo cual cada una de ellas es afectada por un determinado peso (Wjo...Wjq+m) (13). Los pesos corresponden a la intensidad de los enlaces sinápticos entre neuronas y varían libremente en función del tiempo y en cada una de las neuronas que forman parte de la red. (Fig. 1).

El proceso de aprendizaje consiste en hallar los pesos que codifican los conocimientos. Una regla de aprendizaje hace variar el valor de los pesos de una red hasta que estos adoptan un valor constante, cuando esto ocurre se dice que la red ya "ha aprendido". [15] Al conectar varias neuronas de un determinado modo, se consigue una red. Existen variaciones de topologías, que se clasifican según tres criterios:

Page 12: Antologia de Redes Neuronales Entregado

1

1) Número de niveles o capas.

2) Número de neuronas por nivel.

3) Formas de conexión.

El diseño de una u otra tipología depende del problema a solucionar por ejemplo para elaborar un programa de filtro digital en una computadora, se debe emplear un algoritmo en que todas las capas estén uniformemente interconectadas, o sea que todos lo nodos de una capa estén conectados con los nodos de otra capa. En la Figura 2 se muestra la arquitectura de una RNA clásica con variables de entrada, dos capas de neuronas intermedias y y una capa de salida. Todas ellas conectadas entre sí.

Fig. 2. Esquema de una RNA de dos capas de neuronas intermedias.

Otro algoritmo de RNA es el que aparece en la Figura 3, en este ejemplo las neuronas se organizan en una tipología de capas diferentes. Solo incluye una capa neuronal oculta, este algoritmo es muy elemental y es muy utilizado a nivel académico para la construcción y prueba de diferentes tipos de modelos de red.

Fig. 3. Esquema de una RNA del tipo alimentación directa (feed forward). Topologíacon una capa de neuronas intermedias.

Page 13: Antologia de Redes Neuronales Entregado

1

Existe una gran variedad de modelos de redes neuronales estos dependen del objetivo para el cual fueron diseñados y del problema práctico que solucionan. Hoy en día, su éxito depende en, gran medida, del valor comercial que logren alcanzar sus aplicaciones. En dependencia de ello unos serán más populares que otros, entre los más conocidos están el Adaline/Madaline (utilizado en el diseño y realización de filtros, para llevar a cabo la eliminación del ruido en señales portadoras de información, modems, etc.), el back propagation (utilizado en el proyecto de la máquina de escribir neural fonética) y el modelo de los mapas auto-organizados (Self-Organizing Map, SOM). Este último es conocido como modelo de Kohonen por ser este su creador, un análisis más detallado de este modelo aparece en el acápite siguiente.

2. Modelo Kohonen

Este modelo surge ante la curiosidad de Teuvo Kohonen, quien interesado en comprender la clasificación natural que hace el cerebro en cuanto a su funcionalidad, ideó el algoritmo SOM. Una definición simplificada sobre los mapas topológicos podría ser que, en una correspondencia que respecte la topología, las unidades que se encuentran físicamente próximas entre sí van a responder a clase de vectores de entrada que, análogamente, se encuentren cerca unos de otros. Los vectores de entrada de muchas dimensiones son representados sobre el mapa bidimensional, de tal manera que se mantenga el orden natural de los vectores de entrada. [3, 5, 9].

Estos mapas presentan la característica de organizar la información de entrada, de entre un gran volumen de datos, clasificándola automáticamente, esto permitirá visualizar relaciones importantes entre datos. Este modelo es muy útil para establecer relaciones desconocidas previamente

Este modelo de RNA es del tipo “aprendizaje autoorganizado” que como se explicó con anterioridad es un proceso donde las neuronas aprenden mediante la autoorganización. Durante el proceso de aprendizaje, al ingresar un dato solo una neurona que tenga una actividad positiva dentro de la vecindad será activada en la capa de salida.

La arquitectura SOM se ha extendido a infinidad de aplicaciones, es por ello que este algoritmo y sus modelos se han automatizado para dar vida a varios software como son el Viscovery SOMine y el WEBSOM (7). Ambos son utilizados en el análisis y filtrado de información, el Viscovery ha sido validado tanto en estudios de mercado como análisis financiero o proyecciones urbanísticas. Actualmente está incursionando en el tratamiento de la información usando herramientas diseñadas por la bibliometría. [13, 14].

2.1. Los mapas autoorganizados aplicados a la Bibliometría.

La Bibliometría es una disciplina que estudia los aspectos cuantitativos de la información registrada, para ello se han creado una serie de modelos estadísticos que aportan datos numéricos sobre el comportamiento de la actividad científica. También se han adaptado modelos de otras disciplinas para facilitar los análisis y representar los resultados desarrollados a partir de la Bibliometría. Los mapas auto-organizados (SOM) o modelo de Kohonen (basado en las RNA) es una de estas herramientas.

En los estudios métricos la aplicación de las redes neuronales, y específicamente los SOM, están asociados en lo fundamental con la clasificación de información, o sea, la formación de cluster y su representación en mapas bidimensionales de conceptos y más específicamente

Page 14: Antologia de Redes Neuronales Entregado

1

con el descubrimiento de información (data mining). Este último vinculado con la recuperación de la información con "ruido" e incompleta o con el tratamiento de información que incluye diferentes tipos de datos (números, texto, registros estructurados, etc.). Los SOM facilitan que el conocimiento tácito se haga explícito, a partir de la extracción no-trivial (a partir de los datos) de conocimientos implícitos potencialmente útiles desconocidos previamente. Se podrán encontrar patrones o estructuras en el conocimiento tácito.

Las investigaciones bibliométricas, a través de la utilización de las redes neuronales, incursionan en:

la selección de variables,

clasificación de información o formación de cluster,

regresión,

relaciones entre variables,

cambios y desviaciones,

representación de las variables.

Lo anterior se puede ejemplificar a partir de algunas aplicaciones prácticas relacionadas con la evaluación de páginas web [8] y trabajos relacionados con la clasificación de revistas en un determinado campo temático [9]. Se conocen, además, investigaciones relacionadas con la minería de textos (text mining) sobre todo aplicado a la asociación de palabras o co-word.

En todos estos ejemplos se utiliza como variante de las RNA el modelo de los mapas auto- organizativos (self-organizing map, SOM). En un análisis, realizado por los autores sobre el tema, se examinaron cerca de 56 documentos sobre redes neuronales aplicadas al análisisde información, con ello se constato que la mayoría utilizaban el modelo SOM como herramienta de estudio. (2, 7, 8, 12,16).

Un ejemplo de SOM podría ser.el estudio de una temática determinada, para este caso en un mapa cada documento (artículo de revista, podría ser una patente, una tesis, etc.) Va a ocupar un lugar en el espacio, en función de su contenido temático. Cada área del mapa va a reflejar un contenido específico y los tópicos van variando levemente a lo largo del mismo.

Las diferentes tonalidades indican la densidad de documentos, cuanto más oscura más documentos se encuentran.

Este uso frecuente de los SOM quizás se deba a lo amigable de la interfaz de los mapas para los usuarios finales y a la diversidad de sus utilidades prácticas, estas representaciones son válidas para poder identificar, además de los desarrollos temáticos antes mencionados, relaciones entre áreas temáticas y publicaciones, alianzas estratégicas y características de la cooperación. Permite, también, visualizar los avances tecnológicos que tienen lugar en un período, conocer la evolución de una tecnología a través del tiempo e identificar campos emergentes.

Page 15: Antologia de Redes Neuronales Entregado

1

Clusters

En el acápite anterior se mencionó al Viscovery SOMine como un software que ha automatizado el modelo SOM. Este sistema es utilizado por un equipo de trabajo del Instituto Finlay para elaborar mapas científico-tecnológicos. La lógica de funcionamiento del Viscovery SOMine se muestra en la Figura 4.

El punto de partida, para el uso de esta herramienta, es la entrada de un conjunto de datos

numéricos (datos multivariables, variables, “nodos” ). Estos datos necesitan ser pre- procesados con el objetivo de “organizarlos” en forma de matrices. Los datos son convertidos hasta obtener una información visual en forma de mapa, para ello se aplica un número de técnicas de evaluación como coeficientes de correlación entre variables o factores discriminantes [4, 13, 14]. Los mapas serán amigables a la vista del usuario final, en ellos se identificarán dependencias entre parametros, cluster y gráficos que facilitarán diferentes predicciones o el proceso de monitoreo.

Aplicaciones

Se estima que a pesar de las limitaciones técnicas, las redes neuronales aplicadas a la Bibliometría constituyen un campo de investigación muy prometedor. Un ejemplo es presentado a continuación.

La disciplina muldidisciplinar de las redes neuronales es aplicada en esta sección, donde se asume a la producción de los documentos de patentes como indicador de la capacidad de desarrollo industrial. El objetivo es identificar posibles competidores, alianzas estratégicas, dependencia tecnológica, etc.

Page 16: Antologia de Redes Neuronales Entregado

1

Se escogió para el primer ejemplo la representación de la situación tecnológica de la Neisseria meningitidis.3

Las diferentes instituciones en la primera hoja de sus patentes hacen referencias a otras patentes, a partir de estos datos se puede inferir el impacto que produce una tecnología o institución en otra. Con el objetivo de determinar la dependencia tecnológica entre instituciones, se realizó un análisis de citas, estas formaron los cluster que aparecen en la figura 5.

Fig. 5. Posición tecnológica de las instituciones según las citaciones.

El mapa tecnológico presentado en la figura anterior representa a tres cluster: cluster 1 formado solamente por la Merck & Co., un cluster 2 formado únicamente por el National Res. Council of Canada y el cluster 3 que incluye al resto de las instituciones. Este último grupo está formado por una gran cantidad de instituciones que tienen igual estrategia de citación, sobre todo las representadas con colores más claros y sin límites de separación. Se presupone que estas firmas se basan para su desarrollo en su propia base tecnológica, pues citan poco a otras instituciones. El cluster 2 evidencia un alto nivel de autocitación, cuando

esto sucede, algunos investigadores [1] en el tema señalan que probablemente esta institución tenga un nicho de protección cerrada sobre un espacio tecnológico. Puede estar ocurriendo que exista una patente importante, la cual se ha rodeado de invenciones mejoradas. El cluster formado por la Merck & Co. indica un mayor nivel de citación, esto presupone una estrategia balanceada: absorbe tecnología externa y produce

3 Entre las bacterias causantes de la meningitis cerebroespinal, la Neisseria meningitidis es el agente causal más frecuentemente encontrado. La enfermedad se presenta en todo el mundo y se manifiesta de forma endémica o epidémica).

Page 17: Antologia de Redes Neuronales Entregado

1

tecnología propia. La cercanía de los cluster también es una evidencia sobre las instituciones que tienen estrategias parecidas a la de otras. La Rockefeller University hace frontera con el cluster que incluye a North American Vaccine, y el National Res. Council de Canada; estas instituciones forman un colegio tecnológico invisible que basa sus desarrollos en la misma innovación tecnológica.

Otro ejemplo

Otra aplicación se presenta en un campo diferente del conocimiento: la agricultura. En este ejemplo no solo se tomó como elemento de entrada la producción documental de determinados países, también se consideraron otros tipos de variables como "gastos en I+D" en cada uno de los países analizados, "personal dedicado a actividades de I+D", etc.

Fig. 6. Mapa de América Latina y el Caribe (países seleccionados) de acuerdo con la actividad en ciencia agrícola.

En la figura 6 se presenta un mapa auto-organizado sobre la actividad en ciencia agrícola en América Latina y el Caribe (se seleccionaron algunos países según los datos disponibles). Con ello se pretende lograr una representación de la región, teniendo en cuenta los indicadores de insumo y de resultados más significativos. En la figura aparecen, en dos dimensiones, 22 países. La semejanza de los países, considerando de forma simultánea los20 indicadores, se expresa mediante la cercanía de estos en el mapa.

Los 22 países se agrupan (autorganizan) en 3 clusters o grupos: El cluster C1, que aparece en la esquina inferior izquierda, es seguido por una banda de 4 países correspondientes al cluster C2 (Cuba, Colombia, Chile y Venezuela) y otro cluster (C3) con el resto de los países.En el ámbito regional e internacional hay un grupo de países formado por Brasil, México y

Page 18: Antologia de Redes Neuronales Entregado

1

Argentina que tienen una investigación en la temática con mayor solidez y con parecidos niveles de desarrollo. Esto coincide con los países que presentan mayor nivel regional en el desarrollo agrícola.

Consideraciones finales

Ante los ejemplos expuestos, se hace evidente que las redes neuronales artificiales, específicamente las basadas en el modelo Kohonen, pueden ser aplicadas como una herramienta de análisis con múltiples propósitos.

Existen experiencias prácticas sobre estudios de mercado, análisis financieros, líneas de procesos industriales, control de la calidad y sistemas de vigilancia tecnológica. Existen análisis macro-económicos, por ejemplo, para representar datos coleccionados durante un período de 20 años sobre un país determinado, el Viscovery SOMine genera un mapa en el cual se representan el conjunto de los datos. Los cluster representan, entre otros resultados, las diferentes fases económicas durante ese período de tiempo.

El vínculo de la Bibliometría con las redes neuronales se muestra muy fructífero. Esta herramienta de análisis debe ser estudiada no solo por la Bibliometría, sino también por otras disciplinas, las cuales pueden potenciar con ella su propio desarrollo.

Referencias

1. Battelle Memorial Institute. Keeping abreast of science and technology: technical for business. Ashton, B., Klavans, R.A. Ohio: Battelle Memorial Institute, 1997, 557 p.

2. Campanario, J.M. Using neural networks to study networks of scientific journals.Scientometrics. 33(1):23-40, 1995.

3. Deboeck, Guido J. Pattern recognition and prediction with self-organizing maps and ork / AIabtext.html supporting software review: visualization through viscovery [en línea]. <http://www.gordiand-knot.com >>. Gordian Institute Electronic NewsLetter. [Consulta: 20 de febrero 2000.]

4. Eudaptics Software Gmbh. Viscovery® for CRM-applications (Viscovery White Paper) [en línea]. <<http://www.eudatic.com>>. [Consulta: diciembre de 1999].

5. Freeman, J.A.; Skapura, DM. Redes Neuronales. Algoritmos, aplicaciones y técnicas de propagación. México: Addison-Wesley. 1993; 306 p.

6. Hilera González, J.; Martínez Hernández, V. Redes neuronales artificiales: fundamentos, modelos y aplicaciones. Madrid, RA-MA, 1995. 389 p.

7. Honkela, T. y otros. Newsgroup exploration with WEBSOM method and browsing interface. Espoo. Helsinki, University of Technology, Laboratories of Computer and Information Science. 1996. (Technical Report, A32).

Page 19: Antologia de Redes Neuronales Entregado

1

8. Kaski, S. y otros. Creating an order in digital libraries with selft-organizing map. In: Proceeding of World Congress on Neural Networks, WCNN'96. Mahwah, NJ, INNS Press,1996. 1996, pp. 814-817.

9. Kohonen, T. Self-Organizing-Maps. Springer, Berlin, Second edition. 1997, 362 p.

10. Kornilov, A.R. Intelligent technologies new opportunities for modern industry. Information Technology. 1997; 3(6):1-14.

11. Neurofisiología [CD-ROM], Enciclopedia Microsoft(R) Encarta(R) 99. (c) 1993-1998 Microsoft Corporation.

12. Polanco, Xavier; Francois, C., Keim, JF. Artificial neural network technology for theclassification and cartography of scientific and technical information. In: Periz, B., Egghe, L. Procceding Sixth International Conference of the International Society for Scientometrics and Informetrics; Jerusalem, Israel, 1997. Jerusalem, Universidad Hebrewof Jerusalem, 1997, pp. 319-330.

13. Sotolongo, G; Suárez, CA.; Guzmán, MV. Modular Bibliometrics Information System with Propietary Software (MOBIS-ProSoft): a versatile approach to bibliometric research tools. Library and Information Science Electronic Journal (LIBRES). 2000; 10(2): http://libres.curtin.edu.au/

14. Sotolongo, G; Suárez, CA.; Guzmán, MV. Modular Bibliometrics Information System with Propietary Software: In: Macías-Chapula, C. (Ed.). In: Proceedings of the Seventh International Society for Scientometrics and Informetrics. Universidad de Colima, México.1999; 313-322.

15. StatSoft, Inc. Neural Networks. Statistica for Windows [Computer program manual]. Tulsa, Oklahoma: StatSoft, Inc. <<http://www..statsoft.com>>. [Consulta: diciembre del 2000].

16. Swanson, D. R. y N. R. Smalheiser. An interactive system for finding complementary literatures: a stimulus to scientific discovery. Artificial Intelligence. 91(3):183-203, 1997. También disponible en <http://kiwi.uchicago.edu/web>>.

Page 20: Antologia de Redes Neuronales Entregado

1

Page 21: Antologia de Redes Neuronales Entregado

1

Page 22: Antologia de Redes Neuronales Entregado

1

Page 23: Antologia de Redes Neuronales Entregado

1

Page 24: Antologia de Redes Neuronales Entregado

1

Page 25: Antologia de Redes Neuronales Entregado

1

Page 26: Antologia de Redes Neuronales Entregado

1

Page 27: Antologia de Redes Neuronales Entregado

1

Page 28: Antologia de Redes Neuronales Entregado

1

Page 29: Antologia de Redes Neuronales Entregado

1

Page 30: Antologia de Redes Neuronales Entregado

1

Page 31: Antologia de Redes Neuronales Entregado

1

UNIVERSIDAD AUTONOMA DEL CARMEN

ALUMNOS:

Chuina de Carmen Zapata Gómez

Rosali Guadalupe Carbonell Pérez

FACULTAD:

Ciencias de la Información

MAESTRA:

MCC. Abril Ayala Sanchez

TRABAJO:

Antología de Redes Neuronales

FECHA:

28/03/2011