Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción...

53
Introducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales en Procesamiento de Lenguaje Natural Seminario de Aprendizaje Profundo aplicado al Lenguaje Natural Abril, 2016 Redes Neuronales Artificiales en PLN

Transcript of Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción...

Page 1: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Redes Neuronales Artificiales enProcesamiento de Lenguaje Natural

Seminario de Aprendizaje Profundo aplicado al Lenguaje Natural

Abril, 2016

Redes Neuronales Artificiales en PLN

Page 2: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Contenido1 Introducción2 Representaciones Distribuidas en PLN

PalabrasOracionesPárrafos

3 Aplicaciones de RNA en PLNModelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Redes Neuronales Artificiales en PLN

Page 3: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Motivación

En las features manuales generalmente faltainformación. Cuesta diseñarlas y evaluarlas. Usanrecursos externos.Es posible aprender representaciones distribuidas(representation learning) de la información.Representar palabras, imagenes, sonidos, etc. convectores de dimensión alta.Las redes neuronales artificiales permiten crearrepresentaciones distribuidas y utilizarlas pararesolver tareas.

Redes Neuronales Artificiales en PLN

Page 4: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Red feed-forward

(Imagen tomada del libro "Supervised Sequence Labelling with Recurrent Neural Networks"de Alex Graves.)

Redes Neuronales Artificiales en PLN

Page 5: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

NLP (almost) from scratch. (Collober, 2011)

(Imagen tomada del artículo "Natural Language Processing (almost) from Scratch "(Collobert et al., 2011))

Redes Neuronales Artificiales en PLN

Page 6: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

NLP (almost) from scratch. (Collober, 2011)

En todas las tareas propuestas se superó o se estuvopróximo al estado del arte.

(Tabla tomada del artículo "Natural Language Processing (almost) from Scratch "(Collobert et al., 2011))

Redes Neuronales Artificiales en PLN

Page 7: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

NLP (almost) from scratch. (Collober, 2011)

No utiliza features manuales.

No utiliza recursos lingüístcos (además de losconjuntos de entrenamiento).

Se obtienen representaciones distribuidas de laspalabras (tabla de lookup).

Las mismas representaciones son utilizadas en todaslas tareas.

Redes Neuronales Artificiales en PLN

Page 8: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representaciones distribuidas de las palabras

Las representaciones distribuidas puedeninterpretarse como puntos en un espacio vectorial dedimensión alta (Ej. 300).Las palabras relacionadas tienen representacionescercanas.Algunas relaciones entre palabras preservan offsets

(Imagen tomada del artículo "Linguistic Regularities in Continuous Space Word Representations"(Mikolovet al., 2013))

Redes Neuronales Artificiales en PLN

Page 9: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

"Supervised Sequence Labelling with Recurrent NeuralNetworks"de Alex Graves "Natural Language Processing(almost) from Scratch"(Collobert et al., 2011) "LinguisticRegularities in Continuous Space WordRepresentations"(Mikolov et al., 2013)

Redes Neuronales Artificiales en PLN

Page 10: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representaciones distribuidas de las palabras

También ocurre con relaciones semánticas.

(Imagen tomada del artículo "Distributed Representations of Words and Phrases and theirCompositionality"(Mikolov et al., 2013))

Redes Neuronales Artificiales en PLN

Page 11: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representar palabras con RNA

Con modelos neuronales es posible construir buenasrepresentaciones.

Ej. Skip-Gram y CBOW (Mikolov et al., 2013)

(Imagen tomada del artículo .Efficient Estimation of Word Representations in Vector Space "(Mikolov et al.,2013))

Redes Neuronales Artificiales en PLN

Page 12: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Modelos de conteo

También se pueden obtener representacionesdistribuidas contando. Por ejemplo, construyendo unamatriz palabra-contexto y factorizándola con SVD.(LSA (Deerwester, 1990))

Los representaciones basadas en redes neuronalesparecían dar mejores resultados que las de conteo.(Baroni, 2014)

Redes Neuronales Artificiales en PLN

Page 13: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Modelos de conteo

Skip-gram (con negative sampling) converge a unafactorización de la matrix palabra-contexto cuyasceldas son valores de Pointwise Mutual Information(PMI) desplazados por una constante global quedepende de la cantidad de ejemplos negativos (Levy,2014).

Esto permitió mejorar los modelos de conteoobteniendo resultados comparables a los depredicción (Levy, 2015).

Redes Neuronales Artificiales en PLN

Page 14: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representación de oraciones

Es posible representar el significado de una oracióncon un vector?

Utilizar las representaciones de las palabras paraconstruir un vector (de dimensión fija) que representeel significado de la oración.Diversas propuestas: redes convolutivas, redesrecurrentes, autoencoders recursivos, etc.

Redes Neuronales Artificiales en PLN

Page 15: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Red Recurrente

(Imagen tomada del libro "Supervised Sequence Labelling with Recurrent Neural Networks"de Alex Graves.)

Redes Neuronales Artificiales en PLN

Page 16: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Red Recurrente (unfolded)

(Imagen tomada del libro "Supervised Sequence Labelling with Recurrent Neural Networks"de Alex Graves.)

Redes Neuronales Artificiales en PLN

Page 17: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Recursive Autoencoder y Unfolding RecursiveAutoencoder

(Imagen tomada del artículo "Dynamic Pooling and Unfolding Recursive Autoencoders for Paraphrase Detection

"(Socher et al., 2011))

Redes Neuronales Artificiales en PLN

Page 18: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representación de párrafos

Representación usando un autoencoder recursivo.

(Imagen tomada del artículo .A Hierarchical Neural Autoencoder for Paragraphs and Documents "(Li et al.,2015))

Redes Neuronales Artificiales en PLN

Page 19: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representación de párrafos

Representación usando 2 niveles de RAEs.

(Imagen tomada del artículo .A Hierarchical Neural Autoencoder for Paragraphs and Documents "(Li et al.,2015))

Redes Neuronales Artificiales en PLN

Page 20: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

PalabrasOracionesPárrafos

Representación de párrafos

Representación usando una jerarquía deautoencoders recurrentes (with attention).

(Imagen tomada del artículo .A Hierarchical Neural Autoencoder for Paragraphs and Documents "(Li et al.,2015))

Redes Neuronales Artificiales en PLN

Page 21: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Modelos de Lenguaje con FFN

Modelos de lenguaje con redes feed forward (Bengioet al., 2003).

(Imagen tomada del artículo .A Neural Probabilistic Language Model"(Bengio et al., 2003))

Redes Neuronales Artificiales en PLN

Page 22: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Modelos de Lenguaje con RNN

Modelos de lenguaje con redes recurrentes (Mikolovet al., 2010).

(Imagen tomada del artículo Recurrent neural network based language model"(Mikolov et al., 2010))

Redes Neuronales Artificiales en PLN

Page 23: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Detección de Paráfrasis

Dynamic Pooling and Unfolding RecursiveAutoencoders for Paraphrase Detection (Socher etal., 2011)

(Imagen tomada del artículo "Dynamic Pooling and Unfolding Recursive Autoencoders for ParaphraseDetection "(Socher et al., 2011))

Redes Neuronales Artificiales en PLN

Page 24: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis Sintáctico

Compositional Vector Grammars (Socher et al., 2013)Usa word vectors para considerar informaciónsemántica.

(Imagen tomada del artículo "Parsing with Compositional Vector Grammars"(Socher et al., 2013))

Redes Neuronales Artificiales en PLN

Page 25: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis Sintáctico

(Imagen tomada del artículo "Parsing with Compositional Vector Grammars"(Socher et al., 2013))

Redes Neuronales Artificiales en PLN

Page 26: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis de Sentimiento

Vectores en nodos intermedios (Socher et al., 2013)

(Imagen tomada del artículo Recursive Deep Models for Semantic Compositionality Over a Sentiment

Treebank"(Socher et al., 2013))

Redes Neuronales Artificiales en PLN

Page 27: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis de Sentimiento

(Imagen tomada del artículo Recursive Deep Models for Semantic Compositionality Over a Sentiment

Treebank"(Socher et al., 2013))

Redes Neuronales Artificiales en PLN

Page 28: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis de Sentimiento

Global Belief Recursive Neural Networks (Paulus et al., 2014)

(Imagen tomada del artículo "Global Belief Recursive Neural Networks"(Paulus et al., 2014))

Redes Neuronales Artificiales en PLN

Page 29: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis de Sentimiento

(Imagen tomada del artículo "Global Belief Recursive Neural Networks"(Paulus et al., 2014))

Redes Neuronales Artificiales en PLN

Page 30: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Análisis de Sentimiento

(Tabla tomada del artículo Ïmproved Semantic Representations From Tree-Structured Long Short-Term Memory

Networks"(Tai et al., 2015))

Redes Neuronales Artificiales en PLN

Page 31: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Traducción Automática

Triángulo de Vauquois

interlingua = representaciones distribuidas ?

Redes Neuronales Artificiales en PLN

Page 32: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Traducción Automática

Se utiliza una red para obtener una representaciónde la oración. (encoder )

A partir de la representación se decodifica la oraciónen el lenguaje destino. (decoder )

LSTMs (Sutskever et al. 2014), R2NN (Liu et al.,2014), Redes Convolutivas (Cho et al., 2014), ...

Redes Neuronales Artificiales en PLN

Page 33: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Traducción Automática

(Imagen tomada del artículo "Sequence to Sequence Learning with Neural Networks"(Sutskever et al. 2014))

Redes Neuronales Artificiales en PLN

Page 34: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Traducción Automática

(Imagen tomada del artículo "Sequence to Sequence Learning with Neural Networks"(Sutskever et al. 2014))

Redes Neuronales Artificiales en PLN

Page 35: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Reconocimiento del Habla

Se han utilizado redes recurrentes bidireccionales(Graves et al., 2005).

(Imagen tomada del libro "Supervised Sequence Labelling with Recurrent Neural Networks"de AlexGraves.)

Redes Neuronales Artificiales en PLN

Page 36: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Reconocimiento del Habla

Las redes bidireccionales usan contexto pasado yfuturo para realizar predicciones.

(Imagen tomada del libro "Supervised Sequence Labelling with Recurrent Neural Networks"de AlexGraves.)

Redes Neuronales Artificiales en PLN

Page 37: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Reconocimiento del Habla

Se han utilizado redes recurrentes bidireccionalesprofundas (Graves et al., 2013).

(Imagen tomada del libro "Hybrid Speech Recognition with Deep Bidirectional LSTM"(Graves et al., 2013))

Redes Neuronales Artificiales en PLN

Page 38: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Reconocimiento del Habla

También redes convolutivas (Abdel-Hamid et al.,2014).

(Imagen tomada de Çonvolutional Neural Networks for Speech Recognition"(Abdel-Hamid et al., 2014))

Redes Neuronales Artificiales en PLN

Page 39: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Question Answering

Dynamic Memory Networks para PLN (Kumar et al.,2015).

(Imagen tomada de .Ask Me Anything: Dynamic Memory Networks for Natural LanguageProcessing"(Kumar et al., 2015))

Redes Neuronales Artificiales en PLN

Page 40: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Question Answering

(Imagen tomada de .Ask Me Anything: Dynamic Memory Networks for Natural Language Processing"(Kumar et al.,

2015))

Redes Neuronales Artificiales en PLN

Page 41: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Question Answering

Dynamic Memory Networks para responder en textose imágenes (Kumar et al., 2015).

(Imagen tomada de "Dynamic Memory Networks for Visual and Textual Question Answering"(Xiong et al.,2016))

Redes Neuronales Artificiales en PLN

Page 42: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Modelos de LenguajeDetección de ParáfrasisAnálisis SintácticoAnálisis de SentimientoTraducción AutomáticaReconocimiento del HablaQuestion Answering

Preguntas?

Preguntas?

Redes Neuronales Artificiales en PLN

Page 43: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias I

Abdel-Hamid, O., Mohamed, A., Jiang, H., Deng, L., Penn, G., and Yu,D. (2014).Convolutional neural networks for speech recognition.IEEE/ACM Trans. Audio, Speech & Language Processing,22(10):1533–1545.

Baroni, M., Dinu, G., and Kruszewski, G. (2014).Don’t count, predict! A systematic comparison of context-counting vs.context-predicting semantic vectors.In Proceedings of the 52nd Annual Meeting of the Association forComputational Linguistics, ACL 2014, June 22-27, 2014, Baltimore, MD,USA, Volume 1: Long Papers, pages 238–247.

Redes Neuronales Artificiales en PLN

Page 44: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias II

Bengio, Y., Ducharme, R., Vincent, P., and Janvin, C. (2003).A neural probabilistic language model.Journal of Machine Learning Research, 3:1137–1155.

Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., andKuksa, P. P. (2011).Natural language processing (almost) from scratch.Journal of Machine Learning Research, 12:2493–2537.

Deerwester, S., Dumais, S. T., Furnas, G. W., Landauer, T. K., andHarshman, R. (1990).Indexing by latent semantic analysis.Journal of the American Society for Information Science, 41.

Redes Neuronales Artificiales en PLN

Page 45: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias III

Graves, A. (2012).Supervised Sequence Labelling with Recurrent Neural Networks,volume 385 of Studies in Computational Intelligence.Springer.

Graves, A., Jaitly, N., and Mohamed, A. (2013).Hybrid speech recognition with deep bidirectional LSTM.In 2013 IEEE Workshop on Automatic Speech Recognition andUnderstanding, Olomouc, Czech Republic, December 8-12, 2013,pages 273–278.

Redes Neuronales Artificiales en PLN

Page 46: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias IV

Kumar, A., Irsoy, O., Su, J., Bradbury, J., English, R., Pierce, B.,Ondruska, P., Gulrajani, I., and Socher, R. (2015).Ask me anything: Dynamic memory networks for natural languageprocessing.CoRR, abs/1506.07285.

Levy, O. and Goldberg, Y. (2014).Neural word embedding as implicit matrix factorization.In Advances in Neural Information Processing Systems 27: AnnualConference on Neural Information Processing Systems 2014, December8-13 2014, Montreal, Quebec, Canada, pages 2177–2185.

Redes Neuronales Artificiales en PLN

Page 47: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias V

Levy, O., Goldberg, Y., and Dagan, I. (2015).Improving distributional similarity with lessons learned from wordembeddings.TACL, 3:211–225.

Li, J., Luong, M., and Jurafsky, D. (2015).A hierarchical neural autoencoder for paragraphs and documents.In Proceedings of the 53rd Annual Meeting of the Association forComputational Linguistics and the 7th International Joint Conference onNatural Language Processing of the Asian Federation of NaturalLanguage Processing, ACL 2015, July 26-31, 2015, Beijing, China,Volume 1: Long Papers, pages 1106–1115.

Redes Neuronales Artificiales en PLN

Page 48: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias VI

Liu, S., Yang, N., Li, M., and Zhou, M. (2014).A recursive recurrent neural network for statistical machine translation.In Proceedings of the 52nd Annual Meeting of the Association forComputational Linguistics, ACL 2014, June 22-27, 2014, Baltimore, MD,USA, Volume 1: Long Papers, pages 1491–1500.

Mikolov, T., Chen, K., Corrado, G., and Dean, J. (2013a).Efficient estimation of word representations in vector space.In Proceedings of Workshop at ICLR.

Redes Neuronales Artificiales en PLN

Page 49: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias VII

Mikolov, T., Karafiát, M., Burget, L., Cernocký, J., and Khudanpur, S.(2010).Recurrent neural network based language model.In INTERSPEECH 2010, 11th Annual Conference of the InternationalSpeech Communication Association, Makuhari, Chiba, Japan,September 26-30, 2010, pages 1045–1048.

Mikolov, T., Sutskever, I., Chen, K., Corrado, G., and Dean, J. (2013b).Distributed representations of words and phrases and theircompositionality.In Proceedings of NIPS.

Redes Neuronales Artificiales en PLN

Page 50: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias VIII

Mikolov, T., tau Yih, W., and Zweig, G. (2013c).Linguistic regularities in continuous space word representations.In Proceedings of NAACL HLT.

Paulus, R., Socher, R., and Manning, C. D. (2014).Global belief recursive neural networks.In Advances in Neural Information Processing Systems 27: AnnualConference on Neural Information Processing Systems 2014, December8-13 2014, Montreal, Quebec, Canada, pages 2888–2896.

Redes Neuronales Artificiales en PLN

Page 51: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias IX

Socher, R., Bauer, J., Manning, C. D., and Ng, A. Y. (2013a).Parsing with compositional vector grammars.In Proceedings of the 51st Annual Meeting of the Association forComputational Linguistics, ACL 2013, 4-9 August 2013, Sofia, Bulgaria,Volume 1: Long Papers, pages 455–465.

Socher, R., Huang, E. H., Pennington, J., Ng, A. Y., and Manning, C. D.(2011).Dynamic pooling and unfolding recursive autoencoders for paraphrasedetection.In Advances in Neural Information Processing Systems 24: 25th AnnualConference on Neural Information Processing Systems 2011.Proceedings of a meeting held 12-14 December 2011, Granada, Spain.,pages 801–809.

Redes Neuronales Artificiales en PLN

Page 52: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias X

Socher, R., Perelygin, A., Wu, J., Chuang, J., Manning, C. D., Ng, A. Y.,and Potts, C. (2013b).Recursive deep models for semantic compositionality over a sentimenttreebank.In Proceedings of the 2013 Conference on Empirical Methods in NaturalLanguage Processing, pages 1631–1642, Stroudsburg, PA. Associationfor Computational Linguistics.

Sutskever, I., Vinyals, O., and Le, Q. V. (2014).Sequence to sequence learning with neural networks.In Advances in Neural Information Processing Systems 27: AnnualConference on Neural Information Processing Systems 2014, December8-13 2014, Montreal, Quebec, Canada, pages 3104–3112.

Redes Neuronales Artificiales en PLN

Page 53: Redes Neuronales Artificiales en Procesamiento de · PDF fileIntroducción Representaciones Distribuidas en PLN Aplicaciones de RNA en PLN Referencias Redes Neuronales Artificiales

IntroducciónRepresentaciones Distribuidas en PLN

Aplicaciones de RNA en PLNReferencias

Referencias

Referencias XI

Tai, K. S., Socher, R., and Manning, C. D. (2015).Improved semantic representations from tree-structured long short-termmemory networks.In Proceedings of the 53rd Annual Meeting of the Association forComputational Linguistics and the 7th International Joint Conference onNatural Language Processing of the Asian Federation of NaturalLanguage Processing, ACL 2015, July 26-31, 2015, Beijing, China,Volume 1: Long Papers, pages 1556–1566.

Xiong, C., Merity, S., and Socher, R. (2016).Dynamic memory networks for visual and textual question answering.CoRR, abs/1603.01417.

Redes Neuronales Artificiales en PLN