Generación de resúmenes mediante grafos conceptuales

13
UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA FACULTAD DE CIENCIAS DE LA EDUCACIÓN Generación de resúmenes por medio de síntesis de grafos conceptuales PRESENTADO POR: DENIS GUSTAVO, NINA ARANA CURSO: DIDÁCTICA DE LA INFORMÁTICA SÉPTIMO SEMESTRE

Transcript of Generación de resúmenes mediante grafos conceptuales

Page 1: Generación de resúmenes mediante grafos conceptuales

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA

FACULTAD DE CIENCIAS DE LA EDUCACIÓN

Generación de resúmenes por medio de síntesis de grafos conceptuales

PRESENTADO POR:DENIS GUSTAVO, NINA ARANA

CURSO:

DIDÁCTICA DE LA INFORMÁTICASÉPTIMO SEMESTRE

Page 2: Generación de resúmenes mediante grafos conceptuales

Generación de resúmenes abstractivos de un solo documento,

basado en la representación

conceptual del texto.

PROPONE LA INVESTIGACIÓN:

RESUMEN

Modelo que usa una

representación semántica

completa del texto

Resume el conjunto de los grafos conceptuales correspondientes.

Se aplicará un conjunto de

operaciones sobre los grafos

1

23

Resumen del texto a nivel conceptual

Page 3: Generación de resúmenes mediante grafos conceptuales

GENERACIÓN AUTOMÁTICA DE RESÚMENES

Generación de resúmenes por medio de síntesis de grafos conceptuales

La generación automática de resúmenes son capaces de presentar la información de manera concisa

Extraer la información más importante de una fuente para producir una versión abreviada

Se pueden considerar dos grandes grupos de sistemas que generan resúmenes automáticamente

Page 4: Generación de resúmenes mediante grafos conceptuales

GENERACIÓN AUTOMÁTICA DE RESÚMENES

Generación de resúmenes por medio de síntesis de grafos conceptuales

Selección de oraciones consideradas sobresalientes en

el texto de origen

RESUMEN EXTRACTIVO RESUMEN EXTRACTIVO

Se crean regenerando el contenido extraído del texto

fuente

Utilizan métodos lingüísticos, que permiten describir mejor al

documento.

Divide el texto en fragmentos y selecciona los más importantes

Page 5: Generación de resúmenes mediante grafos conceptuales

GRAFOS CONCEPTUALES

Generación de resúmenes por medio de síntesis de grafos conceptuales

SOWA (1984) Son estructuras para la representación del conocimiento basados en lógica

EXISTEN DOS TIPOS DE NODOS:

Un concepto se conecta a otro concepto a través de una relación conceptual, y una relación conceptual debe conectarse estrictamente con algún concepto.

Las relaciones conceptuales

Los conceptos

REDES SEMÁNTICAS Son sistemas de organización del

conocimiento que estructuran los

conceptos

Page 6: Generación de resúmenes mediante grafos conceptuales

FORMA -DISPLAY FORM- (DF)

1

2

Grafo conceptual con 4 conceptos [Go], [Person: John], [City: Boston], y [Bus]. Éste tiene 3 relaciones conceptuales: (Agnt) se refiere [Go] al agente John, (Dest)se refiere [Go] al destino Boston, e (Inst) se refiere [Go] al instrumento bus. Desde el concepto [Go] se agregan 3 relaciones conceptuales, la formal lineal no puede dibujarse en una línea recta, como en el primer ejemplo. En cambio, un guión al final de la primer línea indica que las relaciones adjuntas a [Go] se continúan en líneas subsecuentes.

Page 7: Generación de resúmenes mediante grafos conceptuales

Generación de resúmenes basado en grafos conceptuales (GCs).

Durante el proceso de generación, se agrega información semántica y

sintáctica de fuentes externas.

En la etapa de síntesis, los grafos se reducen de acuerdo a un conjunto

de operaciones

Generar los GCs a partir de un conjunto de

documentos seleccionados.

Page 8: Generación de resúmenes mediante grafos conceptuales

HERRAMIENTASEl enfoque investigado se basa en el formalismo de GCs, la cual requiere información adicional que es añadido a los grafos en su elaboración

WordNet

RECURSOS LINGÜÍSTICOS

Es una base de datos léxica agrupada en sustantivos, verbos, adjetivos y adverbios.

VerbNetEs un diccionario computacional que contiene información sintáctica y semántica de verbos para el inglés.

coherencia de las oraciones

Almacena relaciones semánticas entre conj. De

sinónimos

Page 9: Generación de resúmenes mediante grafos conceptuales

PROPONE LA INVESTIGACIÓN:

Poda

GeneralizaciónAsociación

Ponderación

Síntesis de grafos conceptuales

Generación de grafos conceptuales

Generación de resúmenes por medio de síntesis de grafos conceptuales

1

2

La regla de transformación básica es que palabras tales como sustantivos, verbos, adjetivos y adverbios, CORRESPONDEN NODOS CONCEPTO, y las palabras funcionales tales como las preposiciones, conjunciones y verbos auxiliares,corresponden a NODOS RELACIÓN

Page 10: Generación de resúmenes mediante grafos conceptuales

Generalización

Síntesis de grafos conceptuales

Generación de resúmenes por medio de síntesis de grafos conceptuales

Combina dos GCs de acuerdo a sus elementos comunes.

G1Pedro compra un perro

G2María compra un grato

G3Dos personas compran dos animales

Page 11: Generación de resúmenes mediante grafos conceptuales

Síntesis de grafos conceptuales

Generación de resúmenes por medio de síntesis de grafos conceptuales

PonderaciónLa operación de ponderación filtra los nodos más importantes del grafo. Para determinar la importancia de los nodos, se utiliza el algoritmo

HITSGrado de entrada y el grado de salida del nodo para determinar su

importancia.

AUTH y HUB

Métricas

para determinar la importancia del nodo

que dice cuán buena es la información

Page 12: Generación de resúmenes mediante grafos conceptuales

Síntesis de grafos conceptuales

Generación de resúmenes por medio de síntesis de grafos conceptuales

Esta operación toma en cuenta los resultados de la ponderación, los patrones verbales para remover los nodos irrelevantes y la tasa de compresión para establecer cuántos nodos deben incluirse en el resumen resultante. Esta operación selecciona los nodos según su valor de la métrica AUTH

Poda

Page 13: Generación de resúmenes mediante grafos conceptuales

RESULTADOS

Hovy (2005) un resumen es útil si se encuentra entre el 15% y el 35% de longitud con respecto al documento original.

Los experimentos se realizaron con la colección de noticias de la competencia DUC 2003.Documentos con longitud de entre 50 y 100 palabras. Se definieron tres grupos de documentos según su longitud: 3 oraciones (Grupo I), 4 oraciones (Grupo II) y más de 4 oraciones (Grupo III). Cada grupo consta de 10 documentos representados como GCs.