Lenguajes Documentales
description
Transcript of Lenguajes Documentales
DOCUMENTACIÓN APLICADA A LA TRADUCCIÓN
Otras fuentes de información para encontrar términos: los lenguajes
documentales
Belén Novoa García ([email protected])
Marta Soto González ([email protected])
• Para que sea posible recuperar la información contenida en los documentos, necesitamos un sistema que nos permita establecer una comunicación entre los emisores de la información y los destinatarios (usuarios)
LOS LENGUAJES DOCUMENTALES
Introducción
El lenguaje documental es utilizado por
El documentalista
El usuario
Al indizar los documentos para describir sus contenidos
Cuando hace una búsqueda documental, al interrogar a una base de datos, a un catálogo o a un documentalista, para satisfacer su necesidad de información
Para el traductor: como fuente de información de calidad en la búsqueda de terminología
La indización
La indización consiste:
- En la búsqueda de conceptos presentes en el documentos.
- En la traducción de esos conceptos para pasar del lenguaje natural del autor al lenguaje documental.
¿Por qué surgen los lenguajes documentales?
• Lenguaje natural: lenguaje en que está escrito un documento:
Cura
Sacerdote
Presbítero
Pastor
Religioso
Provoca ruido y silencio documental en el momento de la recuperación.
http://conceptspace.london.edu/
Lenguajes documentales: Características
Objetivo del control del vocabulario es facilitar la representación de las materias
Simplifica el lenguaje natural Evita la sinonimia y la polisemia Univoco: un único término y un único concepto Evitar la ambigüedad Algunos lenguajes documentales resuelven los
problemas planteados por el multilingüismo (tesauros multilingües y lenguajes de clasificación numéricos)
Vocabularios alfabéticos de todos los términos significativos (que no sean palabras vacías) extraídos del título, resumen o texto completo de los documentos, de forma automática. Por ejemplo: Google http://www.google.es/
Palabras-clave
Descriptores libresVocabulario alfabético de términos seleccionados propuestos por el analista después del examen del documento. Por ejemplo: Listado de descriptores de la base de datos del ISI WEB OF KNOWLEDGE (author keywords)
TIPOS DE LENGUAJES DOCUMENTALES
Tradicionalmente se controlaban las autoridades de materia aparte. Reunían bajo una palabra o frase uniforme todos los documentos existentes sobre un tema y agrupaban en el mismo lugar del catálogo todos los documentos que tratan sobre un mismo tema.
Listado de encabezamientos de materia de para las bibliotecas públicas
Listados de encabezamientos de materia
Catálogo de autoridades o descriptores controlados
Catálogo de términos controlados y destinados a representar de manera unívoca el contenido de un documento. Controla de nombres de personas, organismos, entidades, topónimos, materias, etc.
Catálogo CSIC de Autoridades
http://aleph.csic.es/F/LLMDFH6PUGUS6363HE71K931M2E464CCYJCFXQFYLJ6T11ARSV-14515?func=file&file_name=find-b&local_base=MAD10
Catálogo de autoridades de la Library of Congress
http://authorities.loc.gov/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First
Autoridades de WorldCat
http://www.worldcat.org/wcidentities/lccn-n94-112934#linkfastheadings
Autoridades de la Wikipedia
http://en.wikipedia.org/wiki/Barack_Obama
Lenguaje de etiquetas (tags)
Palabras elegidas por el usuario que reflejan, según su propio criterio, el contenido de la información. Es un sistema completamente abierto y democrático, ya que se basa en la colaboración de personas que cooperan para clasificar la información.
http://webcat.hud.ac.uk/ipac20/ipac.jsp?profile=cls#focus
Sistemas de clasificaciónConjunto ordenado de conceptos que se presentan distribuidos sistemáticamente en clases constituyendo una estructura.
Principales
• Clasificación Decimal Universal (CDU) http://www.taranco.eu/cdu/cdu-esquema.htm#1
• Clasificación Decimal de Dewey http://espanol.denverlibrary.org/servicios/dewey.html
• Clasificación de la Biblioteca del Congreso de Washington (http://www.loc.gov/catdir/cpso/lcco/ )
• Clasificación facetada de Ranganathan
http://usuarios.lycos.es/colonada/
• Clasificación Internacional de Patentes (CIP) http://www.wipo.int/classifications/ipc/ipc8trans/es/ipcpub/?lang=es&menulang=ES
Definición
• Un tesauro es un vocabulario controlado y dinámico, compuesto por términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento (Norma ISO 2788)
• Lenguaje documental de estructura combinatoria, de carácter especializado que se basa en expresiones conceptuales (descriptores), provistas de sus relaciones semánticas.
TESAUROS
Los tesauros
• Permiten describir el contenido de los documentos de manera más precisa
• Permiten incluir la nueva terminología, cada vez más especializada, de las diferentes disciplinas
• La ordenación sistemática (por temáticas y significados) de los descriptores, como alternativa a la alfabética, facilita la consulta del analista y el usuario
Estructura del tesauro
• Unidades léxicas- Descriptores o términos preferentes- Términos equivalentes o “no descriptores”- Palabras-herramienta o descriptores auxiliares- Campos semánticos
• Relaciones semánticas entre las unidades léxicas- De equivalencia- Jerárquicas- Asociativas- Notas y aclaraciones
Ejemplos de tesaurosTesauro de la UNESCO http://databases.unesco.org/thessp/
MOTBIS, un thésaurus pour l’éducationhttp://www.thesaurus.motbis.cndp.fr/site/
Thesaurus of Aging Terminologyhttp://assets.aarp.org/rgcenter/general/thesaurus.pdf
Macrotesauro de la OCDE http://168.96.200.17/ar/oecd-macroth/es/index.htm
Tesauros del IEDCYT http://thes.cindoc.csic.es/index_esp.html
JURIVOC
http://www.bger.ch/fr/index/juridiction/jurisdiction-inherit-template/jurisdiction-jurivoc-home/jurisdiction-jurivoc.htm
Tesauros gráficos:http://www.visualthesaurus.com/http://conceptspace.london.edu/
Recopilaciones y acceso a otros tesauros
• Desde Internet:
- Absysnet.comhttp://absysnet.com/recursos/referencia/tesauros.html
- RecBib: Recursos Bibliotecarioshttp://www.recbib.es/book/tesauros
Mochón Bezares, G., & Sorli Rojo, . (2008). Tesaurosmultidisciplinares en Internet. Revista Española de Documentación Científica, 31(1). Consultado el December 9, 2008, de http://redc.revistas.csic.es/index.php/redc/article/view/417/429
Ontologías
Vocabularios comunes para personas y aplicaciones que trabajan en un dominio.Definen los términos que se usan para describir y representar un dominio.
Parte de la filosofía que se ha adaptado a los principios
del desarrollo de la inteligencia artificial
TODA ONTOLOGÍA REPRESENTA CIERTA VISIÓN DEL MUNDO CON RESPECTO A UN DOMINIO.
Ontologías
Las ontologías pueden considerarse lenguajesdocumentales con distintos niveles deestructura, pero elaboradas con una sintaxisque los ordenadores comprendan.
No se limitan a clasificar: • Añaden relaciones (jerárquicas o no)• Razonamiento• Semántica
Ejemplo:http://wordnetweb.princeton.edu/perl/webwnOntología de la lengua inglesa
Web semántica: Segunda generación Web o Web 3.0
Fundador fue Tim Berners-Lee, 1998.Todavía está en un temprano estadio dedesarrollo, pero construye los cimientos de unnuevo espacio de información
Es una extensión de la web actual en la que seda un significado bien definido a la información.
BUSCADOR CONVENCIONAL
BUSCADOR SEMÁNTICO
Palabras clave
Pregunta
(con significado)
Listado de enlaces
Respuestas concretas
Web semántica: Segunda generación Web
En ella que se podrá encontrar respuesta a preguntas de forma más rápida y sencilla gracias a una información mejor definida
¡¡¡Convertirá en obsoletos los buscadores de hoy!!!
http://www.w3c.es/Divulgacion/Guiasbreves/WebSemantica
Proyectos de buscadores semántico
Cognition: mapa semántico del idioma inglés clave para procesamiento del lenguaje natural eficaz. Su utilización en apoyo de la web semántica, herramientas de búsqueda, traducción de documentos, etc.
http://www.cognition.com/http://www.cognition.com/info/videodemo.html
WolframAlpha: proyecto de buscador de conocimiento computacional
http://www.wolframalpha.com/