Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial...

24
SOFTWARE DE ADMINISTRACION DE TESAUROS: CREACION, EDICION Y MANTENIMIENTO (BEAT) Sobre el tutorial y la distribución del programa Para este tutorial hemos utilizado la versión 3.2.0.a (1999/01/23, CP 850) del programa BEAT (“Un Buen Entorno Administrador de Tesauros”), de Josep Sau ([email protected] ), que ha sido distribuida en calidad de software freeware en la web Will Power Information (http://www.willpower.demon.com.uk/thessoft.htm#BEAT) La versión que se proporciona es una “versión liberada” proporcionada sin garantías, con todos los derechos reservados, que puede ser usada y copiada libremente por particulares, pero que tiene prohibida su venta o uso comercial. El autor de este tutorial no tiene ninguna relación comercial con el autor del programa BEAT, si bien este último ha autorizado expresamente su uso, siempre que todo tipo de consultas sobre dicho tutorial se realicen únicamente al autor de este taller del Máster Online de Documentación Digital. Este tutorial no forma parte de la documentación oficial del programa, a la que se puede acceder directamente en el programa a través de la combinación de teclas Alt + F1. 1. Instrucciones generales Para realizar este taller, deben seguirse todos los pasos de manera secuencial, y antes de realizar una acción, deben leerse atentamente todas las instrucciones correspondientes. Es, por tanto, esencial no saltarse ninguna fase del tutorial e intentar comprender el sentido de las acciones que se están realizando. Además, se incluyen Recuadros Especiales que contienen explicaciones de especial importancia para aprovechar al máximo los conocimientos derivados del tutorial. Estas explicaciones deben leerse con especial atención. El alumno no debe proseguir con el tutorial hasta estar seguro de haber comprendido y asimilado bien las explicaciones de cada Recuadro. Si pese a todo, le quedan dudas, o desea 1

Transcript of Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial...

Page 1: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

SOFTWARE DE ADMINISTRACION DE TESAUROS: CREACION, EDICION Y MANTENIMIENTO (BEAT)

Sobre el tutorial y la distribución del programa

Para este tutorial hemos utilizado la versión 3.2.0.a (1999/01/23, CP 850) del programa BEAT (“Un Buen Entorno Administrador de Tesauros”), de Josep Sau ([email protected]), que ha sido distribuida en calidad de software freeware en la web Will Power Information (http://www.willpower.demon.com.uk/thessoft.htm#BEAT)

La versión que se proporciona es una “versión liberada” proporcionada sin garantías, con todos los derechos reservados, que puede ser usada y copiada libremente por particulares, pero que tiene prohibida su venta o uso comercial.

El autor de este tutorial no tiene ninguna relación comercial con el autor del programa BEAT, si bien este último ha autorizado expresamente su uso, siempre que todo tipo de consultas sobre dicho tutorial se realicen únicamente al autor de este taller del Máster Online de Documentación Digital. Este tutorial no forma parte de la documentación oficial del programa, a la que se puede acceder directamente en el programa a través de la combinación de teclas Alt + F1.

1. Instrucciones generales

Para realizar este taller, deben seguirse todos los pasos de manera secuencial, y antes de realizar una acción, deben leerse atentamente todas las instrucciones correspondientes. Es, por tanto, esencial no saltarse ninguna fase del tutorial e intentar comprender el sentido de las acciones que se están realizando.

Además, se incluyen Recuadros Especiales que contienen explicaciones de especial importancia para aprovechar al máximo los conocimientos derivados del tutorial. Estas explicaciones deben leerse con especial atención. El alumno no debe proseguir con el tutorial hasta estar seguro de haber comprendido y asimilado bien las explicaciones de cada Recuadro. Si pese a todo, le quedan dudas, o desea ampliar conceptos, puede tomar nota y preguntar al profesor en las sesiones dedicadas al efecto.

2. ¿Qué es un tesauro?

RECUADRO ESPECIAL n.º 1:

Es muy conveniente leer previamente el apartado 4 de la teoría de la Unidad Seminario 2-2., Lenguajes Documentales de la Prof. Conxa Planas.

2.1. Tesauros

En general, un tesauro es un conjunto de estructuras terminológicas que interrelacionan los términos de una lengua para construir un lenguaje documental normalizado, que es utilizado por:

- los indizadores en la representación abreviada de los documentos, - los bibliotecarios como guía terminológica para la estandarización de las entradas de los

encabezamientos de materias en la ordenación de dichos documentos, y- los usuarios en las ecuaciones de búsqueda, asociaciones terminológicas, comprensión del

entorno de los descriptores del tesauro, etc. de las tareas de recuperación documental.Actualmente, se trata de potenciar los tesauros jerárquicos primitivos de cualquier subárea de

conocimiento para que se conviertan en Tesauros Conceptuales, con numerosas relaciones asociativas entre los descriptores y relaciones cruzadas entre descriptores y los no descriptores. Tras su posterior conversión en hipertextuales, podremos conectarlos entre sí en la Web de Internet, de manera que

1

Page 2: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

constituyan una poderosa ontología terminológica representada en el hiperespacio como una red semántica neuronal.

2.2. Relaciones entre descriptores

Relaciones de equivalencia “Relación entre los términos preferentes y no preferentes cuando se considera, a efectos de

indización, que uno o más términos se refieren al mismo concepto”.Esta reciprocidad entre descriptores y sus sinónimos cuasisinónimos (no descriptores) se expresa

mediante las siguientes convenciones:- USE, que se escribe precediendo al término preferente.- UP (usado por), que se escribe precediendo al término no preferente.

Relaciones jerárquicas “Organización de los términos preferentes (según su significado) en categorías, subcategorías,

etc., basándose en grados o niveles de super y subordinación; en los que un término superordenado representa un todo o clase y los términos subordinados corresponden a sus miembros o partes”.

Esta jerarquía entre términos específicos y genéricos se expresa mediante las siguientes convenciones:

- TG (término general), que se escribe precediendo al término superordenado.- TE (término específico), que se escribe precediendo al término subordinado.

Relaciones asociativas Relaciones afines, de tipo psicológico, establecidas entre los términos preferentes no

equivalentes ni con relaciones jerárquicas entre sí (sobre la base de que tal conexión podría revelar términos alternativos útiles en la recuperación)”.

Se establecen principalmente cuando los términos se encuentran en distintos niveles jerárquicos y la relación es recíproca entre esos términos, expresándose mediante la convención:

- TR (término relacionado), o su equivalente en otros idiomas.

Notas de alcance Son meras notas de aplicación del término o definiciones de conceptos confusos, que nos sirven

para que cualquier usuario no experto pueda utilizar con propiedad los descriptores del tesauro.Según lo anterior, todos los términos de indización, preferentes (descriptores) y no preferentes

(no descriptores), se organizan en una secuencia alfabética única.Normalmente, los términos no descriptores (no preferentes) sólo se acompañan de reenvíos (ej.,

USE) a sus equivalentes descriptores (preferentes), mientras que la información que acompaña a los términos preferentes (descriptores) debe listarse en el siguiente orden:

- NA.Notas de aplicación o definiciones de términos confusos.- UP. Reenvíos de los términos equivalentes no preferentes.- TG. Referencias a los términos genéricos.- TE. Referencias a los términos específicos.- TR. Referencias a los términos asociados por afinidad.

2.3. Problemas en la normalización de los descriptores de un tesauro.

- Selección de los términos.- Control semántico del vocabulario: - Forma gramatical de los términos (sustantivos, adjetivos sustantivados, plurales,

etc.).- Anomalías gramaticales a nivel de descriptor (sinonimia, cuasisinonimia,

polisemia, etc.).- Relaciones a nivel del lenguaje (relaciones de equivalencia y jerárquicas).- Expresión de la estructura jerárquica de los descriptores, y relaciones no jerárquicas

o de equivalencia (o cruzadas) entre descriptores (lenguaje controlado) y no descriptores (lenguaje natural).

- Establecimiento de las relaciones asociativas extrajerárquicas entre los descriptores.- Fijación de las notas de alcance a determinados descriptores.

2

Page 3: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

2.4. Métodos prácticos de selección de los términos.

- Extracción a partir de otras herramientas conceptuales previamente compiladas (glosarios, listas de encabezamientos de materia, clasificaciones temáticas, etc.) en materias relacionadas conceptualmente.

- Creación ex novo de un vocabulario controlado mediante la extracción de los términos directamente de los documentos: o bien por grupos de expertos, o bien automáticamente, o o bien ambas, de manera mixta.

2.5. Expresión de las estructuras.

Estructura alfabética : Los términos descriptores y los no descriptores aparecen dispuestos en orden alfabético. Los no

descriptores aparecen con su reenvío a los descriptores mediante la información USE.

Estructura jerárquica : Los términos se expresan mediante todos los niveles genéricos y específicos de cada descriptor,

adoptando una estructura arbórea única (con sangrados en el texto mediante “saltos de tabulador”).

Estructura alfabética conceptual : Igual que la anterior, pero con la adicción de la siguiente información: NA, UP, TG, TE, TR a los

descriptores.

3. Introducción al uso del gestor de tesauros BEAT.

BEAT es un gestor interactivo de construcción y de consulta de tesauros sobre ordenadores PC. Existen versiones de este programa en castellano, catalán e inglés. BEAT y su documentación constituyen Propiedad Intelectual, el autor conserva y se reserva todos los derechos sobre ellos.

Permite diseñar un tesauro, y actualizar interactivamente sus elementos: descriptores, no descriptores, relaciones, notas de alcance y códigos clasificatorios.

Contempla los tipos de relaciones de equivalencia, jerárquicas y asociativas especificados en las normas ISO. Verifica inmediatamente la coherencia de cualquier modificación en los términos o relaciones y crea automáticamente las relaciones inversas.

Permite consultar interactivamente los términos según su secuencia alfabética o navegar por la red de relaciones semánticas. También, proporciona la posibilidad de buscar términos a partir de palabras clave o de sus códigos clasificatorios, y de limitar los tipos de relaciones visibles en un determinado momento de la consulta. Mantiene la indización alfabética de los términos automáticamente.

Puede generar listados de tesauros en diferentes formatos, que se envían a ficheros de texto en formato ASCII, y que pueden imprimirse o editarse posteriormente con un procesador de textos convencional (ver 6. Generación de Listados).

Entre las especificaciones del entorno, debemos señalar que:- La longitud máxima de un término puede ser de 60 caracteres.- La longitud máxima de las notas puede ser de 2.000 caracteres.- El número máximo de relaciones de cada término puede ser de 80 relaciones

de cualquier tipo.- Admite igualmente términos con varias relaciones de equivalencia (UF/USE).

3

Page 4: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

4. Fases de la construcción de los tesauros.

RECUADRO ESPECIAL N.º 2:

I. Elección del área temática y razones para su elaboración.II. Comprobación de la no existencia de otro tesauro similar.III. Delimitación del tema principal, sus temas auxiliares y/o marginales.IV. Recopilación de los términos:

a. De vocabularios, diccionarios, libros y otras fuentes secundarias (a priori).b. De publicaciones periódicas y otras fuentes primarias (a posteriori).e

V. Depuración y normalización del vocabulario.VI. Agrupación de los términos y estructuración de las relaciones de equivalencia,

jerárquicas, asociativas...VII. Puntualización de las notas de alcance.VIII. Listado de los índices del tesauro. Anexos: acrónimos, topónimos...IX. Edición del tesauro en sus distintos soportes.

5. Uso del programa. ENUNCIADO DEL EJERCICIO PRÁCTICO.

Diseñar una estructura jerárquica y asociativa muy básica para un Macrotesauro de comunicación e información generalista, no especialmente pensado para un determinado sistema de información.

Utilizar para ello los siguientes términos descriptores y no descriptores:

DESCRIPTORES: ACCESO A LA INFORMACIÓN, ADQUISICIÓN, ANALISIS DOCUMENTAL, ARCHIVISTICA, ARCHIVOS, AUTOPISTAS DE LA INFORMACIONBIBLIOMETRIA, BIBLIOTECAS, BIBLIOTECONOMIACENTROS DE DOCUMENTACIÓN, CENTROS DE INFORMACIÓN, CIBERESPACIO, CIENCIAS DE LA INFORMACIÓN, COMUNICACIÓN, CONTROL DOCUMENTALDIFUSION DE LA INFORMACIÓN, DOCUMENTACIÓN, DOCUMENTOS LEGALES, DOCUMENTOS PRIMARIOS, DOCUMENTOS SECUNDARIOS, DOCUMENTOS TERCIARIOSFONOTECAS, FUENTES DE INFORMACIONGESTION DE LA INFORMACIÓN, GESTION DEL CONOCIMIENTO, GLOBALIZACIONHEMEROTECASINFORMACIÓN, INFORMATICAMATERIAL AUDIOVISUAL, MATERIAL IMPRESO, MATERIAL VISUAL, MEDIOS DE COMUNICACIONMODOS DE COMUNICACIÓN, MUSEOSPERIODISMO, POLITICA DE COMUNICACIÓN, PROCESAMIENTO DE LA INFORMACIÓN, PROCESOS DE COMUNICACIÓN, PUBLICACIONES PERIÓDICAS, PUBLICIDADRECUPERACION DE LA INFORMACIONSELECCION DE LA INFORMACIÓN, SERVICIOS BIBLIOGRAFICOS, SERVICIOS DE CONSULTA, SERVICIOS DE INDIZACIÓN, SERVICIOS DE INFORMACIÓN, SERVICIOS DE PRESTAMO, SERVICIOS DE PUBLICACIONES, SERVICIOS DE RESÚMENES, SERVICIOS DE TRADUCCIÓN, SERVICIOS ESTADÍSTICOS, SISTEMAS INFORMATICOS, SOCIEDAD DE LA INFORMACIÓN, SOCIOLOGIA DE LA COMUNICACIÓN, SOPORTES INFORMATICOSTECNICAS DE COMUNICACIÓN, TECNOLOGIAS DE LA EDUCACIÓN, TECNOLOGIAS DE LA INFORMACIÓN, TELECOMUNICACIONES, TEORIA DE LA INFORMACIONUSUARIOS DE LA INFORMACIONVIDEOTECAS

NO DESCRIPTORES: Información en bruto, multimedia, servicios de referencia, tecnologías de la comunicación

4

Page 5: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

5.1. Inicio del programa.

Localice el icono del programa BEAT con el explorador de Windows, para acceder al fichero ejecutable del programa del ya clásico sistema operativo MS-DOS. Haga clic o presione la tecla enter, y vaya ejecutando los comandos correspondientes para activar el programa. Cuando se active el programa puede maximizar la ventana del programa para que ocupe toda la zona útil de la pantalla, si la configuración de su PC lo permite.

La primera vez que utilice el programa gestor, deberá crear un tesauro (ej.: EJERCICIOMASTER) al que acceder después para ir realizando las distintas operaciones de compilación. Las veces sucesivas, bastará con seleccionar este u otro de los tesauros creados de un recuadro, mediante la presión dos veces consecutivas de la tecla enter.

Cuando quiera salir del programa, puesto que trabaja en el sistema operativo MS-DOS, deberá utilizar la combinación de las teclas Alt+F, y después “S”, o también con Escape, y asintiendo a la pregunta de si deseamos salir (¡OJO! No se puede hacer mediante un clic con el ratón en el “aspa” superior derecha de la ventana ). En ambos casos se guardará la información automáticamente al salir, pues no hay comandos para guardar la información mediante “guardar”.

A la indicación de que el “Fichero diario ya existe” deberá presionar la letra “S”, y a la de la pregunta “Nuevo o Añadir” deberá presionar la letra “A”, para pasar a la pantalla siguiente en la que poder ir cargando los términos.

Esto último se hará mediante la presión simultánea de las teclas Alt+M y luego la letra “A”, para pasar a la barra de “Alta término”, y poder dar de alta los nuevos términos (ej.: CIENCIAS DE LA INFORMACIÓN) mediante un formulario desplegable en la parte inferior de la pantalla:

5

Page 6: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

Mediante una nueva presión de la tecla enter se irán añadiendo los términos creados a la lista alfabética general de términos.

RECUADRO ESPECIAL N.º 3:

Para evitar los ya clásicos problemas de no reconocimiento fácil de las letras mayúsculas acentuadas, necesitando configurar tanto la base de datos del gestor como el sistema operativo Windows con la tabla de caracteres latina, adoptaremos el “convenio” de escribir:

los descriptores en mayúsculas sin acentuar, y los no descriptores en minúsculas acentuadas, pues,

también resulta muy visual a la hora de distinguirlos en la edición final del tesauro, tanto en los índices alfabéticos como en los permutados.

5.2. Fase documental. Selección formal de los términos.

RECUADRO ESPECIAL N.º 4:

Seguiremos las indicaciones teóricas de la Prof. Conxa Planas en su apartado 4.4., (Elaboración y Mantenimiento) sobre los métodos analítico, sintético y mixto para la elección de los términos descriptores.

Y, seleccionaremos como “convenio” entre diez y quince conceptos (monotérminos o pluritérminos) como “facetas” de una de las posibles segmentaciones temáticas que se nos ocurra para el tesauro que queremos diseñar, después de una detenida meditación.

Ésta será distinta para cada alumno, según sus conocimientos o preferencias. Pero, su diversidad no producirá un déficit muy grave para el tesauro conceptual final dado que, posteriormente, interrelacionaremos todos estos conceptos entre sí, mediante relaciones de equivalencia con los no descriptores (UP/USE), y/o mediante relaciones asociativas con otros descriptores extrajerárquicos (TR).

Todo ello se traducirá en un tipo de red semántica de conceptos, a los que les afecta menos su inicial emplazamiento jerárquico, o las primeras omisiones que luego se podrán suplir con la inclusión de no descriptores (ya que, en su día, éstos podrán elevarse a descriptores en las sucesivas operaciones de mantenimiento).

A continuación, mediante las teclas Alt+M y luego “A” accederemos a un formulario desplegable en la parte inferior de la tabla alfabética general de términos, en la que iremos dando de alta todos nuestros términos “cabecera de subjerarquía” elegidos.

6

Page 7: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

En el caso de que alguno de los descriptores incluidos se deba modificar, entraremos en la misma pantalla anterior de modificar y nos situaremos en la barra de “Cambio de Término” y presionaremos la letra “T” para que en el formulario desplegable de la parte inferior de la hoja nos aparezca la posibilidad de modificar el término escrito inicialmente:

Igualmente, en esta fase del cargado de términos es más sencillo borrar totalmente un descriptor (Alt+M más “B”). Ya que, más adelante, cuando los descriptores tengan ya sus distintas relaciones habrá que eliminar previamente éstas, por necesidades informáticas del gestor BEAT.

Una vez modificados todos los términos incompletos o erróneos pasaremos de nuevo a la tabla alfabética general de términos para establecer sus relaciones en dos fases sucesivas: lingüística y conceptual.

5.3. Fase lingüística. Control semántico del vocabulario.

En esta fase que denominaremos lingüística, iremos cargando el resto de los términos elegidos, de manera que se constituyan todas las subjerarquías necesarias dentro de esas siete familias generales que hemos establecido en la fase anterior de nuestro ejercicio.

Aprovecharemos, una vez cargados los correspondientes descriptores, para relacionarlos jerárquicamente con sus “padres” o cabeceras de jerarquía de esas siete familias generales establecidas en la fase anterior.

Para ello, nos posicionaremos sobre el término para el que queramos crear la relación y pulsaremos enter. Después, cuando se haya abierto la pantalla con sólo ese término (destinada a añadir o modificar todo lo relativo a ese término), pulsaremos insert, (¿OJO!, a veces hay que insistir una segunda vez) que abre un menú con cinco opciones en el que podremos escoger el tipo de relación a crear:

7

Page 8: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

Aquí, por ejemplo, para cargar el término genérico de “Archivística”, que es “Ciencias de la Información”, escogeremos de este menú “TG Término genérico”. Acto seguido se abrirá un formulario desplegable en la parte inferior de la pantalla, en el que deberemos introducir el término que queramos considerar como genérico (“Ciencias de la Información”). Después pulsaremos enter y la relación genérica aparecerá cargada.

RECUADRO ESPECIAL N.º 5:

Igualmente, una vez cargados todos los descriptores, acompañaremos a cada uno de ellos de su correspondiente código clasificatorio. Para ello, estableceremos el convenio de utilizar:

1. Una letra mayúscula relacionada con el nombre general del tesauro. En este caso pondremos la letra “C” por convenio (a capricho del autor) al ser nuestro ejercicio práctico un tesauro de “Comunicación e (Información)” y dado que la otra letra que se podía elegir “I” ser fácilmente confundible con el dígito numérico “1”.

2. Seguida de un número dígito correlativo del 1 al 9 (después, cuando se agoten los números, utilizaremos de nuevo letras mayúsculas correlativas de la A a la Z) por cada una de las subjerarquías que vayamos constituyendo. A partir del término más general o “top” “Información”, caracterizado por no tener ningún otro genérico superior o TG.

Para hacer esta operación, deberemos posicionarnos sobre el término que elijamos, y pulsar Alt + M. Cuando salga el menú de Modificar, pulsar “C” (Cambiar código). En el formulario desplegable que aparecerá, escribiremos el código correspondiente:

8

Page 9: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

Finalmente, cargaremos todos los términos no descriptores. Aprovecharemos para relacionarlos con sus equivalentes descriptores, mediante relaciones cruzadas del tipo UP/USE.

Para ello, procederemos del mismo modo que para cargar las otras relaciones. Tras seleccionar el descriptor al que queramos asignar el no descriptor, pulsaremos enter para entrar en la pantalla específica del término, y después insert para abrir el menú de relaciones. De ese menú escogeremos “UP Usar por término no preferente”, que abrirá el formulario desplegable que rellenaremos con el correspondiente no descriptor “información en bruto”:

5.4. Fase conceptual. Relaciones asociativas entre los descriptores. Notas de alcance.

Para ello, procederemos del mismo modo que para cargar las otras relaciones. Tras seleccionar el descriptor al que queramos asignar otro descriptor como relacionado

9

Page 10: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

asociativamente (ej.: PROCESAMIENTO DE LA INFORMACIÓN, de la familia jerárquica C5), pulsaremos enter para entrar en la pantalla específica del término, y después insert para abrir el menú de relaciones. De ese menú escogeremos “TR Término relacionado”, que abrirá el formulario desplegable que rellenaremos con el correspondiente descriptor relacionado “GESTIÓN DEL CONOCIMIENTO, de la familia jerárquica C73”. Vemos que no es preciso que ambos descriptores estén al mismo nivel jerárquico, aunque según la norma ISO deben pertenecer a jerarquías diferentes de manera que no se crucen “erróneamente” las relaciones jerárquicas con las asociativas:

También, en esta fase iremos acompañando a aquellos términos muy específicos que lo precisen, dado que su significado pueda resultar desconocido para un usuario no necesariamente experto en el área del conocimiento que pretende abarcar el tesauro en construcción, de su correspondiente nota de alcance (NE Nota explicativa), mediante el acceso primero a la pantalla de Modificar (Alt+M) y a continuación pulsando la letra “N” para el llamado “Cambio de nota”, que sirve tanto para crear una nueva como para modificar una definición anterior que no esté perfilada adecuadamente Las notas es preferible escribirlas con mayúsculas y minúsculas con acentos, dado que así mejoran en su visualización en los índices conceptuales:

10

Page 11: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

RECUADRO ESPECIAL N.º 6:

El número de relaciones asociativas y de notas de alcance es totalmente aleatorio, dependiendo del área del conocimiento cubierta por el tesauro en construcción, el sistema o sistemas de información donde deberá utilizarse, y las características psicosociales de los compiladores.

Sin embargo, hoy en día se ha comprobado mayor eficacia de las recuperaciones en grandes bases de datos documentales no previamente indizadas con ninguna otra herramienta conceptual (ej.: bases de datos periodísticas o de la Web) con tesauros enriquecidos con numerosas relaciones asociativas entre descriptores, y algunos autores proponen más de un 30% de relaciones asociativas como mínimo.

En el caso de las notas de alcance, suele partirse de un mínimo del 10% y no más del 30%, aunque no haya ningún tipo de norma universalmente adoptada al respecto.

6. Generación de listados.

RECUADRO ESPECIAL N.º 7:

Siguiendo las indicaciones teóricas de la Prof. Conxa Planas en su apartado 4.4., (Elaboración y Mantenimiento) sobre las distintas formas de presentación de los tesauros. Seleccionaremos las cuatro formas más usadas en los tipos de tesauros más conocidos (por ej. los del CINDOC) que nos puede proporcionar el gestor BEAT:

Índice alfabético (alfabético de términos para BEAT). Índice jerárquico (sistemático global para BEAT). Índice conceptual (alfabético a un solo nivel para BEAT). Índice permutado KWIC (ídem. para BEAT).

Para la generación de los listados, abriremos la pestaña superior “Listar” mediante la combinación Alt+L y en ella elegiremos sucesivamente cada uno de los índices de BEAT del párrafo anterior:

1) Para el llamado por BEAT “alfabético de términos”, nuestro ALFABÉTICO, pulsaremos la letra “T” y en el recuadro que aparezca iremos contestano sí (“S”) o no (“N”) a las sucesivas preguntas que se nos vayan formulando.

[ES MUY IMPORTANTE TENER EN CUENTA QUE EN ESTA PANTALLA SE SALTA DE UNA A OTRA LÍNEA MEDIANTE LA TECLA “tabulador” (cuarta por la izqda., desde el ángulo inferior izqdo. del teclado).]A la primera pregunta “Explicitar la fecha de modificación” se suele contestar

con una N mayúscula, pues, las fechas repetitivas en cada término producen unos

11

Page 12: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

resultados muy poco visuales de los índices. Las siguientes tres preguntas se suelen mantener con la letra S mayúscula para añadir la mayor cantidad de información.

En la última es imprescindible situarse sobre el renglón “ASCII ISO Latin 1”, para que al “golpear dos veces seguidas” sobre la tecla “intro” nos salga un índice con todos los acentos del teclado cuando hemos diferenciado mayúsculas y minúsculas (no descriptores y notas de alcance):

A continuación cerraremos BEAT y nos iremos al “Explorador de Windows”, donde veremos el fichero con terminación (.LTA) correspondiente a nuestros índice alfabético (por ej.: EJERCICIOMASTER.LTA). Haremos clic dos veces seguidas con el ratón sobre dicho fichero, y al preguntarnos Windows con que programa queremos abrirlo deberemos contestarle bajando en la lista que nos propone hasta el icono de MS-Word y de nuevo clic.

Es una pena que BEAT no muestre en pantalla automáticamente los índices y que al generarlos, y nosotros recuperarlos en una hoja de Word, nos muestre inmediatamente debajo de cada línea del término el “Código Clasificatorio” (CC) en otra línea (en vez de en la misma línea antes o después del término correspondiente), pero los programas en MS-DOS tienen sus limitaciones de programación. Ahora tendremos una página de Word con el índice alfabético del tesauro de nuestro ejemplo.

..............................

GESTION DE LA INFORMACION CC: C4GESTION DEL CONOCIMIENTO CC: C73GLOBALIZACION CC: C74HEMEROTECAS CC: C66INFORMACION CC: C* Información en bruto US: INFORMACIONINFORMATICA CC: C15MATERIAL AUDIOVISUAL

12

Page 13: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

CC: C35MATERIAL IMPRESO CC: C36MATERIAL VISUAL CC: C37MEDIOS DE COMUNICACION CC: C21MODOS DE COMUNICACION CC: C22* Multimedia US: MATERIAL AUDIOVISUAL.....................................................

2) De manera análoga generaremos el índice llamado por BEAT “Sistemático Global”, nuestro JERÁRQUICO, pulsaremos la letra “G” y en el recuadro que aparezca iremos contestano sí (“S”) o no (“N”) a las sucesivas preguntas que se nos vayan formulando.

[ES MUY IMPORTANTE TENER EN CUENTA QUE EN ESTA PANTALLA SE SALTA DE UNA A OTRA LÍNEA MEDIANTE LA TECLA “tabulador” (cuarta por la izqda., desde el ángulo inferior izqdo. del teclado).]Antes de contestar las sucesivas preguntas del recuadro, nos iremos con Alt+V

más la letra “F” al llamado “Filtro de relaciones” y deshabilitaremos aquellas que distorsionan o no aportan contenido a nuestro índice jerárquico: UP, TR, FE, NE y NH. Para ello nos iremos moviendo de arriba abajo presionando la barra espaciadora una sola vez, de manera que un “asterisco” en el lateral izqdo. nos muestre que dicha relación ha quedado anulada para nuestra siguiente actuación (¡OJO!, Hay que repetir el proceso de filtrado de relaciones cada vez que se cierra BEAT). Finalmente, pulsaremos la tecla “intro” y comprobaremos en el recuadro alargado de la pantalla que dichas relaciones han sido eliminadas:

En el recuadro propuesto para la generación del índice jerárquico, aceptaremos las opciones por defecto de BEAT (20 niveles, 4 tabulaciones por nivel, no fechas), excepto la opción de “Incluir los términos no jerárquicos” que contestaremos con N mayúscula por incompatibilidad con la presentación tradicional de dicho tipo de índices.

Ahora seguiremos la mecánica del índice alfabético anterior en el Explorador de Windows y, generaremos un listado con terminación (.SNT) con un único árbol

13

Page 14: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

jerárquico, al “golpear dos veces seguidas” sobre la tecla “intro”(por ej.: EJERCICIO MASTER.SNT).

En caso de que nos aparezcan varios árboles jerárquicos al compilar, ello se deberá a que falta alguna relación del tipo TG/TE entre alguno/s de los descriptores. Deberemos volver a BEAT y revisar cada uno de ellos hasta que aparezca la omisión y se subsane, luego generaremos el índice nuevamente de manera que nos aparezca finalmente una página de Word con el Índice Jerárquico de nuestro tesauro de ejemplo:

INFORMACION CC C CIENCIAS DE LA INFORMACION CC C1 ARCHIVISTICA CC C11 COMUNICACION CC C2 MEDIOS DE COMUNICACION CC C21 MODOS DE COMUNICACION CC C22 POLITICA DE COMUNICACION CC C23 PROCESOS DE COMUNICACION CC C24 SOCIOLOGIA DE LA COMUNICACION CC C25 TECNICAS DE COMUNICACION CC C26 FUENTES DE INFORMACION CC C3.......................................

3) De manera análoga generaremos el índice llamado por BEAT “Alfabético de términos”, nuestro CONCEPTUAL (o alfabético completo), pulsaremos la letra “A” y en el recuadro que aparezca iremos contestano sí (“S”) o no (“N”) a las sucesivas preguntas que se nos vayan formulando.

Igualmente que en el índice jerárquico, antes de contestar las sucesivas preguntas del recuadro, nos iremos con Alt+V más la letra “F” al llamado “Filtro de relaciones” y deshabilitaremos aquellas que no aportan contenido a nuestro índice conceptual: FE, NE y NH.

En el recuadro propuesto para la generación del índice jerárquico, aceptaremos las opciones por defecto de BEAT (no fechas...), e incluso la proposición de “Incluir los términos aislados” que contestaremos con S mayúscula, dado que con ello veremos si en algún termino no descriptor se nos olvidó establecer la relación de equivalencia (o cruzada) mediante UP/USE.

Después, seguiremos la mecánica de los índices anteriores en el Explorador de Windows y, generaremos un listado con terminación (.LTH) al “golpear dos veces seguidas” sobre la tecla “intro” (por ej.: EJERCICIO MASTER.LTH). Tendrá toda la información cargada por nosotros o generada automáticamente por el gestor de tesauros BEAT, por orden alfabético dentro de los distintos términos descriptores o no, de manera que nos aparezca una página de Word con el índice conceptual de nuestro tesauro de ejemplo:

INFORMACION CC C

14

Page 15: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

UP Información en bruto TE CIENCIAS DE LA INFORMACION COMUNICACION FUENTES DE INFORMACION GESTION DE LA INFORMACION PROCESAMIENTO DE LA INFORMACION SERVICIOS DE INFORMACION TECNOLOGIAS DE LA INFORMACIONInformación en bruto US INFORMACIONINFORMATICA CC C15 TG CIENCIAS DE LA INFORMACIONMATERIAL AUDIOVISUAL CC C35 UP Multimedia TG FUENTES DE INFORMACIONMATERIAL IMPRESO CC C36 TG FUENTES DE INFORMACIONMATERIAL VISUAL CC C37 TG FUENTES DE INFORMACIONMEDIOS DE COMUNICACION CC C21 TG COMUNICACIONMODOS DE COMUNICACION CC C22 TG COMUNICACIONMultimedia US MATERIAL AUDIOVISUAL...............................

4) De manera análoga generaremos el índice llamado tanto por BEAT como por nosotros “Índice permutado KWIC”, pulsaremos la letra “K” y en el recuadro que aparezca iremos contestano sí (“S”) o no (“N”) a las sucesivas preguntas que se nos vayan formulando.

En el recuadro propuesto para la generación del índice permutado KWIC (“Keywords in context”), aceptaremos la opción por defecto de BEAT (30 caracteres desde el margen izqdo.), incluyendo las proposiciones de “Incluir los términos no preferentes” y “marcarlos” que contestaremos con S mayúscula; excepto las fechas y la opción de “Explicitar términos preferentes” que contestaremos con N mayúscula, esta última por incompatibilidad con la presentación tradicional de este tipo de índices.

Después, seguiremos la mecánica de los índices anteriores en el Explorador de Windows y generaremos un listado con terminación (.PER), al “golpear dos veces seguidas” sobre la tecla “intro” (por ej.: EJERCICIO MASTER.PER), de manera que a continuación recuperemos una página de Word con el índice KWIC de nuestro tesauro de ejemplo:...........................................

INFORMACION CC: C ACCESO A LA INFORMACION CC: C41 AUTOPISTAS DE LA INFORMACION CC: C71 CENTROS DE INFORMACION CC: C64 CIENCIAS DE LA INFORMACION

15

Page 16: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

CC: C1 DIFUSION DE LA INFORMACION CC: C53 FUENTES DE INFORMACION CC: C3 GESTION DE LA INFORMACION CC: C4 PROCESAMIENTO DE LA INFORMACION CC: C5 RECUPERACION DE LA INFORMACION CC: C54 SELECCION DE LA INFORMACION CC: C55 SERVICIOS DE INFORMACION CC: C6 SOCIEDAD DE LA INFORMACION CC: C76 TECNOLOGIAS DE LA INFORMACION CC: C7 TEORIA DE LA INFORMACION CC: C18 USUARIOS DE LA INFORMACION CC: C43 * información en bruto INFORMATICA CC: C15

............................................................................................

7. Integración documental en una página de MS-Word.

Una vez obtenidos los cuatro índices básicos del tesauro que queremos editar, será preciso maquetarlos con un programa de composición o un procesador de textos. Lo más sencillo será utilizar la función “Esquema” de MS-Word, en la ventana “Ver”.

Allí especificaremos previamente las distintas secciones de un tesauro editado en formato papel: Introducción a la metodología de realización, con las fuentes utilizadas (bibliografía final). Agradecimientos. Índice Analítico con paginación. Cada uno de los cuatro Índices de presentación del tesauro.

Será conveniente consultar algún tesauro reconocido para ver la forma en que se suelen redactar las páginas iniciales, y luego ir abriendo los ficheros que contienen nuestros cuatro índices y “Seleccionando todo” más “Copiar” en la ventana “Edición” los iremos llevando a nuestro Esquema y con “Pegar” los iremos colocando en sus secciones correspondientes:

8. Importación y exportación de datos, desde y a otros programas.

16

Page 17: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

1) BEAT proporciona la posibilidad de incorporar datos (términos, relaciones, códigos, notas, etc.) desde ficheros de texto con un proceso de carga masiva.

Las operaciones no interactivas a realizar sobre el tesauro actual se toman de ficheros de texto con una sintaxis propia del programa, el formato BEAT que se explica en la ayuda del programa:

En una carga masiva desde un fichero, BEAT es capaz de modificar el tesauro de forma no interactiva (o batch) añadiendo, modificando o eliminando términos, relaciones, códigos, notas, etc. repetidos o incompletos. Se considera que las relaciones, códigos o notas afectan al último término encabezamiento (sin ninguna etiqueta) leído del fichero.

Los ficheros de texto de entrada han de ser codificados con la tabla de caracteres ASCII CP 850. Los ficheros que deba leer BEAT estarán preferentemente en mayúsculas sin acentuar (excepto las notas de alcance, SN: y los términos no descriptores, US:) y serán como el siguiente ejemplo:

COMUNICACIONCC:C2BT:INFORMACIONNT:MEDIOS DE COMUNICACIONNT:MODOS DE COMUNICACIONNT:POLITICA DE COMUNICACIONNT:PROCESOS DE COMUNICACIONNT:SOCIOLOGIA DE LA COMUNICACIONNT:TECNICAS DE COMUNICACION

CONTROL DOCUMENTALCC:C42BT:GESTION DE LA INFORMACION

DIFUSION DE LA INFORMACIONCC:C53BT:PROCESAMIENTO DE LA INFORMACION

2) BEAT proporciona igualmente la posibilidad de exportar datos a otros programas gestores (términos, relaciones, códigos, notas, etc.) desde sus ficheros autogenerados de texto. La manera más sencilla es acceder a la casilla de “Exportar”

17

Page 18: Sobre el tutorial y la distribución del programaalcazaba.unex.es/asg/101408/Tutorial TesauroUNEX.doc  · Web viewSobre el tutorial y la distribución del programa. Para este tutorial

mediante la combinación de teclas Alt+E y, luego, con la letra “A” al “Alfabético BEAT”.

El fichero obtenido deberá ser adaptado al tipo de ficheros admitidos por el programa gestor receptor. En la mayoría de los casos, basta con eliminar en el formato BEAT anterior las líneas en blanco entre los términos encabezamiento y sustituir los saltos de línea de las distintas relaciones por un signo separador establecido por el formato del programa receptor (; | ¿).

9. Bibliografía básica.

- AITCHISON, J.; GILCHRIST, A. Thesaurus construction, a practical manual. Londres: ASLIB, 1987.

- CURRAS, E. Thesauros: lenguajes terminológicos. Madrid: Paraninfo, 1991.- GIL URDICIAÍN, B. Manual de lenguajes Documentales. Madrid: Noesis, 1996.- ISO. Documentación - Directrices para el establecimiento y desarrollo de tesauros

monolingües. Norma internacional ISO 2788-1986. En Revista española de documentación científica, 12, 4 (1989), pp. 463-483 (Parte I), y en 13, 1 (1990), pp. 601-629 (Parte II).

18