028_029_fenix_bnp

download 028_029_fenix_bnp

If you can't read please download the document

Transcript of 028_029_fenix_bnp

REVISTA DE LA BIBLIOTECA NACIONAL

INSTITUTO NACIONAL DE CULTURA

28 -29

SUMARIOCATALINA RUILOBA ROSSEL Y MARIA LUISA THORNBERRY VILLARAN. Revisin Sis-

temtica de la Literatura sobre Descriptores y Tesauros.TEODORO HAMPE M. Los primeros libros

5

en el Per Colonial.CARLOS GARCIA BARRON. La Perla de Li-

7191

ma.MERLIN D. COMPTON. Las Tradiciones Pe-

ruanas de Ricardo Palma: Bibliografa y Lista cronolgica tentativas.R. T. ZUIDEMA. Catachillay.NILS JACOBSEN. Las propiedades rurales

99130

de la Iglesia en Azngaro entre 1825 y 1920.MARIA LETICIA CACERES SANCHEZ. Crtica Literaria e Histrica, reas infrecuentes en la produccin intelectual de la mujer peruana.

15 1

161

/ 28-29 INSTITUTO NACIONAL DE CULTURAREVISTA DE LA BIBLIOTECA NACIONAL

AO DEL BICENTENARIO DEL NACIMIENTO DEL LIBERTADOR SIMON BOLIVAR

Lima - Per 1983

DIRECTOR DE LA BIBLIOTECA NACIONAL

JOSE TAMAYO HERRERA FENIXREVISTA DE LA BIBLIOTECA NACIONAL

Nos. 28/29. Aos 1978/ 1979 PE ISSN 00015 - 0002DIRECCION

LUCILA VALDERRAMA G.SUSCRIPCION Y CANJE

BIBLIOTECA NACIONAL Av. Abancay s/n. Apartado 2335 Lima - Per

Revisin Sistemtica de la Literaturasobre Descriptores y Tesauros*Catalina Ruiloba Rossel Mara Luisa Thornberry Villarn

INTRODUCCIONVivimos en una era en que la explosin de E informacin, debido a a la iizcesante produccin bibliogrfica, nos agobia. Su ordenamiento a travs de dcscriptores y tesauros se hace indispensable en esta vorgine del pensamiento humano, cuya recuperacin efectiva no ha sido posible hasta la adopcin de los nuevos sistemas.A travb de nuestra experiencia com? aiumnas en la Escuela Nacional de Bibliotecarios (E.N.B.) hemos advertido la falta de literatura sobre el tema en nuestro pas y principalmente la carencia de bibliografa en Espaol, que acierns de encontrarse muy dispersa, forma parte de bibliotecas varticubares, siendo inaccesible a los interesados.

Hemos llamado revisin sistemtica a nuestro trabajo, porque rene informacin soljre la especialidad, dkpersa en libros, revistas especializadas, jolietos, documentos e informes de reuniones tanto nacionales como internacionales. Esta dirigido principalmente a estudiantes de bibliotecologa, porque pretende dar una visin clara y profunda en lo referente a teora y prcrica de descriptores y tesauros, pero tambin a profesionales que se inician en el rea de la documentacin y en general a todo bibliotecario que encuentre necesaria la adopcin de un tesauro para un Centro de Documen, tacin. Resultado de una extensa investigacin para coordinar la informacin sobre el tema, esperamos cumpla con los requerimientos de los profesionales interesados en el campo. Pretendemos dar una visjn general de la

"

Tesis presentada a la Escuela Nacional de Bibliotecarios para optar el ttulo de Bi. biiotecaria. Lima, 1979. Fnix 28/29: 5-70, 1978/1979

FENIX

evolucin de los sistemas de recuperacin de la informacin a comienzos de la dcada del 60, ubicando los primeros intentos realizados en lo referente a descriptores y tesauros dentro del marco de la Ciencia de la Informacin; definimos exhaustivamente los descriptores y tesauros as como las pautas para la seleccin y elaboracin de descriptores y construccin de tesauros, e intentamos recopizdr los frabajos realizndos a nii;el nacional, latinoamericano y mundial. Deseamos que esta tesis constituya el punto de partida para posteriores trabajos sobre el tema y llene en parte el vaco de bibliografa cn dicha brea de la informacin, en la realidad bibliotecaria nacional.

CAPITULO I ANTECEDENTES TEORICOS DEL TESAUROLa Ciencia de la Informacin es el estudio de los procesos de comunicacin informativa (1) y de los sistemas en que stos son formalizados en la sociedad. La Ciencia de la Informacin comporta un nuevo enfoque que comprende la bibliotecologa y la documentacin en el marco amplio de la comunicacin. Hay dos tipos de comunicacin informativa: La informacin pblica.- De la cual no se ocupa la Ciencia de la Informacin y que es manejada en general por el periodismo como bien de consumo final en la sociedad. La informacin especializada.- Atae a la Ciencia de la Informacin, en cuanto transferencia de conocimientos cientficos y tCcnicos encaminada a la produccin material o intelectual (Alcaide, 1976).

IZECUPERACION DE L A INFORMACIONCalvin Mooers creador del trmino "Recuperacin de la Informacin", lo define como el proceso que se utiliza para analizar cn detallc el sentido de 10s documentos. Kaiser, en 1911, considera la importancia de diferenciar da literatura de la informacin y analizar las partes del contenido de un libro para ordenarlas en forma lgica.(1)Adems de infamar, la comunic:iciOCUMENTACION Nota: "Ttulo de una serie de publicacioncs" Para los casos de traduccin, si el significado no es enteramente equi, valente: LlNKS (engranaje, eslabonamiento, conexin) NEXOS

Fuentes de informacin: Es importante considerar las informaciones sobre la fuente del descriptor ya que servirn para su desarrollo futuro, stas pueden estar con los descriptores sin que ello signifique su inclusin en el tesauro. (UNESCO), 197 1) (Naciones Unidas, 197 1).

Combinacin de palabras o conceptosAl crear un sistema hay que considerar y decidir con precisin como deben ser combinados los trminos, palabras o conceptos a usarse. Si la decisin es tomada antes que dichos trminos sean ubicados en el sistema, ser una precoordinacin; si son combinados durante la bsqueda, ser una postcoordinacin. El problema &epresenta cuando hay que decidir el grado que debe darse a la precoordinacin de los trminos en un sistema postcoordinado de recuperacin. Los trminos de un tesauro pueden precoordinarse a cualquier nivel. Vickery ha mostrado la forma en que 47 entradas pre-coordinadas de un catlogo convencional pueden reemplazarse por 26 trminos en un sistema postcoordinado. Por su parte Heald, en el informe LEX, ha indicado que aunque hay 23,364 trminos en el tesauro, el nmero de palabras que aparece en el ndice es slo de 13,012. Poco despus que Taube publicara su estudio sobre UNITERMINOS, present la nocin "Bound" (atado, ligado),

LENIX

y otros profesionales resaltaron ideas parecidas. Bloomfield en 1957, hall til, dividir trminos como "estratos de ligazn" y, Wadington, que fue el primero en hablar de coordinacin de trminos en 1957, desatendi las reglas de Taube referentes a trminos libres y ligados y cre trminos compuestos segn el grado de especificidad considerada necesaria. Jolinson, aprob el uso de trminos compuestos pero incorporndoles un guin para distinguir entre una palabra usada sola o adjetivamente en un trmino compuesto, por ejemplo: agua y agua-, en que la segunda palabra se usaba siempre en combinacin como: Bombas de agua, ruedas de agua, etc. La discusin y el estudio han continuado durante las ltimas dcadas y, en 1970 Moss hizo un experimento con un sistema establecido con anterioridad en el cual mostr, que el uso de un lenguaje de indizacin de trminos compuestos, tales como los usados p e ~ cientficos en sus inlos formes, da como resultado una mejor recuperacin de 13 informacin, que el uso de palabras claves o unitrminos. El problema de la precoordinacin es similar al de los problemas hallados al separar factores semnticos. Esto se considera un recurso de recuperacin porque est basado en la divisin de trminos complejos en sus cmceptos genricos constituyentes. Algunos trminos compuestos son lgicos, otros no lo son tanto y, las relaciones entre las partes varan $:mto como las relaciones entre las partes y su significado aislado. Muchas veces las partes de un trmino compuesto son usadas incoriwtamente, por ejemplo, "respisacin artificial", no es artificial, ni es una forma de respiracin y un doctor podra preferir !a frase "ventilacin ayudada". Los compuestos no se pueden dividir mecnicainente en forma segura y el significado de cada una debe estudiarse en reiaein a sus partes. El TEST favorece la precoordinacin (64.5% de sus descriptores son trminos compuestos), habiendo incorporado un ndice adicional en el que figuran los trminos compuestos cambiados. Esto lleva a tener como resultado extraas parejas de palabras, pero que a menudo sc cncuentraii en una lista de trminos ms especficos (TME) bajo un gneio. por ej:mplo: Hay 69 tipos de mhquina en lista, bajo: Mquinas, las cualcs se repiten en un ndice cambiado. (Gilchrist, 197 1).Precoordinacin.- Se ocupa primeramente de la divisiii de trminos complejos. Los descriptores precoordinados se deben usar cuando:

El significado propio del descriptor sea diferente del significado del descriptor precombinado. Los descriptores usados en combinaciones jerrquicas puedan diferenciarse as de los otros descriptores precombinados. El descriptor precombinado sea un nombre propio o cuando exista duda sobre si la combinacin creada refleja exacta y exclusivmiente el contenido conceptuai.

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

35

Los trminos de alta significacin son recomcndados en la mayora de los casos como descriptores precombinados. Si el coricepto requiere se; expresado por la combinacin de descriptores, es indispensable la introduccin de la referencia: "use". Para los trminos precombinados de poco uso, es necesaria la aeferencia "usado por", bajo los descriptores. Los descriptores precombinados de poco uso deben ser indicados en la seccin alfabtilca del tesauro como no descriptores y en la seccin sistemtica del mismo, se incluir la combinacin de descriptores simples.

Postcoordinacin.- Solamente se usar la postcoordinacin en los casos de poca frecuencia en la utilizacin de descriptores. Se debe prestar mucha atencin a que la combinacin de descriptores presente inequvocamente el mismo concepto que el descriptor precombinado, salvando as lodo problema de ambigedad. (Aitchinson y Gilchrist, 19 IL,.

CAPITULO III RELACIONES ENTRE DESCRIP'I'OKESUna de ias funciones principales del tesauro cs servir de iiistrumeiito para la recuperacin de la informacin mostrando las relaciones existentes entre los descriptores juntamente con los sinnimos que permiten llegar a ellos a partir del lenguaje natural. "El trabajo de las relaciones de un descriptc~rcon otros descriptores, provec cierta forma de definicin al colocar al descriptor en su espacio semiitico". (Unesco, 1970). Estas relaciones se manifiestan mediante reierencias simples entre los descriptores y los no-descriptores o mediante referencias cruzadas que poseen siempre la propiedad de ser recprocas, debindose indizar, en todos os casos, la relacin existente entre un descriptor y otro, y su inversa. Las relaciones que se presentan entre los descriptores son de tres tipos: Relacin jerrquica, relacin asociativa o de aiinidad y relacin de equivalencia o preferente.

Relacin JerryuicaEste tipo de relacin indica superioridad o subordinacin entre los descriptores; se basa en la posicin del descriptor dentro de una clase de conceptos y no en la aplicacin de un concepto. Algunos trminos pueden ser elementos de ms de una categora jerrquica. Los descriptores deben tener referencias cruzadas para todos los niveles. En la mayor parte de los casos, los conceptos que constituyen subdivisiones de un concepto ms amplio formarn parte de una categora jerrquica. Para establecer las relaciones jerrquicas hay que tener un profundo conocimiento de la disciplina tratada, ya que en ciertos campos del saber,

por ejemplo, en la economa-sociologa es difcil establecer una relacin de este tipo, por lo que se recomlienda indicar las relaciones jerrquicas en economa y sociologa slo cuando es muy evidente. En campos ms limitados, como las tecnologas y las ciencias naturales, las relaciones pueden establecerse ms fcilmente. Las relaciones jerrquicas se indican mediante las referencias: Trmino ms amplio (TMA). Trmino ms especfico (TME).

Relacin Asociativa o de Afinidad"Establece un nexo entre un descriptor y otros que estn estrechamente relacionados con l desde el punto de vista conccptual, pero entre los que no existe una verdadera relacin jerrquica ni preferente". Esta relacin se indica mediante la expresin: Trmino relacionado. (TR) (Rodrguez Delgado, 1979). EMPLEO TR Seguiridad Social SEGURIDAD SOCIAL TR Empleo

Cuando hubiera duda entre dos trminos en la reiacin jerrquica o con dos trminos de igual jerarqua, se utilizar este tipo de relacin. Existe una variedad de relaciones entre los conceptos, por lo tanto esta relacin se establecer slo si se asume que sern requeridas para la recuperacin o indizacin. Las relaciones asociativas pueden-usarse para indicar: Parte-todo, parte de un todo. Cuasi-sinnimos. Antonimia, un concepto opuesto a otro concepto. Otros: Como recurso o medio para llevar a cabo un proceso y, el proceso mismo: Instruccin programada. TR Mquina de enseanza. Medidas especficas o recurso de medicibn y aquello que mide: Visin, T R Umbral, Entrada. Proceso y producto: Pintura, TR Mateiiales de pintura, Pinturas. Producto y recurso p,ara producirlo: Fotografa, TR Cmara fotogrfica. Cosa u objeto, proceso o estado conectado frecuentemente con su presencia, ocurrencia o manipulacin: Lenguas ertranjeras, TR Laboratorio de Lenguaje. Proceso y posible cualidad del objeto no nombrada del proceso: Factibilidad de ordenamiento TR Organizacin.

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

Trminos de alcance anotado y alternativamente trminos ms especficos: Posicin, TR Angulo, Ocupacin, Rango. Trmmos de alcance anotado y otros posibles significados del trmino eil lenguaje natural que son excludos por las notas de alcance: Movilidad, 1 R Movilidad geogrfica. Ljos personas, consideradas desde un punto de vista especial, que interactan en el status resultante especial: Estudiante 'TR Consejero estudiantil. Dos procesos que pueden ocurrir en una secuencia: Examen fsico, T R Diagnstico. Una situacin o condicin y lo que puede ocurrir en esa situacin a condicin: Tiempo libre T R Lectura. Posibie causa y efecto: Enseanza TR Aprendizaje. Opuestos aparentes que pueden tambin construirse como iactores interactuantes: Frustracin, TR Realizacin, Logro. Una persona y proceso habitualmente asociado a esa persona: Consejero, TR Aconsejar. Coordinacin, cuando un concepto deriva de otros conceptos: Relaciones genricas. T R Parte-todo. Concurrencia, uso Crecuente de dos conceptos: Educacin, TR Enseanza. Keiacin instrumental: Escribir, TR Lpiz. Keicin material, cuando algo es la materia de la cual otra est hecha: Papel, TR Libros. (Willets, 1975).

Relacin de Equivuiencia o PreferenieLa rciacin de equivalencia o preferente es la que remite diversos si;i.jninios y cuasi-sinnimos de un descriptor expresado en lenguaje natural, al trmino de indizacin correspondiente en lenguaje documentario; pueden ser combinados en categoras equivalentes, de manera que, trminos equivalentes sean asignados slo al mismo concepto. Este tipo de relacin permiie al usuario, que desconoce el lenguaje documentario, encontrar los trminos normalizados a partir de los mismos en lrnguaje natural. Se utiliza en los casos siguientes:Cuando existen sinnimos o cuasi-sinnimos. Cuando se elige como representativo un descriptor entre un conjunto de ellos (caso que puede incluir a los antnimos). Cuando vara la ortografa en un mismo descriptor. Se debe hacer una distincin entre sinnimos y cuasisinnimos. Los sinnimos verdaderos y los cuasi-sinnimos son trminos de equivalencia. En general ningn idioma pasee verdaderos sinnimos, pero cuando un trmino se encuentra siempre que se busca otro trmino, conviene tratar a ambos coma sinnimos. Los sinnimos en lenguaje comn son ms escasos que en la terminologa cientfica:

FENIX

COMPUTADOR ORDENADOR Pueden considerarse cuasi-sinnimos, los descriptores cuyos trminos coinciden en gran medida o representan distintos aspectos de la misma propiedad. Son aquellas palabras que sin tener el mismo significado pueden considerarse siilnimos en un sistema de recuperacin de informacin. Referencia USE.- Cuando se usa trminos preferenciales en la elaboracin de un tesauro, la referencia USE se emplea para dirigirse de un no-descriptor a uno o ms descriptores, de este modo: Para indicar el sinnimo preferencial: ESQUELETO Use ESTRUCTURA OSEA Mandar de un trmino especfico a un trmino ms general que haya sido previamente seleccionado para representar el concepto especfico (cuasi-sinnimos): PLANTAS GRAMINEAS Use GRAMINEAS Indicar preferencias en la escritura o dar una explicacin de las abreviaturas y siglas usadas: CENTRO PANAMERICANO DE INGENIERIA SANITARIA Y CIENCIAS DEL AMBIENTE Use CEPIS Prescribir el uso de dos o ms conceptos: PELICULAS FERROMAGNETICAS Use MATERIALES FERROMAGNETICOS

+

PELICULAS

Indicar que determinados conceptos deban considerarse sinninlos con propsitos de indizacin y / o recuperacin (cuasi-sinnimos): FACTORES DE LA HERENCIA Use GENES Expresar diferentes grados o puntos de cierta continuidad conceptual:

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

FLUIDEZ Use VISCOSIDAD Mandar de entradas invertidas de referencias cruzadas al orden natural de los trminos: DOS DE MAYO, BATALLA DEL Use BATALLA DEL DOS DE MAYO Incluir las traducciones de un descriptor:ROENTGkNS? RAHLEN Use RAYOS - XReferencia USADO POR.- La referencia "usado por" se utiliza con el tCrmino prekrido para referencias recprocas:

ESTRUCTURA OSEA Usado por ESPUELETO GRAMlNEAS Usado por PLANTAS GRAMINEAS CEPIS usado por CENTRO PANAMERICANO DE INGENIERIA SANITARIA Y CIENCIAS DEL AMBIENTE MATERIALES FERROMAGNETICOS + PELICULAS usado por PELICULAS FERROMACiNETICAS GENES usado por FACTORES DE LA HERENCIA VISCOSIDAD usado por FLUIDEZ BATALLA DEL DOS DE MAYO usado por DOS DE MAYO, BATALLA DEL RAYOS X usado por ROENTGENSTRAHLEN (Unesco, 1971) Las relaciones jerrquicas y de equivalencia slo pueden existir entre descriptores del mismo tipo; las relaciones asociativas, pueden unir cualquier trmino con otro.

-

En el siguiente cuadro aparecen las relaciones cxistentcs entre descriptores, constituyendo un sistema dc referencia en un momento dado, y los dems elementos: Los trminos ms amplios (TMA); los trminos ms especficos (TME); los trminos relacionados (TR); de nivel anlogo, los sinnimos (S,, S,. . . Sn) y los smbolos de la CDU o de cualquier otro sistema de clasificacin, que tambin podremos relacionar con cada uno dc los descriptores de referencia. De esta manera, cada descriptor forma el centro de una serie de relaciones muy complejas de los distintos niveles y de otros campos, constituyendo en su conjunto un tesauro, en el cual figuran todas las relaciones posibles. Tambin se d la relacin de homografa, cuando el trmino se escribe de igual manera que otro de sentido muy distinto. (Rodrguez Delgado, 1977).

TMA

a : DESCRIPTOR DE REFERENCIA TMA : TERMINO MAS AMPLIO TME : TERMINO MAS ESPECIFICO TR : TERMINO RELACIONADO S& : SINONIMOS O CUASI-SINONIMOS CDU : TERMINO Y NUMERO DE LA CDU (Clasificacin Decimal Universal) H : HOMOGRAFO

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

CAPITULO IV CONSTRUCCION Y APLICACTON DEL TESAUROEstructura del Tesauro: Esquemas de ClasificacinLa clasificacin juega un rol importante en la construccin de un tesauro y en la forma en que puede expresarse el producto final. Los procesos analticos de la informacin son la base de los esquemas de clasificacin, conocidos como el rbol del conocimiento. Este proceso consiste en tomar el universo de entidades, cosas e ideas que se desea ordenar y dividirlas sucesivamente segn las correspondientes series de caractersticas para su divisin. Cada divisin se despliega en clases, de manera quc ei rbol completo presenta dos tipos de relaciones lgicas: la relac i h gcnbica de una clase superior y la relacin colateral entre dos tipos de despliegue. Cada divisin debe ser exhaustiva y basarse en una sola caracterstica para evitar relaciones cruzadas. Este despliegue de las esferas del conocimiento son tema de controversia filosfica y todos los esquemas universal'es han presentado sus idcas para csta primera ruptura del universo del raciocinio. (Gilchrist, 1971). Las relaciones semnticas son genricas y partes de un todo dividido. Esto puede detallarse aunque slo sea para subrayar la dificultad en establecer relaciones genricas. Lo correcto es establecer una relacin gneroespecie, particularmente en las ciencias naturales, as, el estao es metal y la clorina un halgeno. La jerarqua genrica se ha formalizado en biologa: especies, por ejemplo gnero familia orden clase reino oso pardo ursus-oso m,arrn, oso peludo ursidae-polar, etc. carnvoro-OSOS,gatos, perros mamfero animal

Estas relacioncs aplicadas a objetos fsicos, conllevan sus propios problemas: sin embargo, las relaciones genricas son ms fciles de establecer cuando incluyen o se refieren a problemas abstractos. Los objetos fsicos pueden arreglarse en jerarquas segn su uso o alguna caracterstica externa a ellos mismos. El informe final del Proyecto LEX por Heald, narra cuntos lenguajes diferentes de indizacin han sido examinados antes de la compilacin de TEST. Descubrieron que un tesauro tena el trmino "recuperacin de la informacin" como genrico de procesamiento de datos y que otro reverta esta decisin y lo tena a la inversa. Se debe asumir queninguno es incorrecto hasta haber examinado a fondo ambos esquemas. Todos los lenguajes de indizacin deben tomar en cuenta las relaciones

FENIX

jerrquicas aunque sea con el fin de evitarlo, como en algunos ejemplos de vocabularios condensados. Las reglas del Engineering Joint Council (EJC) usan tres conectores para desplegar la existencia de una relacin; TMA-TME (trmino ms amplio y trmino ms especfico) y TR (trmino relacionado). Las reglas declaran que la conexin TMA debe usarse para la relacin gnero-especie, pero debe evitarse para las relaciones uarte-todo, excepto en las reas o campos de anatoma o geografa. Tambin se excluven especficamente las relaciones entre cosas u objetos basadas en raractersticas externas, como el uso; platino no debe considerme miembro dc la familia genrica de catalizadores. Algunos tesauros incluyen despliegues de rboles genricos adems de las relaciones de TMA-TME. El Thcsaurus of Terms on Copper Terminology de la Copper Develo~mentAssociation (CDA). incluye 10 rboles dedicados a: Extraccin metalrgica Prctica de moldeado Fabricacin Acabado Unin Proceso de metalurgia en polvo Metalurgia fsica Propiedades Corrosin Aleaciones de cobre y metal La a~licacinde clasificacin dicotmica (mtodo de clasificacin en aue las divisiones tienen slo dos partes) a colecciones de documentos, ha sido atacada por muchos escritores como una lgica absurda; aunque los lgicos dividan las clases en A y no-A, esta forma de pensar no tiene sentido en la prctica bibliotecaria al enfrentarse, por ejemplo, Psicologa y no-Psicologa. La razn, como lo declaran escuetamente algunos autores, es que la clasificacin bibliotecaria no tiene un nico complemento y consiste por lo tanto. en sistemss de relaciones. Este es el hecho que ha llevado a muchos diseadores de clasificaciones y lenguajes de indizacin a empezar desde abajo y trabajar hacia arriba, antes que apoyarse en el acercamiento anlitico, basndose enteramente en la construccin de rboles de jerarquas. Las relaciones entre trminos son solamente una forma de describir la naturaleza poli-jerrquica del conocimiento y esto sucede siempre que una clase es ms especfica que otra. Las clases simples pueden desplegarse en rboles de gneros, por ejemplo, Refinamiento de fuego, en el Tesauro de CDA: METALURGIA EXTRACTORA Concentracin etc. Hidrometalurgia Pirometalurgia Refinacin etc. Fundicin Fuego Refi. electroltico Refina

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

43

estos ejemplos son fortuitos y el nmero de relaciones posibles es demasiado amplio para incluirlo sistemticamente. Fue Rmganathan el primera que impuls las bases analtico-sintticas, que formaliz ms tarde en su clasificacin y que ha sido ampliamente adoptada para el diseo de esquemas especializados de clasificacin facetada. Esta tcnica ha sido utilizada cada vez ms y prueba de ello son las revisiones del CDU y el diseo de las tesauros. Vickery ha descrito un texto prctico para diseadores sobre clasificacin facetada en el que dice que "la esencia del anlisis de facetas es la distribucin de los trminos en un campo dado del conocimiento en grupos homogneos, separados cada uno del patrn universal por una sola caracterstica de divisin". Poclemcs contemplar a estas facetas como grupos de trminos derivados, por su definicin, gnero y diferencias, con respecto al patrn universal. Ranganathan ya haba dicho que estas caractersticas podan estar relacionadas con cinco "categoras fundamentales", los elementos de su muy cvnocida frmula PMEST letras que significan: Personalidad, Materia, Energa, Espacio y Tiempo. La tcnica del anlisis de facetas crea esquemas cuyas propiedades analtico-sintticas permiten ms flexibilidad al indizador y son ms hospitalarias para la adicin de nuevos conceptos. Queda el problema del ordenamiento entre y dentro de las facetas y el arreglo jerrquico que r e q u i e z o dava una hbil estratagema. Deben mencionarse brevemente las dos formas de estudiar el problema de los niveles jerrquicos en general; ambos han sido tomados de otras disciplinas y tienen afinidad la una con la otra, pero hasta aqu actan slo como guas para la construccin de lenguajes de indizacin. La primera es la Teora General de Sistemas, propuesta en 1932 por el bilogo Von Bcrtanlaffy y que ha sido descrita por el economista Boulding como clasificacin de los sistemas en ocho niveles, que van de lo inanimado a lo animado altamente organizado: Armazn, entramado, esqueleto (sistemas estticos como el diseo de los tomos en una frmula molecular). Trabajos de relojera (sistemas "dinmicos" como niveladores o hasta mquinas de vapor). Termostato (el ms bajo nivel de control). Clula "abierta" (o que se mantiene a s misma). Vida de las plantas. Reino animal (difiere del precedente en poseer receptores de informacin especializada. Seres humanos. Organizaciones sociales.

FENIX

La segunda es la teora de niveles integrados, propuesta por cl filsofo Feibleman y descrita dentro del contexto de la clasificacin bibliotccaria por Foskett en 1961, y desarrollada ms ampliamente por Jolley sn 1968. Empieza con el axioma "un trmino es genrico cuando su sentido puede expresarse slo con las palabras que definen una estructura": miembros de juegos - juegos completos lneas figuras geomtricas fotones - partculas subatmicas con masa descanso - tomos y molculas rganos del cuerpo - plantas y animales departamentos, secciones de comunidades, comunidades enteras partes de naciones - naciones

-

Las dos primeras lneas tratan de matemticas; las dos sigiiientcs de fsica; el tercer par, de biologa; y, el ltimo de sociologa, poltica y economa. Podemos llamar a estos ocho niveles, para ms comodidad: de terico geomtrico subatmico molecular citomecnico biomorfo comunal nacional

-

- juego

Es importante destacar en los sistemas de clasificacin facctada. la facilidad con que se pueden usar para la recuperacin post-coordinada. Esto es debido, por supuesto, a la flexibilidad de las bases analtico-sintticas que dan al indizador amplia libertad de coordinar conceptos complejos. Hill ha descrito un sistema de tarjetas fijas basado en la clasificacin facetada, estas se gi~ardanclasificadas, facilitando la bsqueda, El producto final lgico del uso de la clasificacin facctada en la construccin del tesauro se puede ver en el Thesaurofacet: el tesauro se convierte en un ndice alfabtico para la clasificacin facetada. No existe diiplicacin de la informacin en las dos mitades que pueden usarse independientemente y, cuya conexin se hace a travs de la notacin. Se ha demostrado lo til que es el anlisis de facetas para la revisin dc los tesauros como una tcnica para la compilacin y revisin de la literatura; tambin el registro de cada trmino del tesauro en una tarjeta de bordes marcados junto con todos sus trminos relacionados. Los agujeros alrededor del borde se usan para codificar las facetas y disciplinas a las

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

45

que pertenecen cada uno de los trminos, as como las facetas que estn implicadas en l: se marca con un agujero el nmero del primer documento al que se le ha asignado dicho trmino, y el nmero de veces que ha sido adjudicado en un nmero determinado de documentos. Al seguir el anlisis de las tarjetas se descubre que se ha introducido en el sistema tres pares de sinnimos que no demuestran tener ninguna conexin. Estos son: Campestre enfermedades de la piel (humanos) exactitud y siete pares de cuasi-sinnimos: pelotas vlvulas barnices, ar, ando posicin, tomarla mantenimiento higrmetros, metra friccin, ar esferas, esfricos espitas lacas, laquear, ando alineamiento servicio, servir, sirviendo Psicometra frotar

YY Y

rural dermatitis, dermatologa precisin

La mayor utilidad del anlisis es identificar los valorcs o distinciones genricas, los que se dividen en tres tipos: TME no suficientemente diferentes y/o importantes. por lo tanto diluidos; se hacen las alteraciones necesarias a las tarjetas. Se conserva el TME pero lo suficientemente relacionado al trmino ms amplio para envos en la tarjeta, de forma que el TME figura en la tarjeta del TMA. Ej. Carreteras. Ver: Caminos. Se conserva el trmino ms especfico, pero no se considera necesaria la referencia. Ej. Dentado Engranajes La experiencia ha dado como resultado una mejor definicin tras la identificacin de los grupos de trminos similares. Las cavidades, agujeros y perforaciones al ser bien entendidos por el diseador del sistema, fueron definidas en el tesauro como: Cavidades, cavar agujeros perforacin, perforar en lquidos y slidos algo que es perforado, taladra, barrenado reservado a lminas

FENIX

Ya desde 1955, un memorndum escrito por Foskett se titulaba "La necesidad de una clasificacin facetada como base de todos los mtodos de recupcracin de informacin" y m& recientemente ha declarado que "slo cxist:n dos mtodos para hacer un 'thasaurus': El primero coixiste cn fabricar una lista alfabtica de los trminos que uno encuentra en la literatura del tema; y el segundo, es separar primero las categoras, arreglar los i&minos que figuran en ellas, y hacer el ndice alfabti:~", no dcj m i o ninguna duda al lector sobre cual es el mejor mtodo de las dos. Pero se ha publicado relativamente poco sobre el uso de la clasificacin facetada en sistemas de indizacin coordinada, durante los ltimos aos transcu~ rridos antes de da aparicin del Thesaurofacet. Debido a que la tcr' i c ase hta extendido ampiamente, los diferentes autores han tratado cl tema como algo sobreentendido o sin dar cuenta de ello. (Gilchrist, 1971).

Carnpos Smzln~icos:OrdenanzientoLa mente humana es capaz de hacer gran cantidad dc asociaciones el:tre 1;:s ideas, y esta facilidad es la razn del esquema dc intcrrelaciones dcl cono:imiento e implica la existencia de un gran nmero dc clases posibles, mucho ms amplio de lo que sera factible acomodar dcntro de los esqueiiias formales de clasificacin descritos anteriormente. Sc aprecia 1s importancia de cste factor al estudiar la transformacin de los conceptos elegidos que se pueden expresar en gran cantidad de formas y. en un nmero mucho ms pequeo de trminos pertenecientes al lenguaje de indizacin. El indizador experimentado es capaz de hacer muchas de estas transformaciones porque comprende el sentido de ambas, pero se entiende poco del proceso mental de clasificacin que es parte integral dc la identificacin dc las rclevancias de un texto en particular. Una gran parte del proceso de disear u~ii lenguaje de indizacin se apoya cn la crcacin de grupos de conceptos, ya que el icnguaje indizador debe ser siempre ms pequeo que el lenguaje natural. Antes de seguir con el ordenamiento sernntico, vale la pena recordar que todos los recursos de recuperacin son ejemplos de mtodos sistemticos de produccin de grupos, segn diferentes principios: inclusin de sinnimos o formas de palabras y la construccin de clases por jerarquas o anlisis de Iacetas. Un tesauso es una interrelaein de desoriptorcs que despliega conexiones polijerrquicas y a menudo un gran nmero de relaciones temporales. Cuanto ms amplio sea el tesauro, mayor ser el nmero de caminos abiertos al investigador, y la estrategia de bsqueda es heurstica. Las listas de trminos que no despliegan relaciones entre los descriptores estn diseadas para operar como coladores mecnicos, pero estn basadas, sin embargo, en relaciones entre conceptos. Algunos sistemas se apoyan, ms que los sistemas basados en tesaurds, en la experiencia o habilidzd del operador del sistema para proveer las conexiones requeridas entre el lenguaje natural y el lenguaje del &tema (Gilchrist, 1971).

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

Preserztncin del TesnuroUn vocabulario controlado debe ser organizado y presentado en forma til, tanto para el indizador como para el investigador. Los tesauros son 1115s complejos que las listas de descriptores y constan de las siguientes partes:

Introduccin.- Una introduccin clara indicando los campos tcmtiros que cubre cl tesauro, as como el propsito y la estructura del mismo rcr el primer punto a desarrollar. Debern ser explcitamcnte enunciadas 12s rcglas que han regido su elaboracin, los mtodos y servicios usados para su eleccin, el significado de las abreviaturas. Las reglas de alfabetizacin y la forma en que ste se actualizar. Uno de los aspectos ms importantes en la introduccin de un tesauio, son las reglas para su uso y los lmites de aplicabididad, que dcbcn ser ilustrados mediante ejemplos, cuando convenga. Listado sistemtico.- Se ordenan los descriptores en campos semnticos, y estas listas deben seguir las relaciones entire los trminos, ya sean lgicas, jerrquicas, etc. Se ubica primeramente, el descritor central, construyndose luego las relaciones correspondientes, ubicando cada descriptor en el nivel que le corresponde. Listado a1fabtico.- Los ndices alfabticm clcben incluir descriptores y no-descriptores. Para Ia alfabetizacin dc los descriptores es conveniente utilizar los patrn-modelos nacionales e internacionales. La alfabetizacin depender del tamao y estructura del rea que abarca la lista, dc los programas existentes y de otros factores ms.El ordenamiento puede ser:

Letra por letra: Se ignoran los espacios entre las palatiras, todos los caracteres que no sean parntesis a la izquierda, numerales y letras, mantenindolas as unidas. Los parntesis a la izquierda, numerales con valores ascendentes y las letras en el orden de la a a la z, se archivarn de acuerdo con la secuencia. Palabra por palabra: Cada palabra se considera por separado. mantcniendo unido el descriptor general a los ms especficos, pudicndo locallzar fcilmente el trmino. Se consideran sucesivamente las palabras completas. Los caracteres no-alfanmericos como los signos de puntuacin y caracteres especiales, se tratarn como espacios. Clasificacin por computadora: Se pueden usar las siguientes reglas, aunque en la mayora de los casos depender de la configuracin de los programas usados. Todos los caracteres como: letras, nmeros y signos de

FENIX

puntuacin y caracteres especiales, son considerados en la determinacin de la secuencia. Las secuencias numricas son seguidas, no as los valores numricos. Cualquiera sea el tipo de alfabetizacin a utilizarse, las reglas debern ser claras y explcitas y ser establecidas antes que cualquier ordenamiento sea asumido. "La combinacin de ambos mtodos hace fcil la bsqueda de un tCrmino determinado en el listado alfabtico, en tanto que el listado sistemtico permite establecer asociaciones de trminos y ampliar la bsqucda en zonas perifricas o relacionadas". (Naciones Unidas, 19'71). El tesauro puede complementarse con listas de sinnimos o cuasi-sinnimos y cdigos de pases, instituciones, revistas, etc., para ima f k i l recuperacin manual o electrnica.

Actualizacin del TesauroUn vocabulario documentario debe ser evolutivo y no permanecer esttico, es por esto que los tesauros deben actuaiizarsc cada cierto tiempo, incorporando nuevos trminos y eliminando aquellos quc dejaron de tener vigencia. En un principio, el vocabulario es muy amplio, y a medida que se desarrolla, se puede esperar un crecimiento gradual de nucvos tpicos; este crecimiento no debe ser brusco (salvo en el caso que se cambic de especialidad). Las mmlificaciones que se realizan en el tesauro son necesarias teniendo cn cuenta factores externos como: el desarrollo del ci;mpo docuinen;aiio, cada vez ms multidisciplinario; aun el ms especir:lizado abarca un nmero creciente de temas y, la aparicin de nuevas nociones, de determinados conceptos nuevos como materiales, equipos, tcnicas, procedimientos, etc. Como factores internos podemos considerar: La verificacin peridica.- Debe asegurarse la validez de los tirminos tanto para la indizacin como para la recuperacin. En una bsqueda, cuan! do no se obtiene la informacin o el nmero de documentos sobro e tema que se piensa figuran en la coleccin, debe aealizarse un c.ramen crtico de los descsiptores que se utilizan, un estudio estadstico peridico de frecuencia en la indizacin de documentos y consultas. Supresin de descriptores.campo que cubren. Tanto por exceso como por defecto del

Por exceso: Cuando un descriptor aparece con mucha frecuencia y es utilizado para indicar muchos materiales, pierde su especificidad al hacerse su aplicacin muy general. Puede convenirse en buscar trminos ms espe-

LITERATURA COBRE DESCRIPTORES Y TESAUROS

cficos, o separar el concepto en dos o ms descriptores. La bsqueda es la que determina el exceso o la poca utilizacin del trmino. Si es el descriptor menos especfico, el que se usa en ltimo trmino, se podra conservar.

Por defecto: Los descriptores que aparecen con poca frecuencia, debido a que son muy especficos para el nivel al cual se estructur el tesauro, o por estar mal definidos, se expresarn por trminos ms generales. (Oyarzn, 1975). Cuando se suprime un trmino, es necesario: Aclarar la fecha en que sc suprime, modificar las jerarquas, cambiar las listas, modificar los grficos y los listados semnticos, adems de verificar que las asociaciones estn completas. Incorporacin de nuevos descriptores.- La incorporacin de nuevos trminos depender de la indizacin de los docitmentos y de las bsquedas que se requieran. Los investigadores y los usuarios, a medida que leen el nuevo ~naterial,deben investigar la posibilidad de incorporar descriptores al vocabulario, ya sea que representen nuevos conceptos o facetas distintas de conceptos ya conocidos, o la traduccin del concepto cncontrado, un trmino existente en el tesauro o la conjugacin de dos o varios trminos existentes: en este caso, se agrega una relacin de sustitucin (sinnimos). Esta modalidad tiene el inconveniente que no favorece la coherencia entre indizadores: difcilmente coincidirn en la eleccin de la relacin de sustitucin. Tambin puede emplearse un tkrmino transitorio, que se usar por un tiempo considerable, al cabo del cual se verificar su validez para incluirlo definitivamente en el tesauro. Los trminos seleccionados para su incorporacin en el tesauro, se llaman trminos candidatos. Para cada uno de estos descriptores se confecciona una ficha, donde se indica el nmero de los documentos pertinentes, para saber si se incluyen estos trminos (de acucrdo a su frecuencia de uso) en una reedicin del tesauro. Se recomienda poner la fecha de ingreso del documento, junto al nmero. Cada cierto tiempo se har una revisin de los trminos candidatos para decidir su incorporacin en el tesauro. Debe evitarse la aceptacin de descriptores cuyo significado se parezca mucho a un descriptor ya establecido, porque en las bsquedas se puede crear confusin o dispersin de documentos que traten de un mismo tema. Se debe tener en cuenta que un tesauro jams tiene una forma definitiva, sino que va evolucionando de acuerdo a los conocimientos humanos.

Aplicacin del Tesauro: lndieacin"Los descriptores constituyen, junto con la descripcin bibliogrfica, las unidades de recuperacin de informacin, por lo que de su seleccin y estructura depende la relacin de recuperacin, o sea, la relacin entre la

informacin deseada, y la obtenida dentro de un sistema dado. Esta relacin no suele ser igual a la unidad, por perfecto que sea el sis:cma, habr documentos que no aparezcan en la recuperacin, aunque sean pertinentes a la bsqueda, en tanto que aparecern otros que no sean adecuados". (Naciones Unidas, 197 1). Para la organizacin de tesauros existen varias formas, pero todas coinciden en que se trate de recuperar al mximo slo aquellos documentos que desee el usuario. Para la recuperacin de la informacin, se debe seleccionar con especial inters la combinacin de descriptores. Si se utiliza un nivel muy genrica, la bsqueda dar un grupo considerable de documentos que no responden al tema. De lo contrario, si el nivel es muy reducido, no se recuperartn documentos de inters. Es difcil lograr el equilibrio necesario para obtener la informacin deseada y el mnimo de documentos no pertinentes, lo que depende especialmente del diseo del sistema y de su comprobacin permanente. La lgica booleana utilizada para la combinacin de los trminos, permite rcducir el mbito de la bsqueda definindola en trminos de la exactitud requerida:

Las zonas A, B y C representan descriptores, siendo la zona rayada la que corresponde a la bsqueda deseada; las dems zonas representan la informacin no correspondiente al tema. El usuario hace su solicitud de informacin en lenguaje natural, con la suficiente clari'dad y precisin que permita al documentalista, traducir su solicitud a descriptores reconocidos y as recuperar el tema que requiere. Para evitar la falsa combinacin entre los trminos que se han asignado a un tema o artculo, existen los nexos, que son recursos mecnicos que muestran los trminos que estn relacionados, pero no en qu forma,

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

y se hace cada vez ms imperante la necesidad de aumentar el nmero de trminos adjudicados.Por ejemplo: E1 documento N? 2307 de importacin (hierro, acero) y exportacin (cobre, productos qumicos) de Pakistn se indiza de la siguiente manera: Pakistn Importacin Hierro Acero Exportacin Cobre Productos qumicos 2307 2307 2307 2307 2307 2307 2307 A A A A B B B B

Las letra~s y B indican los descriptores quc dcben considci-nrsc juntos, A asegurando de esta forma que no ocurra, por ejemplo, la combinacin de "Importaciones de cobre". Esto acta en forma similar cuando se trata a un documento con un nmero de partes separadas o "temas indizables". Jonker las numera como 2307 parte A y 2307 parte B. Cuando se presentan los diferentes niveles jerrquicos en las palabras clave asignadas a un documento, pueden surgir problemas en el cruce de trminos. Taube ha observado que en el ejemplo; Revestimiento de plomo para tuberas de cobre 100A 100A 1OOB 1OOB se evita la falsa combinacin de "revestimiento de cobre para tuberas de plomo" pero al hacerlo, tambin se evita el verdadero trmino genrico: 6'revestimientospara tuberas". Como no resulta econmico el registro de las conexiones entre los trminos en tarjetas especiales, algunos sistemas utilizan un archivo o file ordenado cronolgicamente. Anterior a este mtodo, Harden utiliz un sistema promedio de indicadores para lograr estos nexos, a los que llam "alfabticos y antalfabticos", En un ejemplo de la bsqueda de artculos que tratan de "la relacin entre calcio de la sangre y fsforo de la orina", pudo recuperar artculos que trataban de calcio de la sangre y fsforo de la orina. Las palabras clave en estos documentos seran: sangre, calcio, rin, excrecin, fsforo y, el cruce adecuado se establece marcando la tarjeta "alfabtiea", porque B (blood) sangre, viene antes de K (kidney) r,in y C de calcio. Si el documento hubiera tratado de "fosfato de la sangre " y "calcio de la orina" se hubiera marcado la tarjeta "antialfabtica".

Otro recurso llamado el "operador doble7' se usa para indicar que Ia palabra clave se ha usado dos veces para el mismo documento. Por ejemplo, un artculo sobre "la relacin entre calcio de la sangre y calcio de la orina" sera codificado con las palabras clave: sangre, excrecin, calcio. Pero una bsqueda subsiguiente producira, por ejemdo, documentos sobre "calcio de la sangre y fsforo de la orina, magnesio, yodo, etc.". Esto se evita si se marca la tarjeta del "operador doble" adems de las tres palabras clave. Moss recurri a un operador que actuaba como conector negativo, siendo til en la aplicacin qumica. En este sistema los compuestos qumicos se indiznn por "factorizacin semntica", as el dixido de manganeso se describa como manganeso y dixido. Esto significaba que en la bsqueda por "manganeso", se recuperaban todos los documentos sobre sus compuestos. Para evitar sto, se usaba la llamada "tarjeta joker", la cual se marcaba para especificar que el manganeso en ese documento no estaba asociado con ningn otro descriptor para definir un compuesto. (Vickery, 1970).

SinopsisSe origina cuando se analiza exhaustivamente un documento, reflejando su contenido. La sinopsis puede ser de dos tipos: integrada y no integrada.Sinopsis integrada.- Contiene descriptores y palabras no recuperables, permitiendo una lectura natural del texto con mayor economa, tanto del esfuerzo para el analista como para el usuario, al leer sinopsis ms breves. Sinopsis no integrada.- Presenta un resumen del contenido del texto analizado, facilitando as la bsqueda para el usuario. En este tipo de sinopsis los descriptores no forman parte del resumen, obligando a duplicar el trabajo de redaccin del resumen y de obtencin de los descriptores; por otra parte, puede ser til cuando se desea dar una explicacin ms completa del contenido de un documento, documento que puede ser recuperabfe con en nmero limitado de descriptores. (Naciones Unidas, 197 1) (Rodrigcicz Delgado, 1979).

CAPITULO V EXPERIENCIAS REALIZADASEn el MundoDesde 1957 se han venido preparando tesauros en el campo de la informacin especializada. No se ha podido hacer hasta ahora una recopilacin completa que cubra los tesauros elaborados desde esa fecha.

LlTERATURA SOBRE DESCRIPTORES Y TESAUROS

53

Algunas instituciones intentan registrar los tesauros que constantemente se elaboran en el mundo. La ms importante es la Case Western Reserve University de los Estados Unidos, que viene cumpliendo esta funcin desde la dcada del 60. Para este trabajo, hemos compilado, una relacin de tesauros publicados sobre distintas especialidades.AERONAUTICA Aerospace Thesaui-us. Los Angeles, Aerospace Co. FAA Thesaurus of Technical Descriptors. Washington, Federal Aviation Aurnini~tration,1969. 67 p. NASA i'hesaurus. Washington, D.C. NASA. 1967. 3 v.

Blagden J. Munagement lnformation Retrieval. London, Management, Yublication, 1971. 227 p. l>isclousure Incorporates. 1974. 453 p.Disclousure Financia1 Thesaurus. Maryland,

La Documeittatin Economiique d,ans L'Administration das Ajfaires. Cuidc cl plan de Classernent. Thesaurus de Most-Cles. Rruxelles. 120 p.

Grosch A. Marketing Reserrrch Library Thesaurus. Minneapolis, General Mills, Inc., 1964. 48 p.Klassifikution. Betriesbswrtschrtft. Cititleutstrasse, 1972. 142 p. (Systernatisch). Frankfurt

(Main).

AGRICULTURA Agricdtural/Biological Vocabdary. Library, 1967. 619 p.

Washington, National

Agricultura1

Baulkwill, W.; Posnett, N. Abridged Thesaurus of Land Resources Terms. Surrey, Land Resources Division of the Directorate of Overseas Surveys, 1971. 3 v.Descriptor Thesaurus. Roseville, Research Laboratory Colonial Sugar Refining Co. Materiaux Terminologiques Agriculture. Bruxelles, Bureau de Terminologie. Communaut Economique Europenne, 1967. 2 v.

FENIX

Thesaurus Documentaire, Pars, Imtitut Francais de Recherckcs Fruitlrec Outre-Mer, 1966. 215 p. ARQUITECTURA

3 Roberts, Michae; Evc, Chris; kinn, P e i x 2 McI-Mc, Eics, comp. Conslruction Industry Thesaurus. London, Department of the Environmental, 1972.Thcsaurus D'Architecture. Pedagogiques . Pars, Centre dc Documeniation InterunirCs ARTE Thesaurus of Coordinate Indexing Terms for Literature related to Experimental Research in the krts. Ohio, Ohio St:& University. Centcr for Experimental Research in the Arts. CIENCIAS DE L A INFORMACION Schuitz, C. Information Science Thesaurui. Phil~dciphin, Urexcl Insiitute of Technology, 1964. Williams, B. Thesaurus of Microjilm a ' e r n ~ ~ . Hriitfilcd, Dcsk Top Library Service, National Reprographic Center for Documentation, 1969. CONTABILIDAD Pi-ice, Waterch ouse & Co., ed. TheLtaur.us Accoitntitlg nnd Adiling Terof mirtology . New York, Price Waterhouse & Co., 1974. 158 p . ECONOMIA Y DESARROLLO ECONOM/C0 Alphabetircher Thesaurus 'Planung und Leitung der Volkwirtschnft' Okonomischea Forschungsinstitut bei del Sia:itlichcn Plankonlmission Unter del Linden, Berlin, 1967 . 2 11 p .C I D - Centro Internacional de Investigacin para el Desarrollo, Tesaurw de la Biblioteca del CIID. Ottawa, 1976.

DES. Repertoire de Descripteurs Economiques Simple. Paris, Assemble Permanente de Chambres de Comerce et de L'Industrie, 1971. 136 p . OCDE. Macrotesauro para el tratamiento de la Informacin rdativa al Desarrollo Econmico y Social. Pars, 1976. Thesaurus jur Wirtschajtliche und Soziale Entwicklung . Franlcfurt, 1972 .

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

55

Thesaurus Okonomie. Berln.

Okonomisches Forschungsistitut,

197 l.

750 p .EDUCACION Iizfornzation Retricval Thesawus on Educatiorzal T e r m . Cleveland, Western Reserve University Press, 1967. 200 p . T / I E S C I Zof U S ~ ERZC Descriptors . Washington, D. C., Educational Resourcc Inforrnation Center, U.S. Office of Education. U.S. Government Printing Offhce, 1972. 330 p.

UNESCO. IBE. Educational 1975. 278 p .

Thesaurus. Pars, ELECTRONICA

The

UNESCO

Press,

IGM. Systcrn Data Divisin. Technical lnformation Cenfer Thesaunls. Poughkeepsie, New York, 1964. Thesaurus Elektrotechnix, Luft und Raun Alesemeinbergriffe. Zurich, Eidgenossiche Techniache Hochschule ETH, Bibliothek, 1970. 577 p . Thesaurus of Computing Terms . Manchester, National Computing Ceiiter, 1971. ENERGIA ATOMICA

Estados Unidos. National Technical Information Service. Energy Microtllesaurus - A Hierarchical Listing of Energy lndexing Ternzs used in /re NTIS Data Base. COM - 75 - 111 00/5 GI.Euratoln i'/zesaurus. Brussels, Euratorn, 1967 . INIS: Thesnurus . Austria, International Atomic Energy Agency, 197 1 . 358 p . NSIC Keyword Thesaurus. Oak Ridge, Nuclear Safesty Information Ccnter. 1967. 73 p .

Thesaurus de Pharmacologie . Hoffmann La Roche, Bhlc GEOGRAFIA Th~~saurris Terms Geographiques. Eds. Technip, 1971. 60 p. del

FENIX

INDUSTRIA Internationales Thesaurus Textiles Begriffe. 1972. 1000 p . List of English Words used in Ceramic Technology. Trent, British Ceramic Research Association, 1967 .94 p. Thesaurus du Eric. Bruxelles, Centre National de Rechcrches Scientifiques et Techniques pour L'Industrie Cimentire, 1971 . Thesaurus of Industrial Development Terms . New York, UNIDO, 197 1 . 227 p. Tlresaurus of Paint and Adlied Technology. Philadelphia, Federation of Societies for Paint Technology, 1968. 272 p. Thesaurus of Textile Terms couvering Fibrous Matenials and Z'rocesses. Cambridge, Mass., Institute of Technology, 1969. 448 p. Textile Terminology Terms . A n lnformation Retrieval Thesaurus . Charlottesville, lnstitute a Textile Technology, 1966. 329 p . f Thesaurus Textile Znternational. France, Institut . Texrile de France, 1970. 3 Y .

Attchinson, T.; Gomersall, A.; Ireland, R. Thesourojacet. A. Thesaurus and faceted classific4tion for Engi~eering and related subject. Leicester, The English Electric Co., 1969. 520 p . CCM Information Corporation . Engineering I n d ~ x Thesaurus (EIT) . New York, 1972.Thesaurus of Engineering and Scientific Terms. New York, Engineers Joint Council, 1969. 690 p.

Tulsa University Information Services Depar'tment. Exploration and Production Thesaurus . Tulsa, Oklahoma, 1970.Z'hesaurus Vacui. Bruggratenstrasse, Berln, Deutsche Arbeirsgemeinschaft Vacuum, 197 1 . 39 p . MEDICINA Medical and Health related Science Thesaurus . Washington, DC., Public Health Service. National Institute of Health, 1970. 502 p.

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

Medical subject Headings (MESH). Washington, DC., National Library of Medicine, 1968. Un Thesaurus de Pathologie. Paris, Centre de Documentation de CNRS, 1970. 980 p . MEDIO AMBIENTE

Estados Unidos. Department of Commerce. National Technical Information Service. Environmental Microthesauru's. A Hierarchical list of Indexing Terms used by NTIS. Washington DC., Environmental Protection Agency, 1977. Estados Unidos. Department of the Interior. Bureau of Reclamation. Thesaurus of Water Resources Terms. Washington. DC., U.S. Government Printing Office, 1971. 339 p. Estados Unidos, National Technical Information Service. Thesaurus of Vekicle Mobility, Environmental and Pavimenta1 Terms. AD - A 01 1 269/8GI. Mayer, R.A.; Jefferis, J.A.; Eischen, M.A. y otros, comps. Ecological and Environmental Thesaurus. Ohio, Columbus Laboratories, 1973. 949 p. OMS. International Reference Center for Wastes Disposal. Solid Wastes Thesaurus. Duebendorf, Institute for Water Resources and Water Pollution Control, 1973. Scarle. V.; Farris. R.: Myatt, D). The Thesaurus of Air Pu~llutionIndexing Terms. Washington, Sei. Communie Inc. 1966. Shriner C.R. Environmental/Chemical Thesaurus. Oak Ridge, National Laboratory, 1978.A Thesaur~cs f the terms used in Biodeterioration. Birmingham, University o o Ason, Biodeterioration Center, 1967. 377 p.Thesaurus National de L'Eau. Pars, Association. Francaise Pour L'Etude de Eaux, ,1971. 47 p. Water Resources Thesaurus. A Vocabulary for Indexing and Retrieving the Literature of Water Resources, Research and Development. Washington, Office of Water Resources Research, 1969. 237 p. METALURGIA

Metallurgical American Society of Metals. Thesaurus of Metallurgical Society of Metals. Ohio, 1969.

FENIX

Thesaurus de Chimie Applique. Metallurgie. Paris. la Recherche Scientifique, 1968.

Centrc National de

Thesaurus Korrosion-Karriosionssclzitz. Dresden, Zentrastelle fur Rorrosionsschutz, Rossendorfbie, 1968 . Tlzesazlrus of Metallurgicol ter ni!^. Ohio, American Socicty for mctals, 1968. 244 p. Thesaurus of Metallurgical Terms. Tokyo, Japan Information Center o! Science and Technculogy, 1969. 802 p . -Thesaurus of Terms on Copper Terminology. New York. Coppci Development Association Inc., 1971. 411 p. Vocabulary if lndexing Ter~ns iNCO Technicul R ( 2 p ~ r t $ .N c w York, for International Nickel Co., 1964. 40 p . PETROLEO Exploration and Production Thcwurus. Tulsa, CoUagc and Science and Engineering, 1970. 439 p . Pctro~cu~n

Subject Authority List. New York, American Petrolcum Inslltute, Central Abstracting Service, 1966. 327 p . Thesaurus Petrok - Exploration, Production. Paris, Eds. Technip, 1971 . 209 p .

Kcller, M.; Efron, V.: Jellinek, E. C A A A L Manuul. A guide t o u s i of thc classified Abstract Archive oj the Alcohol Literature. New Brunswich, N.J., Rutgers Center of Alcohol Studics, 1965. 155 p . Keyword Thesaurus. Tenn., Isotopes Information Center, 1970. 127 p. Thesaurus. South Africa, African Explosives and Chcmical Industrics. Tlzesaurus jor Radjation Chcmistry Notre Dame, 1971. 89 p. Thesaurus of Pulp and Paper Terms. Quebec,. J. Fasman P. Nobbs. Pulp and Paper Research Institute o Canada, 1965. 97 p. SALUD Estados Unidos. National Institute of Hcalth. P~tblic Hc-.nlh Related Science Thesaurus. Washington, D.C., 1970. 520 p.

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

59

Rahl, M.; Sokoloff, L. A. Thesaurus of Rheumatology. New York, Grune, 1965. 182 p . SOCIOLOGIA Viet, M. Thesaurus for lnformation Processing in Sociology. Paris, International Committee for Social Science, Information and Documentation, 1971. 355 p. TRABAJOOHT. Tesnt~ro OIT. Ginebra, 1978.

Revised List of Dcscriptors. Gineva, ILO, 1966. 17 1 p. URBANISMO Dreyfus, J. Thesaurus. Liste Alphabetique Tableaux. Accueil, Centre de Documentation sur L'Urbanisme, 1970. 2 v. Rickert, J. Urban Thesaurus. A Vocabulary for Indexing and Retrieving Ut.an Literature. Kent, Kent State University, Center of Urban Kegionalisin, 1968. 160 p . Thesau:~ude S . M . U .H . Paris Secrtariat des Missionts d'Habitat, Ser!.ice dc Documentation, 1971 . 190 p. Thesaurus Landesplanung. Zurich, Eidgenossische Technische Hoschulc, ETH, Bibliothek, 1970. 220 p . Wright, K . Urban 1972. 130 p . Thesaurus, New VARIOS Estados Unidos. National Tcchnical Information Service. DDC Retrieilail And lndexing Tlmwinology. A D - 001 200/5GI. 2 v. Estados Unidos. National Technical Information Service . Microthesnurus oj Soil Mechanics Terms. A D - A0003 812/5GI. Estados Unidos. National Tcchnical Information Service. Thesaurus for EDU Information Center ( D .1 . C .). AD - A 01 1 448/8GL. Thr New York Time of Descriptors. 1968. 2 v. New York, New York Times Co.,a

York,

CCM

Information Co.,

FENIX

OECD . International Road Research Doctrmentution (Thesaurus). ris, 1971. 4 V .

Pa-

Thesaurus of Descriptive Terms and Code Book . Washington, Bureau of Ship Technical Library, Navy Dep., 1965.

En A mrica LatinaLa Organizacin de Cooperacin y Desarrollo Econmico (OCDE) en colaboracin con el Centro de Investigaciones para el Desarrollo Internacional (CIID) de Canad celebr, entre el 5 y 7 de octubre de 1977, una reunin en la OCDE (Pars) en la cual participaron junto con rcprescntantes de ambas organizaciones, delegados de institucioiics nacionales, rcgionales e internacionales. El objeto de la reunin consista en preparar una nueva edicin del Macrotesauro, lenguaje documental que abarca los diversos aspectos dei desarrollo econmico y social, publicado en 1972-73 por la OCDE y ampliamente difundido en sus versiones en diferentes lenguas (Ingls, francs, alemn, espaol, portugus, rabe. indonesio, etc.), con el fin de responder a las necesidades de la OCDE en lo que se refiere al tratamiento de su documentacin, a las necesidades de un intercambio de informacin provechosa para los pases en vas de desarrollo, y a la armonizacin de los sistemas de indizacin utilizados en las Naciones Unidas. Entre otros aspectos se defini las exigencias de los pases en dcsarro110 en lo que respecta al Macrotesauro, considerando los trminos adccuados para expresar la problemtica del desarrollo en un marco regional, sea ste Amrica Latina, Af~icao Asia. Con este propsito se recomend el establecimiento de un contacto permanente entre los usuarios del Macrotesauro en cada una de dichas regiones, y la organizacin de reuniones para la integracin de experiencias adquiridas por stas. La OCDE en coordinacin con el Centro Latinoamericano de Documentacin Econmica y Social (CLADES) organiz una reunin a nivel latinoamericano del 3 al 7 de julio de 1978 en Bogot, Colombia. En dicha reunin se analizaron diversos aspectos: Como producto de estas reuniones se obtuvo la nueva edicin espaola del Macrotesaura de la OCDE, 1979. DESARROLLO ECONOMICO OCDE CLADES. Macrotesauro; lista bsica de trnzinos rcluiivos al clesarrollo econmico y social. Santiago de Chile, CEPAL/ILPES, 1973. (Traduccin del macrotesauro OCDE al espaol).

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

61

OCDE. Microthesaurus OCDE; Lista dos principais directores referentes al desenvolvimento econmico e social. Ro de Janeiro, Instituto Brasileiro de Bibliografa e Documentacao. (Traduccin del Macrotesauro OCDE al portugus),

DESARROLLO ZNDUSTRlALCENDES. Centro de Desarrollo Industrial del Ecuador. Tesauro clc palabras claves. Quito, s.a. Corporacin del Cobre. Centro de Documentacin Tcnica. Thesaurus de la industria extractiva del cobre y m'ateriales afines. Santiago de Chile. 1974.

La Agrupacin para la Integracin de la Informacin Socioeconmica (ABIISE) ha creado una Comisin de terminologa que viene trabajando desde hacc varios aos en la elaboracin de descriptores con relacin al Macrotesauro de la Organizacin de Cooperacin y Desarrollo Econmico (OCDE), cuya edicin castellana est a cargo del Centro Latinoamericano de Desarrollo Econmico y Social (CLADES) de la CEPAL. La Comisin de Terminologa ha preparado una traduccin del trabaio: "Pautas para la elaboracin de un tesauro monolinge" elaborado por la UNESCO, la cual tiene como anexo el documento de la CEPAL (Comisin Econmica para Amrica Latina), traduccin de la norma ISO (International standardization Organization) para la elaboracin de tesauros monolinges, con el objeto de difundir las normas para crear descriptores. La Comisin de ABIISE para la elaboracin de resmenes e ndices, empezar en breve a publicar un boletn con referencias de artculos indizados cooperativamente, utilizando los descriptores de la nueva edicin del macrotesauro de la OCDE (1979).

AGRZCULTURACentro Nacional de Capacitacin e Investigacin para la Reforma Agraria (CENCIRA). Centro de Docun~entacin del Sector Agrario. Descriptores agrcolas. Lima, CEDSA, 1977. 64 p.

EDUCACZONEl Instituto Nacional de Investigacin para el Desarrollo de la Educacin "Augusto Salazar Bondy" (INDE) est preparando un tesauro en este campo.

FENIX

INGENIERIA SANITARIA Y CIENCIAS DEL AMBlEMTE

Oficina Panamericana de la Salud. Centro Panamericano de Ingeniera Sanitaria y Ciencias del Ambiente. Microtesauro dc ingeniera sanitaria y ciencias del ambiente. (MISCA): versin preliminar en espaol. Lima, CEPIS, 1979. 165 p.INTEGRACION ECONOMICA

Alcdde, Xavier. Tesauro de trminos de la integracin suregionul mdncz. 2a. ed. Lima, JUNAC, 1979. 257 p.

Per. ITINTEC. Centro de Informacin Tci-iici. rl't~:u~wo ~ ( ~ ~ ~ m ; i z ~ l o g t u d~ tcnica. Lima, 1976. 276 p.

CAPETULO VI

Antes de construir un tesauro, debe hacerse un estudio de la rsalidonde se va a aplicar, una vez identificadas las neczsidades, se puede &terminar el tipo de tesauro a elaborarse, considermdo lo siguiente:dixi

Tipo de literatura a indizar; Cantidad de material a procesar, considerando el cxistente, y el que se adquirir en el futuro; Tipo de servicios que se ofrecer a los usuarios; Usuarios: cantidad y nivel de especializacin; Consultas: tipo de informacin y forma en que es solicitada. En base a e s t a pautas se decide si es necesario iin tesmro, el nivel de los trminos que se usar y los temas que debe abarcar la termincloga. "Antes de decidirse a estructurar un tesauro, conviene asegurarse que no exista otro que cubra el mismo tema; si existe aiguno, convendr rcvisrirlo para ver si sc p u e d ~adaptar parte de l coi1 algunas niodificacioncs. Existe tambin la posibilidad que podamos traducir un tesauro desarrollado en otra lengua". (Oyarzn, 1975).

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

Las caractersticas del tesauro influyen tanto en la indizncin como en la recuperacin de la informacin. "Si el nivel de especificidad del lenguaje es bajo, el analista no podr indizar con ms precisin que la que le permite el lenguaje y la vrecisin se ver afectada si los trminos son vagamente definidos o sobrepasados en su significado; el indizador puede elegir un trmino y el usuario otro para definir el mismo concepto. El lenguaje puede ayudar al indizador si muestra relaciones estructurafes, guindolo hacia trminos ms apropiados y especficos para representar el contenido del documento". (Oyarzn, 1975) Si las relaciones jerrquicas de un tesauro estn bien hcchm y los sinnimos se han puesto juntos, el usuario no tendr problemas en lncalizrir ;1 ibrmino que busca. Prva un mejor acceso a la informacin, los tesauros deben elaborar.;e cori unc? previa coordinacin, evitando la creacin de listas improvisadas que dificulten la intercomunicacin. De ah la importancia dv la norma1i7acin de vocabularios controlados, ya sea desde el punto de visln dc l~ unificacin terminolgica, como de los mtodos que se ~ctiliznn para su elaboracin. ncbe preferirse el tesauro cuando se trata de procesar monogr a f'las, revistas, documentos; en cambio, c., mcjor un esquema facetado para libros. Cuando sc prevee una alta tasa de procesamirnto de material, cs necesario cl tesauro para abaratar a la larga el costo del procesnrniento por unidad (si FC: cwe se combinara con un cdigo simple de ubicacih de los dociimentod. Tamhin hay que considerar si los usuarios mismos van a operar >1 sistema o si el uso del sistema va a ser mediado por im bibliotecario o un dnr=lmentalista Solamente en este ltimo caso es fcrteixente rc.com,-ndahle el m n l ~ o tesauro; porque en caso de uso directn se ncccsita del d n dc 1.cqueda lo ms simple posible. Se aconseja el iiso dc tesallro cu indo las c-onsuttas de los usuarios son precisas. As mismo. si el nmero dc rnnsirl?as es grande se justifica el esfuerzo de construir un tesauro para que la prcparacibn de los documcntnc en el procesamiento mismo, ahorre trabajo en JPS I~sauedas.(Aitchinson y Gilchrist. 1972)

CAPITULO VI1 CONSTRUCCTON DE TESAUROS EN COMPUTADORASi se ha decidido proceder a la elaboracin y recuperacir> clertrnic.:. conviene iniciar la programacin al mismo tiempo que la recoicccin de 10s descriptores. La preparacin de un sistema para conlputadora es completo y relativamente caro, especialmente en la fase de la indizacin. Slo exige el trabajo de programadores que posean cierta experiencia cn la ma-

FENIX

teria, ya que hay disponibles diversos mdulos y programas para montar sistemas de capacidades muy diversas. Para la programacin se utiliza cualquier lenguaje general de carcter no estrictamente matemtico, como el Cabol, el Assembler o una mezcla de ambos, como el PL-1, cuyo uso se est generalizando y ha sido ado~tado el sistema PRIS de las Naciones Unidas. por Tambin puede emplearse otros lenguajes ms espccializados. como cl Lisp, para la elaboracin y recuperacin electrnica de la informacin. (Naciones Unidas, 1971). Antes de elaborar un tesauro en computadora debe efectuarse: Recoleccin de un vcvcabulario preliminar de difcrcntcs fucntcs; Seleccin final de los trminos principales y determinacin de las rclaciones entre dichos trminos dentro del tesauro: Preparacin de hojas de trabajo especiales para las perforadoras Programacin de la computadora para ejecutar las siguientes fiinciones: Preparacin del formato para datos (forma de rcdactarlos); Revisin de consistencia en la ortografa, deletreado v codificacin sccuencial; Creacin de relaciones recprocas directas para t o d ; ~ entradas dc las siibtrminos; Creacin de rboles genricos para cada uno de los trminos cn sil entrada principal, por ej.: cuando un subtrmino ms amplio (TMA) se coloca en lista, todos los trminos ms amplios que ste son tambin puestos en lista como trmino de la entrada principal ya dada; cuando se coloca un trmino ms especfico. todos los trminos ms especficos que ste se colocan como (TME) subtrminos dc la entrada principal dada; Eliminar duplicacin y relaciones conflictivas dentro del tesauro en el juego de subtrminos de una entrada princilpal; Marcar todos los trminos en el registro, siempre que no sean del nivel genrico ms bajo, por ej.: los trminos que no tienen subtrminos ms especficos listados en el tesauro; Crear grupos por categoras para los temas o las materias principales de los trminos que han servido de base a las estructuras genricas de rboles que figuran en el tesauro. Para el sostenimiento del tesauro, se pueden aadir o suprimir trminos con la plena seguridad que se mantendr la integridad de las relaciones entre sus trminos. Pueden suprimirse trminos como simple accin de mantenimiento. Un nuevo trmino aadido, debe llevar consigo sus: trmino ms amplio (TMA), trmino ms especfico (TME) y trmino relacionado (TR) inmediatas.

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

65

Scheele ha desarrollado un sistema para construir un tesauro en computadora. Para estructurar las listas se extraen las entradas del texto automticamente. Para toda entrada del tesauro, se asigna manualmente: Tipo de palabra (palabra funcional, nombres propios, abreviaciones, etc); Un cdigo lingstico; Un cdigo para la forma de inflexin de la palabra; Un cdigo para distinguir entre las diferentes estructuras de las palabras; Uno o ms cdigos de expresin para relaciones semnticas; Sinnimos y homnimos; Relaciones jerrquicas; Relaciones asociativas; Autonoma. El tesauro puede organizarse de diferentes formas, pero sienipre teniendo en cuenta estos cdigos, para ayudar a1 especialista a integrar nuevas palabras. El texto verbal que ingresa es indizado manualmente por medio de palabras del lenguaje natural consideradas adecuadas para caracterizar el contenido del texto en opinin del indizador; estas entradas se procesan automticamente. Las que no han sido an registradas en el tesauro se pasan al lexicgrafo para chequearlas, revisarlas y eventualmente incorporarlas al mismo. El chequeo revela si un trmino es sinnimo de un concepto ya "memorizado" o si se trata de un nuevo tmino. Para colocar un nuevo trmino en la posicin adecuada dentro del tesaoro y para hacer los envos, el lexicgrafo tiene a su disposicin un tesauro ordenado polijerrquicamente. Este orden se basa en tres tipos de relaciones: genricas, parte- todo y por atributos. Existe un mtodo para construir un diccionario de final abierto, que lo utilizan expertos en diferentes materias, para la tarea bsica de definir el significado de cada trmino introducido en el tesauro. La idea bsica es empezar con una lista de frecuencia de las palabras incluidas en una coleccin particular de documentos. Adems, es ti4 tener disponible una lista de las palabras en su contexto, para distinguir la utilizacin individual de los significados para trminos ambiguos. Una lista standard KWIC puede prepararse automticamente, de manera que permita al usuario asegurarse de los usos individuales de las palabras incluidas en una coleccin. Despus de preparar la lista de usos de palabras a ser incluidas, es necesario agruparlas en clases dentro del tesauro. Este puede hacerse de varias formas: Un juicio informal para cada doble uso de palabras y as decidir si son sinnimos dentro de la materia considerada; si es as, pueden agruparse dentro de la misma clase en el tesauro. Un juego de enmarcamientos sintcticos, controlndose el uso de palabras que son convenientes en los mismos contextos, como en el mismo

FENIX

grupo dentro del tessuro o, igualmente, se pueden decidir si el trmino A riemplazar siempre al trmino B en un contexto X dado. El autor del diccioilario debe enfrentarse slo con colecciones dentro de ciertos Imtes estrechos. Disear un cuestionario para obtener respuestas sobre cmo preparar los trmin~spara agruparlos e identificar as cada trmino de acuerdo al juego de respuestas obtenido. P m ej.: uno podra preguntar: Representa este trmino un objeto fsico, un proceso o una abstraccin; o, esta pregunta no se le puede aplicar?, se le da 1 punto si es un cbjrto fsico; 2, si se tiata de una abstraccin; 3, si no se le puede aplicar la pregunta. Al acabar este proceso, se identifica cada trmino por una serie de propiedades (en forma de contextos que se adccuan a un trmino dado, o como respuestas a preguntas formuladas sobre los trminos), y el vocabulario completo puede representarse por una matriz de propiedades, Falta hallar la distancia semntica entre los trminos, comparando las propiedades que representan el uso respectivo de cada palabra. Especficamente, las popedades completamente idnticas pueden colocarse en un solo grupo iiinwktaniente; los trminos que no son idnticcs, pueden agruparse diminando juiciosamente algunas de sus propiedades y alternativamente. Los trminos ya agrupados pueden separarse introduciendo nuevas propiedade; para diferenciarlos. La matriz de propiedades puede usarse para "computar" un coeficiente entre cada par de trminos y formular jerarquas automticas. El sistema Passat descrito por Hoffman y otros autores acta para facilitar la seleccin de palabras clave de los textos por anlisis del contexto. El sistema requiere un diccionario (lista de palabras a comparar) que comprenda informacin sobre el tratamiento gramatical de las palabras y su relacin asociativa. Esta lista se construye mediante un piocedimieiito semiautomtico: Se construye un diccionario de palabras basndosc en una coleccin representativa de textos. Esta construccin debe ser automtica. A cada palabra se le asigna manualmente su informacin gramatical que consiste en: Tipo de palabra; Lista de posibies sufijos; Reglas de segmentacin; para finalmente unirse las palabras semnticamente similares. Manualmente se va elaborando un diccionario de palabras compuestas, mientras se indizan nuevos documentos. Rohinson muestra para el sistema Assasin, como se efecta semiautomticamenteeftesauro reactivo (de final abierto y estructurado): Cualquier trmino (y homgrafos) se coloca en el Indizador (que se convierte en un controlador de indizacin) para determinar su significado

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

y, de ser necesario, definir su localizacin en el tesairro. Esto es literalmente. rodearlo de sus trminos ms amplios: ms eqecficos y relacionados. El computador deduce automticamente las relaciones reversas de la informacin prevista por el indizador y completa todas las referen,' cruzadas necesarias. Por lo tanto, este sistema podr producir en ccalquier momento un tesauro completamente estructurado que cubrir todos los trminos usados para indizar los documentos de la coleccin. Este tesaura puede imprimirse en cudqiiier momento, aunque cbviamente su costo os muy alto. La disponibilidad del tesauro impreso y estructurado es fundamental para que el indizador pueda definir la ubicacin de nueves trminos. Adems tiene abstracts para niostrarlc e! ro~~tcxto dentro del cual se usa el trmino. En el Proyecto .Quobird del 1al;oratorio ds computadoras y dcl departamento de Ciencias de la Computacin de la Quecn's University of Belfast, se descubre una tcnica actualizada para la elaboi-acin de un diccionario en lnea. Un programa de indizacin lee a travs del texto de los abstracts (o a travs de los encabezamienfos de los captulos de un libro) procesando nuevos registros para que las palabras que figuren por primera vez puedan aadirse al tesauro. El indizador debe considerar primero, si la palabra es significativa o no. Si se juzga que una palabra no es significativa, no ser usada como palabra clave para la recuperacin. Tan pronto una palabra se declare significativa, ci indizador debe decidir si se desglosa o no. Una palabra puede ser desglosada, de manera que todas las incidencias de palabras de igual rama o raz sean agregadas a la misma lista. En la etapa siguiente del progrsmrt el indizador dcbc sugerir sinnimos para la palabra, a los cuales se le dar la m i m a entrada que a la primera paiabra. No se debe relacionar palabias que son sinnimos slo en algin contexto, si no lo son en todos los casos. E.stos incluyen los de ortografa diferente y los smbolos de elementos qumicos. Los smbolos que son paJ:ihras de poca significacin, deben evitarse. El sistema SLC-11 (Simulated Linguistic Computer) facilita la constritccin de un tesauro. Es un paquete de datos y lenguaje de programacin generalizado, para el procesamiento en lenguaje natural. El procedimiento de construir el tesauro requiere: Una gramtica que represente las fuentes del tcxto; Un diccionario de fuentes morfolgicas del lenguaje; Una coleccin de textos representativos a nivel estadstico.

-El proceso de la construccin automtica del tesauro se subdivide enlos siguientes ciclos: Deteccin de palabras no halladas en el diccionario. La deteccin de homgrafos durante la bsqueda en el diccionario.

FENIX

La determinacin de los conceptos ms importantes por decisin estadstica. La construccin de expresiones compuestas por mtodos de evaluacin estadstica, basados en la concurrencia de palabras, en las unidades lgicas de los textos. La clasificacin automtica, usando un algoritmo de pase mltiple modificado. El diccionario elaborado de esta manera se usa en un sistema completamente automtico de recuperacin de informacin, llamado Faiss (Fast Access Information Retrieval), financiado por el Medical Research Council para un servicio de informacin para ingenieros biolgicos. (Fangmeyer, 1974).

BIBLIOGRAFIA1 . ACUNA. Sandra; CONNING, Arthur; JOHNSON DE VODANOVIC, Betty. 1:'I tcsauro rnultilingiie de Popins para A~nricaLatina. Nueva (Un anlisis del borrador preparado en marzo de 1978). York, Naciones Unidas, 1978. 24 p. (Documentos de Conferencias).l'he Thesaurofacet. 2 . AITCHINSON, Jean. cumentation; vol. 26, n3. Sept. 1970).3 . ----. & GILCHRIST, Alan.

(En: Jnurnal of Do-

manual.

Thesaurus construction, a practica1 London, Aslib, 1972. 95 p.

4 . ALCALDE, Javier. I'esauro de ttrminos de la integracin Subregional Andin~a. 2da. ed. Lima, JUNAC, 1979. 257 p.

5. .

Apuntes de clase del curso de Ciencia de la infortnacin I . Lima, ENB, 1976. (indito).

6 . BAKEWELL, K.G.B. Classification and indexing practice. don, Clive-Bingley, 1978. 2 16 p.

Lon-

7 . BERWICK SAYERS, W .C. A manual of clcrsification of libraries. 404 p. London, A. Deutsch, 1967.8 . CONNOLLY, John A . & FUSCHIN, V . Paul & RODINSKY, SanUser's guide to the solid waste information retrievd thesaurus. . 56 p. U. S., Environmental Protectin Agency, 1974 9 . COUTURE DE TROISMONTS, R . Manual de tcnicas de documentacin Buenos Aires, Marymar eds., 1975. 204 p.

LITERATURA SOBRE DESCRIPTORES Y TESAUROS

A new approach to the development o f a technical 10. DYM, Eleanor D . (En: Proceedings of the American Documentation Insthesaurus. titute, 1967. p. 126-131). lnjormation storage and retrieval without 11 . FAEGER, Hermnn K . de computer assistunce; the terminal digit card system. Ghent (Belgium) ASTRID House, 1973. (Astrid series on Information Science, N" 3; ISBN 90 70078-03-1). Semi automatic indexing state of the art. 12. FRANGMEYER, H . London, AGARD, 1974. 22 p. Inforrnation science in libruries. London, Crosby 13. FOSKETT, D. J . Lockwood & Son, 1982. 142 p. 14. GZLCHRIST, Alan. 1971. 184 p.

The thesaurus in retrleval. London, ASLIB,

15. ISO . Documentation Guidelines for the establishment and Ginebra, International Ordevelopment oj monolingual thesauri. gunization for Standardization, 1974. 13 p.16. JOELEYJ . L . Progress in documentation. (En: Journal of Dopp. 199-215). cumentation, vol. 31, N, " Sept. 1975.17 . LANCASTER, F. Wilfried.

-

Information retrieval systems.

New

York, 1968.18.

-

Vocubulary control in information refrieval systems. (En Advances in Librarianship, vol. 7, 1977. pp. 1-40). Bar-

19. LASSO DE LA VEGA, Javier. Manual de documentacin. celona, Ed. Labor, 1969. 829 p.

On documentatiion of scientific 20. LOOSJES, Th. P . London, Buttersworths, 1973. 187 p.

literature.

2 1 . NACIONES UNIDAS. CONSEJO ECONOMICO Y SOCIAL. COMISION ECONOMICA PARA AMERICA LATINA. Reunin sobre tcnicas modernas de documentacin. Uso de descriptores y tesauros. . . Estudio preparado por el Centro Latinoamericano de Documentacin Econmica y Social (CLADES) de ia CEPAL. San81 p. tiago de Chile, 27-30 Sept., 1971. 22. OYARZUN, Mara. Consfrucciin de tesauros. Santiago de Chile, CONICYT/CENID, 1975. 34 p. (Serie: Informacin y Documentacin, No 12).

FENIX

23. RODRIGUEZ DELGADO, Rafael. Teora de sistenms y descriptores en documentacin cientfica. (En: Gocumcntos. UiiivcrsidadEmpresa, N? 19. El profesional qumico antc I I ~documentarin cientfica. Ciclo de conferencias. Abril, 1977. pp. 29-7 1).24.

.

Uso de descriptores y tc,sauros (apuntes). Lima E N B , 1979. 10 p. (Curso de Formacin de Especiulist~scn Informacin y Documentacin Cientfica. Enci-o-Mazo 1979).

25. UNESCO. Guidelines for the csiuDlishrner,t and clevelopnzent o f nzonolingual tesauri for inforr?:ntionrriiieval. Pars, Uiilrcd N-~tions Educational, Scientific and Culturai Grganizaton, 1971). 30 p. (Serie: SC/WS/SOO).j) . 26. - Lineamienlos para el estaDlec;!~ziento clzsarrollo de tesaua ros rnuitilingiies cientficos y tc'.c!zlcospam la rccr!perncin de d Informacin. Pars, Organizacin de las Naciones Uti:d:is p x a iit Sd~i19 p. cacin, la Ciencia y la Cultura, 1970.

27.

---.

SPINES Thesaurus, a controlles c i d stri!cturcr :*~c~;bulary L:':;! of science and technology for policy marking, ijZUntg~li1t!t ;!2v1loprizent. Pars, The UNESCO Press., 1976. 3 v

E! scrvicio de cic28. VAN DIJK, Marccl bt VAN SLYPE, Geolgcs. curnentacin frente a la explosin de la irzfoumncin. Bwrics Air~:;, 1972. 263 p.

29 . VICKERY, Brian C . 345 p. 1973. 30.

Infornirr!;oti systcrns, i,,:izd:m, Butccrwotlis,I ondon, Butterworths,

.1970.

Techniques oj injor~tzu&xzretric.vci1 262 p.

31. - Tlzesaurus a new worild in docurrrentation. (En: Jcurnal . o Documentation, vol. 6, No 4. Dic. 1974. pp. 181-189). f Desarrollo siiddtico de los tesauros y de los sis32. WALL, Eugene. Eernas de informacin: su historia clnica. (En: Documentacin CINTERFOR, No 43, Set. - Dic. 1977. pp. 3).33 . WHATLEY, H . A ., cd . British librarianslziy and information science. . Londm, The Library Association, 1972. 7 12 p.

-

34. WELLETS, Margaret. Investigation of the natrrre of the relation between terrns in thesauuri. (En: Journal of Documentation, vol 3 1, pp. 158-184). N? 3, Setp. 1975.

L o s Primeros Libros en el Per ColonialTeodoro Hampe M .

De un buen tiempo a esta parte, sucesivos hallazgos documentales han ac:ibado con la falsa idea de que los siglos de la dominacin espaola signiticaron para las colonias de Amrica u i ~ perodo de oscurantismo y de atraso culturni. Se ha comprobado, por el contrario, que existieron libros en abundancia, inciuso desde los primeros tramos de la Conquista; hubo un activo comercio libcesco, las bibliotecas eran ricamente surtidas, y abundaron los autores con profunda densidad de conocimientos. En este contexto, el Pcr no constituye una excepcin. Los documentos que vamos a comentar a continuacin, situados en la primera mitad del siglo XVI, proporcionctn i , ~ms temprana referencia acerca de material bibliogrfico en la poca colonial peruana. Verdaderamente, es escaso cl desarrollo i p e ha tenido el campo de ia historia de las ideas en nuestro pas, lo que tal vez se explique por el enorme e s f ~ m z oy er~idicinque dicha disciplina demanda. Con razn ha sealado Guillermo Lohmann que "lo ingente de una tarea que requiere dosis inagotables de paciencia y de conocimientos en todos los ramos del saber lia retrado a los investigadores de practicar una ponderacin exacta del inilujo de los libros y de su difusin"'. Se hace necesario el trabajo en equipo, y tambin la colaboracin interdisciplinaria (historia, filologa, filosnfa), para poder determinar las influencias de autores, corrientes ideolgicas y avances cientficos en la produccin intelectual de la Colonia. Esta monografa pretende llamar la atencin sobre aquella deficiencia y ofrecer una contribucin al trabajo posterior.1 .

Guillcrmo Lohmann Villena, "Libros, libreros y bibliotecas en la poca virreinal", en Fnix, nm. 21 (Lima, 1971), pgs. 17-24; cita de la pg. 20.

Al dar a luz este trabajo deseo agradecer al doctor Luis Jaime Cisneros por sugmt2 coltiboiacin.

Fhnix 28/29:71-90, 1978/1979

Libros en Hispanoamrica colonialEn el siglo XVI conviven curiosamente en Espaa, y trascienden al Nuevo Mundo, dos tipos de literatura: uno ligero y con arraigo popular, de relatos ficticios, y otro ms serio y elitista, de carcter iilosfico-teolgico. Ambos encuentran prcticamente el mismo auditorio, que comprende una diversidad de estratos sociales, desde el Emperador Carlos V hasta humildes artesanos. De manera conjunta, ambos moldean el espritu del hombre espaol e imprimen a la empresa conquistadora de Amrica su carcter peculiar, a la vez materialista y espiritual, guerrero y piadoso. Tambin en esta centuria, la nacin ibrica, poseedora de una larga tradicin escolstica y tomista, adopta la concepcin humanstica, un humanismo cristiano de posicin crtica frente a la religiosidad tradicional que propugna la reforma de la Iglesia. La literatura popular est dada, naturalmente, por las novelas de caballeras, esas extravagantes historias de la vida de hroes militares y de sus hazaas en pases exticos. Ellas impresionaban profundamente a los lectores que, en su mayora, aceptaban sin crtica la veracidad de los relatos y se identificaban con los personajes, moldeando su conducta y mentalidad segn el ejemplo de stos; se estableca una interaccin entre lo imaginario y lo real. Para el caso que nos ocupa, contamos con el valioso aporte de Irving A. Leonard, quien ha tratado de demostrar cmo el espritu creado por zsas "historias mentirosas" sirvi para activar la conquista de Amrica. Llevados por la curiosidad de encontrar en las ticiras lejanas las maravillas .que haban conocido a travs de los textos, miles de aventureros habran estado dispuestos a embarcarse en las flotrts que cruzaban el Atlntico; ms an -aade Leonard-, las acciones de los conquistadores llegaran a superar en emocin y temeridad a las de los hCrocs novclescos 2. Tal como se constata en los registros aduaneros y en la propia reiteracin de disposiciones proscriptoras, los libros de caballeras pasaron al Nucvo Mundo en crecido volumen. El Per posee un vnculo particularmente estrecho con la ms famosa de las obras de este gnero: el Atnddis, ciclo de doce libros que narra la vida de un prncipe de Gaula y su descendencia; comenz a aparecer en 1508 por obra de Garci Ordez de Montalvo (aunque tambin se le ztribuye al portugus Vasco de Lobeyra) 3. Luego la serie fue continuada por diversos autores, entre los que se encuentra el hidalgo mirobrigense Feliciano de Silva, prolfico escritor, quien se encarg2.

Cf. Irving A. Leonard, Books of the Brnve (Cambridge, Harvard University Press, 1949), caps. 11 y 111. Comp. Leonard, ob. cit., pgs. 15-16, y Jos Torre Revello, El libro, la imprenta y el periodismo en Amrica durante la dominacin espaola (Buenos Aires, Casa Jacobo Peuser, l91U)), pg. 216.

3.

PRIMEROS LIBROS EN EL PERU COLONIAL

de publicar los ltimos cinco libros de Amadis. Hijo suyo fue Diego de Silva y Guzmn, conquistador y cronista perulero; vecino del Cuzco, ciudad donde se estableci luego de su arribo, junto con Hernando Pizarro, en 1536 4. Pero no todos se identificaban con las maravillosas ficciones de los libros de caballeras. Hubo una minora seIecta -eran sobre todo religiosos que influan en los medios cortesanos y acadmicos- que los despreci, optando por el ideal humanstico de sabidura y piedad. En las dcadas iniciales del XVI, cuando prende con fuerza el Renacimiento, se deja sentir en Espaa la fecunda influencia del pensamiento Be Erasmo de Rotterdam, exponente principal del humanismo cristiano. Este propugnaba una renovacin espiritual con reforma en las costumbres y desprecio de lo exterior, para que el hombre pudiera alcanzar libertad intelectual, acercndose a Cristo. Marcel Bataillon explica cmo el erasmismo espaol, movimiento cultural de vastas consecuencias (enriquecido con el aporte de los cristianos nuevos provenienes del judasmo), impuls en la Pennsula una verdadera revolucin religiosa, que sera frenada poco ms tarde por la Contrarreforma, para la que aquellas doctrinas resultaban demasiado audaces 5. El humanismo de Erasmo, descoso de romper con los moldes establecidos en materia eclesistica y de fundar un cristianismo renovado: encontraba terreno propicio para su implantacin en las colonias de ultramar. All la labor de los frailes evangelizadores podra convertir en realidad sus postulados reformistas. De hecho, entre los espaoles que vinieron a Amrica hubo muchos que eran aficionados al erasmismo, segn lo prueban mencioncs de diversas partes del continente. Estos colonos hallaban un buen alimento espiritual en las lecturas morales y religiosas y preferan a Erasmo porque "daba una nota de piedad ilustrada y libre, grata a aquellos hombres desgarrados de su ambiente nativo" 6. SoMe la base de la legislacin referente a la circulacin de libros se mont una errnea concepcin acerca del ambiente intelectual experimentado en Indias. As, no sorprende que en un manual sobre la Vida intelectual del virreindto del Per, que por muchos aos marc 12 pauta en esta materia, topemos con la siguiente afirmacin: "El pensamiento naci esclavizado en la Colonia, incapaz de romper el yugo que desde el siglo XVI4.

Ral Porras Barrenrchca, "Diego de Silva, cronista de la conquista del Pen", en Mar del Sur, ao 111, nm. 15 (Lima, encrofebrero de 1951), pgs, 14-33; vanse especialmente las pgs. 19-20. Mnrcel Bataillon, Erasmo y Espaa. Estudios sobre la historia espiritual del siglo XVI [19371, trad. de Anton:o Alatorrc (Mxico-Buenos Aires, Fondo de Cultura Econhica, 1950), tomo 11, pgs. 429-432. Un buen resumen de los diversos puntos de vista cxpresados sobre el Eumunismo espaol se encuentra en Mara Luisa Rivara de Tuesta, Jos de Acosta, un humanista reformista (Lima, Editorial Universo, 1970), cap. 1. Bataillon, ob. cit., tomo 11, pg. 435.

5.

6

FENIX

lo ahog. Desde entonces, el pensamiento peruano colonial vivi aislado del resto del m