Análisis documental

32
Análisis Documental Descripción Física Análisis de Contenidos Indización Resumen Clasificación Otros datos Palabras Clave Descriptores

description

Operaciones que configuran el análisis documental, definiciones normativas de AD, análisis de páginas web, metadatos, Dublin Core Metadata

Transcript of Análisis documental

Page 1: Análisis documental

Análisis Documental

Descripción Física Análisis de Contenidos

Indización Resumen Clasificación

Otros datos

Palabras Clave Descriptores

Page 2: Análisis documental

Teoría integradora AD > AC

AD = DF + AC

Teoría restrictiva AD=AC

Page 3: Análisis documental

Definición de AD

El análisis documental es un conjunto de operaciones* encaminadas a representar un documento y su contenido bajo una forma diferente de su forma original, con la finalidad posibilitar su recuperación** posterior e identificarlo

*Unas intelectuales y otras mecánicas**A partir de los máximos elementos posibles y de modo automatizadoBBDD

Page 4: Análisis documental

ADDefinición de la norma UNE 50-113

Operación que consiste en examinar un documento para encontrar sus elementos esenciales y las relaciones entre ellos

Page 5: Análisis documental

En el análisis documental se

produce un triple proceso 1.- Un proceso de comunicación, ya que

posibilita y permite la recuperación de información para transmitirla

2.- Un proceso de transformación, en el que un documento primario sometido a las operaciones de análisis se convierte en otro documento secundario de más fácil acceso y difusión

3.- Un proceso analítico-sintético, porque la información es estudiada, interpretada y sintetizada minuciosamente para dar lugar a un nuevo documento que lo representa de modo abreviado pero preciso

Page 6: Análisis documental

Toda la información registrada, en el soporte que sea, puede ser objeto de análisis documental

Page 7: Análisis documental

Núm.Registro:255203Autores:KEEFER, ALICETítulo:FIRSTSEARCH: SERVICIO EN LINEA PARA EL USUARIO FINALTítulo otros idiomas: FIRSTSEARCH: SERVEI EN LINIA PER A L'USUARI FINALISSN:0214-0349Revista:Item. Revista de Biblioteconomía i Documentació Datosfuente:1994,(16):34-42Tipodocumento:Artículo de revistaLengua:CatalánResumen: FirstSearch es el nuevo servicio de teledocumentación de OCLC, que cubre tanto el acceso y la consulta de bases de datos como la obtención del documento original. 5.753 instituciones lo utilizan actualmente. En Europa hay 152 bibliotecas usuarias: 68 universitarias, 6 bibliotecas públicas y 78 de empresas.

De las 50 bases de datos que el servicio ofrece, 5 se distribuyen exclusivamente a través del mismo. Se describen ArticleFirst, ContentsFirst, FastDoc, NetFirst y PapersFirst.

Se describen las modalidades de consulta y los resultados de una encuesta que revelan una gran aceptación por parte de los usuarios y se ilustran los costes de obtención de documentos a partir de diversos proveedores y medios de envíoDescriptores: Catálogos de acceso público en línea ;Bases de datos ; Acceso a la información ; Acceso al documentoIdentificadores:OCLC ; FIRSTSEARCHClasificación: 200501 Catálogos convencionales y automatizados (OPACS)

200402 Catalogación

Page 8: Análisis documental

•PUBLICACIO: EL PAIS

•DATA DE PUBLICACIO: 24-06-2001

•MES DE PUBLICACIO: JUNIO

•ANY DE PUBLICACIO: 2001

•PAGINA INICIAL:30

•PAGINA FINAL:30

•RESUMEN: Evolución de los incendios forestales en España de 1994 a 2000

•AMBIT: ESPANYA

•CLASSIFICACIO: MEDI AMBIENT

•DESCRIPTORS: INCENDIS FORESTALS

•PARAULES CLAU: SUPERFICIE FORESTAL CREMADA

•DATA DE CARREGA: 26-06-2001

•TIPUS DE DOCUMENT:DADES ESTADISTIQUES

•NOTES:

•ANALISTA:tmdo10

Page 9: Análisis documental
Page 10: Análisis documental

<HTML> 

 <HEAD>

 <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

<META NAME="keywords" CONTENT="MALVINE, Manuscripts and letters, ONE, Metadata, EAD, Encoded Archival Description, library, museum, ANSI Z39.50, Z3950, Distributed Search, Retrieval, query broadcasting">

<META NAME="description" CONTENT="MALVINE opens new and enhanced access to disparate holdings  of modern manuscripts and letters, kept and catalogued in European  libraries, archives, documentation centres and museums.">

<META NAME="LANGUAGE" CONTENT="de-an">

<META NAME="security" CONTENT="public">

<META NAME="AUTHOR" CONTENT="JOANNEUM RESEARCH, MALVINE CONSORTIUM">

<TITLE>MALVINE - Manuscripts and Letters via Integrated Networks in Europe</TITLE>

<LINK HREF="styles.css" REL="STYLESHEET">

</HEAD>

. . .

. . .

</HTML>

OJO! Representación del documento dentro del documentometadatos

Page 11: Análisis documental

• El análisis documental representa la información de un documento en un registro estructurado, reduce todos los datos descriptivos físicos y de contenido en un esquema uniforme

Page 12: Análisis documental

Análisis Documental

Descripción Física Análisis de Contenidos

Indización Resumen Clasificación

Otros datos

Palabras Clave Descriptores

Page 13: Análisis documental

• Descripción externa del documentoIdentifica los datos físicos de un documento que lo distinguen de otro

• Actúa sobre el soporte

• Su finalidad principal es permitir localizar los documentos.

Descripción Física

Page 14: Análisis documental

Datos a consignar: Depende del tipo de documento, de lo que se considere como unidad documental y del soporte.

Artículo de revista Noticia de un informativo

Título del artículo Título de la noticia

Autor/es del artículo ProgramaTítulo de la publicación ParteNúmero de la publicación DirectorFecha publicación ColaboradoresMes ( o periodo) Fecha de emisiónAño de publicación Fecha de grabaciónPágina inicial FormatoPágina final Número de cinta

Time code inicioTime code final...

Descripción Física

Page 15: Análisis documental

Opera sobre el contenido temático del documentoLogra una representación de la información tratada

Se divide en varias operaciones: IndizaciónResumenClasificación

Análisis de Contenidos

Page 16: Análisis documental

• Indización o descripción característica 

Análisis de ContenidosINDIZACIÓN

Palabras clave Descriptores

Por asignaciónPor extracción

Page 17: Análisis documental

Análisis de ContenidosIndización

Palabras clave - Descriptores

• Hay dos modalidades diferentes pero complementarias de indización

– Palabras clave y Descriptores

• Se consignan en campos diferentes (Ver formularios)• Con frecuencia se usa el término palabra clave como sinónimo de

descriptor pero esto es INCORRECTO• Las palabras clave pueden ser términos simples o compuestos y

sus sinónimos, cuasisinónimos, antónimos, variaciones ortográficas...

• No suele existir un control estricto del vocabulario empleado en el campo de palabras clave, sin embargo:

– Las palabras clave con una frecuencia alta acaban siendo descriptores

– Las palabras clave son una de las fuentes a considerar a la hora de actualizar (tarea de mantenimiento) los lenguajes documentales empleados en un centro de documentación

Page 18: Análisis documental

Las palabras clave se pueden obtener de dos maneras:

Por extracción o derivación: los términos se toman del texto que se indiza.

Consultando fuentes externas

Indización orientada por documentos ya indizados (IOD)

Por asignación:Indización orientada por peticiones (IOP)

Los términos NO figuran en el texto

Pensando

Norma UNE 50-121

Análisis de ContenidosIndización

Palabras clave

Page 19: Análisis documental

• Son términos normalizados, formalizados, homologados que pertenecen a un lenguaje documental o controlado

• Representan sin ambigüedad los conceptos tratados ya que hacen referencia a un único semantema

• Son los términos preferentes de un lenguaje controlado

Análisis de ContenidosIndización

Descriptores

Page 20: Análisis documental

• Resumen o descripción sustancial– Indicativo o descriptivo: indica el tipo de

documento, los principales temas tratados y cómo se tratan

– Informativo o analítico: facilita la máxima información posible cuantitativa o cualitativa, o ambas, contenida en un documento

– Selectivo:refleja sólo aquellas partes del texto que parecen esenciales para una categoría de usuarios determinada

» Leer ejemplos

– Mixtos; de conclusiones; estructurados.

Análisis de ContenidosRESUMEN (ABSTRACT)

Page 21: Análisis documental

• Clasificar: Ordenar o disponer por clases definidas según el contenido del propio documento

• Los sistemas clasificatorios se caracterizan por sus estructuras jerárquicas– De los conceptos más amplios a los más

específicos» Ejemplos:

Análisis de ContenidosCLASIFICACIÓN

Page 22: Análisis documental

• TRABAJO– Empleo– Paro– Conflictividad laboral– Legislación laboral

• Calendario laboral– Negociación colectiva

• Concertación social• Convenios• Salarios

– Organizaciones empresariales

-----------------------------------------------------------------------------------------------------------------------

Producción científica

Revistas científicas

Factor de impacto

Análisis bibliométrico

Evaluación de revistas

Gestión de la información

Gestión del conocimiento

Selección de documentos

Inteligencia competitiva

Intranets

Page 23: Análisis documental

• Idioma original del documento

• Filiación del autor

• Número de referencias que aporta el documento

• Tipo de documento

• Nivel

• URL

Otros datos

Page 24: Análisis documental

Reflejo del AD en los campos de un registro

• Campos descriptivosse derivan de la descripción física

• Campos analíticosse derivan del análisis de contenidos

• Campos de control

comentar lo del dossier

Page 25: Análisis documental

“Análisis de páginas web”

“Reinvención” de la Documentación:

Crecimiento de la información en Internet imposibilidad de recuperarla de modo preciso necesidad de estructurarla para recuperarlaanálisis documental

a.- externo al documento

b.- en el propio documento

Page 26: Análisis documental

Análisis documental de páginas web – Los metadatos

• El término metadato aplicado a la información distribuída en Internet se define como “datos sobre de datos”.

• cualquier dato usado para ayudar a identificar, describir y localizar los recursos electrónicos en un entorno de red

• propiedades identificativas o descriptivas que se pueden asociar a un recurso de información electrónico

• “Información legible por ordenador sobre recursos web” (Tim Berners-Lee )

Docs. Electrónicos – En el documento

Page 27: Análisis documental

• Necesidad de los lenguajes de marcas que permitan identificar las sintaxis en las que se definen las estructuras de metadatos

• Existen diversas iniciativas de metadatos para normalizar la información incluída en un documento web e intentar facilitar una recuperación fiable por parte de los motores de búsqueda.– DC

– TEI

– GILS

– EAD

– ...

Page 28: Análisis documental

• Información que contienen los metadatos– Descriptiva– Contenidos

– Valoración contenidos– Para el tratamiento de los datos

Los metadatos a diferencia de los lenguajes de marcado se incluyen todos juntos al principio del documento web.

Page 29: Análisis documental

Dublin Core Metadata• <META NAME=”DC.Título” CONTENT=”

· Título: Nombre o título asignado al documento o a la fuente.<META NAME=”DC.Autor” CONTENT=” · Autor o creador: Creador intelectual del contenido del documento o de la fuente. <META NAME=”DC.Materia” CONTENT=” · Materia: Palabras claves o frases que resumen el contenido de un documento o de la fuente, el empleo de vocabularios controlados y esquemas de clasificación formales es aconsejable.

<META NAME=”DC.Resumen” CONTENT=” · Resumen: Se trata de un resumen o descripción textual del documento en caso de documentos como objetos y se hará descripción del contenido para fuentes visuales. <META NAME=”DC.Editor” CONTENT=”

·Editor: Editor o entidad responsable de la publicación del documento.

Page 30: Análisis documental

• <META NAME=”DC.Otras contribuciones” CONTENT=” · Otras contribuciones: Otros colaboradores u otras menciones de responsabilidad, que hayan contribuído al contenido intelectual del documento pero cuyas aportaciones sean secundarias respecto al elemento autor o creador<META NAME=”DC.Fecha” CONTENT=” · Fecha de publicación: Fecha de creación de la fuente. <META NAME=”DC.Tipo de recurso” CONTENT=” · Tipo de recurso: Categoría del recurso, tales como revista, diccionario, poema, informe técnico, directorio. Se espera que el elemento “Tipo de recurso” pueda escogerse de una relación de tipos predefinida.<META NAME=”DC.Formato” CONTENT=” · Formato: Sirve para identificar el programa informático y el equipo material, como texto/html; ASCII; fichero postscript; imagen JPEG, etc. El elemento Formato se asignará desde una lista predefinida, como la de Internet Media Types (MIME Media types). Actualmente la única opción disponible es texto/html.

Page 31: Análisis documental

• <META NAME=”DC.Identificador” CONTENT=” · Identificador del recurso: Código o número único, individualizado e internacional que identifica la fuente. Por ejemplo el URL (Uniform Resource Locator)<META NAME=”DC.Fuente” CONTENT=” · Fuente actual: Para versiones, adaptaciones, revisiones de documentos originales. Trabajo, impreso o electrónico, del que proviene el recurso, si esto ocurre.<META NAME=”DC.Lengua” CONTENT=” · Lengua: Lengua o lenguas en la que está el contenido intelectual de la obra, Ejemplos: en, de, es, fi, fr, ja, th, zh. <META NAME=”DC. Relación CONTENT=” · Relación : Relaciones con otros recursos.

Page 32: Análisis documental

• <META NAME=”DC.Cobertura” CONTENT=” · Cobertura: Cobertura espacio temporal. Se refiere a una región física, uso de coordenadas (longitud y latitud) o nombres de lugares. La temporal se refiere a la temporalidad del contenido del recurso, no a la fecha de creación. <META NAME=”DC.Derechos” CONTENT=” · Derechos: Copyright u otros.

• Comentar división bibliografía