EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. ·...

Post on 28-Apr-2021

2 views 0 download

Transcript of EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. ·...

EPIHUM:DesarrollodelcorpusonlinedeinscripcioneslatinasdeEspañayPortugalduranteelRenacimiento

Prof.ManuelBlázquezOchando.Dpto.BiblioteconomíayDocumentaciónUniversidadComplutensedeMadridmanublaz@ucm.es

Prof.ManuelRamírezSánchez.InstitutoUniversitariodeAnálisisyAplicacionesTextualesUniversidaddeLasPalmasdeGranCanaria.manuel.ramirez@ulpgc.es

Profa.CatarinaGaspar.CentrodeEstudos ClássicosUniversidade deLisboa.cgaspar@letras.ulisboa.pt

Índice

� Introducción, orígenes, motivaciones

� Objeto de estudio

� Estado de la cuestión: fuentes

� Metodología

� Desarrollo, dificultades y soluciones

� Programa EPIBASE

� Conclusiones

Introducción, orígenes, motivaciones

Introducción,orígenes,motivaciones1/3

• El proyecto EPIBASE para desarrollar un sistema de catalogaciónexhaustiva, catálogo y sistema de recuperación especializado endocumentos epigráficos, tiene su origen en el proyecto deinvestigación HAR2015-63637-P aprobado por el Ministerio deEconomía y Competitividad, bajo el título “Escritura expuesta ypoder en España y Portugal (Siglos XVI-XVII): Catálogo epigráficoOn-Line”.

• El proyecto HAR2015-63637-P fue originalmente planteado ydiseñado por el profesor Manuel Ramírez Sánchez de laUniversidad de las Palmas de Gran Canaria.

Introducción,orígenes,motivaciones2/3

Proyectoprincipal• EscrituraexpuestaypoderenEspañayPortugal(siglosXVI-XVII):Catálogoepigráficoon-line

Subproyecto• SistemadecatalogaciónexhaustivadedocumentosepigráficosEPIBASE

Introducción,orígenes,motivaciones3/3

• Elproyectoprincipal,tieneporobjetoelestudiodelasprimerasinscripcioneshumanísticasenlapenínsulaibérica ysuevolución.

• ElperiodoepigráficocomprendidoentrelossiglosXVIyXVII esunodelosmenosestudiadosyelloplanteaunainvestigaciónespecífica.

• Conelobjetivodeproporcionarcoberturatécnicaalosprocesosdecatalogaciónynormalización delosdocumentosepigráficos,seideaunambiciosoplandeingenieríadesoftwareparacrearlamejorbasededatosepigráficaon-line.

Objeto de estudio

Objetodeestudio1/2

• Crearunsistemadecatalogaciónespecializadoendocumentosepigráficos,conlaexperienciadelaCienciadelaDocumentación

• Usarunmodelodedescripciónexhaustivo,extensibleynormalizado

• Proporcionarunaherramientaquepermitalacatalogacióndedetalles

• CompatibilidadconTEI-XML

Objetodeestudio2/2

• Proporcionarbuscadoratextocompleto paraelcatálogoepigráfico

• Gestióndedocumentosepigráficos,fotografíasdedocumentosepigráficos,autoridades,localizaciones,etiquetas,fuentes/bibliografía,migracióndedatos,parámetros,traducciónygestióndeusuarios

• Satisfacerlasnecesidadesdelosinvestigadores

Estado de la cuestión: fuentes

Estadodelacuestión:fuentes1/2

• Epigraphic Database Heidelberg(EDH)- http://edh-www.adw.uni-heidelberg.de/home

• Epigraphic Database Roma(EDR)- http://www.edr-edr.it/en/present_en.php

• HispaniaEpigraphica (EDA-BEA)- http://eda-bea.es/pub/search_select.php?newlang=es

Estadodelacuestión:Fuentes2/2

• TEI:TextEncoding Initiative - http://www.tei-c.org/index.xml

• EpiDoc:Epigraphic Documents inTEIXML-https://sourceforge.net/p/epidoc/wiki/Home/

Metodología

Metodología1/4

• AnálisisdelasbasesdedatosEDH,EDRyEDA-BEA,observandolossiguientesaspectos:

• Característicasprincipales• Funcionalidadesyopciones• Camposdedescripciónparalacatalogacióndedocumentosepigráficos• Gradodenormalización• Compatibilidadconestándares

Metodología2/4

EDH EDR EDA-BEA

Camposdedescripción

Permalink, Transcripción,Mapa,Datación,Textoinscripción,Variantes,Lugardelhallazgo,Lugardeconservación,Idioma,Tipodeinscripción,Material,Descripciónfísica,Técnica,Anotaciones,Autoridades,Nºderegistro,Estadodelaficha,Fechadeactualización,Autordelaficha,Fuentesrelacionadas,Imagen

Nº deregistro,Lugardelhallazgo,Lugardeconservación,Material,Tipodeobjeto,Técnicadeescritura,Idioma,Tipodeinscripción,Bibliografía,Textoinscripción,Variantes,Datación,Autordelaficha,Fechadeactualización,Imagen

Títuloatribuido,nº deregistro,Tipodeobjeto,Palabrasclave,Descripción,Tipodesoporte,Dimensiones,Conservación,Notas,Bibliografía,Autor,Fuentedeinformaciónprincipal,Tipodeinscripción,Textoinscripción,Variantes,Traducción,Descripciónfísica,Datación,Cronología,Lugardehallazgo,Lugardeconservación,Imagen

Nºdecampos 22 15 22

Metodología3/4

EDH EDR EDA-BEA

Funciones Feedback,EpidocXML,Exportación JSON,ExportaciónRDF,Geoposicionamiento,Gestiónbibliográfica,Gestiónfotográfica,Búsquedasencilla,Búsquedaavanzada,Modosdevisualizaciónderesultados

Búsquedasencilla,Búsquedaavanzada,Feedback

Búsquedasencilla,Búsquedaavanzada, Modosdevisualizaciónderesultados

Nºdefunciones 10 3 3

Normalización EpidocXML,JSON,RDF,Pleiades Stoa,EagleNetwork,GeoNames,Trismegistos Geo

Eagle Network,TrismegistosGeo

Eagle Network

NºNormalizaciones 7 2 1

Compatibilidad Sí No No

Metodología4/4

EDH EDR EDA-BEA

Exportación Sí No No

Websemántica Sí No No

Documentosepigráficos 74.606 82.933 30.798

Fotografías 37.683 54.376 30.798?

Fuente:Elaboraciónpropia– 13/10/2017

EDH

EDR

EDA-BEA

Desarrollo, dificultades y soluciones

Desarrollo,dificultadesysoluciones1/5Desarrollo

• Entornodedesarrollo:Apache,PHP,MySQL

• Opciones:Catalogación,Fototeca,Autoridades,Etiquetas,Fuentes,Lugares,Migración,Mantenimiento,Buscador/Catálogo,Parámetros,Traducción/Multilingüe,Gestióndeusuarios

• Tablasdebasededatos:Autoridades,Catálogo,Categorías,Etiquetas,Fuentes

Desarrollo,dificultadesysoluciones2/5Aspectosdiferenciadores

• MétododedescripciónbasadoenlosprincipiosdelaDocumentaciónylaEpigrafía

• Altoniveldenormalización.Epidoc-XML,RDF,SQL,CSV,EagleNetwork,GoogleMaps,Pleiades Stoa,GeoNames,Trismegistos Geo

• GeneraciónautomáticadearchivosEpidoc-XML

• MétododepreservacióndigitaldeimágenesmediantecodificaciónBASE64

Desarrollo,dificultadesysoluciones3/5• Gestióndefotografíasycatalogacióndedetallesbasadosenmicrofotografías

• Recuperaciónbasadaenfichasepigráficas,autoridades,fuentes,lugares,fotografíasysusdetalles

• Aplicaciónconeditorgráficoparalosrecortesdedetalles

Dificultades

• Gestióndeidentificadoresdedetallesdelasfotografías

Desarrollo,dificultadesysoluciones4/5• DesarrollodeexpresionesregulareseinteligenciaartificialparareconocerlasinscripcionesygenerarlosarchivosEpidoc-XML

• ComplejidaddelformatoEpidoc-XML,altísimoniveldejerarquización deetiquetas

Soluciones

• Creacióndeunapantalladecatalogaciónintegradacongestióndeautoridades,localizaciones,etiquetas,fotografías,detallesybibliografía

Desarrollo,dificultadesysoluciones5/5• Diseñodeunesquemadecatalogacióncompatible conloscamposdedescripciónpresentesenEDH,EDR,EDA-BEA

• DesarrollodeunnuevomodeloderepresentaciónXML,paradocumentosepigráficosfundamentadoenEpidocyTEI,quesimplifiquelajerarquizaciónylecturadelainformación

• Gestiónintegraldeparámetrosinvolucradosenlacatalogación:Idioma,Limbo,Material,Tipodematerial,Ocupación,Culto/Religión,Estadodeconservación,Estadodelaficha,Técnica,Tipodeautoridad,Tipodedocumento,Tipodeinscripción,Tipodeobjeto,Tipodelugar.

Programa EPIBASE

ProgramaEPIBASE1/2

Esquemadecatalogación

URLimagenenaltaresolución,CódigodelaimagenenBase64,Identificadoresdedetalles,Estadodelaficha,Camposdecontrol1-5,Títulopropiamentedicho,Otrostítulos,Descripcióngeneral,Inscripción,Transliteración,Traducción,Datación,Contextossocial-político-económico-legal-histórico-militar-geográfico-religioso,Autoridades,Palabrasclave,Tipodeobjeto,Material-Soporte,Técnica,Religión,Tipodeinscripción,Idioma,Lugardelhallazgo,Lugardepreservación,Estadodeconservación,Descripciónfísica,Bibliografía

EPIBASE

Pantallaprincipaldecatalogación

Pantalladeedicióndeparámetros

EstructuradelatabladecatalogacióndelprogramaEPIBASE.Disponede48camposdedescripción.

ProgramaEPIBASE2/2

VisióndelprogramaEPIBASE

VisióncompletadelapantallaDecatalogaciónyparametrización

Conclusiones

Conclusiones1/2

• ElproyectoEPIBASEplanteaunmodelodecatalogaciónexhaustivadedocumentosepigráficos,normalizado,interoperableycompatibleconotrosproyectoseuropeos.

• EPIBASEproyectamejorescapacidadesderecuperaciónalproporcionarrecortesdelasfotografías,detalles catalogados,quepermitengenerarnuevasrelacionessemánticasentreelementossemejantes.Estacaracterísticaabriránuevasvíasdeinvestigaciónyanálisisdelosdocumentosepigráficos.

Conclusiones2/2

• ElprogramaEPIBASEplanteamétodosdepreservacióninnovadoresbasadosenlacodificacióndelasimágenesenformatotextoBASE64quepermiteguardarlasimágenessinpérdidadecalidad,tantoenbasededatos,comoenarchivodetexto.

• EldesarrollodelprogramaEPIBASEplantearáunasolucióntécnicaalageneraciónautomáticadearchivosEpidoc-XML.Sinembargo,sepropondráeintegraráunnuevométododerepresentaciónXMLmássencilloyfácilmentelegibleporprogramasPARSEReinvestigadores.

Prof. Manuel Blázquez Ochando. Dpto. Biblioteconomía yDocumentación. Universidad Complutense de Madrid.manublaz@ucm.es

Prof. Manuel Ramírez Sánchez. Instituto Universitario deAnálisis y Aplicaciones Textuales. Universidad de Las Palmasde Gran Canaria. manuel.ramirez@ulpgc.es

Profa. Catarina Gaspar. Centro de Estudos Clássicos.Universidade de Lisboa. cgaspar@letras.ulisboa.pt