Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del...

12
MSc. Albert Bres Sr. Jose Antonio Olvera Ponència 4: La preservació del patrimoni digital personal Què és el patrimoni personal La història està documentada en llibres, fotografies, películes, mapes, gravacions sonores, cròniques... I cada cop més, aquests materials es produeixen digitalment. Els blogs, fotografies digitals, pàgines web i correus electrònics creats avui, si es preserven, proveiran testament de la nostra història demà; això és el nostre patrimoni personal digital. Si explorem exemples del que els grans arxius i biblioteques han salvat de forma analògica veurem el que es perdria si no fóssim capaços de preservar la història digital. Un exemple molt proper és el cas del fotògraf Valentí Fargnoli [4], que va documentar la vida gironina en el trànsit dels segles XIX al XX. Un paisatge, una arquitectura i uns costums que no entendríem de la mateixa manera sense les imatges de pioners de la fotografia com ell. I és que l’ajuntament de Girona, conserva 4 milions de fotografies en total de tots aquests pioners de la fotografia. Però avui la relació entre la fotografia i l’entorn ha canviat fins al punt que cadascú de nosaltres ha esdevingut un Fargnoli i, per tant, gairebé tothom vol preservar tot allò que l’envolta. Encara no fa gaire temps que la memòria colectiva es construïa a partir d’unes poques mirades particulars i que les institucions públiques n’exercien la salvaguarda, a través dels arxius o les biblioteques. Però quan tots i cadascun de nosaltres esdevenim cronistes del temps que ens toca viure desbordem, per l’excés d’informació, la capacitat dels que fins ara havien gestionat la memòria. Tot apunta que l’única solució possible és que nosaltres mateixos ens responsabilitzem del treball de salvaguarda; però, com ho hauríem de fer? Fins ara, la resposta era copiar les imatges que es conservaven en discos durs locals o en servidors externs, però en el format en què havien estat preses. Tanmateix, els experts adverteixen que els formats dels arxius en què emmagatzemem les imatges no sobreviuen més de quinze anys, perquè l’avenç tecnològic els fa

Transcript of Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del...

Page 1: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

MSc. Albert BresSr. Jose Antonio Olvera

Ponència 4: La preservació del patrimoni digital personal

Què és el patrimoni personalLa història està documentada en llibres, fotografies, pel·lícules, mapes, gravacions sonores, cròniques... I cada cop més, aquests materials es produeixen digitalment. Els blogs, fotografies digitals, pàgines web i correus electrònics creats avui, si es preserven, proveiran testament de la nostra història demà; això és el nostre patrimoni personal digital.

Si explorem exemples del que els grans arxius i biblioteques han salvat de forma analògica veurem el que es perdria si no fóssim capaços de preservar la història digital.

Un exemple molt proper és el cas del fotògraf Valentí Fargnoli [4], que va documentar la vida gironina en el trànsit dels segles XIX al XX. Un paisatge, una arquitectura i uns costums que no entendríem de la mateixa manera sense les imatges de pioners de la fotografia com ell. I és que l’ajuntament de Girona, conserva 4 milions de fotografies en total de tots aquests pioners de la fotografia. Però avui la relació entre la fotografia i l’entorn ha canviat fins al punt que cadascú de nosaltres ha esdevingut un Fargnoli i, per tant, gairebé tothom vol preservar tot allò que l’envolta.

Encara no fa gaire temps que la memòria col·lectiva es construïa a partir d’unes poques mirades particulars i que les institucions públiques n’exercien la salvaguarda, a través dels arxius o les biblioteques. Però quan tots i cadascun de nosaltres esdevenim cronistes del temps que ens toca viure desbordem, per l’excés d’informació, la capacitat dels que fins ara havien gestionat la memòria. Tot apunta que l’única solució possible és que nosaltres mateixos ens responsabilitzem del treball de salvaguarda; però, com ho hauríem de fer? Fins ara, la resposta era copiar les imatges que es conservaven en discos durs locals o en servidors externs, però en el format en què havien estat preses. Tanmateix, els experts adverteixen que els formats dels arxius en què emmagatzemem les imatges no sobreviuen més de quinze anys, perquè l’avenç tecnològic els fa obsolets, la qual cosa vol dir que arribarà un dia en què no podrem mirar les imatges preses temps enrere perquè els lectors que hi haurà no sabran llegirels arxius. Som davant d’un problema d’abast considerable.

Figura 1: «Girona: voltants – pont del riu Guell en l’antic camí de Sta. Eugenia:» FOTO: VALENTÍ FARGNOLI

Page 2: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

Lo més estimat: com es guarda i com es gaudeix Cada persona li té més estima a alguns objectes digitals que a uns altres, però en general, els que solen tenir més valor sentimental són les fotografies, els vídeos, les cartes (correus electrònics actualment), els diplomes...

Aquests objectes digitals es guarden en el disc dur dels nostres ordinadors, en servidors remots o en xarxes socials com Facebook, YouTube i Flickr; guardar els objectes digitals és un tema que ja està resolt.

El que no podem garantir, i que encara és un repte, és poder gaudir-lo al llarg del temps. Una persona pot gaudir el seu patrimoni personal en la intimitat o compartint-lo amb la seva gent, una vegada a l’any o cada sis mesos, però, com podem garantir que sempre ho puguem gaudir? En aquest punt ens trobem amb diversos problemes. Per una part tenim els problemes ocasionats pel hardware on s'emmagatzemen les fotografies, que es va deteriorant amb el pas del temps i es va quedant antiquat per la velocitat amb la que avança la tecnologia. A més s'afegeixen els problemes de software, com són:

Els virus, que poden danyar, alterar, o eliminar aquests fitxers Les fotografies es poden arribar a eliminar per error. Som humans i cometem errors. El software que s'utilitza per poder obrir els fit es queda obsolet. Els canvis de format que puguin succeir amb el pas del temps. Certs errors informàtics que corrompen els arxius (fotogràfics) i fa que els fitxers

comprimits siguin especialment sensibles.

Normalment una nova versió de software pot llegir els seus arxius anteriors, però això rares vegades supera les tres generacions cap enrere[2], pel que els fitxers més antics queden irrecuperables i la versió de l'aplicació que podia llegir-los ja no està disponible o no és llegible pels nous equips.

Respecte als formats, el major risc el constitueixen els "formats propietaris" l'especificació dels quals no està disponible públicament, i que poden ser interpretats només pel software de la mateixa empresa; si aquesta decideix canviar el format o discontinuar el software, o bé cau en fallida o es fusiona amb una altra, els arxius dependents d'aquesta podrien quedar illegibles.

A causa de tots aquests problemes, s'estima que la vida útil de la informació digitalitzada és aproximadament de deu a vint anys [3]. Això, que a priori no sembla un problema greu, comença a tenir conseqüències i es comencen a veure els efectes quan intentem obrir un fitxer i hem de descarregar-nos un software més antic o plug-in que permeti poder obrir-lo. I en el cas de les fotografies digitals, si comptem que es van popularitzar el 2005 (degut als indicis mostrats per gràfiques que mostren quan va començar la venta massiva de càmeres digitals per a l’ús personal), tindrem que cap al 2020 començarem a trobar greus símptomes.

La preservació amb amicsUna manera de preservar és aprofitant els amics que es puguin tenir en les xarxes socials. La idea és que es vagi realitzant còpies dels fitxers que vol preservar un usuari en diversos formats automàticament. Aquests formats, a mesura que passa el temps s’actualitzen perquè es descarten els vells i se n’incorporen de nous. I les còpies que es realitzen es distribueixen en

Page 3: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

diversos espais, siguin propis o aliens, és a dir, en el disc dur de l’ordinador que els produeix o en el dels amics que es tenen per exemple al Facebook o al Twitter. Llavors cada cert temps, quan es produeixi una "catàstrofe" (ve donada per qualsevol tipus de problema de software, com virus, eliminació per error, canvis de format o corrupció de fitxers) el que s'intentarà és recuperar els fitxers afectats amb el format més adient gràcies a aquest treball previ de realitzar còpies distribuïdes en diversos espais.

Per tal de testejar aquesta estratègia de preservació, s'ha desenvolupat un prototipus que permet emular la preservació d'objectes digitals (OD) que tenim en la computadora fent que interactuïn amb un entorn simulat que representa una xarxa social, on succeeixen catàstrofes. El prototipus s'ha implementat emprant la tecnologia d'agents, agentificant els OD en el moment que decidim preservar-los. Aquests, es caracteritzen en que tenen un "pressupost digital", una espècie de crèdit per poder desplaçar-se per la xarxa social i anar fent còpies, que podran anar recarregant regularment, i que farà que competeixin entre ells per preservar-se. Com més interès tingui un OD, més pressupost rebrà i per tant tindrà més probabilitat de ser preservat.

Figura 2: Estructura conceptual dels OD: tenen múltiples components que són preservats amb la redundància de format internament en l'SPADO, que tenen algunes regles que determinen la seva missió, i característiques socials que determinen com interactuarà, cooperarà i competirà pels serveis de preservació sota un pressupost limitat.

D'aquesta manera tindrem un paradigma amb tres actors. Es tracta d'una aproximació centrada en els OD, on l'objecte té el rol de "cuidar-se" per ell mateix, els usuaris "pagaran" per la seva preservació i proveiran el saber com per "curar-los", i els serveis de preservació competeixen per preservar-los.

Les característiques principals del prototipus d'emulació, que ajuden a entendre el seu funcionament general són les següents: Les interconnexions entre els diferents nodes determinarà quins usuaris són amics de

quins. Per la xarxa viatjaran els OD, amb l’objectiu de fer còpies d’ells mateixos en altres

ordinadors i en diferents formats per poder preservar-se. Quan es queden poc pressupost

Page 4: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

intenten tornar a l'usuari al que corresponen perquè aquests els torni a carregar i puguin continuar vius desplaçant-se per la xarxa i fent més còpies.

Cada node (ordinador) només podrà llegir un format determinat de vídeo o imatge, que anirà de més antic a més modern (d’1 a 5).

Quan succeeix una catàstrofe, aquesta afecta a un percentatge determinat d'usuaris de la xarxa sobre els quals es fa desaparèixer els OD que està allotjant en aquell moment per tal de simular l'obsolescència d'aquests OD.

Els agents que actuen en la simulació són:o Els usuaris (ofereixen servei de preservació)o Els objectes digitals (tenen pressupost de preservació digital)o Les catàstrofes (succeeixen cada cert temps)

A més, aquest prototipus permet via interfície generar la topologia de xarxa social que es desitgi, ajustar els diversos paràmetres que actuen en l'emulació (ens permet poder fer diversos experiments), seleccionar els fitxers que es volen preservar, i una pantalla que mostra tot el que està passant en temps real.

Figura 3: Pantalla que permet generar la topologia la xarxa social

Page 5: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

Figura 4: Pantalla que mostra el que està passant en temps real

Per a l'obtenció de resultats, hem fet emulacions que tenen una durada de 20 anys, on succeeixen 3 catàstrofes, una cada 5 anys, on una proporció important de DO mor cada 20 anys. Així fem que coincideixi amb el factor de que cada 20 anys augmenten les dificultats per accedir als materials digitals.

La mesura emprada és l'entropia de Shannon, per saber si hi ha prou diversitat de formats que proveeixen la suficient "resiliència" (capacitat de recuperació davant les pèrdues) per tornar a l'estat anterior, abans que succeeixin les catàstrofes. S'han realitzat catàstrofes que afecten a diferents percentatges d'usuaris de la xarxa, fent desaparèixer els OD que contenen en aquell moment; hem fet que afectin a un 10%, 33% i 50% dels usuaris de la xarxa. Aquestes emulacions s'han realitzat en diversos escenaris, amb diferents topologies de xarxa per determinar la seva repercussió sobre els resultats finals, tot i que en el present document només ho veurem aplicat sobre un escenari . S'han realitzat tantes execucions com han sigut necessàries fins a obtenir estabilitat estadística.

Els resultats que es mostren a continuació han sigut realitzats sobre la topologia que s'observa a continuació (veure Figura 5), i l'evolució de l'entropia de els diversos experiments realitzat on les catàstrofes afecten a un 10, 33 i 50 percent dels usuaris de la xarxa es mostra en la Figura 6. Podem observar com l'entropia va augmentant fins que succeeix la primera catàstrofe, que fa

Page 6: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

decrementar-la considerablement, però tot i això després d'aquesta i de cadascuna de les catàstrofes el sistema mostra una resiliència molt important (es torna a recuperar la diversitat de formats). Si contrastem aquesta informació amb el percentatge de recuperació que mostren davant les catàstrofes (Taula 1) podem dir que en la primera catàstrofe mostren el percentatge més elevat de recuperació i en general va decreixent a mida que succeeixen les catàstrofes, segurament degut al breu interval entre catàstrofes. Cal destacar l'alt percentatge que obtenim de l'entropia al finalitzar l'emulació respecte l'entropia en el primer pic, abans que succeeixi la primera catàstrofe: per a una desaparició del 10% de fitxers obtenim un percentatge de recuperació de 101,78% (guanyem en diversitat de formats respecte l’inici de l’emulació), per a la desaparició del 33% obtenim un percentatge del 84,64% i per una desaparició del 50%, un percentatge del 71,31%.

Figura 5: Topologia de xarxa social emprada

Figura 6: Resultats topologia 1 (small world).

Adopció de software

10% 33% 50%

Catàstrofe 1 152,93% 89,78% 75,82%Catàstrofe 2 96,40% 70,58% 63,53%

Catàstrofe 3 77,04% 48,45% 52,78%Taula 1: Percentatge relatiu de recuperació després de cada catàstrofe

PyramidAquesta és una aplicació, encara en desenvolupament que està en una versió alfa. Es tracta d'un programa preservador digital que s'encarrega de conservar el patrimoni personal digital (de moment centrat en fotografies) al llarg del temps de forma discreta i eficient.

Page 7: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

Té tres maneres diferents de funcionament amb les quals distribueix les còpies de les fotografies:

En local : les guarda en el disc dur de l'ordinador on està instal·lat el programa. En cloud: les guarda en servidors remots. En amics: les guarda en els discs durs dels amics que pot tenir l'usuari del programa.

I les seves principals característiques són: Fàcil d’instal·lar i utilitzar No molesta ja que treballa en background Automàtic. Un cop es selecciona les fotos digitals valuoses que vols preservar, du a

terme la preservació per tu Treballa igual que un antivirus, constantment buscant nous virus – en aquest cas

l’analogia és amb els formats – Segueix el principi open close: obert per extensions però obert per modificacions. És

obert per afegir-li contínuament nous mòduls de “canvi de format” Cooperatiu. Utilitza el poder de les xarxes socials Distribuït. Un servidor pot fallar però no importa perquè les imatges estan distribuïdes

arreu del món

Aquesta aplicació està disponible a [5] i a continuació es mostren les pantalles principals:

Page 8: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)
Page 9: Albert Bres i Jose Antonio Olvera, Preservació del patrimoni digital personal, Jornades del Clúster TIC MEDIA de Girona, Nov 24, 2011 (WORD)

Figura 7: Imatges de l'aplicació Pyramid

Referències[1] SaveMyMemories. http://www.savemymemories.org/[2] Rivera Donoso M. A., Directrices para la creación de un programa de preservación digital.

http://eprints.rclis.org/bitstream/10760/12989/1/Serie_N%C2%B043_Preservacion_digital.pdf

[3] Jiménez León, A. (2006). Preservación digital vs obsolescencia de la información. Apertura, 3, 101-107.

[4] Gorini, C. (2011). Tots som Fargnoli. http://www.udg.edu/LinkClick.aspx?fileticket=SfHmc1mFJFg%3D&tabid=12153&language=ca-ES

[5] Pyramid http://www.pyramid.cat/