Format (preservació digital)
Un format és una codificació estructurada de dades per a la seva gestió i representació per mitjà de programari informàtic. Tot i existir-hi altres definicions alternatives, la més recent i fidel al camp de la preservació digital va ser elaborada pel Grup de Treball de PREMIS: “És una estructura preestablerta i específica per a l'organització d'un fitxer, una cadena de bits o una cadena d'arxius”[1]
Tipologies de Formats
Tot i que actualment existeixen milers de formats en el món, s'ha intentat des de fa anys establir una classificació genèrica dels formats segons la seva tipologia, tot i que encara no s'ha arribat a un consens acadèmic sobre una d'única. Existeixen, això si diferents projectes per dur a terme la correcta identificació de tots els formats existents, com el United Kingdom Digital Curation Centre’s Representation Information Registry,[2] la Global Digital Format Registry,[3] o PRONOM,[4] entre altres. Tot i aquesta disparitat de projectes, es poden identificar 3 tipologies bàsiques, o comunament emprades, de formats, a més d'una última centrada específicament en la preservació digital de documents a llarg termini.
Esquemes de tipologies de formats
Per Gènere
La tipologia per gènere permet agrupar els formats en tretze grans categories que serveixen perquè siguin ordenats amb facilitat per diferents tipus d'audiències encara que aquestes no estiguin familiaritzades amb el món de la informàtica. Un dels seus principals promotors és la National Library of Australia,[5] que està dissenyant en l'actualitat una base de dades col·laborativa on pér mitjà d'aquest tipologia genèrica ajuda als usuaris a identificar els diferents tipus de formats d'arxiu.
- General: gamma àmplia de materials
- Documents d'arxiu i correus electrònics
- Materials audiovisuals
- Art digital i literatura electrònica
- Jocs digitals, realitat virtual i programari
- Manuscrits digitals
- Imatges
- Materials miscel·lanis
- Recursos web i d'informació en línia
- Materials digitals en suports físics
- Dades científiques, estadístiques i d'investigació
- Dades geoespacials i semblants
- Recursos de notícies i d'una altra informació d'actualitat
Per suport
La tipologia de format per suport és de les més emprades popularment, sobretot en el camp de la informàtica. És la tipologia més comuna de classificació de formats, on s'identifiquen els fitxers en funció de l'extensió d'arxiu i es determina d'aquesta manera al grup al qual pertanyen.
- Document (DOC, RTF, RTFD, PDF, XSD, PS)
- Imatge (JPG, JPEG, GIF, PNG, PSD, tif/tff, EPS)
- Àudio (WAV, MP3, AAC)
- Vídeo (WMV, AVI, RM, MPG)
- Full de càlcul (XLS, XSC)
- Estadística (SPSS)
- Diagrama o disseny (Visio, AutoCAD)
- Bases de dades (SQL, MySQL, Oracle, Access)
- Presentacions (PowerPoint)
- Pàgines web
- Text senzill (TXT, XML)
- Arxius (Zip, Stuffit)
- Text especialitzat (LaTEX)
Per propòsit
La tipologia per propòsit, proposada principalment pel Projecte DELOS i la Digital Preservation Coalition[6] va elaborar la tipologia de formats segons l'objectiu o funció que els arxius tenien alhora de ser emprats.
- Document o similar a un document (o "document-like")
- Imatges
- So
- Imatges en moviment
- Dades en brut
- Gràfics estructurats
- Bases de dades
- Col·leccions
- Configuració i metadada
Per gestió a llarg termini
Aquesta és la tipologia més important quan s tracten els formats des de la perspectiva de la preservació digital. Tot i que en l'actualitat molt del programari existent es desenvolupa amb la capacitat de ser compatible amb arxius de versions anteriors, permetent així un cert grau d'interoperabilitat entre programes, l'opció més segura per garantir l'accés a les dades d'un arxiu a llarg termini és convertir dita informació en un format estàndard que segui interpretable per la major quantitat de programes possibles, fent-lo així més apte per ser processat amb la mínima pèrdua d'informació. La United Kingdom Data Archive ha dissenyat[7] amb aquest objectiu una sèrie de recomanacions referents als formats de dades i programari més adequats per preservar la informació que contenen.
Tipus de Dada | Formats d'arxiu recomanats per compartir, editar i preservar a llarg termini |
---|---|
Dades quantitatives amb metadades extensives. Conjunt de dades amb etiquetes variables, etiquetes codificades i amb valors absents definits, a més a més de les matrius de dades | SPSS format portable(.por. Arxiu de comandament ('setup') i text delimitat (SPSS, Stata, SAS,etc.)que conte informació de metadades arxiu. també pot contenir parcialment o totalment text amb informació de metadades, com per exemple un arxiu DDI XML |
Dades quantitatives amb metadades mínimes. Matriu de dades amb encapçalaments de columna o noms variables, o sense, però sense cap altre metadada o etiquetatge | Arxius amb valors separats per comes (.csv)Arxius delimitats (.tab), incloent text delimitat d'un donat conjunt de caràcters amb instruccions de definició de dades SQL si escau |
Dades geoespacials. Dades de 'Vector' i 'Raster' | ESRI Shapefile (essencialment: .shp, .shx, .dbf; optional: .prj, .sbc, .sbn), Geo-referenciat TIFF (.tif, .tfw), Dades CAD (.dwg) i dades d'atributs GIS tabulats |
Dades Qualitatives. Textuals | Text amb llenguatge 'eXtensible Mark-up'(XML)d'acord amb un apropiat tipus de document (DTD) o es esquema (.xml). Format de Text enriquit (.rtf). Dades de text pla, ASCI (.txt) |
Dades d'Imatge Digital | TIFF versió 6 sense comprimir (.tif) |
Dades d'Àudio Digitals | Còdec d'àudio lliure sense pèrdua (FLAC) (.flac) |
Dades de Vídeo Digital | MPEG-4 (.mp4), motion JPEG 2000(.jp2) |
Documentació | Format de text enriquit (.rtf), PDF/A o PDF (.pdf), Text OpenDocument (.odt) |
Vegeu també
- Preservació digital
- Format de fitxer
- Dispositiu d'emmagatzematge de dades
- Document electrònic
- Dipòsit digital fiable
- Dipòsit institucional
- Migració de dades
Referències
- ↑ Data Dictionary for Preservation Metadata: PREMIS version 2.0, pàg. 212
- ↑ Digital Curation Center
- ↑ «Global Digital Format Registry». Arxivat de l'original el 2014-07-05. [Consulta: 22 març 2014].
- ↑ PRONOM Technical Registry
- ↑ National Library of Australia mediapedia
- ↑ «Digital preservation Coalition 2.10 File format preservation, August 2008». Arxivat de l'original el 2013-11-02. [Consulta: 22 març 2014].
- ↑ Data Management Planning
Bibliografia
- Giralt, Olga; Alòs-Moner, Adela «PREMIS Workshop en Roma». El profesional de la información, 18, 4, Julio-Agosto 2009. Arxivat de l'original el 2016-03-03 [Consulta: 22 març 2014].
- Keefer, Alice «Preservación digital y depósitos institucionales». El profesional de la información, 14, 1, Noviembre-Diciembre 2005.[Enllaç no actiu]
- Marcos, Mari Carmen «Los archivos en la era digital». El profesional de la información, 6-1999. Arxivat de l'original el 2012-06-21 [Consulta: 22 març 2014].
- Serra Serra, Jordi «Gestión de los documentos digitales: estrategias para su conservación». El profesional de la información, 10, 9, 9-2001. Arxivat de l'original el 2014-04-07 [Consulta: 22 març 2014].
- Térmens, Miquel. Preservación digital. UOC, 2013. ISBN 978-84-9029-819-0.
- Térmens, Miquel «Investigación y desarrollo en preservación digital: un balance internacional». El profesional de la información, 18, 6, Noviembre-Diciembre 2009. Arxivat de l'original el 2016-03-04 [Consulta: 22 març 2014].
- Térmens, Miquel; Ribera, Mireia «El control de los formatos en la preservación digital». Actas Fesabid, 2009. Arxivat de l'original el 2016-03-04 [Consulta: 22 març 2014].
Enllaços externs
- Digital Curation Center (anglès)
- Digital Preservation and Records Management Programs (anglès)
- The National Archives, UK (anglès)
- PLANETS (Preservation and Long-term Acces through Networked Services) (anglès)