/* ************************* */ /* per gallery responsive */ /* ************************* */ Salta al contenuto principale
 

Biblioteconomia dei dati: Salvare e archiviare i dati

Salvataggio temporaneo a archiviazione nel tempo

Salvataggio dei dati. Consigli pratici

  • creare una struttura coerente di cartelle e sotto-cartelle;
  • utilizzare un formato di dati adeguato per evitarne l’obsolescenza e illeggibilità dei dati: scegliere formati open ossia non proprietari (p.e. png, pdf, ecc.) e quelli che solitamente vengono raccomandati dagli archivi che conservano i dati) che consentono sempre la lettura, cfr. Open ‘Data Handbook, formati dei dati’ oppure DANS preferred file formats 
  • per la denominazione delle cartelle e dei file scegliere una sintassi chiara ed univoca, di seguito alcuni suggerimenti:
    • se si utilizza la data, usare questo formato:  YYYYMMDD o yymmdd.
    • Evitare l’uso di caratteri non alfanumerici o speciali come ?\!@*%{[<> nel nome del file. 
    • Usare nomi brevi, coerenti e significativi, evitare sostantivi ricorrenti, come p.e. libro, ricerca, ecc.
    • Evitare ripetizioni non necessarie p.e. tra il percorso della cartella e il file (/.../Corte/20151030CorteVerbale.rtf), tranne il caso in cui non si è certi della struttura delle cartelle e si vuole rendere più “indipendente” il file.
    • Evitare di utilizzare spazi o underscore (_) per delimitare le parole nel nome, ma scrivere la prima lettera maiuscola, p.e. RiskManagement.pdf e non risk_management.pdf o risk management.pdf.
    • Quando si inserisce un numero nel nome, preferire l’utilizzo di due cifre: 01-99
    • Se si include il nome di una persona mettere il cognome prima seguito dalle iniziali del nome, senza utilizzare alcun segno di punteggiatura
    • Ordinare i vari elementi del nome nel modo più opportuno.
    • Per indicare la versione usare la lettera V e quindi la numerazione a due cifre.
    • cfr. anche ‘TILS Document Naming Convention’ dell’Università di Cambridge, oppure 'Naming files and folders', dell’Università di Leicester

Suggerimenti per il salvataggio temporaneo ai fini dell'analisi dei dati e della loro eventuale condivisione con il gruppo di ricerca

  • anziché affidarsi a sistemi locali (pc, laptop, disco esterno, pen drive, ecc.) è opportuno utilizzare sistemi in cloud, di VRE (Virtual Research Environment) , per evitare perdite accidentali di dati. Esempi di VRE: Dropbox, OneDrive, B2Drop. 
  • per alcune comunità scientifiche è richiesta la preregistrazione dei dati, mentre per altre potrebbe essere semplicemente utile sia a sostegno della solidità dell’esperimento, sia nella priorità sulla paternità dell’idea.  Alcuni strumenti utili a tal fine sono
  • Come conservare i raw data: Raw data, backup and versioning - guida dal sito OpenAIRE

Archiviazione dei dati

L’archiviazione dei dati è richiesta obbligatoriamente per alcuni progetti di ricerca finanziati.

Innanzitutto, in fase di archiviazione è opportuno valutare quali dati dovranno essere conservati, cfr. “Riding the wave. How Europe can gain from the rising tide of scientific data. Final report of the High Level Expert Group on Scientific Data. A submission to the European Commission” ottobre 2010. In questo report dell’Unione Europea i dati vengono classificati in classi, in quanto non tutti i dati hanno la stessa importanza ai fini dell’archiviazione.

L’immagine sotto riportata illustra la complessità dell’ecosistema dei dati. Alla base della piramide ci sono i dati più abbondati, transitori: miliardi di file di dati personali al mondo, presenti su supporti magnetici personali che hanno valore solamente per chi li ha creati o per chi li usa.

Al vertice della piramide si trovano i dati pregiati di alto valore, difficili da riottenere, insostituibili e con un maggiore potenziale di riutilizzo per una intera nazione o società, immagazzinati in più archivi nazionali o internazionali affidabili. Nel mezzo si ritrovano i dati ciclici utili ad un livello medio, comunitario o regionale, per finalità circoscritte.

© European Union, 2010

Gli archivi dei dati sono luoghi di pubblicazione degli stessi. Dovrebbero il più possibile assolvere alle caratteristiche FAIR, certificabili attraverso meccanismi di validazione affidabilità, come il CoreTrustSeal (CTS).

I metadati sono sempre accessibili, mentre l’accesso ai dati è definito dai responsabili dei dati, in conformità alle richieste degli enti finanziatori e nel rispetto dei diritti di proprietà sui medesimi.

Quando si passa all’archiviazione dei dati, se si sceglie la modalità open access è bene verificare le possibili licenze che possono essere utilizzate

Criteri per individuare i repository più adatti per archiviare i dati

Directory di repository di dati

  • Re3data - Registry of Research Data Repository. Directory che permette di trovare il repository più adatto per la conservazione dei dati, attraverso una ricerca o filtrando per ambito disciplinare.

Repository di dati generalisti

  • Zenodo - Fornisce un servizio di archiviazione di dati utile soprattutto per i progetti europei

Metadati – schemi e standard

I metadati sono “dati sui dati” ossia la descrizione dei dati. La funzione dei metadati è quella di rendere i dati rintracciabili più facilmente; servono a fornire informazioni standardizzate e strutturate, comprensibili dall'uomo e leggibili dalla macchina.

I metadati contribuiscono a citare e a disambiguare i dati

Ciascuna comunità scientifica può necessitare di diversi standard . Così come avviene negli archivi delle pubblicazioni, anche per quelli dei dati si possono utilizzare standard trasversali a tutte le comunità, come p.e.  Dublin Core Metadata Element Set o ISO 15836:2009 . I metadati di questo tipo possono essere classificati come nella tabella sottostante:

Per altri tipi di standard per comunità scientifica è possibile consultare

Tipi di metadati

Obiettivo

Esempio

Metadati descrittivi

Descrizione minima per ritrovare un oggetto digitale. Sono utili a questo fine anche metadati di contestualizzazione

Autore, titolo, abstract, data, luogo, metodo/strumenti di raccolta, riferimento temporale

Metadati strutturali

Mettere in relazione i dati con prodotti e risorse collegate

Link ad oggetti digitali collegati (p.e. articoli scritti che si basano sui dati della ricerca collegati)

Metadati tecnici

Informazione sugli aspetti tecnici dei dataset

formati, hardware/software utilizzati, calibrazione, versione, autenticazione, crittografia, standard di metadati

Metadati amministrativi

Esplicitare termini di utilizzo e gestione degli oggetti digitali

Licenze, eventuali spiegazioni per un embargo, waivers

Search logs, traccia dell’utilizzo

 

Altre informazioni sui metadati si possono trovare nei siti di organizzazioni come:

title
Loading...