/* ************************* */ /* per gallery responsive */ /* ************************* */ Salta al contenuto principale
 

Biblioteconomia dei dati: Dati FAIR e riproducibilità della ricerca

Dati FAIR e buone pratiche

"As open as possible - As closed as necessary"

Già nell'ambito del progetto Horizon 2020, l'Open Research Data Pilot, prevedeva che i dati dovessero essere trattati in modo più possibile "FAIR": "as open as possible", ma anche "as closed as necessary", ossia non necessariamente open per motivate ragioni.

L'immagine sotto rappresenta i diversi livelli di sovrapposizione quando si parla di condivisione dei dati.

 

    

Emma Lazzeri, Open Science Is The New Normal – UiS Open Access week 2021

Nella gestione dei dati esistono buone pratiche che ne consentono l'utilizzo, la condivisione e il riutilizzo nel tempo. Tali buone prassi sono state integrate, ormai da anni, nei bandi di finanziamento della ricerca scientifica da parte della Commissione Europea. 

In fase di condivisione, è sempre necessario tenere presente che il trattamento e il riutilizzo dei dati provenienti da fonti terze deve avvenire nel rispetto della protezione dei dati personali ai sensi della normativa GDPR, nonché dei principi etici legati alla ricerca. In proposito è utile consultare la sezione dedicata nel sito dell'Ateneo. Per quanto riguarda il copyright e le licenze d'uso è possibile consultare le schede dedicate in questa pagina.

Riproducibilità della ricerca

Un tema strettamente collegato con le buone pratiche sui dati della ricerca, è quello della riproducibilità della ricerca: ossia la possibilità di mettere a disposizione i dati grezzi e il codice della ricerca in modo che altri possano conseguire gli stessi risultati così come sono stati presentati nelle conclusioni del lavoro di ricerca. Strettamente connesso è il concetto di replicabilità il quale consente di riprodurre una metodologia scientifica per raggiungere analoghe conclusioni. Entrambi i due concetti sono componenti cruciali della ricerca empirica.

Migliorare la riproducibilità comporta maggior rigore e qualità dei prodotti scientifici e di conseguenza un maggior grado di affidabilità della scienza. Sempre di più si percepiscono il bisogno e la volontà di esporre il flusso della ricerca, dal momento cioè in cui un progetto inizia, passando per la raccolta dei dati fino all’interpretazione e alla presentazione dei risultati. Tali sviluppi implicano naturalmente delle sfide inclusa la creazione di flussi di lavoro integrati della ricerca che possono essere adottati dai collaboratori mantenendo al tempo stesso standard di integrità molto elevati.

Il concetto di riproducibilità è direttamente applicabile al metodo scientifico, cardine della scienza, e in particolare attraverso le seguenti cinque fasi:

  1. Formulazione di un’ipotesi

  2. Pianificazione dello studio

  3. Conduzione dello studio e raccolta dei dati

  4. Analisi dei dati

  5. Presentazione dei risultati dello studio

Per ognuna di queste fasi si dovrebbe riuscire a produrre una documentazione chiara e aperta in modo da rendere lo studio trasparente e riproducibile.

Sul tema è possibile seguire l'iniziativa dell'Italian Reproducibility Network, che organizza un ciclo di seminari, Online Seminars on Open Science

 

EOSC e libera circolazione dei dati

Nel documento della Commissione europea attualmente a disposizione, il documento preparatorio “Proposta di regolamento del Parlamento europeo e del Consiglio che istituisce Orizzonte Europa – il programma quadro di ricerca ed innovazione – e ne stabilisce le norme di partecipazione e diffusione”, Bruxelles, 7.6.2018, COM (2018) 435 final, nei consideranda sotto il paragrafo intitolato “Norme in materia di partecipazione e diffusione”, pp. 10 11, sotto il cappello della “Scienza aperta” troviamo un elenco di azioni fra le quali: la trasformazione in realtà del cloud europeo per la scienza aperta (EOSC, European Open Science Cloud), la libera circolazione dei dati (come da comunicazione della Commissione europea “Verso uno spazio europeo dei dati”, Bruxelles, 25.4.2018, COM (2018) 232 final), il consolidamento dello spazio comune dei dati nell'EU, che permetta la circolazione continua e senza restrizioni delle conoscenze e dei dati, ed infine la creazione degli incentivi necessari per far sì che i beneficiari del programma e gli innovatori condividano risultati e dati a fini di riutilizzo.

Nel testo proposto per l’art. 10 del sopra menzionato regolamento intitolato “Accesso aperto e dati aperti”, si legge al primo comma che è assicurato l’accesso aperto ai dati di ricerca secondo il principio “il più aperto possibile, chiuso il tanto necessario” e al secondo che è assicurata la gestione responsabile dei dati di ricerca in linea con i “Principi FAIR”; al terzo comma viene ribadito che sono promosse le pratiche di scienza aperta che vanno al di là dell’accesso aperto ai prodotti della ricerca e la gestione responsabile dei dati di ricerca.

L'EOSC Portal, European Open Science Portal è un portale inaugurato a novembre 2018, che si pone l’obiettivo di dare l’opportunità di accedere a servizi che rispondono a una gestione ottimale dei dati della ricerca, a partire dalla raccolta, per poi passare alle altre fasi di analisi, di elaborazione, di storage, di gestione, di condivisione e di archiviazione.

Ulteriori informazioni si possono trovare in questi articoli: 

EOSC, l'Europa verso la scienza aperta. 

Deborah Grbac, La trasmissione dell’eredità culturale ed intellettuale delle Nazioni Unite online nel contesto internazionale della definizione di un ecosistema della governance di Internet e in particolare della scienza aperta, Rivista italiana di informatica e diritto - RIID, anno 4, fascicolo 1, 333-343 (2022) , https://doi.org/10.32091/RIID0079,  https://creativecommons.org/licenses/by-nc-sa/4.0/  

Video di Jean-Claude Burgelman (responsabile per le politiche sulla scienza aperta e sui dati della ricerca della Direzione Generale della Commissione Europea per la ricerca e l’innovazione)

L'acronimo FAIR riassume le qualità per una ottimale gestione dei dati ai fini della creazione di uno spazio comune dei dati della ricerca - cfr. i principi così come dettagliati dal progetto GoFAIR -  FAIR principles e presentazione del gruppo di esperti della Commissione Europea  “Turning FAIR into Reality: Final outcomes from the European Commission FAIR Data Expert Group”  :

Findable (Reperibili): i (meta)dati  leggibili dall'uomo e dalle macchine

F1. (Meta)data are assigned a globally unique and persistent identifier

F2. Data are described with rich metadata (defined by R1 below)

F3. Metadata clearly and explicitly include the identifier of the data they describe

F4. (Meta)data are registered or indexed in a searchable resource

Accessible (Accessibili):  garantire l'accesso ai dati attraverso il deposito in archivi sicuri, dove viene fornito ai data-set un identificativo permanente e sono rispettati dei protocolli di comunicazione standard e open. I metadati devono essere sempre disponibili, anche se i dati non lo sono (aperti quanto possibile e chiusi quando necessario). L'accessibilità è inoltre garantita dal deposito dei software in repository che ne permettano l’accesso:

A1. (Meta)data are retrievable by their identifier using a standardised communications protocol

A1.1 The protocol is open, free, and universally implementable

A1.2 The protocol allows for an authentication and authorisation procedure, where necessary

A2. Metadata are accessible, even when the data are no longer available

Interoperable (Interoperabili): utilizzo di linguaggi di rappresentazione e di vocabolari standard per i (meta)dati per la loro interoperabilità fra sistemi diversi, Riferimento qualificato ad altri (meta)dati):

I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.

I2. (Meta)data use vocabularies that follow FAIR principles

I3. (Meta)data include qualified references to other (meta)data

Reusable (Riutilizzabili): i dati devono essere provvisti di un corredo di informazioni per permetterne il riutilizzo. A tal fine i dati devono essere accompagnati da (meta)dati che ne forniscano l'informazione, licenze standard che descrivano le possibilità e le autorizzazioni di riutilizzo in altri contesti;

R1. (Meta)data are richly described with a plurality of accurate and relevant attributes

R1.1. (Meta)data are released with a clear and accessible data usage license

R1.2. (Meta)data are associated with detailed provenance

R1.3. (Meta)data meet domain-relevant community standards

Alcune considerazioni preliminari sulla proprietà dei dati della ricerca

In base al diritto d’autore, gli elementi di fatto, come i dati non possono essere posseduti in base al diritto d’autore. Il diritto di autore protegge solo le espressioni originali. Esistono altre aree del diritto che offrono una sorta di protezione sui dati, ma più limitata rispetto al diritto d’autore (ad esempio il segreto industriale).

I dati di per sé non sono protetti, ma possono esserlo i database se la selezione dei dati e la loro organizzazione è originale.

In Europa esiste una forma di protezione chiamata “Sui Generis Database Right” che si applica a database originali nella loro organizzazione e ottenuti  attraverso un sostanziale investimento in denaro.

La normativa in questione è la direttiva sulle banche di dati Direttiva n. 96/9/CE del Parlamento europeo e del Consiglio dell’11 marzo 1996, relativa alla tutela giuridica delle banche dati. Al suo interno la direttiva è divisa in due parti sul diritto d’autore e sulla tutela delle banche di dati mediante il diritto sui generis.

Una semplice raccolta di dati senza alcuna organizzazione particolare non è soggetta dunque a copyright.

Infine, bisogna altresì ricordare che raccolte di materiali, quali ad esempio testi di pubblicazioni scientifica possono essere tutelati dal diritto di autore in capo agli autori che hanno scritto i testi.

Ne consegue che potenzialmente un database potrebbe avere tre livelli di protezione:

  • i contenuti dello stesso protetti da copyright (ad esempio una raccolta di articoli scientifici scaricati in formato pdf)
  • l’organizzazione originale del data-base
  • la raccolta dei dati, se particolarmente elaborata e costosa.

Per le informazioni sopra riportate si ringrazia Thomas Marangoni, RDA Italia, per un approfondimento sul tema si veda il video della presentazione di Marangoni disponibile nei materiali di approfondimento riportati nella scheda dedicata "Strumenti e approfondimenti".

Conformità legale della propria ricerca: linee guida e checklist

Sganga, Caterina, Gebreyesus, Netsanet Haile, van Wezel, Jos, Foggetti, Nadina, Amram, Denise, & Drago, Federico. (2022). EOSC-Pillar Legal Compliance Guidelines for Researchers: a Checklist (printable version). Zenodo. https://doi.org/10.5281/zenodo.6327691

Licenza d'uso

Rendere disponibili i dati non equivale a dare il permesso di effettuare data mining o di riutilizzarli liberamente. L’indicazione di poterlo fare deve essere sempre esplicita.

La licenza è il contratto con il quale il titolare dei diritti di sfruttamento economico definisce il regime giuridico di circolazione e le limitazioni nell'utilizzo e nella cessione del suo lavoro.

Quando i dati vengono resi disponibili ad accesso aperto sul web è possibile far uso delle licenze Creative Commons, che sono utili perché rendono esplicito in maniera chiara quali azioni sono possibili con i dati messi a disposizione... sono anche "comode" o facili da utilizzare perché codificano licenze preconfezionate.

La scelta di una licenza restrittiva piuttosto che di una più permissiva può pregiudicare la possibilità di combinare dataset con diversi tipi di licenze.

Per questo motivo, per i dati non coperti da copyright, la licenza più adeguata ai fini dello sviluppo della ricerca scientifica è la CC0 Public Domain Dedication Licence, che è stata creata appositamente per liberare qualsiasi ostacolo legale o tecnologico al riutilizzo dei dati. In generale si può scegliere tra le Licenze Creative Commons che offrono una modalità standard di condivisione dei contenuti, con diverse modulazioni di permessi.

«Le Creative Commons Public Licenses (CCPL) sono delle licenze di diritto d'autore che si basano sul principio de "alcuni diritti riservati".
Le CCPL, infatti, rendono semplice, per il titolare dei diritti d'autore, segnalare in maniera chiara che la riproduzione, diffusione e circolazione della propria opera è esplicitamente permessa. Il funzionamento delle CCPL è reso possibile dal fatto che la legge italiana sul diritto d'autore - così come, in generale, le corrispondenti normative nazionali e internazionali - riconosce al creatore di un'opera dell'ingegno una serie di diritti; allo stesso tempo, la legge permette al titolare di tali diritti di disporne.[...]
»

Per l'Italia sono state create sei tipi di licenze, cfr. il sito Le Creative Commons Public Licenses (CCPL) italiane.

Lo schema sotto riassume come è possibile combinare le varie possibilità dei termini di concessione di riutilizzo dell'opera, utilizzando le licenze Creative Commons.

https://foter.com/blog/how-to-attribute-creative-commons-photos/

Licenza d'uso per software

Buone pratiche

Controllo della conformità dei propri dati ai principi FAIR e non solo

Open Science e dati

Copyright e dati

Licenze d'uso

Risorse varie e suggerimenti

FAIR data e buone pratiche

title
Loading...