/* ************************* */ /* per gallery responsive */ /* ************************* */
Salta al contenuto principaleEOSC e libera circolazione dei dati
Iniziativa europea ambiziosa per fornire ai ricercatori, innovatori, imprese e cittadini europei un ambiente con servizi gratuiti e aperti per la gestione, l’analisi e il riuso dei dati della ricerca, di qualsiasi disciplina e senza confini nazionali, l’EOSC (European Open Science Cloud) aveva dapprima avviato un portale, EOSC Portal che, da ottobre 2024, è diventato l’EOSC EU Node, Nodo EOSC Europeo.
Nel documento della Commissione europea attualmente a disposizione, il documento preparatorio “Proposta di regolamento del Parlamento europeo e del Consiglio che istituisce Orizzonte Europa – il programma quadro di ricerca ed innovazione – e ne stabilisce le norme di partecipazione e diffusione”, Bruxelles, 7.6.2018, COM (2018) 435 final, nei consideranda sotto il paragrafo intitolato “Norme in materia di partecipazione e diffusione”, pp. 10 11, sotto il cappello della “Scienza aperta” troviamo un elenco di azioni fra le quali: la trasformazione in realtà del cloud europeo per la scienza aperta (EOSC, European Open Science Cloud), la libera circolazione dei dati (come da comunicazione della Commissione europea “Verso uno spazio europeo dei dati”, Bruxelles, 25.4.2018, COM (2018) 232 final), il consolidamento dello spazio comune dei dati nell'EU, che permetta la circolazione continua e senza restrizioni delle conoscenze e dei dati, ed infine la creazione degli incentivi necessari per far sì che i beneficiari del programma e gli innovatori condividano risultati e dati a fini di riutilizzo.
Nel testo proposto per l’art. 10 del sopra menzionato regolamento intitolato “Accesso aperto e dati aperti”, si legge al primo comma che è assicurato l’accesso aperto ai dati di ricerca secondo il principio “il più aperto possibile, chiuso il tanto necessario” e al secondo che è assicurata la gestione responsabile dei dati di ricerca in linea con i “Principi FAIR”; al terzo comma viene ribadito che sono promosse le pratiche di scienza aperta che vanno al di là dell’accesso aperto ai prodotti della ricerca e la gestione responsabile dei dati di ricerca.
Risorse EOSC per fare Scienza Aperta
Elenco di serivizi disponibili, per utilizzare i quali è necessario effettuare la log in con la propria mail istituzionale e selezionando il nostro Ateneo. Consultare la User Access Policy per ulteriori informazioni.
Breve video di presentazione del nodo EOSC per i servizi di analisi, collaborazione, condivisione e lavorazione dei dati.
Ulteriori informazioni si possono trovare in questi articoli:
EOSC, l'Europa verso la scienza aperta.
Deborah Grbac, La trasmissione dell’eredità culturale ed intellettuale delle Nazioni Unite online nel contesto internazionale della definizione di un ecosistema della governance di Internet e in particolare della scienza aperta, Rivista italiana di informatica e diritto - RIID, anno 4, fascicolo 1, 333-343 (2022) , https://doi.org/10.32091/RIID0079, https://creativecommons.org/licenses/by-nc-sa/4.0/
L'acronimo FAIR riassume le qualità per una ottimale gestione dei dati ai fini della creazione di uno spazio comune dei dati della ricerca - cfr. i principi così come dettagliati dal progetto GoFAIR - FAIR principles e presentazione del gruppo di esperti della Commissione Europea “Turning FAIR into Reality: Final outcomes from the European Commission FAIR Data Expert Group” :
Findable (Reperibili): i (meta)dati leggibili dall'uomo e dalle macchine
F1. (Meta)data are assigned a globally unique and persistent identifier
F2. Data are described with rich metadata (defined by R1 below)
F3. Metadata clearly and explicitly include the identifier of the data they describe
F4. (Meta)data are registered or indexed in a searchable resource
Accessible (Accessibili): garantire l'accesso ai dati attraverso il deposito in archivi sicuri, dove viene fornito ai data-set un identificativo permanente e sono rispettati dei protocolli di comunicazione standard e open. I metadati devono essere sempre disponibili, anche se i dati non lo sono (aperti quanto possibile e chiusi quando necessario). L'accessibilità è inoltre garantita dal deposito dei software in repository che ne permettano l’accesso:
A1. (Meta)data are retrievable by their identifier using a standardised communications protocol
A1.1 The protocol is open, free, and universally implementable
A1.2 The protocol allows for an authentication and authorisation procedure, where necessary
A2. Metadata are accessible, even when the data are no longer available
Interoperable (Interoperabili): utilizzo di linguaggi di rappresentazione e di vocabolari standard per i (meta)dati per la loro interoperabilità fra sistemi diversi, Riferimento qualificato ad altri (meta)dati):
I2. (Meta)data use vocabularies that follow FAIR principles
I3. (Meta)data include qualified references to other (meta)data
Reusable (Riutilizzabili): i dati devono essere provvisti di un corredo di informazioni per permetterne il riutilizzo. A tal fine i dati devono essere accompagnati da (meta)dati che ne forniscano l'informazione, licenze standard che descrivano le possibilità e le autorizzazioni di riutilizzo in altri contesti;
R1. (Meta)data are richly described with a plurality of accurate and relevant attributes
R1.1. (Meta)data are released with a clear and accessible data usage license
"As open as possible - As closed as necessary"
Già nell'ambito del progetto Horizon 2020, l'Open Research Data Pilot, prevedeva che i dati dovessero essere trattati in modo più possibile "FAIR": "as open as possible", ma anche "as closed as necessary", ossia non necessariamente open per motivate ragioni.
L'immagine sotto rappresenta i diversi livelli di sovrapposizione quando si parla di condivisione dei dati.
Emma Lazzeri, Open Science Is The New Normal – UiS Open Access week 2021
Nella gestione dei dati esistono buone pratiche che ne consentono l'utilizzo, la condivisione e il riutilizzo nel tempo. Tali buone prassi sono state integrate, ormai da anni, nei bandi di finanziamento della ricerca scientifica da parte della Commissione Europea.
In fase di condivisione, è sempre necessario tenere presente che il trattamento e il riutilizzo dei dati provenienti da fonti terze deve avvenire nel rispetto della protezione dei dati personali ai sensi della normativa GDPR, nonché dei principi etici legati alla ricerca. In proposito è utile consultare la sezione dedicata nel sito dell'Ateneo. Per quanto riguarda il copyright e le licenze d'uso è possibile consultare le schede dedicate in questa pagina.
Riproducibilità della ricerca
Un tema strettamente collegato con le buone pratiche sui dati della ricerca, è quello della riproducibilità della ricerca: ossia la possibilità di mettere a disposizione i dati grezzi e il codice della ricerca in modo che altri possano conseguire gli stessi risultati così come sono stati presentati nelle conclusioni del lavoro di ricerca. Strettamente connesso è il concetto di replicabilità il quale consente di riprodurre una metodologia scientifica per raggiungere analoghe conclusioni. Entrambi i due concetti sono componenti cruciali della ricerca empirica.
Migliorare la riproducibilità comporta maggior rigore e qualità dei prodotti scientifici e di conseguenza un maggior grado di affidabilità della scienza. Sempre di più si percepiscono il bisogno e la volontà di esporre il flusso della ricerca, dal momento cioè in cui un progetto inizia, passando per la raccolta dei dati fino all’interpretazione e alla presentazione dei risultati. Tali sviluppi implicano naturalmente delle sfide inclusa la creazione di flussi di lavoro integrati della ricerca che possono essere adottati dai collaboratori mantenendo al tempo stesso standard di integrità molto elevati.
Il concetto di riproducibilità è direttamente applicabile al metodo scientifico, cardine della scienza, e in particolare attraverso le seguenti cinque fasi:
Formulazione di un’ipotesi
Pianificazione dello studio
Conduzione dello studio e raccolta dei dati
Analisi dei dati
Presentazione dei risultati dello studio
Per ognuna di queste fasi si dovrebbe riuscire a produrre una documentazione chiara e aperta in modo da rendere lo studio trasparente e riproducibile.
Sul tema è possibile seguire l'iniziativa dell'Italian Reproducibility Network, che organizza un ciclo di seminari, Online Seminars on Open Science
Alcune considerazioni preliminari sulla proprietà dei dati della ricerca
In base al diritto d’autore, gli elementi di fatto, come i dati non possono essere posseduti in base al diritto d’autore. Il diritto di autore protegge solo le espressioni originali. Esistono altre aree del diritto che offrono una sorta di protezione sui dati, ma più limitata rispetto al diritto d’autore (ad esempio il segreto industriale).
I dati di per sé non sono protetti, ma possono esserlo i database se la selezione dei dati e la loro organizzazione è originale.
In Europa esiste una forma di protezione chiamata “Sui Generis Database Right” che si applica a database originali nella loro organizzazione e ottenuti attraverso un sostanziale investimento in denaro.
La normativa in questione è la direttiva sulle banche di dati Direttiva n. 96/9/CE del Parlamento europeo e del Consiglio dell’11 marzo 1996, relativa alla tutela giuridica delle banche dati. Al suo interno la direttiva è divisa in due parti sul diritto d’autore e sulla tutela delle banche di dati mediante il diritto sui generis.
Una semplice raccolta di dati senza alcuna organizzazione particolare non è soggetta dunque a copyright.
Infine, bisogna altresì ricordare che raccolte di materiali, quali ad esempio testi di pubblicazioni scientifica possono essere tutelati dal diritto di autore in capo agli autori che hanno scritto i testi.
Ne consegue che potenzialmente un database potrebbe avere tre livelli di protezione:
Per le informazioni sopra riportate si ringrazia Thomas Marangoni, RDA Italia, per un approfondimento sul tema si veda il video della presentazione di Marangoni disponibile nei materiali di approfondimento riportati nella scheda dedicata "Strumenti e approfondimenti".
Conformità legale della propria ricerca: linee guida e checklist
Sganga, Caterina, Gebreyesus, Netsanet Haile, van Wezel, Jos, Foggetti, Nadina, Amram, Denise, & Drago, Federico. (2022). EOSC-Pillar Legal Compliance Guidelines for Researchers: a Checklist (printable version). Zenodo. https://doi.org/10.5281/zenodo.6327691
Licenza d'uso
Rendere disponibili i dati non equivale a dare il permesso di effettuare data mining o di riutilizzarli liberamente. L’indicazione di poterlo fare deve essere sempre esplicita.
La licenza è il contratto con il quale il titolare dei diritti di sfruttamento economico definisce il regime giuridico di circolazione e le limitazioni nell'utilizzo e nella cessione del suo lavoro.
Quando i dati vengono resi disponibili ad accesso aperto sul web è possibile far uso delle licenze Creative Commons, che sono utili perché rendono esplicito in maniera chiara quali azioni sono possibili con i dati messi a disposizione... sono anche "comode" o facili da utilizzare perché codificano licenze preconfezionate.
La scelta di una licenza restrittiva piuttosto che di una più permissiva può pregiudicare la possibilità di combinare dataset con diversi tipi di licenze.
Per questo motivo, per i dati non coperti da copyright, la licenza più adeguata ai fini dello sviluppo della ricerca scientifica è la CC0 Public Domain Dedication Licence, che è stata creata appositamente per liberare qualsiasi ostacolo legale o tecnologico al riutilizzo dei dati. In generale si può scegliere tra le Licenze Creative Commons che offrono una modalità standard di condivisione dei contenuti, con diverse modulazioni di permessi.
«Le Creative Commons Public Licenses (CCPL) sono delle licenze di diritto d'autore che si basano sul principio de "alcuni diritti riservati".
Le CCPL, infatti, rendono semplice, per il titolare dei diritti d'autore, segnalare in maniera chiara che la riproduzione, diffusione e circolazione della propria opera è esplicitamente permessa. Il funzionamento delle CCPL è reso possibile dal fatto che la legge italiana sul diritto d'autore - così come, in generale, le corrispondenti normative nazionali e internazionali - riconosce al creatore di un'opera dell'ingegno una serie di diritti; allo stesso tempo, la legge permette al titolare di tali diritti di disporne.[...]»
Per l'Italia sono state create sei tipi di licenze, cfr. il sito Le Creative Commons Public Licenses (CCPL) italiane.
Lo schema sotto riassume come è possibile combinare le varie possibilità dei termini di concessione di riutilizzo dell'opera, utilizzando le licenze Creative Commons.
https://foter.com/blog/how-to-attribute-creative-commons-photos/
Licenza d'uso per software
Buone pratiche
Practical Guide to the International Alignment of Research Data Management - Extended Edition - guida di Science Europe (associazione dei principali stakeholder nell'ambito della ricerca scientifica in Europa). Guida divisa in quattro parti: una con le indicazioni sui principali requisiti per i DMP; la seconda sui criteri per la selezione di un repository affidabile; la terza parte per fornire ai ricercatori indicazioni più dettagliate ed esempi per ottemperare al meglio alle necessità organizzative; l'ultima parte una guida a supporto dei revisori dei DMP.
ELIXIR Research Data Management Kit (RDMkit) - Guida appositamente studiata per i ricercatori delle scienze della vita per accompagnarli nella realizzazione della ricerca secondo i principi FAIR. Particolarmente raccomandata per i progetti europei Horizon.
ALLEA Report Sustainable and FAIR data Sharing in the Humanities, febbraio 2020
Controllo della conformità dei propri dati ai principi FAIR e non solo
https://fairassist.org/#!/ - Una lista di strumenti manuali e automatici per valutare il grado di FAIRness di una risorsa
10 Things for Curating Reproducible and FAIR Research
Linee guida di RDA per
The "10 Things for Curating Reproducible and FAIR Research" offer a framework for implementing effective curation workflows for achieving greater FAIR-ness and long-term usability of research data and code. Adoption of the guidelines for curating reproducible and FAIR research will improve the prospects for a reproducible scholarly record.
strumento per dati FAIR in geografia e storia curata da Delft Digital Humanities https://delft-dh.github.io/01-Considerations-for-FAIR-research.html
toolkit creato da Pistoia Alliance per la creazione di dati FAIR in biologia, particolarmente utile perché offre case studies provenienti dall'industria sull'importanza dei FAIR data
https://fairtoolkit.pistoiaalliance.org/
https://fairtoolkit.pistoiaalliance.org/practical-support-for-fair-data/
https://fairtoolkit.pistoiaalliance.org/methods/data-management-plans/
https://fairtoolkit.pistoiaalliance.org/methods/data-capability-maturit
How to FAIR. Iniziativa danese sui dati FAIR
FAIR Evaluation Services - Resources and guidelines to assess the FAIRness of digital resources
Do I-PASS for FAIR. A self assessment tool to measure the FAIR-ness of an organization - Questionario dedicato agli enti di ricerca.
Open Science e dati
Copyright e dati
Sganga, Caterina, Gebreyesus, Netsanet Haile, van Wezel, Jos, Foggetti, Nadina, Amram, Denise, & Drago, Federico. (2022). EOSC-Pillar Legal Compliance Guidelines for Researchers: a Checklist (printable version). Zenodo. https://doi.org/10.5281/zenodo.6327691
Licenze d'uso
Quali licenze per i dati della ricerca –sito del Digital Curation Centre (DDC, punto di riferimento mondiale per l'expertise sulla gestione dei dati).con le indicazioni delle policy degli enti finanziatori in merito al trattamento e alla diffusione dei dati).
Risorse varie e suggerimenti