Rendere aperti i dati della ricerca è un passo fondamentale verso la Open Science. L’espressione Open Data si riferisce alla pratica della condivisione dei dati generati nell’ambito della ricerca, così come i risultati pubblicabili vengono condivisi in Open Access.
Per “dati della ricerca” si intende ogni informazione che è stata raccolta, osservata, generata o creata per validare un risultato scientifico. Possono avere anche la forma di osservazioni, immagini, risultati di programmi informatici, registrazioni, misure o esperienze sulle quali si basa un’argomentazione, teoria, esperimento o ipotesi o altro risultato di ricerca. I dati possono essere numerici, descrittivi, visuali o tattili; grezzi, puliti o processati; possono essere conservati in ogni formato o media. Per potere essere riutilizzati devono essere accompagnati dai relativi metadati. Tutte le discipline sono quindi interessate, non solo le scienze esatte.
Si possono rendere pubblici i dati:
- depositandoli in un archivio aperto, es. Zenodo, Dryad, Figshare. Il sito Re3data raccoglie data repositories per ogni disciplina;
- pubblicandoli come dataset in un Data Journal: sono riviste che pubblicano unicamente dataset con le relative schede di descrizione;
- come supplementary material degli articoli pubblicati su riviste scientifiche.
Dati FAIR
La condivisione dei risultati delle ricerche (dati e pubblicazioni) implica questioni di conservazione, accesso, integrità, licenze. Per essere davvero open, i dati devono essere FAIR, ovvero Findable - Accessible - Interoperable - Reusable, dunque reperibili, accessibili, interoperabili e riutilizzabili (Barend Mons et al., The FAIR Guiding Principles for scientific data management and stewardship in Scientific Data, 2016).
Questo significa standardizzare i metadati che consentono di reperire i dati, depositare i dati stessi in repositories sicuri, accertarsi che siano interoperabili e che il software di interpretazione sia disponibile, infine dotarli di licenze aperte del genere creative commons.
I dati FAIR possono essere aperti o chiusi; infatti “accessibile” non è sinonimo di “aperto”, in quanto ci possono essere dati FAIR chiusi per ragioni di sicurezza, o per ragioni di proprietà intellettuale. La Commissione Europea riconosce che alcuni dati non possono essere resi accessibili e applica pertanto il principio “aperto quanto possibile e chiuso quanto necessario”: è quindi possibile decidere di non rendere disponibili i dati per motivi di proprietà intellettuale, di privacy e protezione dei dati, di sicurezza nazionale, perché la ricerca non genera/utilizza dati o per altre legittime ragioni da specificare. A parte queste eccezioni, tutti i progetti finanziati dalla Commissione Europea - e sempre più anche da altri enti - hanno l’obbligo di rendere aperti i dati che supportano i risultati della ricerca.
Data Management Plan
La compatibilità dei dati prodotti dalla ricerca con i principi FAIR è garantita dalla corretta elaborazione del Data Management Plan (DMP), un documento che descrive come i dati utilizzati o generati dalla ricerca verranno gestiti durante e dopo la vita del progetto. Horizon Europe richiede ai progetti finanziati come deliverable obbligatorio un DMP entro il mese 6 e mette a disposizione un template che raccogliere gli aspetti principali del ciclo di vita dei Dati della Ricerca.
Infine, La Commissione suggerisce di prevedere la formazione di nuove figure professionali, data manager e data steward, per una sorta di “certificazione della qualità” dei dati; tali nuove figure professionali dovrebbero venire integrate nello staff di supporto al personale di ricerca.