The data way to science

Condividi su      
 C. Grandi    30-11-2017     Leggi in PDF

The Data Way to Science

Un momento del panel "Towards a national strategy for research infrastructures". (Credits: Edoardo Angelucci, GARR)

Che i risultati delle misure sperimentali siano alla base del processo scientifico è una cosa ormai assodata dai tempi di Galileo Galilei. Che il modo di gestire i dati scientifici, grazie all'evoluzione delle tecnologie informatiche, sia radicalmente cambiato negli ultimi decenni è un fatto altrettanto consolidato. La gestione informatizzata dei dati occupa oggi una posizione centrale nel processo della ricerca. Per questo GARR, l’associazione che gestisce la rete nazionale della ricerca, ha deciso di dedicare la sua conferenza annuale ai dati. Dal 15 al 17 novembre 2017, nella splendida cornice di Venezia, quasi 300 delegati si sono incontrati presso l'Università Ca' Foscari per discutere di come si producono i dati, di come si gestiscono, elaborano e condividono.

Grande interesse hanno suscitato le discussioni sul futuro delle infrastrutture di ricerca in Europa e in Italia. Nell'ambito del calcolo, un ruolo centrale avrà nei prossimi anni la European Open Science Cloud (EOSC), intorno alla quale ruotano molte delle nuove call di Horizon 2020. EOSC, che è un "processo" e non un "progetto", governato da chi fa e supporta la ricerca in Europa, definisce i principi per la gestione dei dati. La parola che durante la conferenza abbiamo imparato molto bene è stata FAIR, un acronimo che significa "Findable, Accessible, Interoperable, Reusable" e che definisce i principi a cui ci dobbiamo attenere nella gestione dei nostri dati.

Si è parlato anche di strategie, sia con esperti di infrastrutture sia con esponenti dei Ministeri, sottolineando l'importanza di presentarsi come comunità compatta per poter avere il giusto peso in ambito europeo. L'esperienza maturata con infrastrutture quali quelle di CINECA per l'High Performance Computing, dell'Istituto Nazionale di Fisica Nucleare (INFN) per la gestione delle grandi quantità di dati di fisica delle alte energie e di GARR per le reti, ci pone in buona posizione nel contesto internazionale, ma avere una strategia comune è essenziale.

Un argomento trattato in diverse occasioni è stato quello relativo alla protezione dei dati sensibili, anche in considerazione degli obblighi previsti dal General Data Protection Regulation (GDPR). L'argomento, poco sentito forse nell’ambito delle discipline fisiche, ha invece molta importanza in altri ambiti di ricerca e ha un forte impatto sociale.

Impossibile tentare di riassumere tutti gli interventi che hanno mostrato come nelle diverse discipline ci si è organizzati per la gestione dei dati. Vale però la pena concludere menzionando un aspetto che più volte è emerso nelle presentazioni e nelle discussioni: è diventato essenziale creare, anche nell'ambito della ricerca, nuove figure professionali legate alla gestione dei dati. Già alcuni Atenei hanno avviato corsi di Laurea o di Dottorato in "Data Science". Queste nuove figure, in realtà già nate in modo spontaneo nelle nostre comunità, devono essere parte integrante del processo di ricerca e devono avere opportune prospettive di formazione e di carriera nelle Università e negli Enti di Ricerca.