TECNOLOGIA

Un supercomputer virtuale contro il Covid-19: il cloud di Amazon mette il turbo al progetto Folding@home

Milioni di simulazioni sul virus attraverso il sistema di computing distribuito che si avvale del registro di Open data su Aws. A quota 200mila le adesioni in tutto il mondo

Pubblicato il 26 Ago 2021

Shot of Corridor in Working Data Center Full of Rack Servers and Supercomputers with Blue Neon Visualization Projection of Data Transmission Through High Speed Internet.

Tocca quota 200mila il numero di persone in tutto il mondo che hanno donato la propria capacità di calcolo allo studio del Covid-19. E’ il risultato di Folding@home, il progetto che utilizza il calcolo distribuito per studiare l’origine di diverse malattie, tra cui anche il cancro, l’Ebola e l’Alzheimer. Al centro la piattaforma di cloud on-demand messa a disposizione da Amazon.

Come partecipare al progetto

Gestito dal Folding@home Consortium, rete mondiale di laboratori di ricerca, il progetto cerca di affrontare i problemi sanitari su una scala altrimenti impossibile da raggiungere, condividendo i risultati di questi maxi-studi con la comunità di ricerca attraverso pubblicazioni peer-reviewed e set di dati condivisi pubblicamente.

Scaricando il software Folding@home e lasciandolo lavorare in background sul proprio computer, chiunque, ovunque, può aiutare i ricercatori a eseguire simulazioni del comportamento delle proteine implicate nello sviluppo del virus da Covid-19.

Nei progetti di calcolo massivamente distribuiti le persone possono prestare la propria potenza di calcolo di riserva per una specifica iniziativa. Questo solitamente aiuta a generare un numero enorme di calcoli o simulazioni necessarie per risolvere un problema complesso. Folding@home, ad esempio, utilizza simulazioni al computer per capire i movimenti delle proteine implicate in una varietà di malattie, tra cui Covid-19.

Come funziona Folding@home

Il risultato di questa collaborazione globale è la prima risorsa di calcolo largamente distribuita. Un supercomputer in grado di fare un quintilione di calcoli al secondo, che sta generando set di dati di dimensioni senza precedenti, e che Folding@home sta mettendo a disposizione dei ricercatori di tutto il mondo attraverso il Registro di Open Data su Amazon Web Services.

“Le nostre simulazioni sono essenzialmente un numero enorme di immagini di ciò a cui una proteina assomiglia – dice Greg Bowman, Direttore del progetto Folding@home -. Se avessimo solo 10 immagini, potremmo guardarle manualmente, confrontarle e fare delle considerazioni. Tuttavia, abbiamo centinaia di milioni di immagini. L’enorme quantità di dati e la nostra larghezza di banda limitata come esseri umani significa che tutto ciò che facciamo deve essere automatizzato”.

“È per questo che abbiamo bisogno di una così elevata quantità di potenza di calcolo ed è il motivo per cui stiamo rendendo i dati disponibili nel cloud di Aws. Abbiamo bisogno del maggior numero possibile di cervelli che lavorino su di esso in parallelo, al fine di raccoglierne i frutti”.

“Stiamo attivamente utilizzando questi dati per la scoperta di nuovi farmaci – prosegue Bowman -. Abbiamo prodotto fase di test e speriamo di sviluppare un nuovo studio clinico nei prossimi sei mesi. Abbiamo dato il via a questo progetto per rispondere ad alcune domande di ricerca di base, e la risposta finora ha completamente superato le nostre aspettative”.

Gli obiettivi del progetto

Ad oggi, Folding@home ha prodotto più di 100mila volte di dati sul virus rispetto a quelli creati tipicamente per altri studi di simulazione. Prima che Folding@home rendesse questi dati disponibili sul Registro degli Open Data di AWS, accedervi era incredibilmente dispendioso e complesso, viste le dimensioni dei file. Spesso tutto ciò richiedeva l’invio di hard disk fisici per condividere un set di dati. Grazie al cloud, tutte le parti interessate possono accedere alle informazioni e scaricarle più rapidamente, su richiesta.

Folding@home è uno dei numerosi set di dati messi a disposizione nel cloud tramite l’Aws Open Data Sponsorship Program, che copre il costo di archiviazione per set di dati di alto valore per la comunità scientifica. Il programma mira a democratizzare l’accesso ai dati rendendoli disponibili per l’analisi su Aws, a sviluppare nuove tecniche, formati e strumenti cloud – native che riducano il costo del lavoro con i dati e a incoraggiare lo sviluppo di comunità che beneficiano dell’accesso a set di dati condivisi.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati