IL VADEMECUM

Web scraping, come difendersi: ecco la guida del Garante Privacy



Indirizzo copiato

Le indicazioni, disponibili sul sito dell’authority, spiegano come tenere al sicuro i dati personali online dalla raccolta indifferenziata operata da terzi per addestrare i modelli di intelligenza artificiale

Pubblicato il 3 giu 2024



Data,Protection,And,Cyber,Security,On,Internet,Server,Network,With

Difendere i dati personali degli utenti dal “web scraping”, l’attività di chi raccoglie in maniera indiscriminata le informazioni sensibili sugli utenti pubblicate online da soggetti pubblici e privati titolari del trattamento. E’ questo l’obiettivo delle indicazioni pubblicate dal Garante Privacy sul proprio sito Internet, e in corso di pubblicazione sulla Gazzetta Ufficiale.Si tratta di misure non obbligatorie – spiega il Garante in una nota – che i titolari del trattamento dovranno valutare, sulla base del principio di accountability, se mettere in atto per prevenire o mitigare, in maniera selettiva, gli effetti del web scraping, in considerazione di una serie di elementi come lo stato dell’arte tecnologico e i costi di attuazione, in particolare per le Pmi”.

L’iter del provvedimento

Le linee guida, si legge in una nota dell’authority, sono state messe a punto tenendo in considerazione i contributi che il Garante ha ricevuto in risposta all’indagine conoscitiva che era stata avviata a dicembre 2023.

Le istruttorie del garante sul web scraping

Sulla liceità del web scraping di dati personali il Garante Privacy ha finora avviato alcune istruttorie, tra le quali quella nei confronti di OpenAI. In attesa degli esiti di questi procedimenti “l’Autorità ha ritenuto necessario fornire a quanti pubblicano online dati personali in qualità di titolari del trattamento – si legge in una nota dell’authority – talune prime indicazioni sull’esigenza di compiere alcune valutazioni in ordine all’esigenza di adottare accorgimenti idonei a impedire o, almeno, ostacolare il web scraping”.

Le misure suggerite dal Garante

Tra le attività suggerite dal Garante nelle indicazioni sul web scraping c’è ad esempio la creazione di aree riservate, accessibili solo previa registrazione, in modo da sottrarre i dati dalla pubblica disponibilità. Ma anche l’inserimento di clausole anti-scraping nei termini di servizio dei siti, e il monitoraggio del traffico verso le pagine web per individuare eventuali flussi anomali di dati in entrata e in uscita. L’authority prevede inoltre interventi specifici sui bot utilizzando anche le soluzioni tecnologiche messe a disposizione dalle stesse società responsabili del web scraping.

Articoli correlati

Articolo 1 di 4