Arriva "Kyoto", il web search che trova tutto

CNR

Si chiama “Kyoto” (Knowledge yielding ontologies for transition-based organization) ed è il nuovo progetto promosso dall’Unione Europea che renderà più facile la ricerca di informazioni sul web. “Kyoto”, infatti, è un algoritmo che, come una bussola, ci aiuterà a cercare di tutto nel marmagnum del web. Superando i limiti linguistici e il modo di rispondere degli attuali motori di ricerca semantici, aprendo alla “traduzione” di ogni tipo di domanda e fornendo, nella lingua usata per la richiesta, le risposte più mirate. Anche l’informazione originaria è solo negli ideogrammi cinesi.

«Si tratta di un motore di ricerca -spiega il Cnr- capace di rispondere alle domande e interpretare le parole chiave a seconda del contesto, senza vincoli linguistici di sorta. Un “motore di ricerca semantico” che promette di essere la bussola più evoluta per navigare nel mare magnum di internet. Così, circoscrivendo la ricerca a particolari domini di interesse, il nuovo algoritmo consentirà di effettuare ricerche componendo domande nella propria lingua, ricevendo vere e proprie risposte».

Attualmente “Kyoto” parla italiano, inglese, spagnolo, basco, olandese, cinese e giapponese, ma la sua struttura modulare consentirà di accettare qualsiasi nuovo linguaggio. Il progetto, inoltre, limita le sue ricerche a un particolare dominio di conoscenza, le problematiche ambientali e, di qui, il nome “Kyoto”, ispirato all’omonimo Protocollo. «Il problema -affermano Maurizio Tesconi e Andrea Marchetti dell’Istituto di informatica e telematica (Iit) del Cnr di Pisa- è che l’estensione di un dizionario e dell’ontologia per diversi settori della conoscenza è un lavoro oneroso, che richiede la partecipazione di molte persone, le quali devono trovare un consenso generale sui concetti da legare ai singoli termini».

«L’Istituto di informatica e telematica del Cnr -aggiungonoTesconi e Marchetti- è impegnato proprio nella creazione di strumenti che consentano in modo facilitato di estendere tali dizionari. E il modello di riferimento è quello “collaborativi”, già sfruttato con successo per l’enciclopedia online Wikipedia».

«Grazie ai motori semantici -sottolinea Tesconi- le ricerche restituiranno risposte nella lingua madre dell’utente, estraendole dai documenti presenti in rete anche se appartengono ad altre lingue. Un esempio? Si potrà chiedere “se esiste un servizio pubblico che collega Pechino con la muraglia cinese” e ricevere la risposta: “Pechino è collegata con…; tramite...”, anche se la fonte di informazioni è un documento scritto in ideogrammi cinesi».

Così, abituati a setacciare la rete tramite Google, da cui è nato il neologismo 'I google' che per gli anglosassoni è sinonimo di 'sto facendo ricerche sul web', gli utenti ben conoscono le difficoltà di raggiungere il bersaglio. Cercare informazione sul web è un'impresa titanica che richiede molta pazienza e, sempre più spesso, anche l'utilizzo di qualche espediente tecnico non proprio alla portata di tutti. “…Google si basa sulle parole digitate dall'utente, escludendo quei termini che hanno poca rilevanza come articoli o preposizioni – ha affermato Marchetti - e la sua fortuna sta nel modo con cui vengono riordinati i risultati. Google, infatti, assegna delle priorità alle singole pagine in base al numero di collegamenti che da altre pagine puntano alla pagina in questione. Per esempio, se nella pagina A c’è un link alla pagina B, questo viene assunto da Google come un voto per B".

“Motori di ricerca come Google – ha aggiunto Marchetti - soffrono però del fatto che si limitano a cercare le parole chiave inserite dall'utente, ignorando ogni possibile significato riposto nella domanda. Se scrivessi 'qual è la montagna più alta d'Europa', Google considererebbe le singole parole (qual, è, montagna, più, alta, Europa), ma ne ignorerebbe completamente il significato”.

06 Aprile 2009