Questo sito utilizza cookie per raccogliere informazioni sull'utilizzo. Cliccando su questo banner o navigando il sito, acconsenti all'uso dei cookie. Leggi la nostra cookie policy.OK

Arriva “Kyoto”, il web search che trova tutto

06 Apr 2009

Si chiama “Kyoto” (Knowledge yielding ontologies for
transition-based organization) ed è il nuovo progetto promosso
dall’Unione Europea che renderà più facile la ricerca di
informazioni sul web. “Kyoto”, infatti, è un algoritmo che,
come una bussola, ci aiuterà a cercare di tutto nel marmagnum del
web. Superando i limiti linguistici e il modo di rispondere degli
attuali motori di ricerca semantici, aprendo alla “traduzione”
di ogni tipo di domanda e fornendo, nella lingua usata per la
richiesta, le risposte più mirate. Anche l’informazione
originaria è solo negli ideogrammi cinesi.

«Si tratta di un motore di ricerca -spiega il Cnr- capace di
rispondere alle domande e interpretare le parole chiave a seconda
del contesto, senza vincoli linguistici di sorta. Un “motore di
ricerca semantico” che promette di essere la bussola più evoluta
per navigare nel mare magnum di internet. Così, circoscrivendo la
ricerca a particolari domini di interesse, il nuovo algoritmo
consentirà di effettuare ricerche componendo domande nella propria
lingua, ricevendo vere e proprie risposte».

Attualmente “Kyoto” parla italiano, inglese, spagnolo, basco,
olandese, cinese e giapponese, ma la sua struttura modulare
consentirà di accettare qualsiasi nuovo linguaggio. Il progetto,
inoltre, limita le sue ricerche a un particolare dominio di
conoscenza, le problematiche ambientali e, di qui, il nome
“Kyoto”, ispirato all’omonimo Protocollo. «Il problema
-affermano Maurizio Tesconi e Andrea Marchetti dell’Istituto di
informatica e telematica (Iit) del Cnr di Pisa- è che
l’estensione di un dizionario e dell’ontologia per diversi
settori della conoscenza è un lavoro oneroso, che richiede la
partecipazione di molte persone, le quali devono trovare un
consenso generale sui concetti da legare ai singoli termini».

«L’Istituto di informatica e telematica del Cnr
-aggiungonoTesconi e Marchetti- è impegnato proprio nella
creazione di strumenti che consentano in modo facilitato di
estendere tali dizionari. E il modello di riferimento è quello
“collaborativi”, già sfruttato con successo per
l’enciclopedia online Wikipedia».

«Grazie ai motori semantici -sottolinea Tesconi- le ricerche
restituiranno risposte nella lingua madre dell’utente,
estraendole dai documenti presenti in rete anche se appartengono ad
altre lingue. Un esempio? Si potrà chiedere “se esiste un
servizio pubblico che collega Pechino con la muraglia cinese” e
ricevere la risposta: “Pechino è collegata con…;
tramite…”, anche se la fonte di informazioni è un documento
scritto in ideogrammi cinesi».

Così, abituati a setacciare la rete tramite Google, da cui è nato
il neologismo 'I google' che per gli anglosassoni è
sinonimo di 'sto facendo ricerche sul web', gli utenti ben
conoscono le difficoltà di raggiungere il bersaglio. Cercare
informazione sul web è un'impresa titanica che richiede molta
pazienza e, sempre più spesso, anche l'utilizzo di qualche
espediente tecnico non proprio alla portata di tutti. “…Google
si basa sulle parole digitate dall'utente, escludendo quei
termini che hanno poca rilevanza come articoli o preposizioni –
ha affermato Marchetti – e la sua fortuna sta nel modo con cui
vengono riordinati i risultati. Google, infatti, assegna delle
priorità alle singole pagine in base al numero di collegamenti che
da altre pagine puntano alla pagina in questione. Per esempio, se
nella pagina A c’è un link alla pagina B, questo viene assunto
da Google come un voto per B".

“Motori di ricerca come Google – ha aggiunto Marchetti –
soffrono però del fatto che si limitano a cercare le parole chiave
inserite dall'utente, ignorando ogni possibile significato
riposto nella domanda. Se scrivessi 'qual è la montagna più
alta d'Europa', Google considererebbe le singole parole
(qual, è, montagna, più, alta, Europa), ma ne ignorerebbe
completamente il significato”.