Verso il Web Semantico: il Knowledge Graph

(lunedì 4 febbraio)

Con l’avvento degli ultimi algoritmi supportati dai motori di ricerca (Hummingbird e RankBrain su tutti) la tendenza del settore è stata quella di fornire all’utente risultati sempre più specifici e attinenti alle query sottoposte (intento di ricerca). E questo sarà uno dei trend del settore nel 2019.

“Knowledge Graph”, questo sconosciuto

Lo scopo del Google Knowledge Graph (in Italiano “grafo”) fu fin dal principio quello di classificare le informazioni disponibili nel web secondo una serie di relazioni. Gran parte dei servizi tecnologici che utilizziamo poggiano su enormi grafi.

Tutto questo lo fa grazie alla ricerca semantica, mettendo in relazione la query effettuata dall’utente col suo intento di ricerca e le informazioni che potrebbero essere più interessanti.

Il primo cambiamento di Google è stato nell’adozione di un motore semantico che pertanto potesse essere in grado di rispondere alle nuove esigenze di ricerca: di qui il motore di ricerca assume un connotato di intelligenza artificiale.

Lo scopo del Google Knowledge Graph (in Italiano “grafo”) è da sempre quello di classificare le informazioni disponibili nel web secondo una serie di relazioni.

Con il supporto del Knowledge Graph Google è stato in grado di semplificare le ricerche affinando la ricerca semantica in senso stretto.

Come appare in una ricerca un Knowledge Graph

Schematicamente, il Knowledge Graph si presenta come una scheda informativa a destra nella SERP dove poter trovare informazioni su personaggi, luoghi famosi, città, opere d’arte, film, avvenimenti, eccetera (in funzione della query posta)… il tutto senza esplorarne i risultati.

Il pregio di questa soluzione è di ottenere ‘risultati migliori‘ incrociando informazioni provenienti da diverse fonti con altre da siti autorevoli individuati dal motore di ricerca.

Google Duplex


Recentemente, nel maggio del 2018, durante l’annuale conferenza di casa Google per gli sviluppatori, è stata presentata quella che passerà come una novità assoluta per il settore: “Google Duplex”, applicazione di machine learning deputata  a fare il lavoro.

Analizzando Google Duplex, si possono cogliere alcune peculiarità fondamentali: per la tonalità della voce, la capacità di interagire e di condurre la conversazione, Google Duplex sembra praticamente umano. Si comporta come un automa, cioè dietro al programma non c’è nessuno che suggerisce le risposte. L’assistente vocale è indipendente e risponde in maniera dinamica alle interrogazioni; non ha preregistrata nessuna serie di risposte da utilizzare bensì per ciò si basa sul “web visibile”. Potendo contare su un elevato numero di pagine web fornite dal motore di ricerca, di volta in volta è in grado di passare contenuti rilevanti in base a quella che è la ricerca.

In breve, Google Duplex è stato “allenato” ad utilizzare il linguaggio umano partendo da un elevato numero di conversazioni.

Il concetto di machine learning (in cui rientra come detto Google Duplex, che è strettamente correlato a quello di intelligenza artificiale, tecnologie valide che che si contraddistinguono per il fatto di riuscire a processare una mole enorme di dati in maniera velocemente.

Google Knowledge Graph, uno step oltre la parola chiave

16 Maggio 2012, Google annuncia per la prima volta ufficialmente il lancio di un enorme Knowledge Graph.

Prima ancora che Google nascesse, la ricerca era legata all’utilizzo di parole chiave: infatti, la parte di ricerca faceva uso di un semplice matching di parole chiave. Ma le parole chiave non sempre bastano.

Nel momento in cui sottopongo un termine cioé non è dato sapere con quale accezione (in che contesto) debba essere inteso ! ed è proprio qui che interviene la potenzialità del ‘knowledge graph’.

Cosa vuol dire “Knowledge Graph”

Knowledge Graph cambia le cose. Il “graph” sviluppato da Google, infatti, rende il motore di ricerca un elemento più vicino agli utenti e consente di ricevere risposte su cose, persone, luoghi, celebrità, squadre sportive, città, edifici, personaggi storici, opere d’arte. Tutto direttamente all’interno del motore di ricerca. Vengono annullate le ambiguità. Ora è in grado di riconoscere la differenza tra le diverse accezioni del termine e può proporre da subito le risposte alle possibili query.

Mentre maturava l’idea del “grafo”, un ulteriore passo in avanti lo si è fatto nel 2005 quando è stato introdotto il nuovo algoritmo RankBrain mediante cui a fronte di una ricerca è possibile ottenere i migliori risultati possibili, ciò utilizzando quella che viene definita “Intelligenza Artificiale”. Mediante questa, grossi volumi di info e dati vengono trasformati in entità matematiche (“vettori“) comprensibili all’elaboratore.

Web semantico e Reti Semantiche

(lunedì 28 gennaio)

Web Semantico e Reti Semantiche

La necessaria specializzazione degli algoritmi che è sotto gli occhi di tutti gli operatori di settore (e non conosce sosta !!) volta a a fornire risultati sempre più precisi e attinenti a quello che è l’intento di ricerca dell’utente ha determinato il passaggio al ‘Web Semantico’ mediante cui, oltre che ad una riorganizzazione. si realizza pure una revisione strutturale della pagina web.

Con il termine web semantico, termine coniato dal suo ideatore, Tim Berners-Lee, si intende ‘la trasformazione del World Wide Web verso un ambiente dove i diversi tipi di contenuti (dalle pagine HTML alle immagini) vengono semplificati e, tramite associazioni ad informazioni e dati (metadati), convertiti in un formato adatto ad essere compreso e interpretato da un motore di ricerca‘ (rif.: www.wikipedia.org).

In questo modo, saranno possibili ricerche più evolute delle precedenti, basate sulla presenza nel documento di parole chiave, e altre operazioni specialistiche come la costruzione di “reti di relazioni“.’

Per stare al passo con un mondo in cui il linguaggio è via via sempre più complesso (“termini neo-nati si accompagnano a vecchie parole le quali vengono tuttavia utilizzate per definire nuovi significati”), il World Wide Web ha trovato la sua “carta vincente” nel creare una associazione tra tutte le differenti informazioni, internet è stato in grado di rivoluzionare la possibilità di passare da un testo ad un altro grazie ai link, che permettono di cliccare su una parola per essere catapultati su altre pagine che ne possono spiegare il significato, dare informazioni.

Una Rete Semantica è una forma elementare di rappresentazione della conoscenza. Schematicamente, è un grafo formato da vertici, che rappresentano concetti, e archi, che rappresentano relazioni semantiche tra i diversi concetti‘ (rif.: www.wikipedia.org). Nate inizialmente come applicazione a supporto dei calcolatori per la traduzione “comprensibile” dei linguaggi naturali, dagli anni Sessanta le ‘Reti Semantiche’ hanno cominciato ad assumere rilevanza culminando nell’enunciato di un certo M. Ross Quillian.

In una definizione di fine anni Novanta, Tim Berners-Lee ammise come ‘i pionieri del web ricorderanno bene come fosse allora articolato effettuare ricerche, sulla meticolosità necessaria nello scegliere le keyword giuste e del pericolo che poi comunque i risultati non corrispondessero a quanto voluto’. ‘Nel web semantico, invece, a ogni documento – che sia un file, un’immagine, un testo – sono associate informazioni, metadati, che, fornendo un contesto semantico appunto, ne rendono più facile l’interrogazione e l’interpretazione automatica, da parte di un motore di ricerca.’


Il web semantico è un web a misura di utente


Ivano Di Biasi afferma che il web semantico è “un metodo per comunicare diversamente con il motore di ricerca, per dargli i dati già pronti ed evitargli di doverli capire da solo analizzando i testi. Un modo, ancora, per rendere più facile a Google acquisire informazioni rapidamente, dal momento che i contenuti aumentano a dismisura ogni giorno, e dare anche i risultati più rapidamente, avere le risposte esatte a ogni esigenza degli utenti“.

Il Web Semantico apre ad una nuova frontiera del web: Web 3.0. Si può pensare a un Web 3.0 dunque per indicare una serie di cambiamenti che di fatto assumono una rilevanza indiscutibile ed inedita se si pensa a come si intendeva il web in passato, a com’era concepito, per l’utente e le sue esigenze.

Intelligenza informatica e Web semantico

Nello specifico, nel mondo informatico, si parla di intelligenza semantica per indicare quelle tecnologie in grado di trasformare informazioni non strutturate, ad esempio i diversi contenuti di un sito web, in un insieme (database) di informazioni strutturate che può essere interpretato ed elaborato automaticamente… ciò è reso possibile dalla combinazione di analisi semantica e codici di mark-up. Dunque, esiste una analogia fra le cosiddette Reti Semantiche e Web Semantico.
Su di essa si basa il concetto di Web 3.0: il World Wide Web si trasforma in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini e così via) diventano interpretabili, cioè vengono associati a informazioni e metadati che ne specificano il contesto semantico in un formato adatto all’interrogazione, all’interpretazione e, più in generale, all’elaborazione automatica.

Riferimenti e approfondimenti:

https://www.insidemarketing.it/web-semantico-caratteristiche/

http://www.x-manager.it/2097