Dic
12
La nascita di Google
Dicembre 12, 2007 |
Avevamo già fatto riferimento al concetto di “link popularity” inteso come “grado di notorietà di un sito web all’ interno della rete“.
La reputazione di un sito o di una pagina web viene poi suggellata da Google con l’ assegnazione di un “voto” che porta il nome di PageRank.
Ma da dove nasce l’ idea di dare un voto alla pagina web?
Secondo John Battelle, autore di “Google e gli altri. Come hanno trasformato la nostra cultura e riscritto le regole del business“, è l’ editoria accademica, con tutta la rete di citazioni da cui essa trae la sua linfa vitale, ad aver ispirato Brin e Page al momento della nascita di Google.
La pubblicazione di articoli scientifici è soggetta alla “peer review“, valutazione preventiva di un gruppo di esperti, capaci di stabilire la rilevanza accademica dell’ articolo e la validità delle tesi che in esso sono sostenute.
Per chi opera nel campo della ricerca scientifica, la pubblicazione di un articolo su una rivista accademica è un traguardo estremamente importante: l’ atto di pubblicazione marchia l’ articolo di attendibilità e lo immette nel mondo della ricerca accademica in qualità di fonte menzionabile e comprovata.
Battelle fa riferimento alla “bibliometrica“, introdotta da Eugene Garfield nel suo Citation Indexes for Science e sviluppata da Jon M. Kleimberg in Fonti autorevoli in un ambiente ipertestuale.
La bibliometrica consente di classificare i documenti accademici sulla base della loro struttura di citazioni. Viene così calcolato il “fattore d’ impatto” di una determinata pubblicazione:
Secondo la definizione standard, il fattore d’ impatto di una rivista j in un certo anno equivale al numero medio di citazioni ricevute da articoli pubblicati nelle due annate precedenti della rivista j. […] Il fattore d’ impatto è una misura classificatoria basata fondamentalmente su un puro conteggio degli in-degrees [i gradi di separazione] di nodi nella rete. Pinski e Narin hanno proposto un metodo più sofisticato di misurazione, derivante dall’ osservazione che non tutte le citazioni hanno eguale rilevanza. I due studiosi hanno mostrato che una rivista è influente se, periodicamente, è citata con ampiezza da altre riviste influenti.
Fu Page a credere di poter applicare il sistema di citazioni accademiche al web:
Egli ragionò sul fatto che l’ intero web poteva dirsi a grandi linee basato sul meccanismo della citazione e dell’ annotazione: dopotutto, che cos’ era un link se non una citazione, e che cos’ era il testo che descriveva quel link se non un’ annotazione? Se fosse riuscito a intuire un metodo per contare e qualificare ogni link in ingresso sul web, per dirla con Page, “il Web sarebbe diventato un luogo di maggior valore”.
Alla fine, Page è riuscito nel suo intento. Tuttavia, il sistema di ricerca di informazioni messo in atto da Google continua ad essere sottoposto a periodici aggiornamenti. Segno che quel “luogo di maggior valore” ipotizzato da Page si trova ancora in una fase embrionale. L’ individuazione dei link in entrata è ormai un problema risolto. Per quello che riguarda il PageRank e l’ assegnazione di un voto che premi davvero la “qualità” delle informazioni contenute in una pagina web, la strada da percorrere è ancora lunga.
Il prossimo traguardo?
Senza dubbio, la ricerca semantica.