Breve storia del motore di ricerca
La nascita di Yahoo risale al 1994 quando due studenti universitari, David Filo e Jerry Yang, decisero di raccogliere i siti che progressivamente scovavano nel web e di organizzarli per argomenti; chiamarono questo loro progetto iniziale “Jerry and David’s Guide to the World Wide Web”.
Il crescente successo della directory da loro creata nella comunità virtuale spinse i due realizzatori alla ricerca, l’anno seguente, di un investitore che fosse disposto a supportare il loro progetto.
Lo trovarono in Sequoia Capital, che mise a loro disposizione un capitale iniziale di 2 milioni di dollari e diede così via al progetto Yahoo.
Dal 1996 ad oggi la dimensione della società si è incrementata progressivamente e le sue ramificazioni si interessano dei settori della comunicazione, dei servizi internet e della diffusione dei media.
Il termine Yahoo deriva dal nome di una delle città infernali menzionate da Italo Calvino nelle Città Invisibili.
Come funziona Yahoo!
Fino al gennaio 2004 Yahoo si poggiava per le sue ricerche a Google; successivamente è stata introdotta nella homepage del portale la piattaforma "Yahoo Search Technology", tecnologia in cui sono confluiti diversi sistemi, primo fra tutti Inktomi ma anche Overture e AltaVista.
Il crowler realizzato per scansionare le pagine web è stato chiamato Yahoo Slurp, robot che, a detta dei realizzatori, "raccoglie i documenti dal web per costruire un indice per servizi di ricerca forniti tramite il motore Yahoo!".
In modo molto similare a GoogleBot, il crawler di Google, Yahoo Slurp:
- segue i link descrittivi;
- considera l'URL;
- tiene in considerazione le sitemap linkate dalla home del sito;
- segue i link ai feed RSS;
- valuta i BackLink.
Diversamente invece non apprezza:
- i reindirizzamenti con i JS;
- i frames;
- i link sulle immagini;
- le session ID nelle URL;
- troppi BackLink;
- i link interni verso carrelli per l'e-commerce.
Con questo cambio di rotta Yahoo abbandona quindi la vecchia indicizzazione manuale che permetteva ai siti "amatoriali", magari confenzionati non molto bene ma ricchi di contenuti utili, di essere conosciuti.