venerdì 29 agosto 2008

Google Sitelinks: cosa sono, come ottenerli

Da tempo si parla di sitelinks, ossia quei link aggiuntivi che Google posiziona sotto un risultato rilevante della ricerca. Tutti chiedono, tutti vogliono sapere cosa sono i sitelinks. Eppure nessuno è in grado di fornire informazioni precise. Un buono spunto lo abbiamo ricevuto da Simone Carletti ed il suo articolo sui sitelinks. Ma è sufficiente? La risposta è, ovviamente, no. Ancora la ricerca e l'analisi degli algoritmi Google è in alto mare, eppure tutti cercano il più possibile di carpirne i segreti.
Come ripeto sempre, le soluzioni le dobbiamo ricercare sempre e solo da Google stesso, e non da SEO o presunti tali. Ecco perciò una serie di informazioni precise sui Google sitelinks.

COSA SONO E DOVE APPAIONO

Fin qui niente di nuovo. I Google sitelinks sono dei piccoli link che appaiono sotto il primo risultato di Google per una determinata serie di parole chiave, e che consentono all'utente di raggiungere informazioni ricercate senza navigare nel sito stesso. Per definizione sono minimo quattro, solitamente otto nei siti che lo permettono. Nell'ottica generale, sono considerati dagli utenti di Google un simbolo di serietà del sito che stanno per visitare, e per questo sono molto ambiti dai webmaster.
Come giustamente dice Simone Carletti, i sitelinks appaiono solo ed esclusivamente sul primo risultato di Google, e non necessariamente appaiono ogni volta che lo stesso sito appare al primo posto.

COME OTTENERE I SITELINKS

Secondo il Google Webmaster Central, è tutto automatizzato. Su questo c'erano pochi dubbi d'altronde, visto che assegnare sitelinks a centinaia di migliaia di siti ogni giorno non è lavoro per esseri umani. Un tempo si riteneva che i sitelinks fossero un premio per i siti che apparivano ai primi posti e ricevevano molti click e link da altri siti.
In realtà le cose sono cambiate. C'è chi ritiene che Google assegni i sitelinks ai siti che rispondono ad un determinato marchio. Vediamo di analizzare nel dettaglio queste ipotesi.

1. Google assegna i sitelinks solo a pagine index. Questo è un dato di fatto verificabile. Non fa distinzioni sul dominio del sito (può essere di secondo, come di terzo livello, inclusi sottodomini). Non assegna i sitelinks per il semplice fatto che corrispondono ad un determinato "marchio" (anche se ciò influisce). Nè per il semplice fatto che un sito è ben organizzato e ben realizzato. Cercando infatti "buddusò" (un paese della Sardegna), e nonostante il sito sia ben realizzato e corrispondente al marchio "buddusò" (il sito comunale è infatti il sito istituzionale ufficiale della parola chiave), non gli sono stati assegnati i sitelinks.

Per verificare l'esattezza di tale affermazione possiamo anche ricercare vaticano su Google. Il sito è infatti il sito ufficiale della parola cercata, tutti si aspettano che sia il primo risultato, riceve moltissime visite: cosa c'è che non va? Il primo risultato contiene la prima pagina in italiano, ma questa non possiede il nome index.html (o .htm né .php) quindi non può ricevere sitelinks. Il secondo risultato invece è sempre il sito ufficiale (internazionale), ma essendo secondo non può avere sitelinks.

(Attenzione! I test sono effettuati su Google Italia)

2. Non è necessario che le parole chiave compaiono nel titolo, descrizione, o dominio della pagina. Lo verifichiamo ricercando federcalcio. Tuttavia posso ritenere che nel caso specifico Google usufruisca della semantica (sinonimi e uguali significati), per associare la parola federcalcio a Figc. Sembra ricorrente il fatto, invece, che alcune delle parole chiavi (o sinonimi, anche non grammaticali, ma di significato come "lega calcio" e "lega nazionale professionisti") debbano necessariamente essere presenti nel titolo e nel dominio, ad assicurare una "autorevolezza" nel settore del sito stesso per quelle parole chiave.

3. Siti dinamici, o che non presentino un'ordinata lista di link (attraverso elenco html, tabella o semplice lista), non ottengono sitelinks (vedi gmail).

4. Il concetto di marchio ricorre ancora una volta: se infatti Google ritiene che una determinata parola chiave sia ambigua per i risultati ottenuti, non visualizza i sitelinks nonostante il sito risponda ai precedenti requisiti. Es: cercando lega, Google non visualizza sitelinks al primo risultato, nonostante due dei primi tre risultati ottengano i sitelinks ricercando rispettivamente lega nord e lega calcio. Stessa cosa si verifica cercando diocesi, nonostante le singole diocesi ottengano i sitelinks se specificata la località.

5. Non influisce per l'ottenimento dei sitelinks il peso della pagina (quella della lega calcio è un'offesa all'accessibilità, prende 100kb).

6. I tipi di link visualizzati nei sitelinks sono link interni al sito (non sottodomini, che Google considera come link esterni), compresi link dinamici.

7. Strani risultati si ottengono cercando milano e comune di milano. In realtà questo fenomeno si verifica per parecchie città: scrivendo anche la parola "comune" appaiono i sitelinks. Per assemini questo non succede. Riceve i sitelinks sia scrivendo assemini, sia comune di assemini.

8. Dal sito del Comune di Assemini abbiamo anche dati interessanti. Visitando le statistiche visite, sappiamo infatti che il sito non è niente di particolarmente importante: riceve 100-200 visite giornaliere, relativamente poco. Cercando poi link:www.comune.assemini.ca.it abbiamo un'ulteriore importantissima informazione: non influisce la link popularity (o influisce poco). Sono infatti sono 18 i siti schedati da Google che linkano al sito comunale, e peraltro si tratta di pagine con basso pagerank. Addirittura scopriamo che cercando cittadella le cose si complicano! Il sito della società sportiva visualizza i sitelinks, nonostante sotto sia presente il link comunale. L'arcano è svelato facilmente comunque: il sito comunale di Cittadella infatti non ha meritato i sitelinks, e perciò non entra in competizione col sito della società sportiva.

9. Non influisce assolutamente il tipo di documento (dichiarato o meno), la "presunta" correttezza del codice, né la presenza di meta tag (molti siti che visualizzano i sitelinks ne sono privi).

UN RIASSUNTO DEI RISULTATI

In definitiva abbiamo scoperto che il metodo di assegnazione dei sitelinks è difficilmente interpretabile. Tuttavia Google non si basa sulle visite, sulla link popularity o sul peso della pagina. Influiscono invece la presenza di parole chiave in titolo e dominio (o eventuali sinonimi), la competizione tra risultati (se una parola chiave visualizza molti siti che con frasi più specifiche hanno i sitelinks, con quella parola ambigua non appaiono). La pagina deve essere la index, deve avere almeno 4 link (ma io ritengo che più sono più spingano Google a selezionare i più importanti) e deve apparire al primo posto. Ancora: non influisce il numero di parole chiave ricercate, né il modo in cui vengono gestiti i link nella pagina.

Resta da pensare che i sitelinks vengano assegnati in maniera del tutto... casuale! Tuttavia concludendo le mie ricerche sono arrivato a scoprire qualcosa di nuovo: mi sono accorto che cercando google su Google non comparivano i sitelinks. Ma come... Google risponde a tutti i requisiti precedenti e poi... è il capo! Pensando che ciò fosse dovuto alla competività delle parole ricercate, ho cercato google.it (il cui obiettivo è ovvio: il sito di Google Italia!) ottenendo i famigerati sitelinks.

Ecco il risultato inaspettato! Il PageRank! Infatti io ho affermato che il PageRank non influisce nell'assegnazione dei sitelinks. L'affermazione corretta è invece che Google assegna i sitelinks basandosi ai siti, rispondendo ai requisiti indicati precedentemente, compaiono nel primo risultato e hanno un PageRank almeno maggiore a quello dei successivi due risultati della ricerca.

Per arrivare a questa conclusione ho fatto diverse analisi con il PageRank Checker che trovate a questa pagina http://www.prchecker.info/check_page_rank.php. E' comunque possibile che questi dati siano sbagliati, per questo vi invito a verificare voi stessi quanto ho scoperto e lasciare un commento.

La mia conclusione spiegherebbe il perché cercando le parole diocesi e lega nonostante la maggior parte dei siti ottenuti possiedano sitelinks specificando meglio la parola chiave (con diocesi di milano). Infatti cercando lega almeno due dei primi 3 risultati hanno pari PageRank, stessa cosa cercando diocesi.
Sarebbe anche possibile dare una spiegazione all'improvviso aumento di siti che visualizzano i sitelinks in rete: probabilmente in precedenza la differenza di PageRank doveva essere maggiore, oppure il controllo veniva effettuato sui primi 5 o 10 risultati della ricerca.

Nessun commento: