venerdì 31 ottobre 2008

Come rimuovere link obsoleti dall'indice di google

Hai apportato modifiche al sito e alcune pagine ora non esistono più
Eppure in google ci sono ancora molti link che portano su quelle pagine, con il risultato che ogni volta che qualcuno ci clicca ottiene una pagina di errore.
Se il sito è stato rifatto ma tratta ancora del medesimo argomento, sarebbe utile riuscire a mantenere le pagine indicizzate in google e magari ridirigere il traffico che raggiunge pagine non più esistenti sule pagine nuove.
Questo si può ottenere inserendo le pagine mancanti e al loro interno mettere un redirect alle nuove pagine, oppure se si stà usando apache con modulo mod rewrite e si ha accesso a questo file, apportare le giuste modifiche al file .htaccess.
Tuttavia in alcuni casi è necessario che le pagine indicizzate debbano essere rimosse dall'indice di google, e alora come si procede?


Web master tool per la rimozione dei link
La procedura da seguire per rimuovere link a pagine ormai non più presenti sul nostro sito dall'indice di google prevede l'utilizzo di webmaster tool di google.
Prima di tutto è necessario che la pagina che si intende rimuovere dall'indice di google non sia effettivamente più raggiungibile (dagli spider di google), e questo accade nel caso in cui sia stata rimossa dal sito, ma può succedere che si voglia rimuovere dagli indici di google una pagina che è ancora presente sul nostro sito. Per impedire al crowler di google di reindicizzare la pagina bisogna prendere delle precauzioni.

Impedire ai Crowler di accedere ai dai da rimuovere dall'indice con i Meta tag

Nelle pagine da rimuovere dall'indice scrivete il seguente metatag:

<meta name="robots" content="noindex">

Questo meta tag impedisce a tutti i motori di ricerca di indicizzare la pagina in cui è contenuto.
Se invece vogliamo che solo google venga respinto dalla pagina inseriamo:

<meta name="googlebot" content="noindex">


Impedire ai Crowler di accedere ai dai da rimuovere dall'indice con Il file robots.txt

Un altro sistema per bloccare i crowler dei motori di ricerca è quello di usare un file robots.txt da inserire nella root del sito.
La sintassi di questo file non è complessa e praticamente consente di scegliere quali cartelle o file non devono essere scansite dai cowler dei motori.
Un esempio di questo file può essere il seguente:

User-Agent: *
Disallow: /file_personali/

Praticamente in questo caso il crowler indicizzerà tutti i file e cartelle tranne il contenuto della cartella file_personali.


Eseguire la richiesta di rimozione

Una volta assicurati che i file da eliminare non sono più ispezionabili dai motori di ricerca possiamo rimuoverli andando nel webmaster tool di google cliccando su:

Strumenti -> rimozione url

Configurazione sito -> Accesso Crawler -> Rimuovi url

poi sul pulsante "+ nuova richiesta rimozione" ci verrà chiesto se vogliamo rimuovere solo un file, una cartella o l'intero sito. per rimuovere l'intero sito, il file robots.txt dovrà contenere le seguenti righe:

User-Agent: *
Disallow: /

Ora inoltrate la richiesta e nel giro di 2-3 giorni le pagine saranno rimosse dall'indice di google a patto che vengano rispettate le condizioni sopra citate. nel caso in cui la rimozione venga negata saranno esposti i motivi.

4 commenti:

Anonimo ha detto...

grazie delle info utili

Ulisse Di Bartolomei ha detto...

Salve!
Il mio problema sta nel rimuovere del tutto una denominazione precedente di un mio blog attuale. Non sono però sicuro che sia così, in quanto potrei avere rimosso il blog del tutto e rifatto exnovo. So che nel tempo gli spider notano il link fasullo e lo eliminano dalla cache, ma il mio è lì quasi da due anni e se qualcuno digita il mio nome esce sempre fuori, mentre i link buoni non escono (ho 11 blog). Insomma come si può rimuovere questa dannazione, oppure mi conviene rifare un blog non quel nome?
Ringrazio di cuore per qualche dritta utile.

Ulisse

staff ha detto...

quale degli 11 blog è quello che le dà problemi?
Eventualmente mi contatti in primavato al seguente indirizzo di posta: seoesem@gmail.com

Ulisse Di Bartolomei ha detto...

Salve!
Vi ringrazio per la pronta risposta. Mi scuso per aver sollecitato il Vostro aiuto, poiché osservando meglio mi sono accorto che l'obsoleto link viene riproposto da un social forum (fai.informazione) dove avevo inserito degli articoli di quel blog onde facilitarne l'indicizzazione. Falso allarme dunque!

Qui sotto come appare in google...

Lo Spirito del Tempo di Ulisse Di Bartolomei
Lo Spirito del Tempo di Ulisse Di Bartolomei (ulissedibartolomei) - Questo blog contiene un prosimetrum introspettivo autobiografico ricco di aneddoti e ...
fai.informazione.it/.../Lo-Spirito-del-Tempo-di-Ulisse-Di-Bartolomei

In questo momento non sto curando i miei blog, preso da tutt'altre circostanze, ma quando sperabilmente ne riprenderò lo sviluppo dei contenuti e dell'indicizzazione non mancherò di rivolgermi a voi.

Buon tempo a tutti!

Ulisse Di Bartolomei

Posta un commento