BigThink

WordPress: eliminare i contenuti duplicati con i Canonical link

Dalla versione 2.7 di WordPress è stata introdotta la paginazione dei commenti: quando un articolo ha più di un certo numero di commenti, questi verranno suddivisi su più pagine.

Se avete attivato questa funzionalità sul vostro blog, si crea però un buon numero di contenuti duplicati, perchè avremo sia la pagina principale con l’articolo che le pagine secondarie con gli altri commenti. Entrambi avranno una url simile, ma diversa.

Duplicate contentQuesto può comportare diversi problemi con i motori di ricerca, che non vedono molto di buon occhio le pagine duplicate, con url diverse. Potremmo quindi imbatterci in penalizzazioni da parte di Google, e comunque la popularity ed il PageRank verrebbero suddivisi tra le pagine simili.

Come risolvere? Ci sono tre soluzioni:

  • Disabilitare la paginazione dei commenti.
  • Rendere noindex le pagine duplicate.
  • Utilizzare il Canonical link.

Consideriamo subito l’ultima soluzione. La scorsa settimana Google, Yahoo e Microsoft si sono accordati per introdurre il supporto ai Canonical link. Di cosa si tratta? Esattamente di quello che fa al caso nostro!

Inserendo un semplice tag nelle nostre pagine duplicate, potremo indicare qual’è la pagina base che deve essere indicizzata. In questo modo non verremo penalizzati e tutta la popularity verrà concentrata sulla pagina principale.

Questo è il tag da inserire nell’header della pagina duplicata:

<link rel="canonical" href="http://www.example.com/my-blog-article" />

Se vogliamo automatizzare il tutto su WordPress, possiamo utilizzare la soluzione di questo sito, appositamente modificata.
Apriamo il file functions.php del nostro tema ed incolliamo queste righe di codice:

function wpi_comment_paging_noindex_meta(){
    global $wp_query;
    if ($wp_query->is_singular && get_option('page_comments')){ // comments paging enabled
        if (isset($wp_query->query['cpage']) && absint($wp_query->query['cpage']) >= 1 ){
            echo '<link rel="canonical" href="'; the_permalink(); echo '" />'.PHP_EOL;
        }
    }
}
add_action('wp_head','wpi_comment_paging_noindex_meta');

Il codice originario prevedeva di inserire un tag noindex che avrebbe impedito completamente l’indicizzazione della pagina duplicata. In questo modo, invece, abbiamo una soluzione più soft e funzionale, grazie al Canonical link.

Articolo scritto da Ghido

Fondatore di BigThink.it, si occupa dello sviluppo e del coordinamento dei progetti tecnologici. Specializzato nel Marketing su Facebook e nello sviluppo di Applicazioni Social, fa consulenza e formazione ad aziende ed agenzie.

Leggi anche...

WordPress trick: come risolvere il problema del feed non valido

WordPress trick: come risolvere il problema del feed non valido

Qualche volta potrà capitarvi un problema piuttosto fastidioso con WordPress: improvvisamente il vostro feed RSS risulta non più valido ed il browser si rifiuta di visualizzarlo, segnalando un errore di interpretazione XML senza un apparente motivo. Disperati, andate in cerca del problema, aggiornate la versione di WordPress e tutti i plugin attivi, ma niente, ...
Video Tutorial: Installare Facebook Connect su WordPress

Video Tutorial: Installare Facebook Connect su WordPress

Vi ricordate la mia guida per installare Facebook Connect su WordPress? Ha avuto ed ha ancora parecchio successo: è stata segnalata da moltissimi siti ed ha superato i 200 commenti. L'ho continuamente aggiornata alle nuove versioni del plugin ed ottimizzata per le vostre esigenze. Ora Stefan Des ha pubblicato un video tutorial, basato sui primi ...
Dividere su due colonne le categorie di WordPress

Dividere su due colonne le categorie di WordPress

Con questo post inizia una nuova serie di guide per la creazione o personalizzazione dei template di WordPress, ambito in cui mi sono specializzato recentemente. Oggi vedremo come dividere l'elenco delle categorie del nostro blog, su due colonne di egual lunghezza. Può tornarci utile nel caso avessimo veramente tante categorie e, per una maggiore ...
WordPress: Dare agli spammer la possibilità di redimersi

WordPress: Dare agli spammer la possibilità di redimersi

Si conclude oggi la miniserie di Camu: dopo aver visto come va modificato l'.htaccess e come farlo in automatico, oggi impariamo a personalizzare la pagina di errore. Dai commenti sul mio blog alla prima puntata di questa miniserie è venuta fuori un'interessante discussione su cosa "vedono" gli spammer presenti nella lista nera quando tentano ...
Un gancio per attaccarsi a WordPress

Un gancio per attaccarsi a WordPress

Con questo primo Guest Post inizia una miniserie di articoli scritti da Camu, che ci condurrà passo-passo nella personalizzazione del nostro blog WordPress. Una delle funzionalità che fanno di WordPress una piattaforma su cui sviluppare funzionalità personalizzate per il proprio sito, è la capacità di essere esteso tramite i cosiddetti plugin. Possiamo fare l'analogia con ...

15 Commenti

  1. marco

    Ciao ho un sito in wp che fino a qualche settimana fa era fatto in joomla e continuo ad avere 600 tag duplicati a causa della vecchia indicizzione tipo ?option=….., questi link pur non esistendo più una volta cliccati visualizzano la nuova home (senza un reale redirect quindi niente errore 404) e pur avendoli bloccati lato robots.txt ed eliminati con le funzioni disponibili su webmaster di google non riesco a farli sparire, qualche suggerimento?

    11 novembre 2011, 10:08
  2. Miss

    al posto di my-blog-article…. va: %year%/%monthnum%/%postname%

    11 novembre 2011, 09:05
  3. ho trovato un’altra soluzione,
    l’ho pubblicata adesso, un plugin che fa tutto in automatico, anche per i post paginati ;)
    ciao ghido!

    9 marzo 2009, 12:59
    • Ghido

      Ottimo, grazie per la segnalazione!

      9 marzo 2009, 17:08
      • Miss

        anche a me interesserebbe. Dove trovo questa plugin e guida per l’eventuale settaggio?

        11 novembre 2011, 09:09
  4. ma grazie!
    Ti faccio notare una cosa però, il contenuto duplicato non tutto penalizza, anzi a bloccarlo tutto si perdono visite ;) , ho fatto un post a parte non ho modificato quello (l’immagine del post proviene dal mio analytics).

    link:
    http://computer-acquisti.com/blog/aggiornamento-per-il-contenuto-duplicato/

    ciao ghido!

    7 marzo 2009, 14:29
    • Ghido

      Verissimo. Infatti il tag “canonical” è la soluzione ideale perchè è più soft del noindex.

      Paik invece aveva bisogno di rimuovere definitamente dall’indice alcune pagine, quindi gli tornava utile il tuo articolo sul robots.txt ;)

      9 marzo 2009, 12:48
  5. grandissimo!
    a me google aveva già visto il contenuto duplicato e non è molto che ho attivato i commenti impaginati, post molto utile.

    7 marzo 2009, 10:29
    • Ghido

      Ottimo post anche il tuo (quello che ho linkato nel commento qua sopra)
      :-)

      7 marzo 2009, 14:14
  6. Ora sono trascorsi più di 10 giorni da quando ho disinstallato il plugin, ma risultano sempre i tag title duplicati. Ad esempio homepage.com/da/; homepage.com/fr; etc.. cliccandoci si apre la home page in italiano! Il comando canonical non lo posso utilzzare per indicare a goole l’indirizzo da indicizzare? Tu che mi consigli di fare? ti ringrazio ancora. Ciao

    7 marzo 2009, 10:05
  7. fino a qualche giorno fà avevo installato un plugin per la traduzione automatca. sono stati creati 56 contenuti. utlizzando “Analisi dei contenuti” di google ho visto che i duplicati sono stati causati praticamente tutti per il plug in. Mi sapresti consigliare per eliminarli?

    2 marzo 2009, 16:18
    • Ghido

      Se hai disabilitato il plugin, le pagine in questione non esistono più. La prossima volta che Google passerà dal tuo blog non le troverà e verranno rimosse dall’indice.
      Devi solo aspettare.

      2 marzo 2009, 20:03
  8. ciao, vorrei poterti chieder un informazione, ho problemi con contenuti duplicati, utilizzando webmaster tool di google mi risultano circa 50 tag title duplicati. Come posso eliminarli? Devo seguire la guida da te indicata incollando il codice? Ch cosa mi consigli?

    2 marzo 2009, 14:03
    • Ghido

      Dipende. Controlla se la causa è la paginazione dei commenti (in questo caso segui la mia guida) o se il problema è che ogni post è presente in più categorie e quindi risulta raggiungibile da più url.
      Nell’ultimo caso non saprei cosa consigliarti, è un problema che ho anch’io.

      2 marzo 2009, 14:18

1 Citazioni