BigThink

WordPress: eliminare i contenuti duplicati con i Canonical link

Dalla versione 2.7 di WordPress è stata introdotta la paginazione dei commenti: quando un articolo ha più di un certo numero di commenti, questi verranno suddivisi su più pagine.

Se avete attivato questa funzionalità sul vostro blog, si crea però un buon numero di contenuti duplicati, perchè avremo sia la pagina principale con l’articolo che le pagine secondarie con gli altri commenti. Entrambi avranno una url simile, ma diversa.

Duplicate contentQuesto può comportare diversi problemi con i motori di ricerca, che non vedono molto di buon occhio le pagine duplicate, con url diverse. Potremmo quindi imbatterci in penalizzazioni da parte di Google, e comunque la popularity ed il PageRank verrebbero suddivisi tra le pagine simili.

Come risolvere? Ci sono tre soluzioni:

  • Disabilitare la paginazione dei commenti.
  • Rendere noindex le pagine duplicate.
  • Utilizzare il Canonical link.

Consideriamo subito l’ultima soluzione. La scorsa settimana Google, Yahoo e Microsoft si sono accordati per introdurre il supporto ai Canonical link. Di cosa si tratta? Esattamente di quello che fa al caso nostro!

Inserendo un semplice tag nelle nostre pagine duplicate, potremo indicare qual’è la pagina base che deve essere indicizzata. In questo modo non verremo penalizzati e tutta la popularity verrà concentrata sulla pagina principale.

Questo è il tag da inserire nell’header della pagina duplicata:

<link rel="canonical" href="http://www.example.com/my-blog-article" />

Se vogliamo automatizzare il tutto su WordPress, possiamo utilizzare la soluzione di questo sito, appositamente modificata.
Apriamo il file functions.php del nostro tema ed incolliamo queste righe di codice:

function wpi_comment_paging_noindex_meta(){
    global $wp_query;
    if ($wp_query->is_singular && get_option('page_comments')){ // comments paging enabled
        if (isset($wp_query->query['cpage']) && absint($wp_query->query['cpage']) >= 1 ){
            echo '<link rel="canonical" href="'; the_permalink(); echo '" />'.PHP_EOL;
        }
    }
}
add_action('wp_head','wpi_comment_paging_noindex_meta');

Il codice originario prevedeva di inserire un tag noindex che avrebbe impedito completamente l’indicizzazione della pagina duplicata. In questo modo, invece, abbiamo una soluzione più soft e funzionale, grazie al Canonical link.

Articolo scritto da Ghido

Fondatore di BigThink.it, si occupa dello sviluppo e del coordinamento dei progetti tecnologici. Specializzato nel Marketing su Facebook e nello sviluppo di Applicazioni Social, fa consulenza e formazione ad aziende ed agenzie.

Leggi anche...

WordPress: capitalizzare i titoli nel feed RSS in automatico

WordPress: capitalizzare i titoli nel feed RSS in automatico

Un paio di giorni fa commentavo un articolo di Francesco Gavello, chiedendogli perchè scrivesse i titoli dei suoi articoli mettendo in maiuscolo l'iniziale di ogni parola. Francesco mi ha allora risposto: Semplice impatto e migliore estetica quando finiscono nei feed reader. Una volta mischiati ad altri flussi RSS, risaltano maggiormente e hanno un “ché” di ...
50+ Strumenti per trovare e analizzare i domini

50+ Strumenti per trovare e analizzare i domini

Tempo fa vi ho spiegato le basi per comprare e vendere domini, oggi torno sull'argomento svelandovi il kit del perfetto Domainer: una lista di link che non possono mancare tra i vostri bookmark, per analizzare e trovare i migliori domini e parole chiave. Si tratta di risorse utili sia a chi compra e vende ...
Rispondere agli utenti con un report: SEO Domande!

Rispondere agli utenti con un report: SEO Domande!

Un saluto ai visitatori di Bigthink. Già da diverse settimane è presente online un mio nuovo report: Seo Domande & Risposte . Oggi voglio proporlo a voi, ovviamente è gratuito. Da quando offro la possibilità ai miei utenti di contattarmi dal mio blog, ricevo moltissime domande giornaliere. Spesso rispondo, ma a volte per mancanza ...
Lista di eBook gratis su Web Marketing e SEO

Lista di eBook gratis su Web Marketing e SEO

Il Web Marketing e la Search Engine Optimization sono discipline che richiedono studio ed esperienza. In rete si trova parecchio materiale a riguardo, soprattutto in inglese, e ci si perde quasi nella vastità di informazioni. Qui ho voluto raccogliere i migliori eBook gratis in lingua italiana che trattano di Web Marketing, SEO, ottimizzazione di ...
WordPress e SPAM: quando Akismet non basta

WordPress e SPAM: quando Akismet non basta

Inizia oggi una nuova miniserie del buon Camu, impegnato in una lotta contro lo spam. Qualche settimana fa ho subito un'ondata massiccia di spam sul mio blog, come mai m'era capitato. Intendiamoci, il mio blog si colloca nella parte bassa della coda lunga, non ho milioni di visitatori al giorno, e quindi anche gli spammer ...

16 Commenti

  1. marco

    Ciao ho un sito in wp che fino a qualche settimana fa era fatto in joomla e continuo ad avere 600 tag duplicati a causa della vecchia indicizzione tipo ?option=….., questi link pur non esistendo più una volta cliccati visualizzano la nuova home (senza un reale redirect quindi niente errore 404) e pur avendoli bloccati lato robots.txt ed eliminati con le funzioni disponibili su webmaster di google non riesco a farli sparire, qualche suggerimento?

    11 novembre 2011, 10:08
  2. Miss

    al posto di my-blog-article…. va: %year%/%monthnum%/%postname%

    11 novembre 2011, 09:05
  3. ho trovato un’altra soluzione,
    l’ho pubblicata adesso, un plugin che fa tutto in automatico, anche per i post paginati ;)
    ciao ghido!

    9 marzo 2009, 12:59
    • Ghido

      Ottimo, grazie per la segnalazione!

      9 marzo 2009, 17:08
      • Miss

        anche a me interesserebbe. Dove trovo questa plugin e guida per l’eventuale settaggio?

        11 novembre 2011, 09:09
  4. ma grazie!
    Ti faccio notare una cosa però, il contenuto duplicato non tutto penalizza, anzi a bloccarlo tutto si perdono visite ;) , ho fatto un post a parte non ho modificato quello (l’immagine del post proviene dal mio analytics).

    link:
    http://computer-acquisti.com/blog/aggiornamento-per-il-contenuto-duplicato/

    ciao ghido!

    7 marzo 2009, 14:29
    • Ghido

      Verissimo. Infatti il tag “canonical” è la soluzione ideale perchè è più soft del noindex.

      Paik invece aveva bisogno di rimuovere definitamente dall’indice alcune pagine, quindi gli tornava utile il tuo articolo sul robots.txt ;)

      9 marzo 2009, 12:48
  5. grandissimo!
    a me google aveva già visto il contenuto duplicato e non è molto che ho attivato i commenti impaginati, post molto utile.

    7 marzo 2009, 10:29
    • Ghido

      Ottimo post anche il tuo (quello che ho linkato nel commento qua sopra)
      :-)

      7 marzo 2009, 14:14
  6. Ora sono trascorsi più di 10 giorni da quando ho disinstallato il plugin, ma risultano sempre i tag title duplicati. Ad esempio homepage.com/da/; homepage.com/fr; etc.. cliccandoci si apre la home page in italiano! Il comando canonical non lo posso utilzzare per indicare a goole l’indirizzo da indicizzare? Tu che mi consigli di fare? ti ringrazio ancora. Ciao

    7 marzo 2009, 10:05
  7. fino a qualche giorno fà avevo installato un plugin per la traduzione automatca. sono stati creati 56 contenuti. utlizzando “Analisi dei contenuti” di google ho visto che i duplicati sono stati causati praticamente tutti per il plug in. Mi sapresti consigliare per eliminarli?

    2 marzo 2009, 16:18
    • Ghido

      Se hai disabilitato il plugin, le pagine in questione non esistono più. La prossima volta che Google passerà dal tuo blog non le troverà e verranno rimosse dall’indice.
      Devi solo aspettare.

      2 marzo 2009, 20:03
  8. ciao, vorrei poterti chieder un informazione, ho problemi con contenuti duplicati, utilizzando webmaster tool di google mi risultano circa 50 tag title duplicati. Come posso eliminarli? Devo seguire la guida da te indicata incollando il codice? Ch cosa mi consigli?

    2 marzo 2009, 14:03
    • Ghido

      Dipende. Controlla se la causa è la paginazione dei commenti (in questo caso segui la mia guida) o se il problema è che ogni post è presente in più categorie e quindi risulta raggiungibile da più url.
      Nell’ultimo caso non saprei cosa consigliarti, è un problema che ho anch’io.

      2 marzo 2009, 14:18

1 Citazioni