Dalla versione 2.7 di WordPress è stata introdotta la paginazione dei commenti: quando un articolo ha più di un certo numero di commenti, questi verranno suddivisi su più pagine.
Se avete attivato questa funzionalità sul vostro blog, si crea però un buon numero di contenuti duplicati, perchè avremo sia la pagina principale con l’articolo che le pagine secondarie con gli altri commenti. Entrambi avranno una url simile, ma diversa.
Questo può comportare diversi problemi con i motori di ricerca, che non vedono molto di buon occhio le pagine duplicate, con url diverse. Potremmo quindi imbatterci in penalizzazioni da parte di Google, e comunque la popularity ed il PageRank verrebbero suddivisi tra le pagine simili.
Come risolvere? Ci sono tre soluzioni:
- Disabilitare la paginazione dei commenti.
- Rendere noindex le pagine duplicate.
- Utilizzare il Canonical link.
Consideriamo subito l’ultima soluzione. La scorsa settimana Google, Yahoo e Microsoft si sono accordati per introdurre il supporto ai Canonical link. Di cosa si tratta? Esattamente di quello che fa al caso nostro!
Inserendo un semplice tag nelle nostre pagine duplicate, potremo indicare qual’è la pagina base che deve essere indicizzata. In questo modo non verremo penalizzati e tutta la popularity verrà concentrata sulla pagina principale.
Questo è il tag da inserire nell’header della pagina duplicata:
Se vogliamo automatizzare il tutto su WordPress, possiamo utilizzare la soluzione di questo sito, appositamente modificata.
Apriamo il file functions.php del nostro tema ed incolliamo queste righe di codice:
global $wp_query;
if ($wp_query->is_singular && get_option('page_comments')){ // comments paging enabled
if (isset($wp_query->query['cpage']) && absint($wp_query->query['cpage']) >= 1 ){
echo '<link rel="canonical" href="'; the_permalink(); echo '" />'.PHP_EOL;
}
}
}
add_action('wp_head','wpi_comment_paging_noindex_meta');
Il codice originario prevedeva di inserire un tag noindex che avrebbe impedito completamente l’indicizzazione della pagina duplicata. In questo modo, invece, abbiamo una soluzione più soft e funzionale, grazie al Canonical link.




Ciao ho un sito in wp che fino a qualche settimana fa era fatto in joomla e continuo ad avere 600 tag duplicati a causa della vecchia indicizzione tipo ?option=….., questi link pur non esistendo più una volta cliccati visualizzano la nuova home (senza un reale redirect quindi niente errore 404) e pur avendoli bloccati lato robots.txt ed eliminati con le funzioni disponibili su webmaster di google non riesco a farli sparire, qualche suggerimento?
al posto di my-blog-article…. va: %year%/%monthnum%/%postname%
ho trovato un’altra soluzione,
l’ho pubblicata adesso, un plugin che fa tutto in automatico, anche per i post paginati
ciao ghido!
Ottimo, grazie per la segnalazione!
anche a me interesserebbe. Dove trovo questa plugin e guida per l’eventuale settaggio?
ma grazie!
, ho fatto un post a parte non ho modificato quello (l’immagine del post proviene dal mio analytics).
Ti faccio notare una cosa però, il contenuto duplicato non tutto penalizza, anzi a bloccarlo tutto si perdono visite
link:
http://computer-acquisti.com/blog/aggiornamento-per-il-contenuto-duplicato/
ciao ghido!
Verissimo. Infatti il tag “canonical” è la soluzione ideale perchè è più soft del noindex.
Paik invece aveva bisogno di rimuovere definitamente dall’indice alcune pagine, quindi gli tornava utile il tuo articolo sul robots.txt
grandissimo!
a me google aveva già visto il contenuto duplicato e non è molto che ho attivato i commenti impaginati, post molto utile.
Ottimo post anche il tuo (quello che ho linkato nel commento qua sopra)
Ora sono trascorsi più di 10 giorni da quando ho disinstallato il plugin, ma risultano sempre i tag title duplicati. Ad esempio homepage.com/da/; homepage.com/fr; etc.. cliccandoci si apre la home page in italiano! Il comando canonical non lo posso utilzzare per indicare a goole l’indirizzo da indicizzare? Tu che mi consigli di fare? ti ringrazio ancora. Ciao
Sì, certo potresti usare il “canonical”, però dove lo metti? Se quella pagina l’hai cancellata, non puoi metterci niente….
Dovresti modificare il file robots.exe. Leggi qua: http://computer-acquisti.com/blog/eliminare-il-contenuto-duplicato-in-wordpress/
fino a qualche giorno fà avevo installato un plugin per la traduzione automatca. sono stati creati 56 contenuti. utlizzando “Analisi dei contenuti” di google ho visto che i duplicati sono stati causati praticamente tutti per il plug in. Mi sapresti consigliare per eliminarli?
Se hai disabilitato il plugin, le pagine in questione non esistono più. La prossima volta che Google passerà dal tuo blog non le troverà e verranno rimosse dall’indice.
Devi solo aspettare.
ciao, vorrei poterti chieder un informazione, ho problemi con contenuti duplicati, utilizzando webmaster tool di google mi risultano circa 50 tag title duplicati. Come posso eliminarli? Devo seguire la guida da te indicata incollando il codice? Ch cosa mi consigli?
Dipende. Controlla se la causa è la paginazione dei commenti (in questo caso segui la mia guida) o se il problema è che ogni post è presente in più categorie e quindi risulta raggiungibile da più url.
Nell’ultimo caso non saprei cosa consigliarti, è un problema che ho anch’io.