Skip links

Contenuti duplicati

Definizione

I contenuti duplicati sono contenuti che si trovano due volte su Internet. Si tratta di contenuti molto simili, o addirittura identici, su più pagine con URL diversi. Queste pagine possono provenire dallo stesso sito o da siti diversi. Inoltre, il contenuto è considerato duplicato quando un singolo paragrafo della pagina è simile a un paragrafo di un’altra pagina. Per questo motivo è importante essere molto attenti alla scrittura dei contenuti per evitare duplicazioni.

Contenu dupliqué

I due tipi di contenuti duplicati

Contenuti duplicati sul sito interno o intra-sito

Come suggerisce il nome, il contenuto duplicato interno, o intra-sito, corrisponde alla presenza di contenuti duplicati in diverse pagine dello stesso sito. Anche se in genere è involontario, il contenuto duplicato è sconsigliato con il rischio di essere penalizzati dai motori di ricerca e di compromettere la propria reputazione.

La grande trappola dei contenuti duplicati all’interno di un sito è che è molto facile caderci. Prendiamo l’esempio di un sito che elenca vari giochi di fuga a Parigi. È quindi una tentazione per questo sito scrivere un unico paragrafo che spieghi cos’è un gioco di fuga, e integrare questo paragrafo in ciascuna delle pagine dedicate a uno di questi giochi di fuga. Tuttavia, questo sarebbe un grosso handicap per la SEO delle vostre pagine ed è quindi fortemente sconsigliato.

I contenuti duplicati all’interno del sito sono un problema che riguarda in particolare i siti di e-commerce a causa delle ricerche sfaccettate. Infatti, la maggior parte dei siti di e-commerce, per facilitare la navigazione degli utenti, offre diversi filtri da applicare alle pagine per affinare la ricerca. Questo tipo di ricerca migliora certamente l’esperienza dell’utente, ma porta anche alla creazione di molte pagine con contenuti molto simili o addirittura identici, e quindi alla presenza di contenuti duplicati sul sito.

In generale, è probabile che il vostro sito abbia contenuti duplicati per vari motivi:

  • Quando il CMS consente di creare due volte la stessa pagina, una volta in versione desktop e una volta in versione mobile, ma con URL diversi
  • Quando si ricrea una pagina sul proprio sito, dimenticando di reindirizzare la vecchia pagina a questa nuova
  • Quando si hanno più nomi di dominio per un singolo sito
  • Quando si riprogetta il sito web senza dire a Google quali contenuti deve indicizzare utilizzando i tag “rel=cannonical”.

Contenuti esterni o cross-site duplicati

I contenuti esterni duplicati, o contenuti cross-site, corrispondono alla presenza di contenuti duplicati su diversi siti. Questo tipo di contenuto duplicato è molto più penalizzato da Google rispetto al contenuto interno. Inoltre, solleva anche problemi legali, con la questione del copyright. È quindi importante rimanere particolarmente vigili su questi contenuti duplicati tra siti, per evitare a tutti i costi che il vostro sito ne sia affetto.

È comune trovare contenuti molto simili su diversi siti di e-commerce, soprattutto nella sezione “descrizione del prodotto”. In effetti, siti diversi possono vendere prodotti dello stesso fornitore e quindi avere le stesse caratteristiche di prodotto. È sufficiente che molti di questi siti ripetano la descrizione scritta sull’etichetta del prodotto per far apparire contenuti duplicati tra i siti.

In genere, Google indicizza solo uno di questi contenuti identici, che sceglie in base alla popolarità o all’età delle pagine. Il contenuto che Google ritiene essere l’originale è chiamato “contenuto canonico“.

Quali sono i pericoli dei contenuti duplicati nella SEO?

I contenuti duplicati sono dannosi sia per l’utente che per Google. L’esperienza dell’utente è indebolita dalla presenza delle stesse informazioni in più risultati di ricerca. Dal punto di vista di Google, i contenuti duplicati hanno un impatto negativo sulla posizionamento e sul traffico di un sito web.

Innanzitutto, è rischioso per la SEO avere contenuti duplicati all’interno del sito. Infatti, se il vostro sito ha diverse pagine con contenuti molto simili o identici, queste possono essere in concorrenza tra loro. Questo fenomeno si chiama cannibalizzazione delle parole chiave. Le vostre pagine, offrendo contenuti molto simili, si posizionano sulle stesse parole chiave e quindi entrano in competizione tra loro in termini di posizionamento su queste parole chiave. In questo modo si penalizzeranno a vicenda, impedendosi di posizionarsi sulle parole chiave oggetto dei loro contenuti.

Inoltre, l’offerta di due pagine con contenuti duplicati utilizza anche il vostro crawl budget e Google sprecherà tempo a scansionare pagine identiche invece di scansionare il vostro sito alla ricerca di contenuti strategici.

Infine, anche i contenuti esterni duplicati sono fortemente penalizzati dai motori di ricerca. Ad esempio, Google ha sviluppato un algoritmo per identificare i contenuti duplicati e rubati: Google Panda. L’algoritmo viene a scandagliare le pagine del vostro sito per verificare la qualità e l’autenticità dei contenuti. Se il contenuto duplicato è eccessivo, si rischiano penalizzazioni che vanno da un calo di posizione nei risultati di ricerca alla totale deindicizzazione del sito.

Siti multilingue e contenuti duplicati: come comportarsi?

Contrariamente a quanto si potrebbe pensare, la traduzione del vostro sito in diverse lingue non è la causa di contenuti duplicati. In effetti, Google non è in grado di stabilire se una pagina è una traduzione di un’altra. Inoltre, il motivo per cui i contenuti duplicati vengono penalizzati da Google è che sono ritenuti poco rilevanti per gli utenti perché offrono la stessa risposta di un altro sito a una ricerca. Tuttavia, due pagine con lo stesso contenuto, ma in due lingue diverse, rispondono a interrogazioni diverse effettuate in aree geografiche distanti.

Le nostre soluzioni per evitare i contenuti duplicati internamente

Come per ogni problema, non c’è niente di meglio che attaccare alla fonte i contenuti interni duplicati per evitare che il vostro sito ne sia affetto. Ecco alcuni riflessi da adottare che vi permetteranno di evitare questo problema.

Avere un solo URL per ogni contenuto

Uno dei primi riflessi da avere è quello di assicurarsi che ogni contenuto abbia un solo e unico URL. Infatti, se il vostro contenuto, a causa dell’applicazione di parametri URL, ID o altri elementi che consentono di modificare un URL, finisce su più pagine con URL diversi, Google lo considererà come contenuto duplicato all’interno del sito. Ecco alcuni consigli per evitare di avere più URL per lo stesso contenuto:

  • Limitare o vietare l’uso degli ID di sessione negli URL
  • Limitare o addirittura vietare l’uso di parametri URL (soprattutto nell’e-commerce con ricerche a faccette).
  • Fate attenzione a costruire tutti i vostri URL intorno al sottodominio www, oppure intorno al solo dominio
  • Fare attenzione a utilizzare un solo protocollo: http o https.

Evitare il copia/incolla

Come si può immaginare, è assolutamente da evitare il copia e incolla da una pagina all’altra del sito. Cercate sempre di offrire contenuti unici, anche se i temi trattati dalle vostre pagine sono simili.

Tag canonici: canonizzazione degli URL

Per evitare di creare contenuti duplicati su un sito, è possibile utilizzare il tag canonical, che consente di indicare la pagina di riferimento di un contenuto. Se aggiungete un tag canonico a una delle vostre pagine, invierete a Google il seguente messaggio: “Questa pagina contiene contenuti molto simili a un’altra pagina del sito. È quindi preferibile indicizzare la pagina di riferimento piuttosto che questa”. In pratica, consente di designare una pagina come “master” del sito e di reindirizzare Google a questa pagina quando si trova su una delle pagine con contenuti simili. Il tag canonical deve essere inserito nella sezione head della pagina di riferimento e delle pagine con contenuti simili.

Mancata indicizzazione di alcuni contenuti

Se il contenuto duplicato compare su pagine che non sono considerate di alta qualità o strategiche, avete la possibilità di non indicizzarle. Tutto ciò che dovete fare è inserire il tag “noindex” nelle vostre pagine per dire a Google di non indicizzarle, ma di effettuare comunque il crawling. Si presenta così: < meta name = “robot” content = “Noindex, Follow” >. Tuttavia, questo metodo non è consigliato se si vuole avere un sito di qualità per tutte le pagine.

Le nostre soluzioni per evitare contenuti esterni duplicati

Come per i contenuti duplicati all’interno, esistono diverse soluzioni che vi permetteranno di combattere i contenuti duplicati all’esterno.

Non utilizzare lo stesso contenuto su siti di rete diversi.

Anche se può essere allettante utilizzare gli stessi contenuti su diversi siti del vostro network con temi simili, questo avrà solo effetti negativi sulla vostra SEO. In effetti, così facendo, Google potrebbe giudicare il contenuto dei vostri siti di scarsa qualità e quindi penalizzarli nel loro referenziamento.

Attenzione alla riprogettazione o alla migrazione del sito

Le riprogettazioni e le migrazioni di siti sono molto complicate per quanto riguarda i contenuti duplicati. Infatti, quando si cambia dominio o si riprogetta il proprio sito web, ci si ritrova a effettuare reindirizzamenti in tutte le direzioni, verso le pagine del nuovo sito la cui architettura può essere stata modificata rispetto alla vecchia versione. È quindi possibile che ci si dimentichi del reindirizzamento portando alla comparsa di contenuti duplicati.

Richiedere la rimozione o la deindicizzazione di pagine con contenuti simili ai vostri.

È possibile che alcuni dei vostri concorrenti prendano i contenuti dalle vostre pagine e li integrino nel loro sito. Se notate questa pratica, potete far valere il vostro diritto d’autore su testi e immagini e chiedere al webmaster di rimuovere o deindicizzare le pagine con contenuti plagiati. Per farlo, è sufficiente inviare un’e-mail o un messaggio utilizzando le informazioni di contatto generalmente indicate sul sito. Se non ricevete una risposta alla vostra richiesta, potete utilizzare lo strumento di reclamo di Google per forzare la rimozione del contenuto.

5 strumenti per individuare i contenuti duplicati

Nell’ambito della vostra strategia SEO, è importante controllare regolarmente che il vostro sito abbia contenuti di qualità e che non ci siano contenuti duplicati. I contenuti duplicati possono essere facilmente individuati su un sito di piccole dimensioni senza l’utilizzo di strumenti SEO tecnici. Ma quando il sito ha molte pagine, è più complicato identificare questi contenuti. Per facilitarvi il compito, ecco un elenco non esaustivo di diversi strumenti SEO che potete utilizzare per rilevare la presenza o meno di contenuti duplicati sul vostro sito.

Screaming Frog

Screaming Frog è uno strumento SEO che consente di effettuare il crawling del vostro sito web proprio come fa Google. Questo strumento fornisce diverse informazioni sul vostro sito web, tra cui la presenza o meno di contenuti duplicati. Screaming Frog vi dice anche se il vostro sito ha titoli di pagina e metadati duplicati.

Duplichecker

Duplichecker è una piattaforma in cui è sufficiente inserire il contenuto di una delle vostre pagine nel campo di ricerca, quindi cliccare su “check plagiarism” e analizzare la percentuale di contenuti duplicati presenti nel vostro contenuto. Potete anche inserire direttamente l’URL del vostro sito o caricare il documento in cui si trova il vostro contenuto se è più lungo di 1000 parole. Infine, Duplichecker consente anche di correggere eventuali errori grammaticali che possono essersi insinuati nei contenuti.

Kill Duplicate

Kill Duplicate è lo strumento perfetto per individuare i furti di contenuti. È sufficiente registrare il vostro sito presso la piattaforma per identificare i siti che potrebbero rubare i vostri contenuti. Kill Duplicate offre diversi pacchetti che consentono di gestire siti di dimensioni diverse.

Siteliner

Siteliner è uno strumento che consente di determinare la presenza o meno di contenuti duplicati all’interno del sito. Per farlo, inserite l’URL del vostro sito nella barra di ricerca e lasciate che Siteliner effettui il crawling del vostro sito. Inoltre, lo strumento consente di rilevare la presenza di link non funzionanti e altre informazioni tecniche sul sito.

Copyscape

La piattaforma Copyscape non solo identifica i potenziali ladri di contenuti, ma controlla anche se i contenuti dei vostri redattori sono effettivamente unici. La versione a pagamento di Copyscape consente di ricevere una notifica in tempo reale se il vostro sito è stato plagiato.

Aumenta la tua visibilità !

Non esitare a contattarci per un preventivo gratuito e su misura.

Notez ce page