Skip links

Contenido Duplicado

Definición

El contenido duplicado es aquel que se encuentra dos veces en Internet. Se trata de contenidos muy similares, o incluso idénticos, en varias páginas con diferentes URLs. Estas páginas pueden ser tanto del mismo sitio como de sitios diferentes. Además, se considera que el contenido está duplicado cuando un solo párrafo de la página es similar a un párrafo de otra página. Por eso es importante estar muy atento a la hora de redactar los contenidos para evitar cualquier duplicación.

Contenu dupliqué

Los dos tipos de contenido duplicado

Duplicación de contenidos a nivel interno o intra-sitio

Como su nombre indica, el contenido duplicado interno, o intra-sitio, corresponde a la presencia de contenido duplicado en varias páginas de un mismo sitio. Aunque generalmente sea involuntario, el contenido duplicado no es recomendable a riesgo de ser penalizado por los motores de búsqueda y de afectar a su reputación.

La gran trampa del contenido duplicado dentro de un sitio es que es muy fácil caer en él. Tomemos el ejemplo de una página web con una lista de varios Juegos de Escapismo en París. Resulta entonces tentador para este sitio escribir un solo párrafo explicando lo que es un Juego de Escape, e integrar este párrafo en cada una de las páginas dedicadas a uno de estos Juegos de Escape. Sin embargo, hacerlo sería una gran desventaja para el SEO de sus páginas, por lo que se desaconseja totalmente.

El contenido duplicado dentro del sitio es un problema que afecta a los sitios de comercio electrónico en particular debido a las búsquedas por facetas. De hecho, la mayoría de los sitios de comercio electrónico, para facilitar la navegación del usuario, ofrecen diferentes filtros que se aplican a las páginas para afinar una búsqueda. Este tipo de búsqueda mejora ciertamente la experiencia del usuario, pero también conduce a la creación de muchas páginas con contenido muy similar o incluso idéntico, y por tanto a la presencia de contenido duplicado en el sitio.

Como regla general, es probable que su sitio tenga contenido duplicado por varias razones:

  • Cuando su CMS le permite crear la misma página dos veces, una en versión de escritorio y otra en versión móvil, pero con diferentes URLs
  • Al recrear una página en su sitio, olvidando redirigir la antigua a esta nueva
  • Cuando se tienen varios nombres de dominio para un mismo sitio
  • Cuando rediseñas tu sitio web sin indicarle a Google qué contenido debe indexar mediante las etiquetas “rel=cannonical”.

Duplicación de contenidos a nivel externos o inter-sitio

El contenido externo duplicado, o contenido entre sitios, corresponde a la presencia de contenido duplicado en varios sitios diferentes. Este tipo de contenido duplicado es mucho más penalizado por Google que el contenido interno. Además, también plantea problemas legales, con la cuestión de los derechos de autor. Por lo tanto, es importante permanecer especialmente atento a este contenido duplicado entre sitios para evitar a toda costa que su sitio lo tenga.

Es habitual encontrar contenidos muy similares en diferentes sitios de comercio electrónico, especialmente en la sección de “descripción del producto”. De hecho, diferentes sitios pueden vender productos del mismo proveedor y, por tanto, tener las mismas características de producto. Basta con que varios de estos sitios se limiten a repetir la descripción escrita en la etiqueta de su producto para que aparezca contenido duplicado entre los sitios.

Por lo general, Google sólo indexará uno de estos contenidos idénticos, que elegirá en función de la popularidad o la antigüedad de las páginas. Este contenido que Google determina como el original se denomina “contenido canónico”.

¿Cuáles son los peligros del contenido duplicado en el SEO?

El contenido duplicado es perjudicial tanto para el usuario como para Google. La experiencia del usuario se ve debilitada por la presencia de información idéntica en varios resultados de búsqueda. Desde el punto de vista de Google, el contenido duplicado tiene un impacto negativo en el SEO y el tráfico de un sitio web.

En primer lugar, es arriesgado para su SEO tener contenido duplicado dentro de su sitio. De hecho, si su sitio tiene varias páginas con un contenido muy similar o idéntico, pueden competir entre sí. Esto se conoce como canibalización de palabras clave. Sus páginas, al ofrecer un contenido muy similar, se posicionan en las mismas palabras clave y, por tanto, compiten entre sí en cuanto a su posicionamiento en estas palabras clave. De este modo, se penalizarán mutuamente impidiendo que se posicionen en las palabras clave a las que apuntan sus contenidos.

Además, ofrecer dos páginas con contenido duplicado también utiliza su presupuesto de rastreo y Google perderá tiempo rastreando páginas idénticas en lugar de rastrear su sitio en busca de contenido estratégico.

Por último, los contenidos externos duplicados también son fuertemente penalizados por los motores de búsqueda. Por ejemplo, Google ha desarrollado un algoritmo para identificar el contenido duplicado y robado: Google Panda. Este algoritmo vendrá a rastrear las páginas de su sitio para comprobar la calidad y autenticidad de su contenido. Si encuentra demasiado contenido duplicado, puede ser penalizado, desde una caída de su posición en los resultados de búsqueda hasta la desindexación total de su sitio.

Sitios multilingües y contenido duplicado: ¿qué pasa?

Al contrario de lo que se podría pensar, traducir su sitio a diferentes idiomas no crea contenido duplicado. De hecho, Google no es capaz de determinar si una página es una traducción de otra. Además, la razón por la que el contenido duplicado es penalizado por Google es que se considera poco relevante para los usuarios porque ofrece la misma respuesta que otro sitio a una búsqueda. Sin embargo, dos páginas con el mismo contenido, pero en dos idiomas diferentes, responden a consultas diferentes realizadas en zonas geográficas distintas.

Nuestras soluciones para evitar el contenido duplicado en la empresa

Como con cualquier problema, no hay nada mejor que atacar el contenido duplicado internamente en el origen para evitar que su sitio lo tenga. He aquí algunos reflejos a adoptar que le permitirán evitar este problema.

Tener una sola URL para cada contenido

Uno de los primeros reflejos que hay que tener es asegurarse de que cada contenido tiene una sola y única URL. De hecho, si su contenido, debido a la aplicación de parámetros de URL, IDs o cualquier otro elemento que permita modificar una URL, acaba en varias páginas con diferentes URLs, entonces Google lo considerará como contenido duplicado intra-sitio. Estos son algunos consejos para evitar tener varias URLs para el mismo contenido:

  • Limite o prohíba el uso de identificadores de sesión en sus URLs.
  • Limitar o incluso prohibir el uso de parámetros de URL (especialmente en el comercio electrónico con búsquedas facetadas).
  • Tenga cuidado de construir todas sus URLs alrededor del subdominio www, o alrededor del dominio solamente.
  • Tenga cuidado de utilizar solo un protocolo: http o https.

Evite copiar y pegar

Como puede imaginar, es imperativo evitar copiar y pegar de una página de su sitio a otra. Intente siempre ofrecer un contenido único, incluso si los temas tratados en sus páginas son similares.

Etiquetas canonical: canonización de Urls

Para evitar la creación de contenido duplicado en un sitio, puede utilizar la etiqueta canónica, que permite indicar la página de referencia de un contenido. Si añade una etiqueta canónica a una de sus páginas, enviará el siguiente mensaje a Google: “Esta página tiene un contenido muy similar al de otra página del sitio. Por lo tanto, es preferible indexar la página de referencia en lugar de ésta”. En términos prácticos, le permite designar una página como “maestra” en su sitio, y redirigir a Google a esta página cuando se encuentra en una de las páginas con contenido similar. La etiqueta canónica debe colocarse en el encabezamiento de la página principal y de las páginas con contenido similar.

La no indexación de ciertos contenidos

Si el contenido duplicado está en páginas que se consideran de no calidad o no estratégicas, tiene la opción de no indexarlas. Todo lo que tiene que hacer es colocar la etiqueta “noindex” en sus páginas para decirle a Google que no las indexe, pero que las rastree. Se ve así: < meta name = “robot” content = “Noindex, Follow” >. Sin embargo, este método no es recomendable si quiere tener un sitio cualitativo en todas sus páginas.

Nuestras soluciones para evitar el contenido duplicado en el exterior

Al igual que con el contenido duplicado interno, hay varias soluciones que le permitirán luchar contra el contenido duplicado externo.

No utilice el mismo contenido en diferentes sitios de la red

Aunque puede ser tentador utilizar el mismo contenido en varios sitios de su red con temas similares, esto sólo tendrá efectos negativos en su referenciación. De hecho, al hacerlo, Google puede juzgar que el contenido de sus sitios es de mala calidad y, por tanto, penalizarlos en su referenciación.

Tenga cuidado al rediseñar o migrar su sitio web

Los rediseños y las migraciones de sitios web son muy complicados en términos de contenido duplicado. En efecto, cuando uno cambia de dominio, o cuando rediseña su sitio web, se encuentra haciendo redireccionamientos en todas las direcciones, hacia las páginas del nuevo sitio cuya arquitectura puede haber cambiado en comparación con la versión antigua. Por lo tanto, es habitual olvidarse de redireccionar, lo que provoca la aparición de contenido duplicado.

Solicitar la eliminación o desindexación de páginas con contenido similar al suyo

Es posible que algunos de sus competidores estén tomando contenido de sus páginas y lo integren en su sitio. Si observas una práctica de este tipo, puedes hacer valer tus derechos de autor sobre tus textos e imágenes, y pedir al webmaster que elimine o desindexe esas páginas con contenido plagiado del tuyo. Para ello, sólo tiene que enviar un correo electrónico o un mensaje utilizando la información de contacto generalmente indicada en el sitio. Si no recibes respuesta a tu solicitud, puedes utilizar la herramienta de reclamación de Google para forzar la eliminación de este contenido.

5 herramientas para detectar contenido duplicado

Como parte de su estrategia de SEO, es importante comprobar periódicamente que su sitio web tenga un contenido de calidad y que no haya contenido duplicado. El contenido duplicado puede detectarse fácilmente en un sitio pequeño sin el uso de herramientas técnicas de SEO. Pero cuando su sitio tiene muchas páginas, es más complicado identificar este contenido. Para facilitarte la tarea, aquí tienes una lista no exhaustiva de diferentes herramientas SEO que puedes utilizar para detectar la presencia o ausencia de contenido duplicado en tu sitio.

Screaming Frog

Screaming Frog es una herramienta de SEO que le permite rastrear su sitio web como lo hace Google. Esta herramienta le da varias informaciones sobre su sitio web, incluyendo si hay o no contenido duplicado internamente. Screaming Frog también le indica si su sitio tiene títulos de página y metadatos duplicados.

Duplichecker

Duplichecker es una plataforma en la que sólo tienes que introducir el contenido de una de tus páginas en el campo de búsqueda, y luego hacer clic en “comprobar el plagio” para que analice el porcentaje de contenido duplicado presente en tu contenido. También puede introducir directamente la URL de su sitio web, o subir el documento en el que se encuentra su contenido si tiene más de 1000 palabras. Por último, Duplichecker también le permite corregir los errores gramaticales que puedan haberse colado en su contenido.

Kill Duplicate

Kill Duplicate es la herramienta perfecta para detectar a los ladrones de contenido. Simplemente registre su sitio en la plataforma y ésta identificará los sitios que podrían robar su contenido. Kill Duplicate ofrece diferentes paquetes, lo que le permite ocuparse de sitios de diferentes tamaños.

Siteliner

Siteliner es una herramienta que le permite determinar la presencia o ausencia de contenido duplicado en su sitio. Para ello, introduzca la URL de su sitio en la barra de búsqueda y deje que Siteliner rastree su sitio. Además, la herramienta también permite detectar la presencia de enlaces rotos y otra información técnica en su sitio.

Copyscape

La plataforma Copyscape no solo identifica a sus posibles ladrones de contenido, sino que también le permite comprobar si su contenido es único. La versión de pago de Copyscape le permite recibir una notificación en tiempo real si su sitio ha sido plagiado.

Las definiciones más populares

análisis de backlinks
etiqueta h1
Trust Flow
data seo
índice de popularidad
link juice
atributo alt
capullo semántico
meta descripción
malla interna
contenido duplicado

Aumenta tu visibilidad

No dudes en ponerte en contacto con nosotros para obtener un presupuesto gratuito y personalizado.

Notez ce page