Contenido duplicado: Qué es y cómo puedes evitarlo

Contenido duplicado: Qué es y cómo puedes evitarlo

El contenido duplicado, es algo de lo que muy pocos sitios web se libran, puesto que la mayoría de las veces, puede ser algo creado por nuestro propio gestor, ni siquiera intencionadamente. Este tipo de textos tienen un valor muy bajo de cara al usuario y puede llegar a perjudicar tu posicionamiento web.

En este post, queremos compartir con vosotros a qué nos referimos exactamente cuando hablamos de contenido duplicado, así como por qué puede ser perjudicial para el posicionamiento orgánico de tu sitio web. Existen diferentes tipos de contenidos duplicados, para los cuales se debe actuar de manera diferenciada si queremos solucionarlos.

 

¡Sigue leyendo para conocer todo lo que debes saber sobre el contenido duplicado!

 

¿Qué es el contenido duplicado?

Estrictamente, se considera contenido duplicado, a un conjunto amplio de texto o código fuente de una página web que coincide parcial o totalmente con otro que existe en otra página.

Este puede ser de dos tipos principalmente, interno, cuando las duplicidades se producen en el mismo sitio web, o externo, cuando éstas se producen en sitios webs diferenciados, los cuales trataremos más adelante.

que es contenido duplicado

¿Por qué puede ser perjudicial para el SEO?

El objetivo principal de Google, es dar la mejor respuesta posible al usuario. Para ello, el buscador necesita rastrear el contenido que cada web ofrece para dichas búsquedas.

Cuando encuentra varias versiones para un mismo contenido, es complicado que los motores de búsqueda determinen qué versión deben indexar para mostrar en los resultados. Esto reduce el rendimiento de todas las versiones, puesto que se encuentran compitiendo entre ellas.

Esto también será perjudicial a la hora de asignar autoridad, confianza y relevancia a una página web, puesto que ésta se verá dividida entre diferentes resultados, haciendo que cada versión sea más débil.

¿El contenido duplicado penaliza?

Una de las preguntas más repetidas, es si el hecho de tener contenido duplicado en un proyecto web, es motivo de penalización. Como ya adelantaba Google en su blog para webmasters, el contenido duplicado no penaliza una web, salvo que se vea claramente que el objetivo de haber incluido dicho contenido, es engañar y manipular los resultados de los buscadores.

Tipos contenido duplicado

Como hemos comentado anteriormente, la duplicidad de contenido puede darse de diferentes formas, ya que no solo afecta que estas versiones se encuentren en sitios diferenciados, sino que también pueden ubicarse en nuestra propia página web, y ni tan siquiera ser conscientes de ello. A continuación, compartiremos con vosotros algunos de problemas de contenido duplicado más frecuentes:

Contenido duplicado interno

La mayor parte de los problemas de contenido duplicado, se producen por una mala utilización de ciertos parámetros en nuestra propia página web, no pudiendo Google identificar aquel contenido que queremos que priorice su indexación.

No hay dominio principal

También denominado dominio canónico. Nuestra página web, es capaz de operar con diferentes versiones (con www, sin ellas, con la versión segura HTTPS, etc), por ese motivo debemos indicarle a Google cuál queremos que valore por encima de las demás, ya que sino cada versión creará páginas con idénticos contenidos, y correremos el riesgo de que Google las considere como contenido duplicado.

Organización inadecuada del contenido

Es muy habitual encontrarnos en proyectos web, categorías con una mala clasificación o incluso, con inexistencia de metadescripciones, la utilización de contenido idéntico en diferentes post o la tendencia en algunos e-commerce a copiar las fichas de producto. Esto provoca, que a los ojos de Google, al tratarse de URLs diferenciadas, lo entienda como contenido duplicado.

Parámetros URL

Debemos tener en cuenta que cuando nuestro sitio web contiene diferentes versiones, dependiendo del país o región, si no indicamos lo contrario a Google, pasará a considerarse como contenido duplicado.

Por ello, es importante la utilización de etiquetas “hreflang, puesto que estaremos señalando a Google que estos contenidos, se encuentra destinadas a diferentes públicos.

Paginación, archivos, categorías y etiquetas

Cada URL que va surgiendo en una web, es susceptible de que Google la valore como contenido duplicado. Esto sucede con las URLs de paginación, archivos de imágenes, categorías y etiquetas.

Por ese motivo, es recomendable que si no queremos que Google valore dicho contenido, podamos proceder a desindexar. Aquí entra en juego el denominado “Thin Content”, el cual hace referencia al contenido de muy baja calidad o pobre, para todas aquellas URLs de nuestro sitio web, que apenas proporcionan contenido o incluso, carecen de él.

Partes de la web en desarrollo

Si permitimos que Google acceda a determinadas URLs de nuestra web, que aún se encuentren en desarrollo, éstas pueden llegar a ser indexadas. Por ello, es recomendable que podamos indicar esto a Google dentro de nuestro propio archivo robots.txt.

Contenido duplicado externo

En otras ocasiones, el contenido duplicado se produce en sitios webs diferenciados, gestionados por distintas administradores. Esto puede producirse, bien porque nosotros mismos copiemos un artículo o algunos fragmentos, a la hora de redactar un contenido para nuestro blog, o por otro lado, que sean otras webs las que nos copien a nosotros.

En este último caso, hay ocasiones, en que aunque nuestra fecha de publicación sea anterior, si tu dominio es muy reciente, puede que Google tenga en cuenta la reputación de ambas páginas, pensando que el plagiador eres tú.

¿Cómo puedo solucionar los errores de contenido duplicado?

A la hora de solucionar posibles problemas de contenido duplicado, es importante que primero localices dicho contenido, para así podemos aplicar una solución efectiva al problema en cuestión.

Detectar contenido duplicado

Existen varias herramientas, algunas de ellas gratuitas, que te pueden ayudar a la hora detectar contenido duplicado. Te comentamos algunas de las más utilizadas:

 

  • Comando “site”: Se trata de una fórmula muy efectiva y recomendable para aquellos proyectos web, que no posean un número demasiado elevado de URLs, puesto que si cuentas con mucho contenido, ésta búsqueda puede volverse interminable. Es tan fácil como poner en el buscador de Google: <<site:tudominio.com>>, y podrás ver todo lo que Google tiene indexado en tu sitio web.

 

como hacer un site

 

  • CopyScape: Sirve para detectar aquellas páginas web externas que hayan podido copiar de manera parcial o total, el contenido de tu página web. Funciona de igual manera que un buscador, simplemente introduciendo la URL que queremos analizar, nos arrojará un resultado, sobre aquellas páginas que contienen un porcentaje de palabras similares a las que hay en nuestro contenido.
  • Siteliner: Esta herramienta nos ayudará a detectar contenido duplicado interno, puesto que analizará aquellas páginas en nuestro sitio web, que cuentan con contenido similar o duplicado.
  • Sistrix, SEMrush o Screaming Frog, son herramientas de pago, que nos ofrecen un amplio abanico de posibilidades, a la hora de analizar el contenido duplicado. Más en concreto, ofrecen un funcionamiento algo más complejo.

Claves para solucionar el contenido duplicado

Aplicar soluciones efectivas para los problemas de contenido duplicado, implica tiempo de control y seguimiento. A pesar de que cada página es diferente, sí que existen algunos errores comunes, que si llevamos a cabo ciertas acciones, podemos solucionar determinados problemas de contenido duplicado.

 

  1. Rel Canonical: Anteriormente ya hablamos de esta etiqueta. Sirve para que Google identifique la versión de tu web que debe fijarse para la indexación.
  2. Archivo robots.txt: Te recomendamos que si no tienes conocimiento técnicos sobre la materia, lo dejes en manos de profesionales. Pero sí debes saber, que incluir ciertas páginas en este archivo, impide que los bots de Google pasen por las mismas.
  3. Redirecciones 301: Esto nos ayudará a llevar a los bots de Google a las páginas que nos interesan. Suele realizarse cuando hemos movido contenido de una página a otra, de esta manera, cuando un usuario o el propio Google, intente entrar a una página que contenga contenido duplicado, automáticamente se le redireccionará a la página adecuada.
  4. Reescribir contenidos: Si has identificado fichas de productos duplicadas o contenidos en tu blog muy similares, es conveniente que puedas reescribir dichos contenidos, atacando por ejemplo, palabras clave diferenciadas.
  5. No follow: Puedes incluir etiquetas “no follow”, para indicar a Google que no acceda a determinados enlaces colocados en tu sitio web.
  6. Etiqueta Hrflang: Como comentamos anteriormente, esto avisará a Google de que nuestro contenido se está ofreciendo para dos públicos diferenciados, en idioma, país o región.
  7. Es conveniente que mejoraremos nuestros títulos, categorías del blog o de producto y sus metadescripciones, aportando un contenido diferenciado.
  8. No plagiar a la hora de trabajar nuestra estrategia de contenidos, aunque se trate de únicamente un párrafo, esto es detectable.
  9. Si encontramos contenido duplicado en sitios webs externos, es conveniente que exijamos que lo eliminen. Si es necesario, podemos también denunciar la página web a Google.

Ahora que ya conoces más acerca del contenido duplicado, te recomendamos que seas constante a la hora de revisar y detectar dicho contenido, para poder ponerle solución lo antes posible.

 

Desde Online Zebra, trabajamos el marketing de contenidos a la hora de adaptar la estrategia, en proporcionar al usuario de tu página web un contenido de calidad y que realmente sea relevante para el mismo. No dudes en ponerte en contacto con nosotros, si necesitas más información acerca de dicho servicio.


Autor: Carmen García Robles


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *