Ejemplos de herramientas para detectar contenido duplicado

alexreal

El contenido duplicado puede afectar gravemente a tu posicionamiento SEO y por ello no debemos olvidarnos de optimizar y tener en cuenta esto. A continuación te mostramos una serie de ejemplos de herramientas para detectar contenido duplicado para que aprendas como se desarrollan.

Conoce los ejemplos de las herramientas para detectar el contenido duplicado

Si no controlas el contenido duplicado de tu web, puede que con el tiempo pierdas el posicionamiento de artículos que tanto esfuerzo te ha costado tener en primera página de Google. ¿Por qué? Muy sencillo, porque Google detesta el contenido duplicado, de mala calidad o que no sea de interés para el lector.

Pasos para detectar el contenido duplicado de una Web

El contenido duplicado no es otra cosa que una cantidad importante de fragmentos de un texto que aparece en varios dominios a la vez, bien a través de una copia literal del contenido, bien manteniendo coincidencias bastante similares.

Lo más habitual es que ni siquiera seas consciente de esto que te estoy contando. Incluso, es posible que sufras contenido duplicado dentro de tu propia página web.

Debes tener cuidado con esto para evitar posibles penalizaciones de Google. Tengo que decirte que Google sabe detectar cuándo tienes contenido duplicado sin mala intención. En principio no te penalizará por ello, pero te aconsejo que trates de corregir estos errores para que interprete que vas por el buen camino.

Las mejores herramientas para identificar el contenido duplicado

A continuación te mostramos una serie de ejemplos de herramientas para detectar contenido duplicado para que aprendas como se desarrollan en situaciones reales.

  • Ahrefs

Ahrefs: gracias a esta herramienta, además de detectar contenido duplicado, vas a poder descubrir quiénes son tus competidores o cuál es la posición media de las keywords que más te interesan. Para descubrir si tienes contenido duplicado y cuáles son estas URL’S, tienes que entrar en ahrefs y seleccionar la opción ‘Site audit’. Te aparecerán los diferentes proyectos que has creado anteriormente, elige el que te interesa y, si todavía no lo has hecho, solo tienes que darle a ‘New project’ y crear el tuyo.

  • Webmaster tools / Search Console

Webmaster tools / Search Console: es una herramienta interna de Google y nos dirá qué meta títulos y meta descripciones están duplicadas. Pero no sirve solo para esto, también puedes ver por ejemplo qué problemas de seguridad tiene tu web. Para ver el contenido duplicado en Search Console tienes que seleccionar el proyecto que te interesa y en la barra lateral izquierda pinchar en ‘Apariencia en el buscador’ > ‘Mejoras de HTML’.

  • Screaming frog

Screaming frog: una vez descargues esta herramienta y la ejecutes podrás detectar diferentes tipos de problemas de tu web, desde contenido duplicado hasta enlaces rotos. La versión existe de manera gratuita, aunque con ella solo puedes rastrear un máximo de 500 páginas. Dicho esto, el proceso es: haz el proyecto, exporta los datos en Excel y espera, tardará un rato. En cuanto te haya generado el Excel, descárgalo porque tienes que hacerlo con el Excel de escritorio, no con el Drive

  • Copyscape

Copyscape: es la herramienta más conocida y es muy sencilla de utilizar. Lo único que tienes que hacer es entrar en la web y copiar en el buscador la URL del contenido que te interesa chequear o un fragmento del mismo, y te dirá qué porcentaje de coincidencias tiene con respecto a cualquier texto publicado online. La principal desventaja es que tienes que ir URL por URL, es decir, no puedes ver todo el contenido de tu web, una pena.

  • Plagium

Es otra de las herramientas que solemos utilizar y funciona de una manera muy similar al Copyscape, solo que en lugar de copiar la página que quieres ver si tiene contenido duplicado tienes que poner en el buscador el texto directamente. Si no pagas, el máximo son 5.000 caracteres.

  • Siteliner

Es una alternativa que  ayuda a comprobar si tu contenido se ha duplicado en otras páginas web. Siteliner también analiza la estructura de tu sitio web y te proporciona un informe detallado con los resultados de tu búsqueda.

  • Plagium

Se trata de una opción por Internet totalmente gratuita que te permite comprobar la originalidad de tu contenido. Solo tienes que copiar y pegar tu texto en el cuadro de búsqueda y Plagium te mostrará si hay contenido duplicado en la web.

  • Grammarly

Aunque se trata de una herramienta de corrección gramatical y ortográfica que también te permite comprobar la originalidad de tu contenido. Grammarly te muestra si hay contenido duplicado en la web y te crea un informe detallado con los resultados de tu búsqueda.

  • DupliChecker


Entre las opciones gratuitas Duplichecker ayuda a buscar contenido duplicado en la web. Escanea la web para encontrar contenido duplicado y te proporciona un informe detallado con los resultados en el SERP.

  • SmallSEOTools

Es una herramienta en línea gratuita que te permite comprobar la originalidad de tu contenido. SmallSEOTools revisa la web en busca de contenido duplicado y te proporciona un informe detallado con los resultados de tu búsqueda.

  • SEMrush

SEMrush es un software de SEO de pago que mejora y  comprueba la originalidad de tu contenido y analizar la estrategia de contenido de tu competencia. SEMrush te muestra si hay contenido duplicado en tu sitio web y te proporciona un informe detallado con los resultados de tu búsqueda.

  • Ayuda de búsqueda de Google

Ayuda de búsqueda de Google: este truco también te puede ayudar, pero solo sirve para casos muy concretos en los que quieras comprobar si un texto determinado y no muy extenso aparece en otro sitio web. Todo lo que tienes que hacer es ponerlo entre comillas («) y buscarlo en Google, te mostrará solo aquellos resultados que sean idénticos.

Enlace a ejemplos de contenido duplicado y sus soluciones

A continuación te mostramos un par de ejemplos de empresas en las que se dan situaciones en los que se da mas comúnmente el contenido duplicado y las soluciones que deberíamos aportar.

  • Este es el motivo más común de contenido duplicado, se produce cuando tu página de inicio tiene más de una URL:

ejemplo.com
www.ejemplo.com
ejemplo.com/index.html
www.ejemplo.com/index.html
Cada una de las anteriores dirigen a la misma página con el mismo contenido, tenerlas sin ninguna redirección hace que el buscador no sepa cual es a la que quieres dirigir a la gente.

Solución

Tienes dos opciones:

Hacer una redirección en el servidor para asegurarte de que solo hay una página que se muestre a los usuarios.
Definir que subdominio quieres que sea el principal («www» o «no-www») en Google Webmaster Tools.

 

  • Podemos ver loque las siguientes páginas tienen los mismos post:

Las etiquetas SEO y Contenido Duplicado.
Las categorías SEO y Contenido.
La categoría consejos y la etiqueta consejos.

Solución

La solución depende de cómo uses las categorías y las etiquetas y cuantas haya en cada publicación. Si usas pocas categorías y muchas etiquetas (como la mayoría de la gente) añade meta-etiquetas noindex, follow a tus páginas de etiquetas, en este caso tus categorías son las que posicionaran en los resultados de búsqueda. Si usas muchas categorías y unas pocas etiquetas, la cosa se invertiría añadiendo las meta-etiquetas noindex, follow a tus páginas de categorías.

 

  • Parámetros en la URL

Existen muchos tipos de parámetros, sobre todo en e-commerce: filtros de los productos (color, talla, puntuación, etc.), ordenación (precio menor, por relevancia, precio mayor, en cuadricula, etc.) y sesiones de usuarios. El problema es que muchos de estos parámetros no cambian el contenido de la página, eso produce que haya muchas URLs para el mismo contenido.

Solución

La solución para cualquier problema con los parámetros es añadir una etiqueta rel=canonical hacia la pagina original, simplemente con esto podréis evitar cualquier tipo de confusión por parte de Google con la página original.

Otra posible solución es indicar a Google a través de Google Webmaster Tools > Configuración > Parámetros de URL que parámetros debe ignorar a la hora de indexar páginas en tu web.

 

  • ¿Te ha servido de ayuda?
  • No