¿Te acuerdas de lo que pasaba cuando ibas al colegio y el profesor te pillaba copiando? Pues ahora ese profesor se llama Google y te lo advertimos, no tiene un pelo de tonto. Es por ello que detectar contenido duplicado se convierte en una cuestión de gran importancia, para asegurarnos de que la información que aportamos en nuestra web es original y evitar así que el todopoderoso nos penalice.
Pero, ¿qué puede pasarnos si tenemos contenido duplicado? ¿Cómo podemos detectarlo?
Como dijo Jack el destripador, vamos por partes. ¡En nuestro blog de SEO encontrarás toda la información que necesitas!
Consecuencias del contenido duplicado
Lo primero que tenemos que tener en cuenta es que las consecuencias del contenido duplicado para el SEO pueden ser más importantes de lo que parece y, como seguramente hayas leído, cuando el ratio es muy grande, esta acción penaliza.
Si tienes un par de URL’s con contenido duplicado Google no se va a enfadar, pero si la gran mayoría del contenido de tu web es copiado de otros sitios de Internet o has fusilado la misma información en diferentes URL’s, puede que sí lo haga.
El objetivo de Google es ofrecer al usuario información única y útil, y es por eso que la creación de contenido de calidad tiene tanta importancia hoy en día.
Si ayudas a Google a cumplir su objetivo te cuidará bien pero, si el robot pasa por tu web y encuentra un exceso de contenido duplicado, puede que te penalice y te saque de una patada de las SERP’s.
Pero la posibilidad de que te penalicen no es el único riesgo que corres cuando publicas contenido duplicado, además:
- Dificultas el posicionamiento y la visibilidad online de tu web, si no ofreces contenidos de calidad y relevantes ni los usuarios ni los bots te tomarán en serio.
- Das una muy mala imagen de tu marca o servicio. Los textos de nuestra web son la vía que usamos para comunicarnos con los usuarios, y hacerlo bien es fundamental.
- Estás trabajando para nada. Tras los muchos cambios de algoritmo de Google, el aporte del thin content es completamente nulo, por lo que si esa es tu estrategia, vas en la dirección equivocada.
Saber cómo detectar contenido duplicado es muy importante para evitarlo tanto de manera interna, con la información que damos dentro de la web, como de manera externa con el resto de páginas de Internet.
Como apunte, destacar que si tienes la misma información en diferentes URL’s pero estas se encuentran en Noindex, no pasa nada. Como el robot del buscador no va a pasar por estas páginas con textos repetidos, no hay ningún problema ni riesgo.
Por ejemplo, pongámonos en el caso de que tienes una web de venta de ropa. A la hora de etiquetar tus productos seguramente recurras a conceptos como “camisa a rayas” o “pantalón boyfriend” y, si tienes varias prendas del estilo, estarán categorizadas de la misma manera.
Generalmente, cuando los usuarios buscan prendas concretas lo hacen dentro de una web porque saben que en esa tienda online van a poder encontrarlo, pero no acuden a Google y buscan por ejemplo “camisa a rayas”. Por lo tanto, puedes tener la misma información en las diferentes descripciones de productos similares, ponlo en Noindex y ya está.
Las mejores herramientas para detectar contenido duplicado
No es lo mismo querer detectar información duplicada en tus diferentes páginas que querer averiguar si un texto es copiado directamente de Internet, así que vamos a recomendar diferentes herramientas para unos y otros casos:
Detectar contenido duplicado en tu web
- Ahrefs: gracias a esta herramienta, además de detectar contenido duplicado, vas a poder descubrir quiénes son tus competidores o cuál es la posición media de las keywords que más te interesan. Para descubrir si tienes contenido duplicado y cuáles son estas URL’S, tienes que entrar en ahrefs y seleccionar la opción ‘Site audit’. Te aparecerán los diferentes proyectos que has creado anteriormente, elige el que te interesa y, si todavía no lo has hecho, solo tienes que darle a ‘New project’ y crear el tuyo.
Una vez estés dentro del proyecto que quieres, clica donde pone ‘All crawls’ en la más actual y si bajas te aparecerá una imagen como esta:
Nosotros hemos hecho este proceso para Unareceta.com, uno de nuestros proyectos, y el programa nos detecta tres contenidos como ‘bad duplicates’. Presiona sobre este y podrás ver las URL’s en cuestión. En nuestro caso, teníamos tres páginas (una de ellas en Noindex por lo que no pasa nada). Ya lo hemos solucionado 😉
- Webmaster tools / Search Console: es una herramienta interna de Google y nos dirá qué meta títulos y meta descripciones están duplicadas. Pero no sirve solo para esto, también puedes ver por ejemplo qué problemas de seguridad tiene tu web. Para ver el contenido duplicado en Search Console tienes que seleccionar el proyecto que te interesa y en la barra lateral izquierda pinchar en ‘Apariencia en el buscador’ > ‘Mejoras de HTML’.
- Screaming frog: una vez descargues esta herramienta y la ejecutes podrás detectar diferentes tipos de problemas de tu web, desde contenido duplicado hasta enlaces rotos. La versión existe de manera gratuita, aunque con ella solo puedes rastrear un máximo de 500 páginas. Dicho esto, el proceso es: haz el proyecto, exporta los datos en Excel y espera, tardará un rato. En cuanto te haya generado el Excel, descárgalo porque tienes que hacerlo con el Excel de escritorio, no con el Drive.
Vamos a utilizar las herramientas que nos ofrece Excel, este truquito made in BigSEO no tiene precio. Selecciona ‘Formato condicional’ > ‘Resaltar reglas de celdas’ > ‘Duplicar valores’.
Te saldrán marcados en rojo los que estén duplicados. Para poder verlo con mayor facilidad, aplica filtros con relleno y ordena alfabéticamente. ¡Listo!
- Site: herramienta interna de Google: basta con poner en la barra de direcciones ‘site:’ seguido de tu dominio para que Google te muestre todo aquello que tiene indexado. Podrás ver si tienes contenido duplicado o no. No obstante, si tienes una web muy grande con mucho contenido esta herramienta es la última, ultimísima opción que te recomendamos.
Para ver el contenido duplicado de Unareceta.com hemos hecho los cuatro procesos y en todos ellos hemos obtenido el mismo resultado, ¿conclusión? Elijas la que elijas, ¡todos los caminos llevan a Roma! Solo que unos, pues son más rápidos que otros.
Detectar si un contenido es duplicado de otra web
Si para tu web trabajan diferentes redactores, es una buena idea asegurarte de que están generando textos 100% originales. Y para hacerlo, algunas buenas opciones son:
- Copyscape: es la herramienta más conocida y es muy sencilla de utilizar. Lo único que tienes que hacer es entrar en la web y copiar en el buscador la URL del contenido que te interesa chequear o un fragmento del mismo, y te dirá qué porcentaje de coincidencias tiene con respecto a cualquier texto publicado online. La principal desventaja es que tienes que ir URL por URL, es decir, no puedes ver todo el contenido de tu web, una pena.
- Plagium: es otra de las herramientas que solemos utilizar y funciona de una manera muy similar al Copyscape, solo que en lugar de copiar la página que quieres ver si tiene contenido duplicado tienes que poner en el buscador el texto directamente. Si no pagas, el máximo son 5.000 caracteres.
- Ayuda de búsqueda de Google: este truco también te puede ayudar, pero solo sirve para casos muy concretos en los que quieras comprobar si un texto determinado y no muy extenso aparece en otro sitio web. Todo lo que tienes que hacer es ponerlo entre comillas («) y buscarlo en Google, te mostrará solo aquellos resultados que sean idénticos.
Consejos para evitar el contenido duplicado
De acuerdo, ya hemos visto si tenemos contenido duplicado. ¿Y ahora qué? Como ya hemos mencionado antes, a Google le gusta lo bueno, bonito y original, así que si quieres tenerlo contento lo que tienes que hacer es crear contenido original. Algunas de nuestras recomendaciones son:
- Crea contenido original y contrasta la información en diferentes sitios. De este modo, obtendrás distintas ideas sobre un mismo concepto y podrás crear uno nuevo con tus propias palabras. Es importante que antes de hacerlo entiendas de qué estás hablando y sepas que lo que dices es real. Si no lo haces y copias contenido, podrías cometer los mismos errores que el resto.
- No parafrasees. Puede ser que exista una idea que te haya gustado mucho, de acuerdo, nos ha pasado a todos. Pero, ¿esa idea es tuya? ¿No? Pues no la utilices. Tienes que crear textos originales, únicos, con tus propias palabras y muletillas, hacerlo personal.
- Si trabajas con un equipo de redactores, asegúrate de contratar a auténticos profesionales que se toman el tiempo y las molestias pertinentes para hacer un buen trabajo. Si no lo haces, las repercusiones de su no profesionalidad te afectarán directamente.
- En caso de contratar con redactores externos, lo mismo, asegúrate de que son de confianza. Incluso si quieres puedes pasar los textos por el Copyscape, si no te salta no hay ningún problema.
Y, ahora que ya sabes cómo detectar contenido duplicado y por qué es importante crear textos originales y de calidad, no le des más vueltas. Aunque tengas que dedicarle tiempo, recuerda, ¡quien algo quiere algo le cuesta!
A ver si me podeis ayudar oráculos del SEO, en el contenido de mi web, es necesario hacer referencias literales en ocasiones al BOE, pero este contenido realmente no me interesa que lo coja google, pero poner la página entera en no index, no me interesa porque el resto de contenido es propio y aporta al lector. ¿Cómo puedo no indexar sólo una parte de una entrada/página? No indexar páginas enteras lo hago desde el propio plugin de YOAST SEO, pero no se si existe alguna solución, fácil para esto que comento.
Gracias por el artículo y toda la información útil
Una duda: Si tengo una empresa que presta sus servicios en 50 poblaciones distintas, y quiero posicionar para :pintores Getafe, pintores parla, …. Y así en las 50 poblaciones, como lo puedo hacer para que no sea contenido duplicado, es imposible el crear 50 páginas completamente distintas y con el contenido suficiente como para posicionarse.
Muchas gracias