Contenido duplicado y Google

Ismael nos traduce a Adam Lasnik en su weblog telendro.com.es un buen sitio para saber cómo funciona el buscador más utilizado, el concepto web más envidiado y un negocio que renta millones de $$$$:

«Adam Lasnik (otro Matt Cutts) explica en el weblog oficial para webmasters de Google algunas cuestiones y consejos referidos al contenido duplicado en Google.

(Si no te fí­as de mi traducción chapucera, puedes leer la fuente original)

¿ Qué es el contenido duplicado ?
El contenido duplicado se refiere a bloques de contenido significativo, dentro o entre dominios, que son completamente idénticos o muy similares. La mayorí­a de las veces no es intencionado o al menos no tiene un fin malicioso: foros o blogs con versiones para móviles, productos de tienda online con múltiples distintas urls En algunos casos el contenido es duplicado entre dominios con la intención de manipular los resultados de búsqueda o aumentar el tráfico ví­a búsquedas populares o búsquedas residuales (long tail).

¿Qué no es contenido duplicado ?
Por ejemplo no consideramos contenido duplicado un mismo artí­culo escrito en inglés y español. Tampoco es considerado contenido duplicado pequeños fragmentos, referencias textuales de textos ajenos y similares.

¿Porqué Google se preocupa por el contenido duplicado?
Nuestros usuarios quieren ver contenido diverso cuando realizan una búsqueda. En contraste, es entendible que se molesten cuando encuentran el mismo contenido en diferentes páginas dentro de una misma búsqueda. También, los webmasters se preocupan cuando mostramos una url compleja (example.com/contentredir?value=shorty-george?=en) en vez de una url «más bonita» (example.com/en/shorty-george.htm).

¿ Qué hace Google respecto a este tema?
Durante el rastreo y cuando servimos resultados de búsqueda, intentamos indexar y mostrar páginas con información única.
El filtro significa, por ejemplo, que si tu web tiene artí­culos en «formato estandar» y en versión para impresión y ninguna de ellas está bloqueada desde el robots.txt o ví­a el meta tag noindex, nosotros elegiremos una versión para ser listada.
En los casos raros en los cuales notamos que el contenido duplicado está siendo utilizado con la intención de manipular los rankings o engañar a los usuarios, también realizaremos los ajustes necesarios en el index y en el ranking de las webs implicadas. Sin embargo, preferimos centrarnos en filtrar más que en ajustes en el ranking. por tanto, en la inmensa mayorí­a de ocasiones, lo peor que puede ocurrirle a un webmaster es que elijamos la «versión menos deseada» de una página en nuestro index.

¿Cómo puede un webmaster evitar problemas por contenido duplicado?
Bloquear apropiadamente: Ayuda a google a elegir la mejor versión de tus documentos. Bloquea las versiones duplicadas.
Utiliza 301s: Si reestructuras tu web, utiliza redirecciones 301 («Redirección permanente») en tu archivo .htaccess para redireccionar elegantemente a tus usuarios, a googlebot y a otras arañas.
Se consecuente: Utiliza siempre la misma versión de url para tus enlaces internos; no uses /pagina/ , /pagina y /pagina/index.html. En online.com.es explican una posible solución.
Utiliza TLDs: Para ayudarnos a elegir la mejor versión de un documento, utiliza dominios de primer nivel cuando sea posible para organizar el contenido para diferentes paí­ses. Un dominio .de nos sugiere que está enfocado a usuarios alemanes, mientras que un /de o de.ejemplo.com no nos ofrece tantas pistas (Lasnik puntualiza en wmw que si ya tienes un .com posicionado Google ya se encargará de averiguar la lengua de los documentos)
Sindica con cuidado: Si sindicas tus contenidos en otras webs, cerciórate de que incluyen un link a la versión original de cada artí­culo sindicado. Incluso con eso, ten en cuenta que elegiremos la versión más apropiada a los usuarios para cada búsqueda, lo que significa que para determinadas búsquedas podrí­a aparecer la copia sindicada.
Utiliza la opción de dominio preferido en las herramientas para webmasters: Si otras webs enlazan con la versión www y la versión no-www de tu dominio, puedes hacernos saber cual de las dos versiones prefieres que indexemos.
Minimiza las repeticiones de texto: Por ejemplo, en vez de incluir un largo texto de copyright en la parte baja de cada documento, incluye un breve resumen y enlaza a una página con más detalles.
Evita páginas sin contenido: A los usuarios no les gusta encontrarse con páginas vacias, por tanto evita páginas que solo contienen la plantilla de tu web. Esto significa no publicar (o por lo menos bloquear) páginas sin reseñas, sin listados de pisos en venta para cierta zona, etc
Entiende como funciona tu CMS: Comprende como se muestra el contenido de tu web, particularmente si éste incluye un blog, foro, o sistemas similares que muchas veces muestran el mismo contenido bajo diferentes formatos.
Dont worry be happy: No te ofusques demasiado con webs (planetas y similares) que duplican tu contenido. Siendo algo molesto, es difí­cil que estos sitios impacten negativamente el posicionamiento de tu web en google (aunque también podéis hacer caso a especialistas en posicionamiento). Si encuentras algún caso especialmente frustrante, puedes rellenar una petición DMCA para reclamar la autorí­a de cierto contenido.»

telendro.com.es » Contenido duplicado y Google:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  1. Si hago un directorio manual en html para cada provincia y las páginas en si son iguales hasta que tenga enlaces, pero cambio los metas y el texto de la seccion… por ejemplo: socios en zamora, socios en león… eso es contenido duplicado o al cambiar los metas no???

    Gracias de antemano

    1. Hola Julio,

      No deberí­a considerarse contenido duplicado, hablas de contenido distinto. En principio puedes hacer la prueba con esta herramienta:

      http://www.webconfs.com/similar-page-checker.php

      Y también utilizar Google Webmasters Tools. Con el tema de los blogs Google anunció que serí­a más benevolente con el contenido duplicado, muchas veces una página de un artí­culo es exactamente igual a otra de una categorí­a o tag.

      Recuerda en cualquier caso que Google no penaliza el contenido duplicado simplemente puede ser que el posicionamiento en las páginas de búsqueda sea inferior.

      En cualquier caso quizás sea mejor plantear tu duda en el foro para que los demás también aporten sus conocimientos:

      http://foro.ceslava.com/

      Saludos