Ismael nos traduce a Adam Lasnik en su weblog telendro.com.es un buen sitio para saber cómo funciona el buscador más utilizado, el concepto web más envidiado y un negocio que renta millones de $$$$:
«Adam Lasnik (otro Matt Cutts) explica en el weblog oficial para webmasters de Google algunas cuestiones y consejos referidos al contenido duplicado en Google.
(Si no te fías de mi traducción chapucera, puedes leer la fuente original)
¿ Qué es el contenido duplicado ?
El contenido duplicado se refiere a bloques de contenido significativo, dentro o entre dominios, que son completamente idénticos o muy similares. La mayoría de las veces no es intencionado o al menos no tiene un fin malicioso: foros o blogs con versiones para móviles, productos de tienda online con múltiples distintas urls En algunos casos el contenido es duplicado entre dominios con la intención de manipular los resultados de búsqueda o aumentar el tráfico vía búsquedas populares o búsquedas residuales (long tail).
¿Qué no es contenido duplicado ?
Por ejemplo no consideramos contenido duplicado un mismo artículo escrito en inglés y español. Tampoco es considerado contenido duplicado pequeños fragmentos, referencias textuales de textos ajenos y similares.
¿Porqué Google se preocupa por el contenido duplicado?
Nuestros usuarios quieren ver contenido diverso cuando realizan una búsqueda. En contraste, es entendible que se molesten cuando encuentran el mismo contenido en diferentes páginas dentro de una misma búsqueda. También, los webmasters se preocupan cuando mostramos una url compleja (example.com/contentredir?value=shorty-george?=en) en vez de una url «más bonita» (example.com/en/shorty-george.htm).
¿ Qué hace Google respecto a este tema?
Durante el rastreo y cuando servimos resultados de búsqueda, intentamos indexar y mostrar páginas con información única.
El filtro significa, por ejemplo, que si tu web tiene artículos en «formato estandar» y en versión para impresión y ninguna de ellas está bloqueada desde el robots.txt o vía el meta tag noindex, nosotros elegiremos una versión para ser listada.
En los casos raros en los cuales notamos que el contenido duplicado está siendo utilizado con la intención de manipular los rankings o engañar a los usuarios, también realizaremos los ajustes necesarios en el index y en el ranking de las webs implicadas. Sin embargo, preferimos centrarnos en filtrar más que en ajustes en el ranking. por tanto, en la inmensa mayoría de ocasiones, lo peor que puede ocurrirle a un webmaster es que elijamos la «versión menos deseada» de una página en nuestro index.
¿Cómo puede un webmaster evitar problemas por contenido duplicado?
– Bloquear apropiadamente: Ayuda a google a elegir la mejor versión de tus documentos. Bloquea las versiones duplicadas.
– Utiliza 301s: Si reestructuras tu web, utiliza redirecciones 301 («Redirección permanente») en tu archivo .htaccess para redireccionar elegantemente a tus usuarios, a googlebot y a otras arañas.
– Se consecuente: Utiliza siempre la misma versión de url para tus enlaces internos; no uses /pagina/ , /pagina y /pagina/index.html. En online.com.es explican una posible solución.
– Utiliza TLDs: Para ayudarnos a elegir la mejor versión de un documento, utiliza dominios de primer nivel cuando sea posible para organizar el contenido para diferentes países. Un dominio .de nos sugiere que está enfocado a usuarios alemanes, mientras que un /de o de.ejemplo.com no nos ofrece tantas pistas (Lasnik puntualiza en wmw que si ya tienes un .com posicionado Google ya se encargará de averiguar la lengua de los documentos)
– Sindica con cuidado: Si sindicas tus contenidos en otras webs, cerciórate de que incluyen un link a la versión original de cada artículo sindicado. Incluso con eso, ten en cuenta que elegiremos la versión más apropiada a los usuarios para cada búsqueda, lo que significa que para determinadas búsquedas podría aparecer la copia sindicada.
– Utiliza la opción de dominio preferido en las herramientas para webmasters: Si otras webs enlazan con la versión www y la versión no-www de tu dominio, puedes hacernos saber cual de las dos versiones prefieres que indexemos.
– Minimiza las repeticiones de texto: Por ejemplo, en vez de incluir un largo texto de copyright en la parte baja de cada documento, incluye un breve resumen y enlaza a una página con más detalles.
– Evita páginas sin contenido: A los usuarios no les gusta encontrarse con páginas vacias, por tanto evita páginas que solo contienen la plantilla de tu web. Esto significa no publicar (o por lo menos bloquear) páginas sin reseñas, sin listados de pisos en venta para cierta zona, etc
– Entiende como funciona tu CMS: Comprende como se muestra el contenido de tu web, particularmente si éste incluye un blog, foro, o sistemas similares que muchas veces muestran el mismo contenido bajo diferentes formatos.
– Dont worry be happy: No te ofusques demasiado con webs (planetas y similares) que duplican tu contenido. Siendo algo molesto, es difícil que estos sitios impacten negativamente el posicionamiento de tu web en google (aunque también podéis hacer caso a especialistas en posicionamiento). Si encuentras algún caso especialmente frustrante, puedes rellenar una petición DMCA para reclamar la autoría de cierto contenido.»
Si hago un directorio manual en html para cada provincia y las páginas en si son iguales hasta que tenga enlaces, pero cambio los metas y el texto de la seccion… por ejemplo: socios en zamora, socios en león… eso es contenido duplicado o al cambiar los metas no???
Gracias de antemano
Hola Julio,
No debería considerarse contenido duplicado, hablas de contenido distinto. En principio puedes hacer la prueba con esta herramienta:
http://www.webconfs.com/similar-page-checker.php
Y también utilizar Google Webmasters Tools. Con el tema de los blogs Google anunció que sería más benevolente con el contenido duplicado, muchas veces una página de un artículo es exactamente igual a otra de una categoría o tag.
Recuerda en cualquier caso que Google no penaliza el contenido duplicado simplemente puede ser que el posicionamiento en las páginas de búsqueda sea inferior.
En cualquier caso quizás sea mejor plantear tu duda en el foro para que los demás también aporten sus conocimientos:
http://foro.ceslava.com/
Saludos