9 Febrero 2010

Contenido duplicado en páginas Web

Emilio 9 Febrero 2010, 10:50
Categoría: General

Hoy vamos a hablar de uno de los fallos más comunes en las páginas Web, el contenido duplicado. Mucha gente, Contenido duplicadocuando se le pregunta por contenido duplicado en sus páginas, no saben identificarlo, simplemente creen que si en cada página ponen un contenido diferente están a salvo de este problema.

Pero antes de aprender a identificarlo, vamos a conocer qué repercursiones podría ocasionar en nuestras páginas Web.

Es muy importante tener en cuenta que el contenido duplicado no es penalizado por Google, pero aún no siendo penalizado por los buscadores provocará que nuestra páginas pierdan posiciones dentro de los resultados de las búsquedas orgánicas ya que haremos que todo el contenido duplicado compita entre sí.

Identificar el contenido duplicado

Teniendo esto en cuenta deberíamos de asegurarnos de que nuestras páginas no dispongan de contenido duplicado, pero.. ¿cómo identificamos el contenido duplicado?

Es muy sencillo, tendremos contenido duplicado en nuestras páginas cuando cambiando una URL (dirección Web) accedemos al mismo contenido, es decir, para los buscadores, una URL diferente significa una página diferente, independientemente de que la URL tenga simplemente una barra “/” más o menos.

Uno de los casos más típicos suele ocurrir en la página principal de un sitio Web, normalmente podemos acceder de diferentes formas:

  1. www.site.com
  2. www.site.com/index.html
  3. site.com
  4. site.com/index.html

En el caso de arriba estaríamos creando código duplicado cuatro veces, luego nuestros esfuerzos por posicionar la home de nuestra página se verían divididos por cuatro.

¿Cómo solucionar el código duplicado?

Para solucionarlo, simplemente tendremos que redireccionar todas las posibles puertas a una sola, por ejempo, a www.site.com; no importará como se teclee la dirección de nuestra página Web, siempre entraremos por una sola.

Para hacer esta redirección es necesaria hacerla del tipo 301 (movido permanente) ya que es la única manera de que los robots de los buscadores tengan en cuenta y transfieran la popularidad de las otras puertas de acceso.

Solución alternativa, atributo canonical

Una solución alternativa a la redirección 301 para evitar el contenido duplicado es el atributo canonical. Si añadimos esta etiqueta a nuestra página de inicio, podremos informar de un único acceso válido a nuestra página, de esta forma, seguimos ofreciendo cuatro puertas de acceso pero le indicamos a los buscadores que solo tengan en cuenta una de ellas.

El atributo canonical ha deser agregado en la cabecera de las páginas y debe contener la siguiente información

<link rel=”canonical” href=”http://www.site.com/canonical-page.html”/>

Dentro de href deberemos indicar la URL de la página que queremos que sea considerada como la principal, en el caso anterior, podría ser http://www.site.com.

Esperamos que esta información os pueda ser de ayuda en vuestros proyectos y evite que desperdiciéis tiempo posicionando varias páginas cuando en realidad se trataba de posicionar solo una.

Share and Enjoy:
  • Print
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks

6 comentarios

  1. [...] contenido duplicado, del que hablamos la semana pasada,  es sin duda un enemigo peligroso del posicionamiento Web. Ya [...]

  2. [...] quiero extenderme en el concepto general, pues ya expliqué qué es el contenido duplicado y como podemos [...]

  3. kumikiro dice:

    Muchas gracias por el artículo,

    pero 2 preguntas, la primera es como podemos identificar contenido duplicado cuando nos enfrentamos a un site con más de 1000 páginas, es decir, no podemos ir una por una buscando.

    La segunda pregunta es si google detecta como contenido duplicado la misma página cuando tienen siempre el mismo id en la url pero “variables aleatorias” diferentes del tipo “ttnews” o “cHash”

    Gracias

  4. Emilio dice:

    Hola kumikiro, respecto a la primera pregunta, para detectar contenido duplicado en páginas muy grandes o bien analizas la “estructura web” y compruebas posibles anomalías que pudiera generar contenido duplicado o te registras en Webmasters tools y esperas a que Google recabe información; si encuentra contenido duplicado te lo hará saber.

    Con respecto a tu segunda pregunta, si se le añaden variables a una URL y el contenido no varía.. será contenido duplicado. La única forma de evitarlo sería añadiendo antes de estas variables el símbolo “#” ya que a partir de ese punto, Google ignorará el resto de parámetros.

  5. kumikiro dice:

    Muchas gracias por la respuesta,

    Sencilla y efectiva.

    Os habéis ganado un nuevo seguidor en el feed

  6. Emilio dice:

    Kumikiro, me alegro que te sirviera, espero que puedas encontrar cosas valiosas para ti en este blog, un saludo.

Deja tu comentario


Buscar

  • Categorias

  • Últimos comentarios

    • Diseñador web: Una lista super amplia .. por algo el posicionamiento es caro
    • Emilio: Kumikiro, me alegro que te sirviera, espero que puedas encontrar cosas valiosas para ti en este blog, un...
    • kumikiro: Muchas gracias por la respuesta, Sencilla y efectiva. Os habéis ganado un nuevo seguidor en el feed
    • Emilio: Me alegro que te haya gustado Jota, muchas gracias por dar tu opinión.
    • Emilio: Hola kumikiro, respecto a la primera pregunta, para detectar contenido duplicado en páginas muy grandes o...

    Twitter