<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Marketing en buscadores orientado a resultados &#187; robots.txt</title>
	<atom:link href="http://blog.traffic4u.es/articulo/tag/robots-txt/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.traffic4u.es</link>
	<description>Empresa especializada en marketing online y publicidad en buscadores</description>
	<lastBuildDate>Fri, 10 Sep 2010 12:31:11 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Como bloquear diferentes partes de nuestra Web a los buscadores</title>
		<link>http://blog.traffic4u.es/articulo/como-bloquear-diferentes-partes-de-nuestra-web-a-los-buscadores/</link>
		<comments>http://blog.traffic4u.es/articulo/como-bloquear-diferentes-partes-de-nuestra-web-a-los-buscadores/#comments</comments>
		<pubDate>Wed, 03 Mar 2010 21:23:12 +0000</pubDate>
		<dc:creator>Emilio</dc:creator>
				<category><![CDATA[General]]></category>
		<category><![CDATA[robots.txt]]></category>

		<guid isPermaLink="false">http://blog.traffic4u.es/?p=590</guid>
		<description><![CDATA[Mucha gente es posible que se pregunte por qué interesaría bloquear ciertas partes de una página Web a los buscadores. Pues bien, entre los motivos más importantes se me ocurren dos, una gran razón podría ser por motivos de seguridad. Razones para bloquear ciertas partes de un sitio Web Muchas páginas disponen de &#8220;zonas seguras&#8221; [...]]]></description>
			<content:encoded><![CDATA[<p>Mucha gente es posible que se pregunte por qué interesaría bloquear ciertas partes de una página Web a los buscadores. Pues bien, entre los motivos más importantes se me ocurren dos, una gran razón podría ser por motivos de seguridad.</p>
<h2>Razones para bloquear ciertas partes de un sitio Web</h2>
<p>Muchas páginas disponen de &#8220;zonas seguras&#8221; donde la gente o los webmasters guardan cierta documentación o simplemente son sitios desde los que se puede administrar la página. Si permitimos a los robots de búsqueda indexar por completo toda la estructura de nuestra página es posible que estas secciones se vuelvan visibles para ciertas personas o lo que es peor, que en el caso de disponer de fallos de seguridad, estos robots puedan acceder a dichas secciones y publicar toda la información alli encontrada.</p>
<p><span id="more-590"></span></p>
<p>Una segunda razón puede ser para controlar la carga de trabajo de nuestro servidor, en especial, el ancho de banda consumido. Imaginemos que disponemos de una sección de noticias que además de mostrarlas vía web, permite su descarga en formato PDF y todos esos ficheros se almacenan en una carpeta.</p>
<p>Si permitimos que los robots indexen todos los ficheros PDF, estaríamos permitiendo que la misma información se indexara dos veces (en formatos diferentes) por lo que la carga de trabajo y ancho de banda de nuestro servidor aumentaría.</p>
<h2>¿Cómo puedo bloquear ciertas partes de mi sitio Web?</h2>
<p>Para bloquear partes de un sitio Web a los buscadores podemos hacer uso del fichero robots.txt. A continuación mostramos una imagen que explica el proceso.</p>
<p><img class="aligncenter size-full wp-image-591" title="robots.txt" src="http://blog.traffic4u.es/wp-content/uploads/2010/03/etiquetarobots-seo_thumb.gif" alt="robots.txt" width="497" height="530" /></p>
<p>Este fichero, de nombre <strong>robots.txt</strong> tiene que ser creado en la raíz de nuestro servidor y la estructura para bloquear ciertas partes de una página Web debería ser la siguiente:</p>
<p><em>User-agent: *<br />
Disallow: /descargas-pdf<br />
Disallow: /admin</em></p>
<p>Con la instrucción User-agent nos referimos al buscador, si utilizamos &#8216;*&#8217; indicaremos que es válido para todos. Y mediante Disallow indicamos las carpetas que no queremos que sean indexadas. Es importante darse cuenta que las rutas deben de ser relativas, es decir, sin añadir <em>http://..</em></p>
<p>Si queréis saber más información sobre el archivo robots.txt, <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=es&amp;answer=156449">en este enlace podréis encontrarlo</a>.</p>
<h2>Validar robots.txt</h2>
<p>En el panel de Herramientras para Webmasters de Google podremos también supervisar este fichero y comprobar si está funcionando de forma correcta. Incluso dipondremos un una herramienta para crear de forma sencilla e intuitiva.</p>
<p><img class="aligncenter size-full wp-image-594" title="robots" src="http://blog.traffic4u.es/wp-content/uploads/2010/03/robots1.png" alt="robots" width="559" height="183" /></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.traffic4u.es/articulo/como-bloquear-diferentes-partes-de-nuestra-web-a-los-buscadores/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
