什么及如何建立一个Robots.txt文件?

首页 >> 中国网络传播网文章管理系统 >> 搜索引擎知识 >> 正文

什么及如何建立一个Robots.txt文件?

来源:中国搜索引擎研究网   文章作者:佚名


为获得在某一搜索引擎中的排名,您根据其排名规律,精心设计某一页面,使其符合得很好,登记后也获得理想的排名。

由于各搜索引擎排名规则各异,您的某一页面能获得某一搜索引擎中的好的排名,但通常情况下,对于其他搜索引擎,排名就差得很远。

为此,有人在站点中复制出内容相同的不同文件名的页面,并对复制页面的原标记进行修改,以期符合其他搜索引擎排名规则。

然而,许多搜索引擎一旦发现您站点中有异常“克隆”页面,会给予惩罚,不收录您的页面。

Robots.txt就是为了解决这问题。

我们给出样本:

User-agent:
Disallow:

譬如,如果您想告诉Excite搜索引擎的Spider(ArchitextSpider),不检索您站点中三个特定页面,您可这样操作:

User-agent: ArchitextSpider
Disallow: /orderform.html
Disallow: /product1.html
Disallow: /product2.html

如果您不想让Excite的Spider检索在abc目录下的def.htm文件:

User-agent: ArchitextSpider
Disallow: /abc/def.htm

不检索整个mydirectory目录:

User-agent: ArchitextSpider
Disallow: /mydirectory/

不让所有Spider检索:

User-agent: *

不检索整个站点:

Disallow: /

我们给出其他实例:

User-agent: ArchitextSpider
Disallow: /abc/def.htm

User-agent: Infoseek
Disallow: /ghi/jkl.htm

User-agent: ArchitextSpider
User-agent: Infoseek
Disallow: /abc/def.htm
Disallow: /ghi/jkl.htm


如下列表为世界各大搜索引擎和其对应的User-Agent,供大家参考。

搜索引擎 User-Agent
AltaVista Scooter
Infoseek Infoseek
Hotbot Slurp
AOL Search Slurp
Excite ArchitextSpider
Google Googlebot
Goto Slurp
Lycos Lycos
MSN Slurp
Netscape Googlebot
NorthernLight Gulliver
WebCrawler ArchitextSpider
Iwon Slurp
Fast Fast
DirectHit Grabber
Yahoo Web Pages Googlebot
Looksmart Web Pages Slurp


小心Slurp,如果您不想让其检索一个页面,这会使多个其他搜索引擎也不检索该页面。通常,用Slurp的搜索引擎规则差不多。

一般,根目录下的页面排名要高于次目录下页面的排名,这是因为,搜索引擎有时会认为次目录下的URL可能没有自己独立域名或与他人共享主机。

如果多个递交页面内容丰富,相互不非常类似,或在原有页面基础上进行优化,您不必担心会遭搜索引擎惩罚,不必建立robots.txt文件。

如果您使用一个非常有用的页面但针对许多不同搜索引擎,您“克隆”出许多类似的页面,那您就必须考虑robots.txt。

robots.txt也可用在某一目录中。

若欲了解有关robots.txt详细情况,可访问
http://www.marketposition.com

要检查您建立的robots.txt的正确性,可访问
http://tardis.ed.ac.uk/~sxw/robots/check/

·上一篇文章:搜狐搜索引擎登录网站规范及注意事项
·下一篇文章:元标记和其在搜索引擎排名中的作用


  相关新闻

·如何查询一台服务器放了多少网站

佚名

 

·HTML文件也能格式化硬盘

韩俞

 

·如何解决Google“这个网站有可能会损害您的计算机”问题?

佚名

 

·如何构筑企业域名保护体系?

余建祥

 

·如何利用网络打造“企业航空母舰系统”

余建祥

 

·如何提高企业网站可信度

余建祥

 

·你的网站为什么不能帮你赚钱

王通

 

·如何科学选择推广关键词

余建祥

 

·我如何把一本《搜索引擎排名秘笈》卖到1200元的

王通

 

·各类网站如何赚钱

佚名