OIC点子创业俱乐部,专注于创新,创业,提供点子,创业,连锁加盟,产品代理,创业联盟,小本创业,创业经验 OIC点子创业俱乐部  | [注册] 点币点币 [电信服务器] [网通服务器]
广告服务
点子首页 | 点子超市 | 创业指南 | 点子人才 | 创业联盟 | 点子论坛 | 创业论坛 | 会员专区 | 《OIC创意中国》
您的位置:首页>>创业指南>>网站策划与推广

在你的主页中为Web Robot设计路标

.../robots.txt. 
  2、Robots META tag 
  一个网页作者可以使用专门的HTML META tag ,来指出某一个网页是否可以被索 引、分析或链接。 
  这些方法适合于大多数的Web Robot,至于是否在软件中实施了这些方法,还依赖于 Robot的开发者,并非可以保证对任何Robot都灵验。如果你迫切需要保护自己内容,则应考虑采用诸如增加密码等其他保护方法。 
  使用Robots Exclusion Protocol协议 
  当Robot访问一个 Web 站点时,比如http://www.sti.net.cn/,它先去检查文件http://www.sti.net.cn/robots.txt。如果这个文件存在,它便会按照这样的记录格式去分析: 
  User-agent: * 
  Disallow: /cgi-bin/ 
  Disallow: /tmp/ 
  Disallow: /~joe/
  以确定它是否应该检索站点的文件。这些记录是专门给Web Robot看的,一般的浏览 者大概永远不会看到这个文件,所以千万不要异想天开地在里面加入形似 类的HTML语句或是“How do you do? where are you from?”之类假情假意的问候语。 
  在一个站点上只能有一个 "/robots.txt" 文件,而且文件名的每个字母要求全部是小 写。在Robot的记录格式中每一个单独的"Disallow"行表示你不希望Robot访问的URL, 每个URL必须单独占一行,不能出现 "Disallow: /cgi-bin/ /tmp/"这样的病句。同时在一个记录中不能出现空行,这是因为空行是多个记录分割的标志。 
  User-agent行指出的是Robot或其他代理的名称。在User-agent行,''*'' 表示一个特殊的含义---所有的robot。 
  下面是几个robot.txt的例子: 
  在整个服务器上拒绝所有的robots: 
  User-agent: * 
  Disallow: / 
  允许所有的robots访问整个站点: 
  User-agent: * 
  Disallow: 
   ……
下一页>>

分页:[1]  [2]  [3]  [4]  

刘 建 新 

地产红人潘石屹:十周年回首创业路线图
台商“在大陆创业我很快乐”
盖茨忆创业
严介和:终身不做资本玩家
严介和:自己不是富豪 社会中富豪也是弱...
25岁身价过亿,戴志康的悲欢历程
这样的合伙人,还有必要继续下去吗?
管理:软心肠与硬心肠
07年创业赚钱:教你八招方法准成功
管理故事:“红蜂王国”的覆灭
动漫“玩”出百万资本
周彦俊:跌不倒的创业者
创业-无中生有
看准商机不放弃:白手起家创亿元
真正的玩家,最有可能把电玩店经营的更好
在线访谈李斌:创业得要有一个理想
外汇投资全攻略-转存不一定划算
经典:创业成功必看的24个小故事(2)
创收成功的必备条件
创业派 小本就能做的好项目
吴锦屏:公关界传奇女性
成功推销“三部曲”
汪延:浪尖上的舞者(2)
网上开店快乐赚钱-发现潜在商机
从女工到酒吧老板娘
黄敏杰 中国“吊带衫之父”的传奇
网店老板 有了交易就要缴税
透视欧洁蔓成功之路
2007年最值得关注的新创业投资项目
宝典:网上开店的十二条经验共享

广告服务 | 会员注册 | 修改资料 | 找回密码 | 邮件订阅 | 关于我们 | 积分说明 RSS订阅 联系我们:
网安    公安局备案编号:4403101910636
   粤ICP备05005794号