转载自谷歌中文网站管理员博客
发表者: Maile Ohye, 开发者项目技术带头人
原文: Farewell to soft 404s
发表于: 2008年8月12日星期二,下午2:54
在网络上,我们可以看到两种404("文件无法找到")响应代码:"硬404代码"和"软404代码"。我们不鼓励使用所谓的"软404代码",因为它们可能会对用户和搜索引擎造成困惑。对一个不存在的URL,那些提供"软404代码"的网站不是返回一个404响应代码,而是返回一个200响应代码。然而,伴随这种200响应代码的内容通常是该网站的首页或者是一个错误信息的页面。
一个软404代码的用户体验是怎样的呢?这里有一个软404代码的模型:这个网站对一个不存在的URL返回一个200相应代码以及这个网站的首页。
如上图所示,软404代码会给用户带来困惑,而且搜索引擎也会花很多时间在您的网站上爬行和索引一些并不存在、而且经常重复的URL。这会给您网站的索引覆盖率造成负面影响——由于谷歌机器人被这种代码误导并花了大量时间爬行一些并不存在的网页,您的一部分含有独特内容的网页反而有可能无法被及时发现,或者不能被经常性访问。
如果不返回一个软404代码,我应当怎么做呢?
更好的做法是返回一个404响应代码,而且向用户清晰地说明这个文件无法找到。这样做将使搜索引擎和用户都得到更愉快的体验。
返回404响应代码
向用户返回更明确的信息
我的服务器可以返回404代码,但同时向用户发送一个有帮助意义的"无法找到"的消息么?
当然可以做到!在今后的"404专题周"里您可以看到更多相关信息!