中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
删除URL(二):如何从页面上删除敏感内容
2010年5月20日
发表者 John Mueller,谷歌瑞士Webmaster趋势分析师
原文链接:
URL removals explained, part II: Removing sensitive text from a page
转载自:
谷歌中文网站管理员博客
发布时间:2010年4月6日 星期二 下午2:25
网站站长级别:所有
我们
上一篇关于删除
URL
的博文
中讲过,有时您可以完全拦截或删除自己网站中的一个网页;有时,您也可能只需要更改一部分网页内容或删除某个摘录。由于页面被抓取的频率不同,所以这些变更往往需要等一段时间才能从我们的搜索结果中得到显示。在本文中,我们将向您介绍:如果已删除的内容仍然以“摘录”的形式出现在我们的搜索结果中,或者搜索结果可以链接到该内容的缓存页面,您是可以采取一定的措施来解决这一问题的。如果原内容包含需要迅速删除的敏感信息,这样做很有必要——而如果您只是常规地更新网站,就没必要这样做了。
我们以下面这个虚构的搜索结果为例:
标题:
Walter E. Coyote
摘录:
Acme Corp的首席开发官 1948-2003:从事开发顶级保密的velocitus incalculii捕捉设备,这种设备已经展示出潜力…
URL +链接到缓存页面:
www.example.com/about/waltercoyote
- 缓存
要想更改摘录(或链接到的缓存页面)中显示的内容,
首先要更改实际页面中的内容
。Google的自动流程始终会在搜索结果中显示原始内容的摘录,直到该页面更改其对外显示的内容。
页面的内容一经修改,有以下几种方案可以使我们的搜索结果显示更改:
1. 等待Googlebot重新抓取并重新索引该页面
大多数人都会采取Google这种自然更新内容的方式。有时要等上很长一段时间,这取决于Googlebot当前抓取相关页面的频率。我们一旦重新抓取并重新索引该页面,以当前内容取代原先的内容,通常就不再显示原先的内容。如果Googlebot未被拦截,仍然抓取到相关页面(无论是通过robots.txt或者是不能正常访问服务器),您不需要采取任何特别措施。通常我们不可能加快抓取或索引速度,因为这些流程是全自动的,同时也取决于许多外在因素。
2. 使用
Google
公共
URL
删除工具
请求删除已经从其他网页上删除的内容
使用这个工具,需要输入已更改
页面的准确
URL
,选择“内容已经从当前页面删除”选项,然后指定一个或多个已经从当前页面完全删除的词语。
请注意:您输入的词语都不会显示在页面上;即使一个词语已经从页面上某部分删除,但该页面其他部分还包含这个词语,您的请求也会被拒绝。确保所选词语(或多个词语)不再出现在该页面任何地方。在上例中,如果您删除了“顶级保密的velocitus incalculii捕捉设备”,则应该提交这些词语,而非“我的项目”这样的词语。然而,如果页面上其他地方还有“顶级”或“设备”等词语,请求就会遭到拒绝。为了尽可能提高操作成功的几率,通常应该输入一个页面上任何地方都没出现的词语,这样就简单了。
一旦请求经过处理并且页面上不再显示所提交的词语(或多个词语),搜索结果就不再显示片段,也不再出现缓存页面。该页面的标题和URL仍然可见,如果搜索已删除的内容(如搜索
[velocitus incalculii]
),搜索结果中也会显示链接,即使片段中不再显示这些词语。然而,一旦该页面被重新抓取并重新索引后,搜索结果中就会出现新的片段和缓存页面。
请记住:我们需要查看页面以确认词语(或多个词语)已被删除。如果页面不存在,服务器返回一个相应的
404
或
410HTTP
结果码
,致使我们无法查看页面,您最好请求删除该页面。
3. 用Google站长工具URL删除工具
请求删除自己网站上某个页面的信息
如果您访问了相关网站,并且在
Google
站长工具
中确认了站长身份,就可以使用URL删除工具(在网站配置>爬虫访问下)请求删除片段和缓存页面,直到页面被重新抓取。要使用这一工具,只需提交该页面的准确URL(无需指定任何已删除的词语)。您的请求一经处理,我们就会从搜索结果中删除片段和缓存页面。页面的标题和URL仍然可见,当搜索与已删除内容相关的内容时,该页面也可能继续出现在搜索结果中。当页面被重新抓取并重新索引后,搜索结果就会更新片段和缓存页面(根据新内容)。
Google的索引和排名不仅仅基于页面内容,还会根据其他一些外在因素,如URL导入链接。正是因为这样,当搜索页面上已经删除的内容时,即使页面已经被重新抓取和重新索引,URL还有可能继续出现在搜索结果中。尽管URL删除工具能够从搜索结果中删除片段和缓存页面,但当搜索任何当前或原先内容时,它不会更改或删除搜索结果的标题或更改显示的URL,也不会阻止页面显示。如果这对您来说很重要,您应该确保URL符合完全从搜索结果中删除的条件。
删除非HTML内容
如果更改的内容不是(X)HTML(如图片、Flash文件或PDF文件被修改),就不能使用缓存删除工具。如果不想让原内容在搜索结果中显示,最快捷的方法就是更改文件的URL,这样原URL就会返回一个404HTTP结果码,使用URL删除工具删除原URL。否则,如果等Google自动更新信息,则需重新抓取后进行更新,这样预览非HTML内容(如
PDF文件的快捷查看链接
)所花费的时间比普通HTML页面更长。
主动阻止摘录或缓存内容出现
作为站长,您可以选择使用机器人
元标签
来主动防止片段或缓存内容出现,而无需使用我们的删除工具。尽管我们并不推荐这种默认的方式(摘录可以帮助用户更快发现一个相关搜索结果,而缓存页面则能在服务器不能访问时让用户看到内容),但您还是可以使用“nosnippet”元标签来
防止显示摘录
,或者用“noarchive”机器人元标签,让页面无法缓存。请注意:如果对现有页面和已知页面进行更改,Googlebot需要重新抓取并重新索引这些页面,然后才能在搜索结果中显示这些变更。
我们希望本文能让您更清楚地了解一些URL删除工具背后的操作流程。在下一篇博文中,我们将谈到如何请求删除不属于您的内容;请静候更新!
我们一如既往地欢迎您在
网站站长帮助论坛
上发表反馈信息或咨询问题。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed