中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
提高跨域选择URL的意识
2011年11月30日
发表者:Pierre Far,网站管理员趋势分析
原文:
Raising awareness of cross-domain URL selections
转载自:
谷歌中文网站管理员博客
发布时间:2011年11月29日 下午 01:57:00
一份内容一般可通过多个URL获得,而非全部集中在同一域名。几年来我们把用多个URL获得同一份内容,称为
重复内容
。发现一组重复内容网页时,Google算法会选出一个有代表性的URL。一组网页可能包含来自相同或不同网站的URL。从一组不同的网站中选出有代表性的URL,这种选择就被称为跨域选择。举个简单的例子,如果一组URL中一个来自a网站,一个来自b网站,我们的算法选择了来自b网站的URL,那么a网站的URL就无法再在我们的搜索结果中显示,并且与此内容相关的搜索流量也会下降。
网站管理员通过使用一个目前支持的机制,比如
rel="canonical" elements
或
301 重定向
来指示他们的首选URL,这在很大程度上影响了我们算法的选择结果。大多情况下,算法做出的选择正确反映了网站管理员的意图。但是在极少情况下,我们发现网站管理员不明白为何算法会做出此种选择,也不知如何处理,他们认为算法的选择是错误的。
为使跨域URL选择过程更透明,我们正在发布新的有关网站管理工具的信息,试图在我们的算法选择了外部URL而非管理员网站的URL时对网站管理员给予提示。这些信息的工作原理细节可在关于
该主题的帮助中心文章
中找到,在本篇博文中我们将探讨各种可能出现跨域URL选择的情况,以及如何修复那些您认为是错误的情况。
引起跨域URL选择的主要原因:
很多情况都会导致我们的算法进行跨域URL选择。
多数情况下,网站管理员会发出能够影响选择结果的信号,我们的算法会根据此信号来选择URL。例如,如果网站管理员按照我们的
指南
和
最佳方法
对网站进行迁移,这明显表明新网站的URL才是他们希望Google选择的。如果您正在迁移您的网站并在网站管理工具中看到这些新信息,您可以对我们算法给出的提示予以确认。
不过,我们经常看见网站管理员提交问题说我们的算法选择的URL与他们想选择的不同。当您的网站遇到跨域选择,并且您认为该选择不正确(比如选择结果与您所预想的不符)时,您还可以运用一些策略来进行改善。这里有一些导致预料之外跨域选择URL的常见原因,以及改善方法:
1. 重复内容,包括多域名网站上的内容:
我们常见到网站管理员在多个域名上使用同种语言和相似的内容。这有时是疏忽所致,有时是以地理区域为标准来决定显示语言种类的。例如,在域名为.com 和.net的网站上,管理员通常会使用英语作为显示语言,而在域名为 .de, .at,和.ch的网站则使用德语作为显示语言。
根据网站和用户的不同,您可以使用一种目前支持的标准化技术来提示算法您希望选择的URL。以下是关于此主题的文章,仅供参考:
*
规范化
, 尤其是
rel="canonical" elements
和
301 重定向
*
多域名及多语言网站
以及
管理多区域网站
* 关于
rel="alternate" hreflang="x"
2. 配置错误: 一些错误的配置会使我们算法作出错误决定。出现错误配置的例子包括:
1.标准化错误:错误使用
规范化
技术指向外部网站上的URL会使我们的算法在搜索结果中选择外部URL。我们曾在配置错误的内容管理系统(CMS)或网站管理安装的CMS插件上遇到过此类问题。
要修复此类状况,需查清您的网站是如何错误指示规范URL偏好的(例如:通过错误使用了一个rel="canonical"元素或错误使用了301重定向)并进行修复。
2.服务器配置错误:有时我们会遇到主机托管配置错误的情况-a网站内容被返回b网站的URL。当两个无关的网站服务器返回相同
软 404
页面而我们又未能发现此错误网页时,以上类似状况会再次出现。这两种情况中,我们都会认为相同内容正从两个不同网站返回,而我们的算法可能错误地将a网站的URL选做了B网站URL的规范偏好。
您需要调查网站服务基础设施的哪部分配置有误。例如,在遇到错误网页时,您的服务器返回的可能是HTTP 200(成功)状态代码,也可能会混淆其托管的不同域名的要求。一旦查到问题的根本原因,您要和服务器管理员一起矫正配置进行。
3. 恶性网站攻击:一些网站攻击会引入导致不良标准化的代码。例如,恶性代码可能导致网站返回HTTP 301 重定向 或在HTML 或HTTP header中插入一个跨域rel="canonical" 链接元素,这通常会指向一个托管恶性内容的外部URL。该情况下,我们的算法可能选择恶性或垃圾URL而非默认网站上的URL。
碰到这种情况,请按照我们的
网站清理指南
进行操作并在清理完成后递交重新审核请求。如果想要识别
cloaked
攻击,您可以使用网站管理工具中的
Googlebot 抓取
功能,这样您看到的网页内容便会和在Googlebot上看到的一样。
极少情况下,我们的算法会未经您的允许,就选择那些包含您网站内容的外部网站的URL。如果您认为另一网站复制了您网站上的内容,违反了版权法,请联系网站托管主机,填写
数字千年版权法案
政策申请删除那些侵权网页。
总之,如果您在如何认定错误原因或修复办法方面需要帮助,您可以浏览我们关于此主题的
帮助中心的文章
并在我们的
网站管理员帮助论坛
上提问。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
12月
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed