中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
谷歌排序的介绍
2008年7月21日
发表者: 谷歌首席工程师 Amit Singhal
今年 5 月,我们的副总裁乌迪•曼博曾撰博介绍谷歌搜索质量小组,这个组主要负责谷歌搜索结果的排序工作。尤迪介绍了这个“质量”小组的不同团队,包括核心排序团队、国际搜索团队、用户界面团队、网络作弊以及其他团队。在这篇文章中,我希望向你重点介绍他们其中的一员:负责核心排序的团队。
首先让我介绍我自己:我的名字是 Amit Singhal,谷歌首席工程师,负责谷歌的搜索排序团队。1990 年,作为计算机专业的毕业生,我开始了解搜索,至今在这一领域工作了 18 年。在学术界,搜索被称作是信息检索。我先是作为信息检索研究员工作了 10 年,2000 年,我进入谷歌,一直从事谷歌搜索排序工作到现在。
谷歌的搜索排序是一整套的算法,用于寻找相关程度最高的文档以满足每个用户查询需求。我们每天在海量的网络信息中用这套算法处理数亿次的查询,每一个用户的查询我们都会应用这套算法。我们的网页搜索是访问量最高也是最知名的搜索服务,这套算法也用在其他的谷歌搜索服务,包括图片搜索、资讯搜索、YouTube、谷歌地图、谷歌图书等等,在这些搜索中谷歌的排序算法有所修改。
关于谷歌排序,我最常听到的问题是:“你们怎么做搜索排序?”当然,我需要很多篇幅来介绍建立像谷歌一样的一个堪称艺术品的排序系统,我将在后续的文章中做更深入的阐述。现在,我很高兴与你分享谷歌搜索排序算法的哲学:
1、为全球用户提供相关性最强的本土搜索服务
2、简单易用
3、从不人为干预
关于第一点显而易见,因为我们对搜索服务的热情,我们绝对想确保每个用户查询都获得相关度最高的搜索结果。我们把这一点称作“不放过任何一个有瑕疵的查询”原则。无论何时,无论是来自哪个国家的何种语言的查询,只要我们没有给出理想的搜索结果——尽管我们确信这种不完美在搜索中依旧存在,搜索才刚刚开始,我们都用这一原则激励我们改进服务。
第二点看起来也很明显。哪个系统架构师不希望他们的系统简单易用?不过,因为我们必须对多种语言的各种各样的查询做出回应,我们的搜索系统也随着查询服务的发展而变得越来越复杂。我们非常努力地保持系统的简单易用,同时保证搜索质量没有降低。这是一项长期的工作,但这一切值得我们去努力。我们每周做十次搜索排序算法的改进,简单易用是我们做每一次改进时重点考虑的事情。我们的工程师很清楚地了解针对一个既定查询一篇网页应该如何排序。这个简单易懂的系统可以让我们快速实现创新。“简单易用”的原则非常有效。
关于谷歌排序一个不可避免但总是有些被误导的话题就是“谷歌是否人为干预搜索结果?”请允许我用谷歌算法的第三点原则来回答:从不人为干预。我们认为,互联网是人类共同建立的。你们就是网页的创建者和链接者,我们用我们的算法将人类的贡献利用起来。搜索结果的最终排序应该取决于我们对互联网大社区的总体贡献的运算结果,而不是我们的人为干预的结果。我们相信,对于任何个人的主观判断只是一个主观结果,而通过我们的算法,将充满着庞大的人类智慧的网页和链接提炼出来,其结果优于任何人为的主观判断。
我们反对人为调整搜索结果的第二个理由,就是我们认为,一次失败的查询意味着我们的搜索排序算法的一次改进。而算法的改进将不仅仅提高一次查询的服务质量,它可以提高类似查询的整体搜索服务质量,而且通常是对多种语言搜索服务质量的提高。不过,我还要补充一点,谷歌对于所推荐的网页有明确规定,如果出现违反我们的规定的网站,例如非法、儿童色情、病毒或恶意软件等等,我们将采取行动。
请继续关注我的下一篇文章,我将详细讲解我们的搜索排序技术,并且举出排序技术的几个实例。让我用一句话总结这个博客:我们对于搜索的热情比以往更为强烈。作为一个搜索研究员,我拥有这个世界上最好的工作:-)
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
12月
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed