中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
我们的新搜索索引:Caffeine
2010年6月30日
发表者:Carrie Grimes,软件工程师
原文链接:
Our new search index: Caffeine
转载自:
谷歌中文网站管理员博客
发布时间:2010年6月8日 星期二,下午5:00
今天,我们正式宣布:新网络索引系统Caffeine的开发完成了。Caffeine提供的网络搜索结果比上一个版本索引的结果新50%,它能给我们提供最多的网络内容。现在,无论是新闻报道、博客还是论坛帖,在其发表后,您都可以比以往任何时候更快地找到相关内容的链接。
对于那些不是和我们一样以构建搜索引擎谋生的人们来说,以下是一些背景知识:当您搜索谷歌时,您在搜索的不是实时网络;相反,您搜索的是谷歌的索引,它和书背面的清单一样,可以帮助您锁定需要的信息的位置。(点击
这里
,可以清楚了解索引是如何工作。)
那么,我们为什么要创建一个新的搜索索引系统呢?网络的内容日益剧增,这不仅仅是数目和容量在增多。随着视频、图片、新闻和实时内容的出现,普通网页的内容更丰富也更复杂。此外,人们对搜索的预期也比以往更高。搜索者希望找到最新的相关内容,内容发布者希望在发布内容后立即被人搜索到。
为了紧跟网络的发展趋势并满足不断增长的用户期望,我们创建了Caffeine。下图将为您演示Caffeine与旧索引系统的工作原理的对比:
我们的旧索引有多层结构,它们中间的更新速度不尽相同:有一些会比另外一些更新速度快,而主层则是几个星期更新一次。为了更新旧索引的一层,我们必须分析整个网络,这意味着,在我们找到网页与让您访问该网页之间,将会有很大的延迟。
在Caffeine系统下,我们分析网络的小部分,并在全球持续更新我们的搜索索引。当我们发现新网页,或现有网页出现新信息时,我们可以将其直接添加在索引中。这意味着您可以发现比以往任何时候都更新的信息――无论该信息是在什么时候、什么地方发布的。
凭借Caffeine我们可以检索规模巨大的网页。事实上,每秒钟Caffeine能平行处理上几十万个网页。如果这些网页是一堆纸的话,那么每秒钟纸堆都将长高三英里。Caffeine占据了数据库中近1亿G的储存空间,并以每天几十万G的速度添加新信息。存储这么多信息,您需要625,000个存储量最大的iPod才能完成;将这些iPod头尾相连的话,总长将超过40英里。
着眼于未来,我们创建了Caffeine。它不仅可以保证内容更新,还能为我们创建一个更快速全面、并且随着网络信息增长而扩展的搜索引擎打下坚实基础,从而为您提供更多相关的内容。请做好准备,在未来几个月里您可以见证更多的改进。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
12月
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed