中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
过犹不及
2006年4月27日
发表者:Taraneh Razavi,Google 医生
大多数现在 IT 行业工作的人大概跟 googler 一样,每天长时间工作,与电脑为伴。这里就是 Google 医生给你保持正确姿势和健康的建议。
中国有句俗话叫"过犹不及"。换句话说,你能连续多长时间坐在椅子上敲打键盘而不至于伤害到自己呢?
从身体构造上看,我们并非适合像现在我们所从事的许多工作那样久坐不动,或者长时间执行精准的机械动作。有证据表明,处于不正常的姿态过久,或者重复运动会引起颈部、四肢和背部的疼痛,这些状况总称为过度使用综合症,或重复性压迫损伤 -- RSI (Repetitive Strain Injury).
RSI 可不是个小问题。根据美国劳工部的统计 (
Bureau of Labor statistics
),造成误工伤害和疾病中,它占到 34%,同时还连带着 200 亿美元的经济损失。美国国家科学院 (
The National Academy of Science
)认为,企业每年由于重复性压迫失调而导致的员工病假、生产能力下降和医疗支出而损失的收入估计高达 500 亿美元。科学院自 1998 年以来已经出版了
2 份报告
,说明重复性运动和职业伤害之间的直接关系。
RSI 导致的损害可归结为肌肉纤维的结构性变化和血流量减少,神经也不幸被牵扯其中。不活动的组织和周围的炎症压迫着神经,能够引起肢体失去知觉和酸麻,在神经损坏严重时最终变得脆弱。
如果有人想看看证据,请参见这篇文章:
《过度使用综合症:一项肌肉活体研究试验》
。此项研究中,研究者从受伤的手和正常的手上分别取样,结果表明肌肉纤维中出现结构性破坏,而且这种破坏与受伤的程度有关。在另一项针对
慢性斜方肌疼痛
的研究中,研究者在研究对象的脖颈后部进行活体试验,发现受伤区域的微循环血流量下降。疼痛的差别越大,血流量的降低越厉害。
RSI 伤害的一些最常见现象是
腱鞘炎
和
腕管综合症
。目前,与工作有关的腕管综合症(CTS)已经在全美所有重复性运动失调患者中占据了 41% 以上的比例。与工作有关的腕管综合症的并发症。努力工作永远不会伤害任何人,其实并不如此。
那么你该怎么办?关键的治疗在于预防。研究表明,如果雇主鼓励员工时常休息和伸展一下,并强调人机工效学的重要性,职业伤害就会减少,而生产能力则相应提高。作者
S. Iserphagen
另外在这里对大家还有一些建议:
- 每工作 30-45 分钟,至少休息 5 分钟。如果需要协助,网上有
免费定时器程序
可供下载,能够帮助提醒你按时休息一下。
- 在休息时伸展你的双臂/双手/颈部/背部。这个
瑜伽网站
能够给你一些锻炼的示范。后面是其他一些网站。
- 时常注意
矫正
身体姿态。不要躺坐在沙发上使用笔记本电脑。
- 在最初和每次转换座位时,都要对工作地点进行评估。
调整座椅、显示器、键盘、鼠标和笔记本电脑。定期交换键盘和鼠标的方位。
- 将视线从计算机屏幕上移向远处。别忘了眨眼!
- 减少不必要的计算机使用。这听起来有点古怪 - 不过你也得让网上冲浪、电子游戏、电子邮件和发讯息歇一会。
- 如果开始觉得疼痛或疼痛持续,一定要向医生求助,他们可能建议你使用腕带、冰袋、布洛芬、可的松注射液、物理疗法等,最重要的是休息,让情况好转。看病千万不要拖拖拉拉。早治早好。
下面一些网站或许对你有用:
Harvard RSI Action
RSI 练习
RSI 网页
数学之美系列 4 -- 怎样度量信息?
2006年4月26日
发表者:吴军,Google 研究员
前言: Google 一直以 “整合全球信息,让人人能获取,使人人能受益” 为使命。那么究竟每一条信息应该怎样度量呢?
信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年,
香农
提出了“
信息熵
”(shāng) 的概念,才解决了对信息的量化度量问题。
一条信息的信息量大小和它的不确定性有直接的关系。比如说,我们要搞清楚一件非常非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。相反,如果我们对某件事已经有了较多的了解,我们不需要太多的信息就能把它搞清楚。所以,从这个角度,我们可以认为,信息量的度量就等于不确定性的多少。
那么我们如何量化的度量信息量呢?我们来看一个例子,马上要举行世界杯赛了。大家都很关心谁会是冠军。假如我错过了看世界杯,赛后我问一个知道比赛结果的观众“哪支球队是冠军”? 他不愿意直接告诉我, 而要让我猜,并且我每猜一次,他要收一元钱才肯告诉我是否猜对了,那么我需要付给他多少钱才能知道谁是冠军呢? 我可以把球队编上号,从 1 到 32, 然后提问: “冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了, 我会接着问: “冠军在 1-8 号中吗?” 假如他告诉我猜错了, 我自然知道冠军队在 9-16 中。 这样只需要五次, 我就能知道哪支球队是冠军。所以,谁是世界杯冠军这条消息的信息量只值五块钱。
当然,香农不是用钱,而是用 “比特”(bit)这个概念来度量信息量。 一个比特是一位二进制数,计算机中的一个字节是八个比特。在上面的例子中,这条消息的信息量是五比特。(如果有朝一日有六十四个队进入决赛阶段的比赛,那么“谁世界杯冠军”的信息量就是六比特,因为我们要多猜一次。) 读者可能已经发现, 信息量的比特数和所有可能情况的对数函数 log 有关。 (log32=5, log64=6。)
有些读者此时可能会发现我们实际上可能不需要猜五次就能猜出谁是冠军,因为象巴西、德国、意大利这样的球队得冠军的可能性比日本、美国、韩国等队大的多。因此,我们第一次猜测时不需要把 32 个球队等分成两个组,而可以把少数几个最可能的球队分成一组,把其它队分成另一组。然后我们猜冠军球队是否在那几只热门队中。我们重复这样的过程,根据夺冠概率对剩下的候选球队分组,直到找到冠军队。这样,我们也许三次或四次就猜出结果。因此,当每个球队夺冠的可能性(概率)不等时,“谁世界杯冠军”的信息量的信息量比五比特少。香农指出,它的准确信息量应该是
= -(p1*log p1 + p2 * log p2 + ... +p32 *log p32),
其中,p1,p2 , ...,p32 分别是这 32 个球队夺冠的概率。香农把它称为“信息熵” (Entropy),一般用符号 H 表示,单位是比特。有兴趣的读者可以推算一下当 32 个球队夺冠概率相同时,对应的信息熵等于五比特。有数学基础的读者还可以证明上面公式的值不可能大于五。对于任意一个随机变量 X(比如得冠军的球队),它的熵定义如下:
变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。
有了“熵”这个概念,我们就可以回答本文开始提出的问题,即一本五十万字的中文书平均有多少信息量。我们知道常用的汉字(一级二级国标)大约有 7000 字。假如每个字等概率,那么我们大约需要 13 个比特(即 13 位二进制数)表示一个汉字。但汉字的使用是不平衡的。实际上,前 10% 的汉字占文本的 95% 以上。因此,即使不考虑上下文的相关性,而只考虑每个汉字的独立的概率,那么,每个汉字的信息熵大约也只有 8-9 个比特。如果我们再考虑上下文相关性,每个汉字的信息熵只有5比特左右。所以,一本五十万字的中文书,信息量大约是 250 万比特。如果用一个好的算法压缩一下,整本书可以存成一个 320KB 的文件。如果我们直接用两字节的国标编码存储这本书,大约需要 1MB 大小,是压缩文件的三倍。这两个数量的差距,在信息论中称作“冗余度”(redundancy)。 需要指出的是我们这里讲的 250 万比特是个平均数,同样长度的书,所含的信息量可以差很多。如果一本书重复的内容很多,它的信息量就小,冗余度就大。
不同语言的冗余度差别很大,而汉语在所有语言中冗余度是相对小的。这和人们普遍的认识“汉语是最简洁的语言”是一致的。
在下一集中, 我们将介绍信息熵在信息处理中的应用以及两个相关的概念互信息和相对熵。
对中文信息熵有兴趣的读者可以读我和王作英教授在电子学报上合写的一篇文章
《语信息熵和语言模型的复杂度》
Beta believe it -- Google 桌面 3 正式出炉
2006年4月25日
发表者: Greg Coladonato, 产品经理
如果你一直因为 Google 桌面 3 中文版还处在 “Beta” 版而没有使用它,那现在你不用顾虑了,我们刚刚推出了正式版的
桌面3
。有关第三版的新功能,我们在之前的一篇
帖子
中曾详细介绍过。
在这里我们要感谢所有给 Google 桌面 Beta 版提供反馈的朋友。你们的想法和意见在我们改进产品的过程中给予了非常大的帮助。
学术捜索新添找寻新近文章功能
2006年4月24日
发表者:黄靖新,产品经理
现在你用 Google 学术搜索,你可以发现在任一结果页的右上角出现了“新近文章”这一链接。这是我们对学术搜索增加的 “新近文章” 搜索排名。它不是按时间日期排列,而是显示了与你搜索内容相关的最新研究进展。“新近文章” 结果排名按照学术研究者的思维习惯,综合了多方面因素:作者知名度、该期刊上以前发表过的文章、文章发表的年限、被引用的次数等等,让你快速找到最新、最值得看的研究发现。
如果你用 Google 学术搜索查找关于
《红楼梦》
的学术文章,看到的第一个结果应该是曹雪芹的原著,紧接着是王国维、王昆仑、周汝昌等人的评论文章,评论发表或刊印的时间从 70年代到 2001 年不等。在如此众多的学术结果里,你如何能够立刻找到最新、最有价值的研究发现呢?点击页面右上角的
“新近文章”
链接,它你会看到一个不同于前面的搜索排名页,从上到下分别是王昆仑、蔡义江、闫敏敏等人的文章,发表时间都在 2000 年以后,但其排序仍贯彻学术捜索的综合智能排序原则。这就是我们刚推出的“新近文章”的功能。
你可以再试试"钱钟书"两种结果的比较:
全部文章
、
新近文章
。
同时,我们增加了 “图书馆搜索” 功能,把学术搜索与 13 个国家/地区的图书馆相连,让用户知道哪个图书馆有他们需要的书。比如说你想搜索爱因斯坦的学术信息(
Einstein
),结果下方会出现 “图书馆搜索”的链接,通过它,你可以看到哪个图书馆藏有何种爱因斯坦的书。我们会根据用户所处地域自动提供这些结果,您也可以在
学术捜索使用偏好
里的“图书馆捜索”一栏中搜索设定。
中国用户可以通过中科院的联合目录和中国国家图书馆的图书目录看到捜索的文章书籍在各个图书馆的馆藏信息或电子接入方式。例如,您捜索 “
超导
” 的最近文章(你可能需要先在“
学术搜索搜索偏好
”的 “图书馆搜索” 中寻找然后选中 “National Library of China” (中国国家图书馆)。于是在第一个结果的下方,你可以看到 “National Library of China” 的字样。点击后,可以详细了解该文章在中国国家图书馆系统内馆藏或电子接入方式。图书馆捜索的目录中英文都支持,你如果捜索 “
Science
” 的最近文章,细心的用户会看到中科院联合目录提供的目录链接 “图书馆捜索” 的字样,在此,中科院 516 家成员图书馆的馆藏记录你可以瞬间获得。
学术的进步就是在已有的成果上不断发展的过程。我们希望,Google 学术搜索也能不断根据学者治学的方法不断补充新功能。“新近文章”这个功能就是我们向前迈进的一小步,其目的是为了您更好的站在巨人的肩膀上。
另外,我们现在可以实现将引用文章信息导入到 EndNote, RefWorks, Refman 和 Bibtex,方便学术研究者使用,该功能可以在学术捜索的使用偏好里设定。
从名说起
2006年4月21日
发表者:崔瑾,Google 员工
作为一个普通 Google 员工,作为亲身经历
谷歌
产生的参与者,看到如此众多用户对 Google 关切的意见,我很感动,一周来似乎所有的记忆、思索都围绕着名字铺开。
就好像一个人不是因为名字而伟大一样,一个企业也决不会单凭名称而杰出。8 年来,从无名小卒到受到众多用户的喜爱,这些得益于我们坚持了一些理念,传递了一些价值,并不断追求创新。爱屋及乌,用户因为这些“实”而热爱着 Google 的“名”。在中国,我们的“
谷歌宣言
”郑重表达了“信息还有很多,我们要做也就更多”的信念,借一个用户 Blog 中的测字良言:“谷歌:先历困苦,后得幸福,霜雪梅花,春来怒放。”
在家里,我是老小,父亲是很牵挂我的,事无巨细,唯有一样,就是我换工作以后,爸爸死活搞不对我的工作单位,几天前,又因为这件事情让我无语了一通,人家问他:
“您的女儿在哪里工作啊?”
“北京”
“什么单位?”
"一个国际公司叫咕什么的我也念不清" (My Goodness!!!爸爸,铁树都开花啦!!)
爸爸年轻时候学的是俄语,他对英文仅有的理解就是点头 yes 摇头 no,记住 Google 这个名字简直就是难于上青天。有了谷歌,爸爸以后就可以告诉别人我女儿在谷歌工作。就好像我的父母、我的姐姐,还有小孩子们、学生,这样年龄阶段的人他们需要一个方便知道、获取 Google 的渠道。 如果我们仅以自己的标准来衡量这件事情,而对他们的需求视而不见,这样是不公平的。
谷歌发布以后,一个朋友 MSN 上传来信息说喜欢“狗狗”,我苦口婆心:1.狗狗也许是个可爱的呢称,但是 Google 中文名称需要成为公司名、品牌名、产品名、网站名,狗狗就不合适了;2. 狗狗不能全面体现 Google 的使命和目标; 3. 狗狗了以后喵喵们怎么办呢?蛇和迷你猪加入,军阀混战啊!恐!Google 是多面孔的,那些骨灰级的用户,Google 始终在您左右,谷歌不会取代 Google。
谷歌的产生是 Google 中国人集体民主讨论的结果,不是个人的产物。几乎所有的 Google 的中国人都与这个名字或多或少有着联系。馒头血案是冤案啊!
《根》在小说一开头的时候:一七五0年的早春,在沿西非冈比亚河岸向上行需四天行程之处,有个叫做嘉福村的村落,村民欧玛若·金特的妻子嫔塔·金特刚临盆生下一个男孩……
依循古例,往后的七天,欧玛若必须很慎重其事地只专注于一件职务——为孩子命名。这个名字必须富有历史意义而且带有预言性,因为他的族人——曼丁喀族——深信孩子会从他所取名的人或事中承袭七种特性…… 对一个名字来说,包涵在里面的承诺和期望也许比什么都重要。 那么对于谷歌,我们更看重的是对中国用户的承诺:客观公正;用我们的心血为您争取时间,希望您在谷歌快速获取信息并且能够迅速离开去做自己想做的事情;现在我们所整合的信息还非常有限,信息还有很多,我们要做的也就更多。
关于时间
2006年4月19日
Google 近期在美国发布了 Google Calendar 产品(现只有英文版),很多用户致电希望了解更多关于这个产品信息,所以今天我们对这个产品简单介绍一下。
发表者: Carl Sjogreen, 产品经理
我们都很忙。无论是忙于工作、活动、学习、或是家庭,我们的每一天都被各种事情占据。想把一天的日程安排好并不是一件容易的事情,况且坦率的说,我们对现有的安排日程的工具也不是很满意。我们刚刚推出的
Google Calendar
(现在只有英文版) ,它可以简化好几项工作,比如说记录每天的事物、特别活动和约会,而且不论是你的还是其他人日程表上的活动,你都可以更好的安排时间。
首先,我们在研发产品的过程中努力把它做的
快捷、易用
。如果你要加一个活动日程,你只需直接点击日历上的相应时间并输入一句活动信息。不会弄乱,没有麻烦,更没有烦人的表格需要填写。而且,Google Calendar 和 Gmail 是整合的,这样方便让你把邮件里提到的某件事情通过点击直接加到日历里。
第二,我们让你能查看所有对你有意义的节日或活动。我们在你日程的旁边可以让你非常容易的看到你家人或朋友的日程表,或其它一些内置的日历 (比如“中国的节假日”,你可以看到即将到来的“五一劳动节”)。你也可以根据自己的需要选择是否让他人看到你的日历。
第三,我们努力把这个日历做活。你可以把日历上的任何一个活动变成一个邀请函,你所要做的只需加入邀请人的 email 地址。你的朋友不论是不是用 Google Calendar 都可以看见和回复你的邀请。
最后,我们想说我们是开放的。Google Calendar 支持
iCal standard
,所以它和许多其他的日历工具是兼容的,让你可以轻松的输入或输出你的日程信息。网站管理员还可以在他们的网页上加上一个自己定制的 Google Calendar
活动提醒
按钮,这样可以让网站访问者很快的把网站的活动加到他们自己的日历上去。
好了,我们想现在应该是让你们看一看 Google Calendar 究竟长什么样的时候了。(注:现在 Google Calendar 只在美国发布了英文版)
数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用
2006年4月17日
发表者:吴军,Google 研究员
前言:隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法。复杂的语音识别问题通过隐含马尔可夫模型能非常简单地被表述、解决,让我不由由衷地感叹数学模型之妙。
自然语言是人类交流信息的工具。很多自然语言处理问题都可以等同于通信系统中的解码问题 -- 一个人根据接收到的信息,去猜测发话人要表达的意思。这其实就象通信中,我们根据接收端收到的信号去分析、理解、还原发送端传送过来的信息。以下该图就表示了一个典型的通信系统:
其中 s1,s2,s3...表示信息源发出的信号。o1, o2, o3 ... 是接受器接收到的信号。通信中的解码就是根据接收到的信号 o1, o2, o3 ...还原出发送的信号 s1,s2,s3...。
其实我们平时在说话时,脑子就是一个信息源。我们的喉咙(声带),空气,就是如电线和光缆般的信道。听众耳朵的就是接收端,而听到的声音就是传送过来的信号。根据声学信号来推测说话者的意思,就是语音识别。这样说来,如果接收端是一台计算机而不是人的话,那么计算机要做的就是语音的自动识别。同样,在计算机中,如果我们要根据接收到的英语信息,推测说话者的汉语意思,就是机器翻译; 如果我们要根据带有拼写错误的语句推测说话者想表达的正确意思,那就是自动纠错。
那么怎么根据接收到的信息来推测说话者想表达的意思呢?我们可以利用叫做“
隐含马尔可夫模型
”(Hidden Markov Model)来解决这些问题。以语音识别为例,当我们观测到语音信号 o1,o2,o3 时,我们要根据这组信号推测出发送的句子 s1,s2,s3。显然,我们应该在所有可能的句子中找最有可能性的一个。用数学语言来描述,就是在已知 o1,o2,o3,...的情况下,求使得条件概率
P (s1,s2,s3,...|o1,o2,o3....) 达到最大值的那个句子 s1,s2,s3,...
当然,上面的概率不容易直接求出,于是我们可以间接地计算它。利用贝叶斯公式并且省掉一个常数项,可以把上述公式等价变换成
P(o1,o2,o3,...|s1,s2,s3....) * P(s1,s2,s3,...)
其中
P(o1,o2,o3,...|s1,s2,s3....) 表示某句话 s1,s2,s3...被读成 o1,o2,o3,...的可能性, 而
P(s1,s2,s3,...) 表示字串 s1,s2,s3,...本身能够成为一个合乎情理的句子的可能性,所以这个公式的意义是用发送信号为 s1,s2,s3...这个数列的可能性乘以 s1,s2,s3...本身可以一个句子的可能性,得出概率。
(读者读到这里也许会问,你现在是不是把问题变得更复杂了,因为公式越写越长了。别着急,我们现在就来简化这个问题。)我们在这里做两个假设:
第一,s1,s2,s3,... 是一个马尔可夫链,也就是说,si 只由 si-1 决定 (详见
系列一
);
第二, 第 i 时刻的接收信号 oi 只由发送信号 si 决定(又称为独立输出假设, 即 P(o1,o2,o3,...|s1,s2,s3....) = P(o1|s1) * P(o2|s2)*P(o3|s3)...。
那么我们就可以很容易利用算法
Viterbi
找出上面式子的最大值,进而找出要识别的句子 s1,s2,s3,...。
满足上述两个假设的模型就叫隐含马尔可夫模型。我们之所以用“隐含”这个词,是因为状态 s1,s2,s3,...是无法直接观测到的。
隐含马尔可夫模型的应用远不只在语音识别中。在上面的公式中,如果我们把 s1,s2,s3,...当成中文,把 o1,o2,o3,...当成对应的英文,那么我们就能利用这个模型解决机器翻译问题; 如果我们把 o1,o2,o3,...当成扫描文字得到的图像特征,就能利用这个模型解决印刷体和手写体的识别。
P (o1,o2,o3,...|s1,s2,s3....) 根据应用的不同而又不同的名称,在语音识别中它被称为“声学模型” (Acoustic Model), 在机器翻译中是“翻译模型” (Translation Model) 而在拼写校正中是“纠错模型” (Correction Model)。 而P (s1,s2,s3,...) 就是我们在系列一中提到的语言模型。
在利用隐含马尔可夫模型解决语言处理问题前,先要进行模型的训练。 常用的训练方法由伯姆(Baum)在60年代提出的,并以他的名字命名。隐含马尔可夫模型在处理语言问题早期的成功应用是语音识别。七十年代,当时 IBM 的
Fred Jelinek
(贾里尼克) 和卡内基·梅隆大学的 Jim and Janet Baker
(贝克夫妇
,李开复的师兄师姐) 分别独立地提出用隐含马尔可夫模型来识别语音,语音识别的错误率相比人工智能和模式匹配等方法降低了三倍 (从 30% 到 10%)。 八十年代李开复博士坚持采用隐含马尔可夫模型的框架, 成功地开发了世界上第一个大词汇量连续语音识别系统 Sphinx。
我最早接触到隐含马尔可夫模型是几乎二十年前的事。那时在《随机过程》(清华“著名”的一门课)里学到这个模型,但当时实在想不出它有什么实际用途。几年后,我在清华跟随王作英教授学习、研究语音识别时,他给了我几十篇文献。 我印象最深的就是贾里尼克和李开复的文章,它们的核心思想就是隐含马尔可夫模型。复杂的语音识别问题居然能如此简单地被表述、解决,我由衷地感叹数学模型之妙。
谷歌 -- 寄语
2006年4月14日
天街小雨润如酥,草色遥看近却无。今天就是这样一个日子,春意盎然,生机勃勃。
在这个耕耘的季节,Google 取名“谷歌”。以谷为歌,是播种与期待之歌,亦是收获与欢愉之歌。
我们希望,“谷歌” 能为每一个人整合全球信息,让人人能获取,使人人都受益。
欢迎你到 “谷歌” 来,让我们为你搜索,给你收获。
一条条信息就像一株株小草,鲜活而充满生命力,汇聚起来,成一片新绿,无边无际。
我们把每个网站当成一个选民,所有搜索结果的排名完全由这些选民相互 “投票” 公正决定。因为我们相信,信息面前,人人平等,只有真正在网络上被大家公选、信赖的信息才是有价值的。
我们更期望,一旦你到“谷歌”来,就可以迅速找到所需的信息,然后离开,去做自己想做的事情。我们以心血为你争取时间,并为你不断寻找更多获取信息的方式。
我们曾经设想,把庞大的服务器群放在一艘船上,让淙淙流水发动能源,带动信息的整合。这乍看起来风光无限的浪漫图景,诉说着我们对理想不舍昼夜的追求。
今天我们所整合的,只是无穷信息的一小部分。我们要做的,是汇天下信息,予天下人。信息还有许多, 我们要做的也就更多。
你可以在这里
观看下载 “谷歌 Flash”
或者你可以把这个链接发给你的朋友:
http://googlechinablog.com/gugeflash.swf
谷歌的诞生
2006年4月13日
发表者:张晶,亚太区市场经理
昨天,Google 发布了我们在全球唯一的非英文品牌名称 –
谷歌
。
顾名思义,以谷为歌,象征着耕耘和收获的喜悦,也表达了一种勤恳求实的态度。
有关起名的过程,很多媒体已做了
详细的报导
,就不想在这里有更多的描述。我只是想说,就像给自己的孩子起名字,每个 Google 的中国人都希望为 Google 起一个既符合品牌特点、又方便广大中文用户的名字。但是就像有太多的爸爸妈妈,每个人对 Google 品牌都有不同的诠释和期待,大家精益求精,起名字就成了一个漫长的过程。
在最后确定这两个字的时候,我们受到了
梵高
作品中对
金黄色麦田
的描绘。梵高是一位极具创新精神、不同凡响的艺术家。他画中所描绘的广阔、金黄色的麦田好像蕴蓄着无尽的信息,我们在这里耕耘、创作,为用户收获结果。所以,以谷为歌,是我们的播种与期待之歌,也是收获与欢愉之歌。
“谷歌” 并不会代替 “Google” 英文名称的使用,这两个名字今后将相互呼应、互为支持。
一个名字的诞生,仅仅是我们更贴近中国用户的一步,我们今后的工作还会不断赋予它更丰富的含义。希望 “谷歌” 带着我们所有 googler 的理想开始它新的历程。
谈图片搜索
2006年4月11日
发表者: 朱安, Google 工程师
俗话说:百闻不如一见。有时候图片较于文字更能直接地表达意境。英语中也有相似的说法,就是:A picture is worth a thousand words,意为:一画千言。上星期张晶的
《你知道吗》
提到了几个图片搜索的巧妙应用,今天我想谈谈 Google 图片搜索的一些基本应用。
Google 早在2000年时就开始向中文用户提供图片搜索的服务。目前,Google 共索引了几十亿张图片,并且每天进行更新、补充。对于每一个搜索结果,我们会向用户提供一张缩略图(thumbnail),并会对之进行注释。在图片下面,我们首先提供一个简短的摘要,其次是图片本身的信息,按尺寸、大小、格式排列,最后是图片所在的网站。举
“清明时节雨纷纷”
为例:
清明时节雨纷纷-清明节 ...
600 x 373 像素 - 46k - jpg
www.nongli.com
我们所提供的摘要是:清明时节雨纷纷-清明节 ...
图片信息是:600 x 373 像素 - 46k - jpg(尺寸 - 大小 - 格式)
图片出处是:
www.nongli.com
点击缩略图你将可以
查看原始图片
和查看图片所在的
网页
。
图片是不分国界和语言的。基于此,Google 对于图片搜索的排名也有所调整。你有没有注意到直接输入一些中文的关键词也可以查到在别国网站上的图片了呢?试一试:
人名:
泽塔 琼斯
汤姆•克鲁斯
地名:
卫城
阿尔卑斯山脉
除了人名、地名有这样的处理以外,类似的关键词还有:品牌名、漫画名、游戏名等等。因为在某种程度上说,它们在不同语言里都是通用的。
另外,再向大家介绍一个小诀窍。如果你想搜索可以作为桌布(wallpaper)背景的图片,不妨把图片尺寸限制在较大尺寸,比如:
圣斗士
。
数学之美 系列二 -- 谈谈中文分词
2006年4月10日
发表者: 吴军, Google 研究员
谈谈中文分词
----- 统计语言模型在中文处理中的一个应用
上回我们谈到
利用统计语言模型进行语言处理
,由于模型是建立在词的基础上的,对于中日韩等语言,首先需要进行分词。例如把句子 “中国航天官员应邀到美国与太空总署官员开会。”
分成一串词:
中国 / 航天 / 官员 / 应邀 / 到 / 美国 / 与 / 太空 / 总署 / 官员 / 开会。
最容易想到的,也是最简单的分词办法就是查字典。这种方法最早是由北京航天航空大学的梁南元教授提出的。
用 “查字典” 法,其实就是我们把一个句子从左向右扫描一遍,遇到字典里有的词就标识出来,遇到复合词(比如 “上海大学”)就找最长的词匹配,遇到不认识的字串就分割成单字词,于是简单的分词就完成了。这种简单的分词方法完全能处理上面例子中的句子。八十年代,
哈工大的王晓龙博士
把它理论化,发展成最少词数的分词理论,即一句话应该分成数量最少的词串。这种方法一个明显的不足是当遇到有二义性 (有双重理解意思)的分割时就无能为力了。比如,对短语 “发展中国家” 正确的分割是“发展-中-国家”,而从左向右查字典的办法会将它分割成“发展-中国-家”,显然是错了。另外,并非所有的最长匹配都一定是正确的。比如“上海大学城书店”的正确分词应该是 “上海-大学城-书店,” 而不是 “上海大学-城-书店”。
九十年代以前,海内外不少学者试图用一些文法规则来解决分词的二义性问题,都不是很成功。90年前后,清华大学的郭进博士用统计语言模型成功解决分词二义性问题,将汉语分词的错误率降低了一个数量级。
利用统计语言模型分词的方法,可以用几个数学公式简单概括如下:
我们假定一个句子S可以有几种分词方法,为了简单起见我们假定有以下三种:
A1, A2, A3, ..., Ak,
B1, B2, B3, ..., Bm
C1, C2, C3, ..., Cn
其中,A1, A2, B1, B2, C1, C2 等等都是汉语的词。那么最好的一种分词方法应该保证分完词后这个句子出现的概率最大。也就是说如果 A1,A2,..., Ak 是最好的分法,那么 (P 表示概率):
P (A1, A2, A3, ..., Ak) 〉 P (B1, B2, B3, ..., Bm), 并且
P (A1, A2, A3, ..., Ak) 〉 P(C1, C2, C3, ..., Cn)
因此,只要我们利用上回提到的统计语言模型计算出每种分词后句子出现的概率,并找出其中概率最大的,我们就能够找到最好的分词方法。
当然,这里面有一个实现的技巧。如果我们穷举所有可能的分词方法并计算出每种可能性下句子的概率,那么计算量是相当大的。因此,我们可以把它看成是一个
动态规划
(Dynamic Programming) 的问题,并利用 “维特比”(
Viterbi
) 算法快速地找到最佳分词。
在清华大学的郭进博士以后,海内外不少学者利用统计的方法,进一步完善中文分词。其中值得一提的是清华大学孙茂松教授和香港科技大学吴德凯教授的工作。
需要指出的是,语言学家对词语的定义不完全相同。比如说 “北京大学”,有人认为是一个词,而有人认为该分成两个词。一个折中的解决办法是在分词的同时,找到复合词的嵌套结构。在上面的例子中,如果一句话包含“北京大学”四个字,那么先把它当成一个四字词,然后再进一步找出细分词 “北京” 和 “大学”。这种方法是最早是郭进在 “Computational Linguistics” (《计算机语言学》)杂志上发表的,以后不少系统采用这种方法。
一般来讲,根据不同应用,汉语分词的颗粒度大小应该不同。比如,在机器翻译中,颗粒度应该大一些,“北京大学”就不能被分成两个词。而在语音识别中,“北京大学”一般是被分成两个词。因此,不同的应用,应该有不同的分词系统。Google 的葛显平博士和朱安博士,专门为搜索设计和实现了自己的分词系统。
也许你想不到,中文分词的方法也被应用到英语处理,主要是手写体识别中。因为在识别手写体时,单词之间的空格就不很清楚了。中文分词方法可以帮助判别英语单词的边界。其实,语言处理的许多数学方法通用的和具体的语言无关。在 Google 内,我们在设计语言处理的算法时,都会考虑它是否能很容易地适用于各种自然语言。这样,我们才能有效地支持上百种语言的搜索。
对中文分词有兴趣的读者,可以阅读以下文献:
1. 梁南元
书面汉语自动分词系统
http://www.touchwrite.com/demo/LiangNanyuan-JCIP-1987.pdf
2. 郭进
统计语言模型和汉语音字转换的一些新结果
http://www.touchwrite.com/demo/GuoJin-JCIP-1993.pdf
3. 郭进
Critical Tokenization and its Properties
http://acl.ldc.upenn.edu/J/J97/J97-4004.pdf
4. 孙茂松
Chinese word segmentation without using lexicon and hand-crafted training data
http://portal.acm.org/citation.cfm?coll=GUIDE&dl=GUIDE&id=980775
一地鸡毛
2006年4月7日
发表者:崔瑾,Google 公关部
小组长一直说,做公关的似乎不太适合写 Blog,我心中也欣然默许了。但是,当我结束第一次总部之旅,我还是决定写写我在这里见到的一些平凡的人。
初进 Google 我有点不服气,从职位的名称来看似乎是回到了最初工作的起点,比起我上家公司,怎么也低了3、4级,要不是冲着是互联网公司和面试时见到的几个非常非常 Nice 的面试官,还有我老公的鼓励,我今天还不一定能成为 Google 的一员。还记得面试过程中的一天,我犹豫的对老公说自己想放弃了,他居然回答:“不行,Volunteer 也要去”。但是今天我很庆幸自己当初的决定。
第一次见到 Jing 是面试的时候,Jing 很安静,轻轻的敲门,静悄悄的进来,初识她的人不会想到她是多么倔强和坚持的人。后来很多时候,每当我在竞争的压力中左右摇摆、不知所措的时候,我总要跟 Jing 聊聊。记得很清楚,Jing 说,我们一定要信仰些什么?我们应该坚信,搜索是用户体验型的产品,用户很聪明。Jing 还告诉我,我们一定要有使命感,在总部,正是因为这些使命感,我们的工程师才有着惊人的创造力。
Peter 是面试的时候最特别的。一进来,他便说,你见了第几个人了,我说,您是第6个了吧。他突然笑起来说,那我就不问你问题了,你问我吧。这一下把我搞懵了,哪有这样面试的。我就问他:“人家都说,Google 可以带狗上班,这是真的么?”他说:“大家都说 Google 是一个 Dog company,前一阵有一个争论,说公司歧视了猫,哈哈,要是猫也来,不知道 Google 能不能发明一个猫狗关系调节工具”。后来当我正式上班,跟他再提起这件事情的时候,他说,“我说过这么聪明的话么?”Peter 很棒,但也非常辛苦,他在我们中国这边基本上可以说是负责一切,他是我们的财务总监,但是小到找按摩师、找办公室、员工公寓,大到各类财务事宜,他都得挂心。
与修平只有一面之缘,大多关于他的故事是从同事那里获知的,他是 Google 很资深的一个工程师了,注意到他,是因为他头发花白,但是,做事实在认真,有时甚至认真的像小学生。有一次公司希望他给新员工讲讲公司文化,到了时间,他居然拿出了一张纸,一丝不苟的逐字念了起来。一个同事不无敬佩地介绍说,修平,牛人啊!你知道 Google 当时以竞拍的方式上市么,那就是修平建议的。这次回总部,我有幸又一次见到了修平,在跟中国工程师见面自我介绍的时候,修平一丝不苟得说:“我是沈修平,在 Google 公司作软件工程师,现在在大姐(我们亚太组的一位女性工程师)的小组工作。” 据说,修平现在在做一个对中国很有意义的项目,我们都非常期待他又一次的创意。
上班第一天的时候,在我们小小的新华保险大厦见到了长相相当本土的 Yuke,后来才知道,Yuke 很厉害,精通三国语言。Yuke 是一个很低调的人,希望能够全身心地躲在角落里安静做自己的事情,他有很多故事,这里我想我还是要尊重他的选择。无论如何,我还是希望提到他,否则我怕自己会遗憾。
上班第一周的好老师,要算是 Alex 和 Richard 了。来上班的时候很不巧,公司全球销售大会,很多人都回总部了。第一天,我无依无靠的不知道做什么,这时候 Alex 来了,他和 Richard 两人邀请我坐到他们的办公室去,然后,Alex 又给我很多他们渠道部门的材料读,带我走进真正 Google 的大门。Alex 很小离开中国,但他的中文好极了,能说能写。另外,他还是一个围棋高手。
鹏程是我们新来的工程师,有一天他吃中午饭的时候,对大家说,你们知道 Google Earth 的一个应用么?我用它看我在美国的女朋友家门口的人流车辆。还有一次 Google Code Jam 编程挑战赛结束后,他对我说,能跟我照一张照片么?我说你干什么,整天上班看还不够,还要拿回家去 24 小时看不成。他笑着说,我想照张照片寄给我女朋友气气她。晕ing
第一次见到 Johnny(韶宁)是面试的时候,那时他的任命还没有正式发布。阴差阳错,一周以后,我又被安排和他见一次,Johnny 一见到我,就说,哎呀,抱歉,我见过你了,跟你聊过了,真是抱歉,浪费你的时间又来一次。不过既然来了,你愿不愿意再聊聊。临走的时候,他说想给我点建议,他说,你不应该辞职休假然后再找工作,我觉得你的注意力已经不太集中了。我笑笑说,哈,人有不同的追求,我还是挺追求生活的。他想了想,你说得也有道理,我这个人,比较喜欢工作。Johnny 很亲切,面试结束后,他说正好要出去,就送我下楼,说说笑笑没有一点距离感。后来,合作起来,我发现他是一个行动力很强的人,他说,他坚信遇见事绝不能等,一定要迅速采取行动。加入 Google 的决心是 Johnny 帮我坚定的,面试的时候,我问 Johnny,Google 对中国用户的承诺是什么?他说,起初他没有想到会加入 Google,但是后来,他去了总部几趟,觉得搜索很厉害,,非常震撼,见到 Eric Schmidt 他们对中国用户都非常重视和认真。他说,他见到开复的第一句话是,开复咱们两个人只能赢不能退。真诚、坚定与行动这是 Johnny 身上最鲜明的特色。就是他身上的这种气质,让我没有理由的相信这个公司、这个团队。
最后,我还是要说开复,尽管写他的文章已经太多了,而且我不认为,我对开复的描述会超越他人。2001 年就听过开复的名字,说句老实话,进入 Google 之前,我对开复没有什么太特殊的感觉,我好像天生对很多事情都很淡,习惯于欣赏自己的世界。但是,同开复共事的这几个月,我打心眼里佩服他。没有同开复工作过的人,不能想象他惊人的效率和精力,他白天上班要处理工作,晚上回去居然还能够回复自己学生网的邮件,经常早晨来,他会转发过来好几封学生网上来的采访要求,并清楚地写上他的建议和意见。在 Google 有未能处理的邮件是很正常的事情,对此我经常感到很愧疚。但是,今天回想起来,我几乎想不起来开复有什么样邮件没有给我回复过,这是很惊人的。开复有时心很软,不愿意拒绝别人的请求,我和 Tina 经常冲进他的办公室说:“开复,No,这件事情不能做。”开复经常会很可爱的歪着脑袋说“那好吧,听你们的。”我和 Tina 为此经常觉得很不忍心,对对方说,“我们以后不要再欺负开复了”:) 开复很尊重我们,他很乐观,碰见很困难的情况,他都会说笑话给我们听。
我总能想起大雁文化,大雁长途迁徙,靠什么保持团队呢?就是靠互相吆喝、互相鼓励。我想我们 Google 中国的团队,就是这样,互相鼓励、真心帮助、互相促进。我经常问自己,为什么要这样辛苦?因为和这些优秀的人在一起工作是有压力的,我经常担心自己跟不上大家的节奏而成为瓶颈。但是,每天我都期待上班,期待和他们在一起讨论事情、争论问题、激情碰撞的时间。有时候哪怕只要公司还有一个人在,我都不舍得离开,为什么呢?我想也许就是因为这些人。
用于 Firefox 的 Google 工具栏 Beta 2 发布了
2006年4月6日
发表者:吴丹丹,Google 黑板报小组
今天,我们非常高兴的宣布
用于 Firefox(火狐浏览器)的 Google 工具栏 Beta 2
发布了。这个新的版本是 Google 公司集中了一批工程师的力量在我们西雅图附近的 Kirkland 办公室完成的。这个新版本的 Google Firefox 工具栏提供包括中文在内的 16 个语言版本,也可供 Windows、Mac 和 Linux 操作系统使用。
最新发布的 Firefox 工具栏中文版把 RSS 和 Google 个性化首页或其它阅读器整合了起来,让你可以直接订阅你喜爱的网页内容并在你的个性化页面 (如 iGoogle 上)阅读。同时,为了防范越来越猖獗的网络“钓鱼”现象,我们还在工具栏中增加了“
安全浏览
”功能,在某些网页试图窃取你敏感信息时给你提示。另外,当你在工具栏搜索框里搜索英文时,工具栏回自动提供一系列的关键词建议,方便你快速输入。如果你是 Gmail 用户,你应该会喜欢我们通过工具栏增加的一个 Gmail 相关功能,让你单击网页上的邮件地址可以直接打开 Gmail 的邮件撰写窗口(你需要在工具栏下拉的“选项”菜单里开启 “使用 Gmail 发送功能”),而无需再拷贝和粘贴电子邮件地址 。想了解这款工具栏的全部新功能,可以访问
这里
。
对于很多 Google 内部忠实的
Firefox
用户来说,我们希望最新版的 Google Firefox 工具栏能够使一个本身具有创新意义的浏览器功能更加强大。喜欢
Google IE 工具栏 4
的用户可能会发现我们的 Firefox 工具栏的功能与 Google IE 的工具栏不完全一样,那是因为在 Google firefox 工具栏中,我们首先立足于满足 Firefox 用户的需要。但是请放心,我们会努力在两个版本的工具栏中提供用户都喜爱的功能。
Google Firefox 工具栏 Beta 2
你知道吗?
2006年4月5日
发表者: 张晶, Google 黑板报小组
在 Google 工作,常常看到一些同事有灵活运用自己产品的小技巧。这些虽不算什么高难动作,却令人有耳目一新的感觉。下面是三款这样的 tips,写出来与大家分享。
1.如果你要找的内容可以用图像来表达,你就不妨试试图片搜索:
- 找一些别致的卡片,试试键入这些关键字 -
可爱的卡片
,
cute card
,
父亲节贺卡
,
father's day card
- 收集一些家居布置的参考图片,试试 -
居室布置
,
home decoration
,
和纸灯
- 如果光键入一些形容词、名词,看看会出来什么?比如 -
春天
,
柳絮
,
老北京
,
相声
,
小桥流水
2. 把图片搜索当作英文字典使用,看图识字,尤其是当你知道这个单词可能是动物、食物或其它用图片表示更直观、更能表达这个单词的意思的时候。试试这几个:
-
albacore
,
caribou
,
aerobics
3. 把搜索结果简介当作英文翻译工具用。这种方法特别适用于技术词汇、新单词、或在汉英字典中找不到的人名。做法是,在 Google 中文网页搜索框内,打入要查找的英文字词,然后将搜索范围限制在 "简体中文" 范围 (Google 网页搜索框下面一般有“搜索所有网页”、“搜索所有中文网页”、“搜索简体中文网页” 三个选项)。试试看以下两例:
-
hash table
,在搜索结果的简介中知道其中文翻译为 “哈希表”
-
Celine Dion
,在搜索结果的简介中知道这位歌唱艺术家的中文名被翻译为 “席琳狄翁”
数学之美 系列一 -- 统计语言模型
2006年4月3日
从本周开始,我们将定期刊登 Google 科学家吴军写的《数学之美》系列文章,介绍数学在信息检索和自然语言处理中的主导作用和奇妙应用。
发表者: 吴军, Google 研究员
前言
也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望利用 Google 中文黑板报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发 Google 产品的。
系列一: 统计语言模型 (Statistical Language Models)
Google 的使命是整合全球的信息,所以我们一直致力于研究如何让机器对信息、语言做最好的理解和处理。长期以来,人类一直梦想着能让机器代替人来翻译语言、识别语音、认识文字(不论是印刷体或手写体)和进行海量文献的自动检索,这就需要让机器理解语言。但是人类的语言可以说是信息里最复杂最动态的一部分。为了解决这个问题,人们容易想到的办法就是让机器模拟人类进行学习 - 学习人类的语法、分析语句等等。尤其是在乔姆斯基(Noam Chomsky 有史以来最伟大的语言学家)提出 “形式语言” 以后,人们更坚定了利用语法规则的办法进行文字处理的信念。遗憾的是,几十年过去了,在计算机处理语言领域,基于这个语法规则的方法几乎毫无突破。
其实早在几十年前,数学家兼信息论的祖师爷
香农
(Claude Shannon)就提出了用数学的办法处理自然语言的想法。遗憾的是当时的计算机条件根本无法满足大量信息处理的需要,所以他这个想法当时并没有被人们重视。七十年代初,有了大规模集成电路的快速计算机后,香农的梦想才得以实现。
首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克 (
Fred Jelinek
)。当时贾里尼克在 IBM 公司做学术休假 (Sabbatical Leave),领导了一批杰出的科学家利用大型计算机来处理人类语言问题。统计语言模型就是在那个时候提出的。
给大家举个例子:在很多涉及到自然语言处理的领域,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中,我们都需要知道一个文字序列是否能构成一个大家能理解的句子,显示给使用者。对这个问题,我们可以用一个简单的统计模型来解决这个问题。
如果 S 表示一连串特定顺序排列的词 w1, w2,…, wn ,换句话说,S 可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子。现在,机器对语言的识别从某种角度来说,就是想知道S在文本中出现的可能性,也就是数学上所说的S 的概率用 P(S) 来表示。利用条件概率的公式,S 这个序列出现的概率等于每一个词出现的概率相乘,于是P(S) 可展开为:
P(S) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…wn-1)
其中 P (w1) 表示第一个词w1 出现的概率;P (w2|w1) 是在已知第一个词的前提下,第二个词出现的概率;以次类推。不难看出,到了词wn,它的出现概率取决于它前面所有词。从计算上来看,各种可能性太多,无法实现。因此我们假定任意一个词wi的出现概率只同它前面的词 wi-1 有关(即马尔可夫假设),于是问题就变得很简单了。现在,S 出现的概率就变为:
P(S) = P(w1)P(w2|w1)P(w3|w2)…P(wi|wi-1)…
(当然,也可以假设一个词又前面N-1个词决定,模型稍微复杂些。)
接下来的问题就是如何估计 P (wi|wi-1)。现在有了大量机读文本后,这个问题变得很简单,只要数一数这对词(wi-1,wi) 在统计的文本中出现了多少次,以及 wi-1 本身在同样的文本中前后相邻出现了多少次,然后用两个数一除就可以了,P(wi|wi-1) = P(wi-1,wi)/ P (wi-1)。
也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题。其实不光是常人,就连很多语言学家都曾质疑过这种方法的有效性,但事实证明,统计语言模型比任何已知的借助某种规则的解决方法都有效。比如在 Google 的
中英文自动翻译
中,用的最重要的就是这个统计语言模型。去年美国标准局(NIST) 对所有的机器翻译系统进行了评测,Google 的系统是不仅是全世界最好的,而且高出所有基于规则的系统很多。
现在,读者也许已经能感受到数学的美妙之处了,它把一些复杂的问题变得如此的简单。当然,真正实现一个好的统计语言模型还有许多细节问题需要解决。贾里尼克和他的同事的贡献在于提出了统计语言模型,而且很漂亮地解决了所有的细节问题。十几年后,李开复用统计语言模型把 997 词语音识别的问题简化成了一个 20 词的识别问题,实现了有史以来第一次大词汇量非特定人连续语音的识别。
我是一名科学研究人员 ,我在工作中经常惊叹于数学语言应用于解决实际问题上时的神奇。我也希望把这种神奇讲解给大家听。当然,归根结底,不管什莫样的科学方法、无论多莫奇妙的解决手段都是为人服务的。我希望 Google 多努力一分,用户就多一分搜索的喜悦。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2025
3月
2024
12月
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed