中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
从喊话教材到 Google 翻译
2006年10月27日
发表者:潘茜,Google 中国市场部
有一天在网上无意中看到还是上个世纪国内流行的外语喊话教材,觉得颇为幽默。但想想那时的内容与形式,再看看今天流行的华尔街英语,似乎我们逐渐走向全民学外语的历程,也折射着中国人走向世界的进程。 从
英文的财经网站
,到葡萄牙语的
巴西足球网站
, 我们将更多地接触外语的互联网,几乎是不可避免的了。
也正是因为这个原因,Google 的中外文在线翻译工具在不断地把翻译质量推向新台阶的同时,也在让操作变得更简便, 例如本周上线的
全新在线翻译界面
,只留下翻译一段文字和翻译整个网页的 Url 输入两部分,左面输入文字,点击翻译按钮右侧立刻就可以得到结果,使这个页面变得非常轻松好用:
如果你想很快了解一个英文网页大概说了什么,但又不想一个一个词地抱着词霸“死磕”, 可以在这里试试输入网页的网址。一键点击, Google 翻译就可以帮你把整个网页的文字部分英翻中啦!例如
美国斯坦福大学的网站首页
本来是纯英文的,经
Google 工具栏
上内置的一键翻译按钮翻译后变成了如下的样子,虽然还是有不准确之处,但读者已经可以通过它了解原文的大致意思。 特别值得一提的是,最新版的翻译工具还提供了鼠标划过翻译后的文字即出现原文的功能, 如图:
此外, 你还可以在浏览器收藏夹中的“链接” 文件夹内, 加入一个
一键翻译的快捷键
, 这样下次看到英文网页时,直接打开:收藏夹—〉链接—〉英语翻译成中文 (或其他数十种语言的互译), 网页即刻被翻译过来。当然,
Google工具栏上内置的一键翻译按钮
也非常直观, 步骤比放入收藏夹更简单,只有操作一步。
最后要解释一下, 那就是全文翻译的难度远远不同于只能查找翻译单个字词类的词典 – 那只是一个固定的数据库, 把对应的字词储备好供人们调用即可。 全文翻译需要通过服务器对海量的多语言数据进行对比学习 (例如通过研究一篇文章在联合国上被翻译成的 N 种文字),以找到不同语言之间的语法和文字对应规律,而大家多少都知道外国人说话的句子结构、语法、时态等等,跟咱中国人很不一样啊! 如果 “what did Enron do?” 被按照单词直译成 “什么做安然做?”, 我们中国加入全球市场这件事基本也就可以歇歇了。
这种用程序通过对海量的多语言数据进行对比学习、以找到不同语言之间的对应规律的方式,学名叫做 machine learning, 即机器学习或识别。 虽然目前 Google 的智能机器识别能力和全文翻译功能已经在全球被公认为质量最好,它大概平均也只能达到一个英文还不错(但词汇量可能巨大)的中国高中生的翻译水准。目前 Google 翻译可以处理得最好的应该是那些行文语法比较严谨标准的新闻和学术文章,把他们从英文翻译到中文,而比较准确地从中文翻译到英文似乎还有更长的路要走。例如:
来自联合国的
一篇会议记录
:
"... Still, it was generally felt that the Strategy’s condemnation of terrorism in all its forms and manifestations signalled the will of the international community that it would no longer tolerate the actions of the sponsors of terrorism or of those whose who wilfully failed to prevent terrorists from using their territories. In the end, it was hoped that the strategy would provide the impetus to unite the international community in its fight against terrorism via practical measures that facilitated cooperation by way of extradition, prosecution, information flows and capacity-building.”
可以被 Google 翻译一键点击译为:
"…还有,与会者普遍认为,该战略谴责一切形式的恐怖主义和表现标志着国际社会的意愿,将不再容忍恐怖主义行动的提案或那些故意未能阻止恐怖分子利用其领土.到最后,人们希望这一战略将提供动力团结国际社会打击恐怖主义的切实措施,促进合作,经借引渡起诉、信息流和能力建设."
答用户问 (二) -- 关于 Google 工具栏
2006年10月23日
发表者:产品支持小组
自从黑板报上的
Google 工具栏的“小特点”与“大目标”
系列文章在 Google 黑板报刊出后,很多用户对 Google 工具栏产生了浓厚的兴趣。相应地,我们最近收到了很多有关工具栏的来信,其中有很多是由于我们针对 Internet Explorer (IE) 和 Firefox 分别提供不同版本的 Google 工具栏所引发的。下面我们在此将回答几个出现频率最高的问题,希望也能一并解除您的疑问。
一、你们的黑板报中说 Google (谷歌)工具栏已经推出 4.0 版本了,为什么我下载的是 2.1 版本呢?
情况是这样的 …… 潘茜在文章中所介绍的 4.0 版本的 Google 工具栏是适用于 IE 的版本。适用于
IE 的工具栏
自 2002 年 12 月 11 日面世后,历经多次完善与升级,目前在我们网站供用户下载的已经是 4.0 版本。而随着 Firefox 的普及,我们在 05 年 7 月又推出了
适用于 Firefox 的工具栏
版本。从首次推出 1.0 测试版到目前最新的 2.1 版本,已经有越来越多的 Firefox 用户也体验到了 Google 工具栏所带来的便利。
由于 IE 和 Firefox 浏览器与生俱来的不同,用户只能分别下载与其浏览器相匹配的工具栏。为了方便用户下载,我们的下载网站可以自动诊断出您所使用的浏览器。比如,如果您用的是 Firefox 浏览器,即使您输入适用于 IE 的工具栏的下载网址,我们的网站也会自动将您引导到用于 Firefox 的工具栏的下载页面。这一动作如此细微,以至于很多用户根本不会注意到。结果是,您得到了与您的浏览器相匹配的 Google 工具栏,尽管版本号与您原来估计的不同。:)
二、 为什么基于 Firefox 的工具栏的功能和基于 IE 的工具栏功能不一样呢? 比如说, Firefox 版本的没有书签和自定义按钮功能!
正如我们在第一个问题中所提到的,由于 IE 和 Firefox 各有自己的特点,因此,适用于 Firefox 的 Google 工具栏与适用于 IE 的工具栏在功能上并不完全相同。例如,用于 IE 的工具栏的一个很受欢迎的功能是“弹出式窗口拦截器”,但由于 Firefox 本身已经带有拦截弹出式窗口的功能,在我们的适用于 Firefox 的工具栏中,我们就不再提供这项功能了。
除了“弹出式窗口拦截器”功能外,还有一些其他的适用于 IE 的工具栏提供的功能,目前在用于 Firefox 的工具栏中尚未提供,例如:书签、自定义按钮等等。我们非常理解 Firefox 用户对这些功能的需求,我们会不断努力,争取尽早在适用于 Firefox 版本的工具栏中也推出这些功能。
三、Google Toolbar 的中文版,是不是无法安装到 Firefox 的英文版上?
答案是:是的。如果您使用的 Firefox 是英文版,那么,您只能安装英文版的 Google 工具栏,即使您在工具栏安装页面已经选择了“中文”也是如此。也就是说,Google 工具栏的语言将自动与 Firefox 的界面语言保持一致。如果您重新安装其他语言版本的 Firefox,工具栏使用的语言也会自动更改,以与 Firefox 保持一致。尽管我们尚未提供不同于 Firefox 浏览器语言的 Google 工具栏安装方法,但是我们理解用户对这一功能的要求,我们会努力对此进行改进。
相关文章:
Google (谷歌)工具栏的“小特点”与“大目标” 之一 搜索篇
Google (谷歌)工具栏的“小特点”与“大目标” 之二 精巧功能
答用户问 (一) -- 关于 Google 桌面
如何准备软件工程师的面试
2006年10月13日
发表者:王忻,Google 工程师
(作者简介: 王忻,Google 工程师。北京出生,五岁时跟随父母移居美国。中学期间跳了三级,十五岁进入了加州理工大学,加入 Google 前曾在微软等公司工作。)
六月份的时候,我曾经在黑板报上介绍过“
如何写一份好的工程师简历
”, 今天想跟大家来谈谈如何准备软件工程师的面试?假设,现在您的杀手简历 (killer resume)已经吸引了某大公司的注意并约你面试。那么接下来该如何准备呢?
我在 Google(以前是微软)工作期间面试了不下 300人,其中某些应聘者确实表现非凡,但有些却显得准备不足。当然许多面试准备不足的人最后依然获得了录用通知,因为他们本身确实才华出众。但如果应聘者能提前准备妥当,那么面试过程将更为保险和轻松。以下所列出的就是我根据多年经验总结得出的建议:
1.使用相同的工具(如铅笔和纸张)和时间限制(例如半个小时)模拟面试训练
Google 和微软都会让应聘者在白板上手工解答编程问题,但通常大部分的应聘者都是习惯于在电脑上利用编程工具系统编写程序。因此面试的时候,某些应聘者离开了熟悉的电脑光标,站在白板前感觉手足无措不知该如何起行。又或者他们不习惯在编程之时旁边有人观看,这会让他们感到紧张而无法正常思考。
在现实生活中,如果你想要横渡英吉利海峡,自然不能总是在室内游泳池练习。你必须投身于大海在波涛之中训练,在准备面试的时候也是如此。:)
在面试开始之前你最好向招聘单位询问面试形式和面试问题。如果招聘单位让你在某个房间考试且仅提供没有汇编程序的编辑器,那么就应该在家中按照这种情景进行练习。如果招聘公司单位让你在白板上回答问题并会安排考官在旁监督,那么你就要找一位软件工程师来扮演考官配合你练习。即使找来的考官经验不如你也没有关系,他们依然能帮助你消除在他人面前出错所带来的紧张感,这样可以让你适应有人在旁边盯着看的面试氛围。
如果你恰巧认识我并希望由我来帮你联系,那我的条件就是必须请我吃饭:如果你已经工作了就吃日本寿司大餐;如果你还是学生,那么吃比萨饼也可以。:)
2.在面试过程中不要对细小错误耿耿于怀
我曾不止一次的在面试过程中碰到这种情况:当应聘者知道编程问题后,他马上就想到了最佳的方案、确定了边界条件,然后开始编写程序。但在编写过程中,应聘者犯了诸如首先检查是不是操作顺序错误或忘记设定某变量等无关大局的小错误,当我指出其错误之后,应聘者立刻变得十分紧张,这种焦虑情绪影响了他在后面环节的正常发挥。
其实这种恐惧心理完全不必要。一名优秀的程序员在编程过程中出现错误也是很正常的,就像是小提琴手在演奏高难度的巴赫交响乐时也会偶尔失误。音乐会的听众可能会觉察到这些错误,但是听众绝对不会因为这种细小失误就把出色的小提琴手看作是门外汉。
即便应聘者彻底搞砸了某个编程问题,面试考官也可能会提出不同的问题并会容忍应聘者在某个问题上的失误。再退一步说,就算某次面试彻底失败,你也有机会在其它面试上补救。
我的一位同事(一个项目的技术负责人)最近面试了一个人,在开始面试时他觉得面试者的交流方式存在问题,因此开始表现的相当不友好。但经过了整个面试过程后,面试者证明了自身的能力,而我的那位同事也成了那位面试者最坚定的支持者。在过去的一年中,我从未见过这位同事如此强烈的支持哪位面试者。
所以,因此就算面试进展不顺,也务必坚持到底不要放弃。
3.在面试过程中不要失礼
这似乎是不用说的问题,但在面试过程中我确实碰到过影响很不好的失礼行为。曾有一位前来应聘软件工程师的人看到我就说:“哇,我真不敢相信你这么年轻!你看上去好小!!我觉得你才 18 岁!”
面试者的这种言行实在要不得。
面试者也要注意不要说出诸如此类的话:“哇,你真的就是考官吗?你看上去好老!”“哇,你真的是来面试我的,你看上去好胖!”(相信应该不会有人说这样的话)。
在我的另外一次面试中,应聘者的手机在面试开始 15 分钟之后就响了,她没有理会,手机连续响了 20 秒,这样不免会对面试造成影响。5 分钟之后,她的手机又响了,她依然没有理会;5分钟之后,手机第三次响起。最后她终于抓过手提包在里面翻出了手机。我想:“是时候关掉手机了,她在进来之前就应该把手机关掉。”但是她在手提包中拿出手机之后却旁若无人的打起电话来,而且就在面试过程中间!
这种情况唯一可接受的理由就是他有什么非常紧急的事,但是即便情况如此,那么他也应该在面试开始之时就讲清楚,让面试官有所准备。
4.不要在面试中喧宾夺主
我曾经面试过几个应聘者,他们好像铁了心肠一定要告诉我他们最近的“超级项目”。当我开始发话他们就立刻打断:“我想让你了解我们近期处理的超级项目,10年之前当这个项目开始之时还默默无闻……”,然后接下来的5分钟时间都在那里滔滔不绝唾沫横飞。
有时应聘者好像打定主意要给每个考官详细描述其引以为豪的项目,然后一整天都在那里翻来覆去的说这个项目。
记住:面试官在面试过程中有具体的问题需要询问。但是如果应聘者喧宾夺主,那么考官就可能无法获得充分的信息来做出判断,同时这种行为也会让考官觉得应聘者很难共事。
如果你确实想谈论自己的项目,那么就应询问面试官:“我觉得最近的某某项目能充分体现我的能力,我能不能用 10分钟的时间来描述一下具体情况?”这样就会给面试官空间来调整面试过程,由此也避免毫无征兆就让面试离题万里。
5.在回答需要具体答案的问题之时,记得首先要有总括性的发言
有时我会问一个答案可以很简练的问题,例如:“在你的那个成功项目中总共有多少人参与?”但应聘者往往会就此打开话匣:“恩,张三参与了这个项目,他负责UI部分,当然我也会给他一些指导。李四也在项目中,她在宾州远程工作,负责后端服务器。两年之后我们又有新人王五加入……”
在应聘者滔滔不绝的讲了三分钟之后,我还是不知道这个项目到底有多少人参与。
因此首先要简练的回答问题,然后再展开描述:“在我接手项目时有三个人,但当我离开项目时人数已经增加到12人。”
当然如果能简练的回答问题,然后征询意见之后再展开论述那就更好了:“在我接手项目时有三个人,但当我离开项目时人数已经增加到 12 人。我可以讲一下各人在项目中的具体分工吗?”
6.(不是特别重要)在面试中要衣着得体,舒适的商务便装是最佳的选择
人们有时候会为衣着犯愁。但是最重要的是要让自己感觉舒适。如果需要具体的建议,那么我建议穿衬衫甚至T恤衫。对于某些公司(例如 Google),西装革履显然是太隆重了。
这条建议不必太看中,因为面试官不会管应聘者穿什么。最好应该询问人事招聘部门穿什么合适,因为不同国家有不同习俗,就算美国东海岸和西海岸的公司着装文化也会有差别。像 Google 这样的公司在着装方面更加随意,因此如果你穿着“三件套”的经典西服去 Google 面试,考官可能会有异样的感觉。因此如果你真的具备软件工程的本领,穿什么其实并不重要。某个应聘者曾经穿着皱巴巴脏兮兮的T恤就跑来面试,他的T恤衫上还有着许多破洞。但最后他还是拿到了录取通知(当然我绝不建议如此穿着)。
最后的一个小故事
最后我想讲一场极为尴尬的面试。在看完之后,我希望你能这样想:无论你的面试如何糟糕,你至少要比这位应聘者幸运。
以前我还在微软的时候,我们通常会为应聘者准备一些饮料,某位暂称其为 Jeff 的应聘者要了一听百事可乐。我们走进面试房间后,他就在桌前坐下了。接下来我们简要的谈了谈他的工作经历,然后他开始在白板上解答编程问题,此时他还没有打开他的可乐。
我们俩站在白板前,然后杰夫开始在上面写程序。在写程序之时他沉浸在对整体构架的思考中,下意识的退了一步来查看整个白板。在后退时他不小心碰到了桌子,放在桌上的百事可乐掉到了地上。
因为可乐还没有打开,因此当可乐罐落地的时候,可乐罐炸开了。
可乐罐在地上打转,泡沫喷的到处都是。你可以想象当时的场景,可乐喷到了墙上、书架还有我电脑的键盘上。我俩楞在那里,手都半伸着(根本来不及抓到可乐罐),眼睁睁的看着可乐弄得到处都是。
我们花了 5 分钟的时间用纸巾来清理现场(虽然我的书本自那天之后都粘页了,而墙壁也不再是干净的了)。
随后我们重新开始白板测试。杰夫此时已非常紧张(换了谁都会紧张吧?)。他写了几行程序,然后擦掉,然后再写。他是用自己的手擦拭白板而不是用板刷。他急得额头冒汗,然后他又用刚刚擦过白板的手擦汗。在面试过程结束之时,他的脸上布满了红色、绿色和蓝色的颜料。
我说:“你的手上粘了很多颜料,我带你去卫生间洗洗吧,”然后我把他领到洗手间让他从镜中看到了自己的尊容。
王忻的其它文章:
如何写一份好的工程师简历
我对女性做工程师的一点看法
答用户问 (二) -- 关于 Google 工具栏
2006年10月10日
自从潘茜的Google工具栏的“小特点”与“大目标”系列文章在 Google 黑板报刊出后,很多用户对 Google 工具栏产生了浓厚的兴趣。相应地,我们最近收到了很多有关工具栏的来信,其中有很多是由于我们针对Internet Explorer (IE) 和 Firefox 分别提供不同版本的 Google 工具栏所引发的。下面我们在此将回答几个出现频率最高的问题,希望也能一并解除您的疑问。
一、你们的黑板报中说Google (谷歌)工具栏已经推出 4.0 版本了,为什么我下载的是2.1版本呢?
情况是这样的 …… 潘茜在文章中所介绍的4.0 版本的 Google 工具栏是适用于IE的版本。适用于 IE 的工具栏自2002年 12 月 11 日面世后,历经多次完善与升级,目前在我们网站供用户下载的已经是 4.0 版本。而随着 Firefox 的普及,我们在2005年7月又推出了适用于Firefox 的工具栏版本。从首次推出1.0 测试版到目前最新的 2.1 版本,已经有越来越多的 Firefox 用户也体验到了Google 工具栏所带来的便利。
由于 IE 和 Firefox 浏览器与生俱来的不同,用户只能分别下载与其浏览器相匹配的工具栏。为了方便用户下载,我们的下载网站可以自动诊断出您所使用的浏览器。比如,如果您用的是 Firefox 浏览器,即使您输入适用于 IE 的工具栏的下载网址,我们的网站也会自动将您引导到用于 Firefox 的工具栏的下载页面。这一动作如此细微,以至于很多用户根本不会注意到。结果是,您得到了与您的浏览器相匹配的 Google 工具栏,尽管版本号与您原来估计的不同。
二、 为什么基于 Firefox 的工具栏的功能和基于 IE 的工具栏功能不一样呢? 比如说, Firefox 版本的没有书签和自定义按钮功能!
正如我们在第一个问题中所提到的,由于 IE 和 Firefox 各有自己的特点,因此,适用于 Firefox 的Google 工具栏与适用于 IE 的工具栏在功能上并不完全相同。例如,用于 IE 的工具栏的一个很受欢迎的功能是“弹出式窗口拦截器”,但由于 Firefox 本身已经带有拦截弹出式窗口的功能,在我们的适用于 Firefox 的工具栏中,我们就不再提供这项功能了。
除了“弹出式窗口拦截器”功能外,还有一些其他的适用于 IE 的工具栏提供的功能,目前在用于 Firefox 的工具栏中尚未提供,例如:书签、自定义按钮等等。我们非常理解 Firefox 用户对这些功能的需求,我们会不断努力,争取尽早在适用于 Firefox 版本的工具栏中也推出这些功能。
三、Google Toolbar的中文版,是不是无法安装到Firefox的英文版上?
答案是:是的。如果您使用的 Firefox 是英文版,那么,您只能安装英文版的 Google 工具栏,即使您在工具栏安装页面已经选择了“中文”也是如此。也就是说,Google 工具栏的语言将自动与 Firefox 的界面语言保持一致。如果您重新安装其他语言版本的 Firefox,工具栏使用的语言也会自动更改,以与 Firefox 保持一致。尽管我们尚未提供不同于 Firefox 浏览器语言的 Google 工具栏安装方法,但是我们理解用户对这一功能的要求,我们会努力对此进行改进。
数学之美 系列十六(上) 不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型
2006年10月8日
发表者:Google 研究员,吴军
[我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里,这样可以降低风险。在信息处理中,这个原理同样适用。在数学上,这个原理称为
最大熵原理
(the maximum entropy principle)。这是一个非常有意思的题目,但是把它讲清楚要用两个系列的篇幅。]
前段时间,Google 中国研究院的刘骏总监谈到在网络搜索排名中,用到的信息有上百种。更普遍地讲,在自然语言处理中,我们常常知道各种各样的但是又不完全确定的信息,我们需要用一个统一的模型将这些信息综合起来。如何综合得好,是一门很大的学问。
让我们看一个拼音转汉字的简单的例子。假如输入的拼音是"wang-xiao-bo",利用语言模型,根据有限的上下文(比如前两个词),我们能给出两个最常见的名字“王小波”和“王晓波”。至于要唯一确定是哪个名字就难了,即使利用较长的上下文也做不到。当然,我们知道如果通篇文章是介绍文学的,作家王小波的可能性就较大;而在讨论两岸关系时,台湾学者王晓波的可能性会较大。在上面的例子中,我们只需要综合两类不同的信息,即主题信息和上下文信息。虽然有不少凑合的办法,比如:分成成千上万种的不同的主题单独处理,或者对每种信息的作用加权平均等等,但都不能准确而圆满地解决问题,这样好比以前我们谈到的行星运动模型中的
小圆套大圆
打补丁的方法。在很多应用中,我们需要综合几十甚至上百种不同的信息,这种小圆套大圆的方法显然行不通。
数学上最漂亮的办法是最大熵(maximum entropy)模型,它相当于行星运动的椭圆模型。“最大熵”这个名词听起来很深奥,但是它的原理很简单,我们每天都在用。说白了,就是要保留全部的不确定性,将风险降到最小。让我们来看一个实际例子。
有一次,我去 AT&T 实验室作关于最大熵模型的报告,我带去了一个色子。我问听众“每个面朝上的概率分别是多少”,所有人都说是等概率,即各点的概率均为1/6。这种猜测当然是对的。我问听众们为什么,得到的回答是一致的:对这个“一无所知”的色子,假定它每一个朝上概率均等是最安全的做法。(你不应该主观假设它象韦小宝的色子一样灌了铅。)从投资的角度看,就是风险最小的做法。从信息论的角度讲,就是保留了最大的不确定性,也就是说让熵达到最大。接着,我又告诉听众,我的这个色子被我特殊处理过,已知四点朝上的概率是三分之一,在这种情况下,每个面朝上的概率是多少?这次,大部分人认为除去四点的概率是 1/3,其余的均是 2/15,也就是说已知的条件(四点概率为 1/3)必须满足,而对其余各点的概率因为仍然无从知道,因此只好认为它们均等。注意,在猜测这两种不同情况下的概率分布时,大家都没有添加任何主观的假设,诸如四点的反面一定是三点等等。(事实上,有的色子四点反面不是三点而是一点。)这种基于直觉的猜测之所以准确,是因为它恰好符合了最大熵原理。
最大熵原理指出,当我们需要对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。(不做主观假设这点很重要。)在这种情况下,概率分布最均匀,预测的风险最小。因为这时概率分布的信息熵最大,所以人们称这种模型叫“最大熵模型”。我们常说,不要把所有的鸡蛋放在一个篮子里,其实就是最大熵原理的一个朴素的说法,因为当我们遇到不确定性时,就要保留各种可能性。
回到我们刚才谈到的拼音转汉字的例子,我们已知两种信息,第一,根据语言模型,wang-xiao-bo 可以被转换成王晓波和王小波;第二,根据主题,王小波是作家,《黄金时代》的作者等等,而王晓波是台湾研究两岸关系的学者。因此,我们就可以建立一个最大熵模型,同时满足这两种信息。现在的问题是,这样一个模型是否存在。匈牙利著名数学家、信息论最高奖香农奖得主希萨(Csiszar)证明,对任何一组不自相矛盾的信息,这个最大熵模型不仅存在,而且是唯一的。而且它们都有同一个非常简单的形式 -- 指数函数。下面公式是根据上下文(前两个词)和主题预测下一个词的最大熵模型,其中 w3 是要预测的词(王晓波或者王小波)w1 和 w2 是它的前两个字(比如说它们分别是“出版”,和“”),也就是其上下文的一个大致估计,subject 表示主题。
我们看到,在上面的公式中,有几个参数 lambda 和 Z ,他们需要通过观测数据训练出来。
最大熵模型在形式上是最漂亮的统计模型,而在实现上是最复杂的模型之一。我们在将下一个系列中介绍如何训练最大熵模型的诸多参数,以及最大熵模型在自然语言处理和金融方面很多有趣的应用。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed