中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
提高用户输入体验,让谷歌输入法更智能
2009年9月3日
发表者:谷歌工程研究院工程师 罗宇翔 李大海 区良裔
谷歌输入法一直把提高输入法的智能性,让输入更准确作为其努力目标之一。在此前发布的谷歌输入法 2.0 正式版当中,我们实现了两项能显著提高输入体验的功能——新词推送和个性化语言模型。
中国广大网民具有无穷的创造力,网络新词也层出不穷。新词推送功能,可以监测互联网上最近一段时间内出现的热门词语,并作为新词实时推送给输入法用户。得益于谷歌搜索引擎庞大的网页索引库以及每天海量的搜索请求,谷歌拼音输入法在发现新词和判断新词上具有天然的数据优势和算法优势。我们让用户机器上的词典时刻都是“最潮的”。
个性化语言模型是我们提高输入法智能性的一项新的尝试。谷歌输入法自推出以来就已经可以记录用户自己组成的词语,并应用到后续输入上。但随着在中文处理领域研究的不断深化,我们觉得我们还有能力做得更好。我们在用户调研中发现,不同用户因为职业不同、文化背景不同、地域不同,因此日常谈论的话题、关心的内容、语言使用的习惯大不相同,输入习惯有显著差异。比如说,不少游戏玩家更倾向于在输入中使用大量网游的词汇搭配和习惯用语;对于新闻从业人员,措辞准确而规范就显得更重要一些。一个输入法要想真的称得上智能,需要不断学习用户的使用行为,并在此基础上有针对性地调整排序算法,给用户提供更合适的候选词句。传统输入法都是首先为所有用户提供一个通用的模型——无论是词频统计还是语言模型——然后在此基础上进行微调。而我们认为,应该一开始针对不同的用户,收集符合他们语言习惯和输入习惯的语料,训练针对每一个人的语言模型。
个性化语言模型完全基于用户同步于服务器上的词典信息,用机器学习算法自动找出和这类信息关联性比较强的词语搭配规则,并更新到用户的机器上。此类规则比单纯的词库更具有通用性,也更能体现出语言的真实使用习惯,相当于给输入法再提供了一个善于学习的大脑,专门去适应不同用户的个性输入需求。 当然,为每一个用户搜集和训练专有的模型需要巨大的计算量。好在Google的云计算提供了这样的计算能力,使得过去只能在研究室里采用的个性化语言模型得以在我们的产品中应用。
假如谷歌拼音输入法识别出您经常输入诗词歌赋,那么您就可以轻松输入“窈窕身姿惹来众人怜”这样的短语组合。假如您输入的内容多是体育相关,那输入法将在你输入“安哥拉大胜伊朗”的时候提示出正确的候选项。当然,上述例子并不是每个人都有机会碰到。根据您的实际使用情况,我们会给您提供更能辅助您日常输入的语言模型。
结合新词推送和个性化语言模型的功能,相信谷歌输入法 2.0 可以给您更佳的输入体验。如果您想更多了解我们的输入法,最好的办法当然是到
http://www.google.com/ime/pinyin/
下载并使用一下,相信您会喜欢上她。
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed