中国的博客,走近我们的产品、技术和文化
Google 中国的博客,走近我们的产品、技术和文化
AI 是怎么让机器学会涂鸦的?
2017年5月5日
在 Google,AI 和机器学习绝不仅仅是“高冷”的实验和冗杂的数据。去年,来自Google AI 实验室的一群脑洞巨大的科研人员已经证明了这一点:他们用 AI 唱 Rap,识别实物,编写旋律,构建可视化高维空间...
在这些奇奇怪怪却很有意思的“小玩意儿”之中,有一个 AI 版的“你画我猜”:QuickDraw。AI 会给你一个涂鸦主题,在你作画的过程中 AI 将不断地识别和猜测你画了什么,直到得出正确答案,或是 20 秒倒计时结束。
而在不久之前,Google 又推出了功能更加实用的“你画我猜”升级版 AutoDraw,可智能识别涂鸦内容并进行完善。有了它,就连“灵魂画手”也能画出一手好画啦:
涂鸦是人们对事物的抽象视觉表达。AI 和机器学习技术似乎使机器学会了“看懂”和“理解”涂鸦内容,但这似乎还远远不够。比如,要如何让机器学会自行生成涂鸦呢?
其实,在此之前,科研人员已在机器生成图像的领域做了大量的工作。这是一项非常有难度的研究,其过程中不乏产生一些十分“魔性”的成品:
近期,来自 Google 的科研人员们在论文《简笔画绘图的神经表征》(A Neural Representation of Sketch Drawings) 中,让教会机器绘画成为了可能。
科研人员们受人类绘画过程的启发,降低维度,通过用大量的手绘涂鸦来组成数据集训练模型,训练机器来理解人们在绘制涂鸦时是在何时起笔、走笔方向、何时停笔。经过训练的模型在接收一张人手绘的涂鸦后可以生成一张同主题的新涂鸦:
用“猫”为主题的涂鸦训练的模型重建的猫涂鸦
是不是看起来就只是把人的涂鸦重复了一遍?但事情可没有是这么简单!
实际上,模型生成的新涂鸦的确不是简单地重复了人的绘画,而是对图像的本质进行了分析和理解的。为证明模型确实是学会了人类画猫的一些技巧,可以尝试输入一些故意犯了一些小错误的涂鸦:
在收到故意被画成三只眼的小猫涂鸦后,模型输出了一个轮廓类似的新涂鸦,其中“三只眼”的错误已被修正。这说明经训练的模型已经理解了“猫”涂鸦的特征,理解了这个抽象概念,进而将这个抽象概念正确地表达出来。
同样,用大量小猪涂鸦训练的模型也能达到类似的效果。输入人类绘制的小猪涂鸦,也能得到一个新的、有着相近轮廓的小猪涂鸦:
可以看到,模型将第一行中八条腿的小猪涂鸦修正成了四条腿。而若是输入一张卡车涂鸦,模型则会遵从对“小猪”这个抽象概念的理解,输出一只长得像卡车的小猪!
一千个人会画出一千个不同的小猪涂鸦,比如下图绿框中的猪头和橙色框中的整猪。模型又是如何理解同一抽象概念的不同表达的呢?模型中,只有头的涂鸦各部位尺寸被一步步调整,再加上了身子,最终过度到一只完整的小猪。
科研人员还发现,模型的确对不同的涂鸦进行了类比。比如,将“身体”部分进行类比,为猫头涂鸦加上加上身子,或是将完整是小猪涂鸦中的身体去掉,剩下猪头涂鸦:
对于人类来说,涂鸦作为一种高度概括的抽象概念,在人们进行交流、表达情感的过程中起着很大的作用。让机器学会涂鸦的研究,其意义不仅在于探索机器如何对抽象概念进行理解。或许在不久的将来,这些模型将会协助艺术家进行创作,或是成为辅导人们学习绘画!
標籤
编程之夏,UR
创新
创意改善社会 公益温暖中国
促进智能能源利用
大学
谷歌翻译,即时相机翻译,Instant Camera Translation
谷歌十周年系列
谷歌艺术与文化
观妙中国,Shadow Art,智玩皮影
广告
广告安全
互联网,Internet
科技
女性开发者
社会
视频广告
数据中心
数字营销
搜索
网站管理员
文化研究所
艺术计划
音乐搜索
愚人节
增强型广告系列
智能隐形眼镜项目
中小企业
adexchange
Admob
admob sdk
Ads
Adsense
AdWords
android
android m
Android应用开发中国大学生挑战赛
App Inventor
Calendar
cardboard
CES
Chrome
Chrome Web Store
Chrome,Chrome实验
Chrome实验
CI
Code Jam
corporate
Creative
Cross-device
Cultural Institute
culture
Data Center
DevArt
Developer
display
diversity
Doodle
DoubleClick
G+
G2G,Culture
GA&C
gaming
Global Impact Awards
Gmail
Gogle科学挑战赛
Good to Know
Google Ads
Google AdWords
Google Analytics
Google Art Project
Google Arts & Culture
Google Code-in竞赛
Google Demo Day Asia
Google Docs
Google Doodle
Google Drive
Google Drive 云端硬盘
Google Fiber
Google Font
Google for Startups
Google Green
Google I/O
Google Image Search
Google Keep
Google partners
Google Play
Google Science Fair
Google Search
Google Top Contributor Summit
Google Translate
Google Trend
Google Trends
Google Zeitgeist 2012
Google安全系统
Google博士生奖研金
Google翻译
Google奖学金
Google杰出贡献者峰会
Google科学挑战赛
Google网站管理员
Google网站管理员,Webmaster
Google文化研究所
Google在线营销挑战赛
Google中国教育高峰会
IME 输入法
Innovation
Made with Code
maps
mobile ads
mobile ads sdk
Modoo
moonshot
native ads
Nexus
programmatic buying
Project X
Pwn20wn及Pwnium3 黑客大赛
Remarketing. Ads
Search
Security
smb
Solve for X
Street view
student
UR
VR
Web Platform Docs
web security
Webmaster
year in search 2014
YouTube
zeitgeist
博客归档
2024
11月
10月
8月
7月
6月
5月
4月
3月
2月
1月
2023
12月
11月
10月
9月
5月
4月
3月
2月
2022
11月
10月
5月
4月
2月
1月
2021
10月
9月
5月
4月
3月
2月
2020
12月
5月
4月
3月
2019
10月
8月
7月
6月
5月
4月
3月
2018
12月
10月
9月
8月
7月
6月
5月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2013
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2012
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2011
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2010
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2009
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2008
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2007
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2006
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
Feed