继“跳一跳”和“弹球王者”刷屏之后,一款名为“猜画小歌”的小程序,最近又成为了朋友圈当之无愧的C位选手。
游戏设定很简单:启动游戏,界面会显示“洗衣机”、“云朵”、“房子”等一个个词汇,玩家需在规定时间内手绘出对应图案,如果你的手绘图案被AI识别,即为成功,然后再进入下一个词汇……总体风格较为类似“你画我猜”,只是猜词的队友由人类玩家变成了AI——“小歌”。
不少网友在玩过之后都表示,和人类“猪队友”相比,“小歌”的猜画速度不可谓不神速。很多时候,玩家只是刚一提笔,“小歌”就迅速报出答案,比如画一个挂着“迷之微笑”的脸,“小歌”就能猜出是蒙娜丽莎……
▲红星新闻记者尝试的手绘图,其中个别还未完成就已被识别
据国外科技媒体介绍,“猜画小歌”小程序已不是谷歌第一次发布类似的应用。去年11月,一款与之类似的在线游戏“快速涂鸦”,就已占据国外很多的社交媒体。
实际上,它远远不只是一款游戏那么简单——
谷歌称,这款应用真正的初衷是利用全球玩家们成千上万的草图,让AI学习人类如何绘画。也就是说,在大家玩得不亦乐乎时,谷歌AI其实正默默地观测着人类的运笔方式,乃至构图思路,并且不断更新着储备和识别能力……
听起来,是不是有点诡异?
5000万手绘草稿成核心数据
仍在深度学习你的手绘
据悉,“猜画小歌”由来自Google AI的神经网络驱动,该网络囊括了超过5000万幅手绘素描的数据库。Google 产品经理克里斯(Chris Tam)在个人博客中称,这款游戏旨在让人们体会“人工智能的交互功能目前已经到了多么强大的阶段”。
▲包含超过5000万草图的数据库 图自“快速涂鸦”
可想而知,对于主打深度学习的“猜画小歌”,“数据”的样本可谓是它的大脑,有了数据库的支持,小歌才能识别出绘画水平多数比较“困难”的玩家在20秒时间内创造出的“灵魂画作”。
那么,数据库中5000多万幅作品,也就是支撑小歌智慧的“数据”,都来自哪里?
据悉,“猜画小歌”并非谷歌上线的第一款类似应用。在去年,谷歌就曾推出网页版的“快速涂鸦”(Quik, draw!)小游戏,其操作方式与“猜画小歌”类似,只是绘图方式是拖拽鼠标进行。
▲外国网友手绘的熊被成功识别 图自网络
虽然与手指直接绘图相比,鼠标的灵活性差了不少,但是,这款粗糙的“快速涂鸦”为“猜画小歌”提供了上千万的手绘素描数据,玩家在玩游戏的同时也协助训练了它的神经网络,让它能更好地识别后来玩家的画作。
截至2018年5月,“快速涂鸦”收集到的样本已超过5000万个。目前,谷歌在网络上已经开放了这些数据库,将每个词汇对应的简笔画进行了归纳,每个词汇下面的样本都有十多万个。
红星新闻记者登陆数据库看到,所有的简笔画都已按门类显示,例如点击“闹钟”图标,就会出现此前世界各地的玩家绘制的超过11.39万种各式各样的闹钟,基本能够囊括人类日常生活中所见到的各种闹钟形态。当红星新闻记者将鼠标移到每个图标之上,它甚至还会以动画方式再现这个图标被绘画出来的轨迹。
▲闹钟板块下有超过11.39万数据 图自“快速涂鸦”
正是有了如此强大的数据库,“猜画小歌”才能在短短的数秒间识别出中国玩家画出的、就连玩家自己都觉得不像的“蒙娜丽莎”、“野兽迁徙”等高级词汇——毕竟,世界那么大,总有人画得比你还差。
数据库揭秘各地人思维差异
欧美人和东亚人画圆方式不同
除了对神经网络的强化和深度学习能力的延展之外,科学家们在“快速涂鸦”的数据库中,还挖掘到更多与发展心理学相关的课题,这种前所未有的大数据,也以另一种角度展示了各国人在思维上的异同。
例如,当你拿起笔画出一个圆,通过你绘制的轨迹,多半就能推断出你来自世界上的哪一个地区。
这又是为什么呢?
据科技媒体quartz报道,根据谷歌数据库收集到的11.9万个来自148个国家和地区的网友绘制的圆形,科学家发现这里面大有乾坤。
其中,美国人更喜欢逆时针画圆,在近5万个美国人所绘制的圆形中,有85%都是逆时针画出,英国、澳大利亚人的逆时针比例基本与美国相同,越南和菲律宾的比例更高,超过90%以上。而在800多个参与的日本人中,80%的人都是顺时针画圆。
▲各国网友画圆的轨迹显示,不同地区的人的思维方式不同 图自Quartz
科学家分析,最可能导致这种差异的原因是各国语言和书写文字的顺序与方式,例如美国、西欧和拉美地区在书写方式和画圆方式上都表现出惊人的相似,而亚洲地区的网友则表现出了明显的不同,这一现象在圆形、三角形等形状的描摹中都有非常类似的显示。
艺术家利用数据库打造拍立得
可对实物拍照变成手绘图
而围绕着谷歌的数据库,一些艺术家还想出了更加脑洞大开的利用方式。
本来,数据库中的漫画是玩家对于现实物品的抽象描绘,但是,澳洲墨尔本一位名叫Dan Macnish的工程师兼视觉艺术家却反其道而行,打造出了一款拍立得产品,对准现实中的物品拍照,即可获得漫画涂鸦式的成像。
据科技杂志Verge报道,这款拍立得产品搭载以谷歌数据库为核心的AI系统,对准物品进行拍摄后,数据库即会对实物进行识别,并“翻译”成涂鸦作品,最后显示在热感应纸上。
▲漫画版拍立得照片 图自艺术家个人博客
Macnish 介绍,最初,他在电脑上建立了一个图象辨识系统进行测试,并利用 谷歌的训练软体来提高 AI 对物品的辨识精度与准确度,将预先拍好的影像传入电脑中进行测试,同时研究“快速涂鸦”上的数据库,将数据中可用的类别与影像辨识中可识别的类别比对,再通过编程将两者拼凑在一起。
“其实,这并不难,你也可以自己尝试一下。”Macnish在自己的博客中写道。