相比去年重点强调人工智能是谷歌最高战略,年GoogleI/O开发者大会上,谷歌展示的是人工智能的全面升级——越来越“像人”,越来越能够代替人。
5月8日早上,在谷歌园区的圆顶露天剧场里,谷歌CEO桑达尔.皮查伊(SundarPichai)以及各个产品线负责人相继登场,轮番介绍AI在产品里的应用进展。但最让人感到惊讶的,是皮查伊展示的谷歌助手(GoogleAssistant)打电话的两个使用场景。
1.给你打电话的是人还是机器?
“我这里有个女顾客要剪头发,我打电话来预定一下”,谷歌助手在电话里对理发店服务员说,“我想看看5月3日是不是有空档”。
皮查伊说,这是谷歌助手打电话给一个理发店的真实场景。不仅仅发音非常自然,而不是以往的机器发音,反应也非常接近人类,在理发店服务员说,让“它”稍后时,谷歌助手甚至给出“嗯哼”的口语回应。
更让人惊讶的是,对于一些复杂的对话,它应对自如,理发店问它希望在几点到店,它说需要12点附近,理发店回应说,最近的时间只有1:15PM的,它又询问,是否有早上10点到12点的。
在这些复杂的对话中,它表现出对于口语化对话的很好的理解,以及对语意的理解,甚至还能够理解和表达自己所服务用户的偏好——“早上10点到12点之间”。
如果说这个使用场景让许多人感到惊喜的话,皮查伊展示的下一个场景则让人觉得惊悚了——你也许会无法辨别和你对话的是真实的人类还是机器。
这是一个电话订餐的场景,从英文口音来听,像是亚洲餐馆。在美国的生活中,中餐馆等亚洲餐厅接线员英语并不是很好,对话会较为困难,谷歌展示的使用案例还原了生活中的场景,“这个电话对话可能要比预期难一点,你们听听”,皮查伊说。
“我想定一个位置,在下周三,是7号”,谷歌助手在电话里说。
“7个人吗”?餐厅的接线员问。
在电话一开始,接线员就显示出英文理解能力的不足——仅仅抓住了7这个数字,问对方是不是要定个7个人的桌子,谷歌回答说,“是4个人的”。
接线员又问,“4个人的话,哪一天,今晚还是明晚”——接线员忘了一秒钟之前的对话,谷歌再次答复她,是“下周三”。
在这场场景中,接线员表现出对于对话的混乱地理解,但谷歌一直表现优秀——能够理解无序的话对,“不被带偏”,记住并完成自己的核心任务。
“让人惊讶的是,助手能够理解对话里的细微末节”,皮查伊说,“我们在这个技术上研发了很多年,叫GoogleDuplex”。
皮查伊表示,公司多年来在自然语言理解,深度学习和语言转文字上投入巨大,而Duplex对这三大技术融会贯通。“Duplex还有很长的路要走,不是所有的电话都完美结束,但这项技术已经能够理解对话的上下文,每句话所表达的细微的意义差别。”皮查伊强调说,GoogleDuplex还在研发中,他们计划今年夏天把这个技术置入谷歌助手测试,到时候,用户就可以像Demo展示的那样,让谷歌助手去定个理发师剪或者是给餐厅打个电话。
2.AI和道德
作为本次大会的主讲人,皮查伊表示,今年有人来到现场,见证AI正在带来的巨大变革和机遇。Facebook事件当前,皮查伊也谈到了AI和社会责任的关系,他认为技术更核心的是正能量,但在隐私和道德等层面,也需要谨慎前行,而Google对此深怀责任感。
将AI投入到医疗领域,在谷歌看来是一种承担社会责任的表现。
皮查伊说,两年前,Google开发了一套神经网络,它能通过眼部医学造影来探测糖尿病视网膜病变。如今,谷歌的深度学习模型已经能够利用同样的造影图片,高度精确的预测一位病人未来心脏病和脑淤血的发病风险。
帮助残障人士,也是谷歌将AI投入使用的领域之一。
谷歌在大屏幕上展示了一个短片,从小失语的Finlayson一直以来都很难跟人交流,她的丈夫专门基于莫斯密码为她开发了一套交流系统——左右两个按钮能够向系统发出长和短的信号,而系统能够把这些信号翻译成语音,帮助她与外界交流。
谷歌的G-Board吸收这个点子,把摩丝密码融合到键盘中去,让残障人士和机器之间交流更为简单。
也就是说,相比语音输入、文字输入、摩斯密码成为了任何机器之间一种新的交流方式。
在大会上,Finlayson一家也来到了现场,就如她在短片中说的,因为这套系统,她能够表达自己,并且获得爱情和家庭。
3.尽可能地取代人的工作
在去年大会上,皮查伊强调,谷歌的策略正在从“移动为首位”变成“AI高于一切”,到了今年,AI真正成为了谷歌各项产品中“水电煤”基础设施,布局到Gmail邮箱、照片应用还有谷歌助手中去。
AI变成基础设施,意味着我们在使用一些应用功能时,意识不到这可能是AI在起作用,也意识不到是人工智能的算法有了进展;而这一切最终都指向一个目的——尽可能地取代人的劳动。
把AI使用在邮件写作中,能够实时向用户推荐“你可能会用到的短语”。比如根据邮件地址,能够在邮件正文自动为用户生成收件人称呼,而根据邮件名称,《今天吃墨西哥卷》,能够在正文书写疑问句“要不要一起”,自动为用户生成“吃墨西哥卷”。
用户要做的就是,一直敲空格键确认就可以了,这项名为“智能写作”的功能预计在5月底向全体用户上线。
而谷歌照片应用Photos,可以帮用户归类照片,这实际上是AI长期在攻克的一个技术方向——识别图片内容,这种应用越来越好用,实际上是算法进一步提升。
谷歌还在大会上推出了“SmartActions”功能,比如平时许多人对着文件拍一张照片,为的是把纸质文档存储下来,而现在通过这个功能,能够直接变成PDF扫描文件,让用户更方便阅读。
比如希望把一张黑白照片变成彩色,则需要机器能够精准地识别出图片中不同的图像,并给他们上合适的颜色。
这一切都是源于算法的进步。
4.AI介入新闻
当今日头条这样的信息流产品大行其道时,谷歌这样的美国互联网巨头也不愿意错过这一机会。
皮查伊表示,未来3年内将投资3亿美元与新闻媒体合作,致力于严肃新闻,以提高新闻质量。
在大会上,谷歌更新了他们的“GoogleNews”——用AI介入了人们阅读新闻方式。
如果用户读了一条朝鲜韩国领导人见面新闻,它会关联推送其他相关新闻,谷歌把这个关联阅读当作GoogleNews一个重要的特征。当然,这并不新奇,今日头条等应用上早已有了这样的功能。
GoogleNews的第二个特征是“度报道”,让用户了解整个新闻的来龙去脉。比如某地停电,在新闻前后有这件事本身、人们需要做什么,以前以后相关的相关事件。他们想让用户知道一件事,并在后台绘制出一张脉络图,让用户完整理解这件事——这基本等于机器自己搭建了一个专题。
第三个特征,是让用户订阅自己需要的媒体,目前GoogleNews已经进入个国家和地区,在Android和iOS上都能找到。
不过,从广告收入的角度来考虑,这个产品的商业前景让人怀疑。以在商业领域取得巨大成功的今日头条为例,单个信息(即一个视频、一条新闻或者一个帖子)消费时长都较短,比如视频控制在15秒内,文字信息也保持在较短范围内。单条信息消费时间较短,便能够夹带更多的信息流广告,广告库存高,这也是今日头条今年广告收入预计亿人民币的底气。但从谷歌来看,致力于严肃新闻和长篇报道,则不符合这一广告收入逻辑。
与此同时,GoogleNews是一个推送新闻产品,但谷歌在同一类产品中又推出了订阅功能。目前美国几大互联网公司中,苹果依靠手机产品推销自己的推送类新闻产品,,脸书也在年推出了自己的订阅新闻产品;而谷歌今天发布的产品则横跨了订阅和推送两种模式,即便加上AI助力,商业化的未来可能还需要时间来验证。