我们有大部分时间都浪费在日常通话中,打电话叫外卖、收快递、预约酒店……对于大忙人或者社交恐惧者来说,打电话可能是非常痛苦的一件事。当手机上的Siri只能帮你拨通电话时,你不禁要问,人工智能就这点本事?
在昨天的Google I/O大会上, CEO桑德尔·皮查伊(Sundar Pichai)终于带来拯救社交恐惧症的福音。他在现场演示中,展示了智能助手如何通过电话预约理发店和餐厅,能够流畅和自然交流的AI顿时技惊四座,成为此次大会的焦点。Google称其为Google Duplex,结合了自然语言处理、深度学习和文字语音转换的黑科技。
在演示中,AI的声音已经可以媲美人类,在电话的一端你绝不会听出这是蹩脚的机器语音。而这也是Google正在开发的领域,此次他们就为语音助手带来6种不同的自然语音,其中还包括歌手John Legend的声音。
图片来源:发布会直播截图
不过,更令人惊艳的是毫无破绽的人机对话。正如皮查伊在现场所说的那样,“智能助手能够真正理解对话中的细微差别”。例如在另一个订餐的演示中,尽管对方的英语有口音且不完整,AI仍然理解并完成了对话。在人机交互实现人机对话这一目标时,虽然Duplex的应用仍局限于预约场景,不能够进行一般的对话,但其自然程度已然是显著突破。
如何打造自然的人机对话?
在现实生活中,人类之间的交谈往往是复杂的,对于机器来说,理解自然场景中的对话非常困难。人们交谈时,经常会自我纠正和省略语句,而且有时候语速很快,甚至有着不同的口音。当进行电话交谈时,背景噪音和语音质量更是让语音识别的难度上升。此外,人类交谈中,不同的语境也有不同的意思。这些问题在Duplex上的解决,得益于循环神经网络(RNN)和谷歌机器学习平台TensorFlow Extended。
“for 4”在左图的语境中指4点,右图中指4人。 图片来源:Google AI Blog
自动语音识别(ASR)技术在Duplex中的应用:声音输入由ASR处理,通过上下文数据和其他输入分析生成文字,然后由TTS系统朗读。图片来源:Google AI Blog
为了让对话更自然,谷歌让AI在对话停顿期间发出“嗯哼”、“呃”之类的语气词。为了响应人们在说出“你好!”时对即时回复的期待,他们还设计了低延迟系统,以快速响应相关场景中的对话。另外,他们在测试中发现,当句子更复杂时,更多的延迟反而会让对话更自然。
贝克街的某人:我的语速一点也不快。图片来源:《神探夏洛克》
解决语音识别的问题后,谷歌通过“实时导师训练”来训练Duplex系统。在现实中,导师使用这一方法指导学生,他们会提供必要的指导,确保学生执行任务时达到了导师水准。当系统在新的领域进行电话训练时,“导师”会在必要时影响系统的行为,直到系统达到期望的水平,能够自动打电话,成为真正的智能助手。
图片来源:电影《星球大战》
目前Duplex的应用场景还不广泛,只能处理有限的问答。谷歌尚未公布Duplex详细的应用场景,而且它使用的声音也不是此次公布的6个虚拟语音之一。
机器能为你打call了,然后呢?
Duplex目前还处于测试阶段,虽然有着广泛的应用前景,但也会带来不少问题。
首先,智能助手在人机对话中的角色是什么?在谷歌的第一段演示中,AI打电话时称自己在为“客人”预约。谷歌还没有公开推出Duplex,但是人们已经开始担心,AI在电话中没有明确表达自己的身份会带来诸多困惑。对此,谷歌并未公开回应,不过他们告诉CNET,AI会告诉对方自己是数字个人助理。
图片来源:pixabay
其次,Duplex或许会成为电影《她》里的情感倾诉对象,或许会代替你和他人撕逼,也可能被人用来打推销电话。谷歌已经推出了基于机器学习的虚拟语音,生成了John Legend的专属声音。那么当Duplex和虚拟语音相结合的技术变得更加普遍时,是否会出现身份冒用的问题呢?
例如,有人可以用AI伪造自己的伴侣,但他早已将其杀害,却一直在和冒用身份的AI进行对话,制造两人仍然生活在一起的假象。谷歌必定会限制Duplex的应用场景,但这一技术难免会有被黑客利用的风险。
图片来源:电影《她》
正如《连线》杂志评论的那样,“对于谷歌来说,Duplex标志着自然语言、全自动机器对话的重大进步。对于我们来说,它介于极其方便和诡异的欺骗之间。”
这一届的谷歌开发者大会还公布了Gmail智能邮件回复、能够复制照片中文字的Google Lens、AI为你整理新闻的Google News、Android P和自动驾驶技术等。围绕着“人工智能”这一主题,谷歌想要全面渗透你的生活,让技术隐藏于生活背后。
从Duplex来看,它渗透你生活的方式,首先会是客服。这也是谷歌在商业领域的愿景,他们“希望给商家和客户带来更好的用户体验”。但是对于普通人来说,拯救社恐难道不是更重要的吗?
作者:EON
编辑:Ent
参考来源:
Wired, How Google's Eerie Robot Phone Calls Hint At Ai's Future
Google AI Blog,Google Duplex: An AI System for Accomplishing Real World Tasks Over the Phone
一个AI
定个餐也要我们出马,你们能干个啥!
本文来自果壳网,谢绝转载
如有需要请联系sns@guokr.com
(欢迎转发到朋友圈~)
ID:Guokr42
整天不知道在科普啥的果壳网
建议你关注一下
对,这是一个二维码
给果壳发送【二维码】告诉你原理
点个赞再走~~
1、头条易读遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2、本文内容来自“果壳网”微信公众号,文章版权归果壳网公众号所有。