人工智能(AI)是一个包罗万象的术语,指的是人工智能的自然语言模型。人工智能可以解释人类语言、与人类对话、用自然语言执行任务或进行计算。
但是,如果你与当今最知名的人工智能助手(Alexa、Siri、谷歌Assistant)交谈,你会发现它们并不是真正意义上的对话。他们可以给你讲笑话,回答事实性的问题,甚至可以回答多个问题,而不需要一直重复一句叫醒的话,但交谈或闲聊在很大程度上仍然是人类的努力。
为了分享深度学习的进展,谷歌今天介绍了Meena,一个拥有26亿个参数的神经网络。Meena可以处理多回合对话,谷歌声称它比其他人工智能代理更好。它甚至讲了一个即兴的笑话。
谷歌今天还发布了敏感性和特异性平均值(SSA),这是谷歌研究人员创建的一个度量标准,用于测量会话代理在有意义且特定的会话中保持响应的能力。人类在SSA中的排名约为86%,而在最初的测试中,Meena的得分高达79%。潘多拉机器人(Pandora Bots)创造的人工智能代理三宿(Mitsuku)获得了过去四年的罗布纳奖(Loebner Prize),获得了56%的分数,而会说普通话的微软小冰(XiaoIce)获得了31%的分数。
这项工作在“向类人开放域聊天机器人发展”中有详细介绍,这是一篇周一发表在预印资源库arXiv上的论文。
Meena训练了400亿个单词,并使用了一个seq2seq模型和一个流行的Transformer架构的变体。谷歌在2017年第一次发布了Transformer,但是从那时起,该语言已经成长为周围表现最好的语言模型之一。
SSA使用一组固定的提示或交互性能来评估基于静态性能的对话,这允许自由流动的对话。每次评估的谈话都要求至少进行14轮,不超过28轮。然后根据特定或合理的转弯百分比得出结果。SSA使用通用的响应来惩罚响应。
谷歌公司在一篇博客文章中表示,他们可能会在未来几个月向研究人员提供Meena,但决定避免立即提供演示版本。
SSA标准的谷歌提议不同于其他人工智能助手为评估真正的人工智能会话而设置的度量标准。
今年是Alexa奖的第三个年头,它是一项挑战,要求学生开发团队开发出能够进行最多20分钟对话的人工智能。去年进入决赛的选手有10分钟的时间。最新一轮的决赛将于5月公布。你只需要简单地说一句“Alexa,让我们聊一聊”,就可以和去年的入围者交谈。
亚马逊已经开始增加其多回合对话服务。对话是一个功能,它将语音应用程序的建议打包到对话的多回合对话中。在去年夏天发布的时候,亚马逊设备副总裁David Limp称其为“语音科学的圣杯”。
微软于2018年收购了语义机器公司,并于去年开始向微软Bot框架的用户展示更多的多回合对话。
正如前Alexa奖得主、现任谷歌研究主管阿什温•拉姆(Ashwin Ram)在2017年所说,能够保持对话的人工智能助手或许能够加强与人类的联系,并为人类提供情感支持,或治愈孤独流行病。