人工智能将非语言人群的沟通鸿沟减少了一半

来自剑桥大学和邓迪大学的团队开发了一种新的情境感知方法,该方法可以消除用户键入以进行交流的50%到96%的击键次数,从而缩小了交流差距。

该系统专门针对非语言人群,并使用一系列上下文线索(例如用户的位置,一天中的时间或用户的讲话伙伴的身份)来帮助建议与用户最相关的句子。

非言语运动障碍人士经常使用带有语音输出功能的计算机与他人交流。但是,即使没有影响打字过程的肢体残疾,这些交流辅助工具仍然太慢且容易出错,无法进行有意义的对话:典型的打字速度在每分钟5到20个单词之间,而典型的说话速度在100范围内每分钟140个单词。

该研究的主要作者,剑桥大学工程系的珀·奥拉·克里斯滕森教授说:“通信速率的差异被称为通信差距。”“这种差距通常在每分钟80到135个词之间,并且影响了依靠计算机进行交流的人们的日常交互质量。”

克里斯滕森教授及其同事开发的方法使用人工智能,使用户可以快速检索他们过去键入的句子。先前的研究表明,依赖语音合成的人们,就像其他所有人一样,倾向于在日常对话中重用许多相同的短语和句子。但是,对于现有语音合成技术的用户而言,检索这些短语和句子是一个耗时的过程,从而进一步减慢了对话流程。

在新系统中,随着人员的键入,系统会使用信息检索算法根据键入的文本和人员所参与的会话的上下文自动检索最相关的先前句子。上下文包括有关会话的信息,例如位置,一天中的时间以及自动识别对方的脸部。使用经过训练可从前置摄像头识别人脸的计算机视觉算法来识别其他说话者。

(0)
上一篇 2022年3月27日
下一篇 2022年3月27日

相关推荐