三十年来,这是语音识别:您将与您的计算机通话,通常使用头戴式麦克风和Micros of tW indows中未公开的语音识别应用程序,或来自Nuance Communications的龙自然讲话版本。 如果你仔细阐述,文字将出现在屏幕上,或命令将被执行。
今天,改进得多的语音识别正在被广泛部署,在过去的两年里,它催生了一个新的消费产品家族:语音控制的个人助理。 语音实验室(Voice Labs)的联合创始人亚当?马奇克(Adam Marchick)表示:“这是一个为期30年的一夜成功。 “它终于精确到可以进行对话。
就像技术中的大多数东西一样,语音识别的进展可以量化。 在2017年8月,微软宣布,在行业标准测试中,其会话语音识别系统的单词识别精度超过了专业的人类誊写器的识别精度。 此类测试的专业人员的平均单词错误率为5.9%。 微软系统实现了5.1%。
“就像梦想成真,”薛东说。 D.“黄,一个微软的技术研究员和公司的演讲和语言集团的负责人。 “当1993年我们在微软开始演讲时,错误率约为80%。 1982年,当我[在研究生院]开始研究演讲时,我们正在处理孤立的单词,我无法想象[该软件能够识别]会话演讲像一个人一样好。
“今天,如果你在一个安静的办公室里用普通的口音说话,你将接近100%的语音识别准确率,”Nuance的CTOVlad Sejnoha说。
这种精确程度意味着人们将更多地与手机交谈,更轻松、更有效地在客户服务电话上与机器人聊天,并使用语音命令使事情发生在他们的家里和办公室。