微软研究人员表示,他们已经创造了一种语音识别系统,可以像普通人一样理解人类的对话。
在本周发表的一篇论文中,微软人工智能和研究小组表示,其语音识别系统已经达到了“人类水平”,比人类专业转录员犯的错误更少。
+更多关于网络世界足球竞猜app软件:联邦政府希望为未来的人工智能发展奠定基础+
“对于Switchboard部分的数据,专业转录员的错误率为5.9%,其中新认识的一对人讨论指定的话题,而对于CallHome部分,朋友和家人进行开放式谈话,错误率为11.3%。在这两种情况下,我们的自动化系统都建立了一种新的艺术水平,并超越了人类的基准。这标志着第一次有报道称人类在对话性语言中具有同等地位。纸.交换机是用于语音识别测试的标准会话语音和文本集。
5.9%的错误率与被要求抄录同一段对话的人的错误率大致相当,而且与行业标准的“交换台语音识别任务”微软相比,这是有史以来的最低记录在其网站上写道.
这一里程碑是在数十年的语音识别研究之后出现的,从20世纪70年代初开始美国国防部高级研究计划局,微软写道。随着时间的推移,大多数主要的技术公司和许多研究机构都开发了语音识别技术,包括BBN,谷歌,微软,惠普和IBM。
+更多关于网络世界足球竞猜app软件:我怎么知道你在撒谎?我的《星球大战》算法告诉我的+
微软表示:“这一里程碑将对消费者和商业产品产生广泛影响,语音识别将大大增强这些产品。这包括Xbox等消费者娱乐设备,即时语音文本转录等辅助工具,以及Cortana等个人数字助理。”
微软首席研究员杰弗里·茨威格表示,研究人员正在研究如何确保语音识别在更真实的环境中也能很好地工作。“这包括有很多背景噪音的地方,比如在派对上或在高速公路上开车时。他们还将专注于寻找更好的方法,帮助这项技术在多人说话时为单个说话者命名,并确保它能很好地适应各种不同的声音,无论年龄、口音或能力如何。”
从长远来看,研究人员将专注于研究如何让计算机不仅能转录人类口腔发出的声音信号,还能理解他们所说的话。这将使该技术能够回答问题或根据被告知的内容采取行动。”微软表示。
看看其他热门故事:
空军配备了太空望远镜,可以看到太空物体,这是以前没有的地基系统