当前位置:首页 > 汽车 > 正文

谷歌语音识别能力将超过人类,方法是借助神经网络

汽车来源:点击:

编者按:正在本月19日,百度首席科学家吴恩达颁布发表,百度Deep Speech语音识别手艺取得严沉冲破,曾经了苹果和谷歌。不外,彭博社撰文指出,谷歌的语音识别手艺将要超越人类,方式是借帮神经收集。那么该若何实现呢?请看下文的解读,本文由新浪科技

但研究人员暗示,语音识别和人工智能范畴比来取得的冲破,很快就能大幅提拔这些电子产物的理解力,使之更好地取我们展开沟通。谷歌工程师约翰·沙尔克维克(Johan Schalkwyk)暗示,这种全新的设备不只能听懂我们的意义,还能连系上下文和腔调的细微不同理解深层寄义。

比来正在语音识别和机械范畴的各类发现,将给语音识别带来庞大变化。Siri的一位次要发现人暗示,工程师都正在狂热地开辟语音识别手艺,使之具备脚够的智能,取用户展开实正的对话。“语音识此外所有范畴都曾经实现了很大前进。”Siri底层手艺开辟公司SRI International副总裁威廉·马克(William Mark)说,“这种对话互动目前曾经成为前沿手艺。”

蒂姆·图塔尔(Tim Tuttle)期待这一天曾经好久了。他1997年获得了麻省理工学院的博士学位,并任职于该校的人工智能尝试室。10年来,他先后正在硅谷多家公司任职,最终究2010年开办了本人的Except Labs公司。图塔尔的公司客岁起头设想一套系统,向挪动使用中添加复杂的语音指令。例如,当用户走进超市时,能够通过这项功能获知他要买的扫帚位于哪条走廊。

“一年前,我们正在做基准,我们其时认为这不成能实现。但一切都变了。我们的公司曾经对语音加倍下注,次要是由于近期所看到的各类手艺前进。”图塔尔说,“取人类程度相当或高于人类程度的语音识别系统将实现贸易化。”

但起首,仍是先来回首一下汗青:两年半以前,谷歌和大学的研究人员颁发了一篇颇有影响力的论文,内容是用“深度神经收集”来指点计较机语音手艺。几个月后,微软取IBM也合做颁发了别的一篇论文,被谷歌工程师杰夫·迪恩(Jeff Dean)称做“语音研究范畴20年来的最大前进”。

这些研究使得一项数十年前降生的数字神经收集发现再度新生。这项手艺1980年代就正在大数据预测和阐发范畴实现了不俗的表示,但其时却遭到计较机速度的。神经收集曲到比来才变成可行的方案,此次要得益于计较机处置速度的加速,以及新型软件模式的成长。

谷歌尝试室也开展了雷同的研究。6个月前,该团队从这种名为“前馈神经收集”的陈旧方式入手,鞭策了神经收集手艺的新生。这项手艺使得系统能够储存更多消息,并处置更长、更复杂的序列。谷歌这项冲破源自对底层代码的简化,能够正在统一套系统中保留更多概念和不雅念,从而让用户更容易问出复杂的问题,获得成心义的谜底。“系统复杂性可能对持久成长形成。”沙尔克维克说。

谷歌的系统目前利用上下文、物理和其他要素进行假设,以此判断语音的实正寄义——整个过程取人类大脑的思维模式相仿。谷歌的最新收集手艺能够提拔这一过程的效率,从而处置比以往更大的数据量,回覆更复杂的问题。

为领会释语音识别手艺正在将来的工做体例,沙尔克维克提到了谷歌山景城总部几公里之外的一间高级越南餐厅。这家名为Xanh Restaurant的餐厅对典型的语音识别形成了挑和,由于Xanh这个名字(发音为“扎恩”)很难识别。“若是我能找到它正在地图上的,然后说,‘这是一家餐馆,它位于。’那么范畴就会立即缩小。”沙尔克维克说,“借帮语义手艺,我们便可大幅改善质量。”

这听起来似乎很简单,但对电脑来说,听到一个单词,然后把它放到句子上下文中去辨识,再取地舆消息相连系,是好不容易并且花费时间的。现在,谷歌语音曾经能够准确识别餐馆。沙尔克维克暗示,谷歌此后将能够处置其他一些同样野心勃勃的问题。

沙尔克维克暗示,正在谷歌内部,语音识别手艺曾经实现了空前的前进。虽然谷歌的严沉前进还要再等一两年才能使用到用户的手机中,但这个项目曾经催生了良多能够使用于谷歌其他项目标手艺。“开辟登月项目标同时,还会同时设想出别的一百项有用的手艺。”沙尔克维克说。