狼堡阁 狼堡阁

远场语音是什么鬼?和人工智能有什么关系?

语音交互被视为用户在未来很多场景下的主要流量入口之一,因此,寻求可靠有效的远场语音技术突破变成了当下的需求;一个经典的语音识别系统包含麦克风信号采集模块、信号处理模块以及语音识别模块,每个模块的处理方法都会影响最终的识别效果。

智能远场语音是融合了AI语音搜索的一项改变用户体验的功能,用过蓝牙语音遥控器的玩家都知道,当我们要发出语音指令需要按下遥控器的语音按键,对着遥控器说出指令,才能让智能电视或者智能盒子做出反应,而智能远场语音功能则是省略了按下遥控语音键这一程序,你只需要坐在沙发上说出指令,即可得到反馈。

远场语音识别主要面临着回声干扰、室内混响、多信号源干扰以及非平稳噪声的干扰等;针对回声干扰问题,需采取回声消除技术,将设备自身播放的声音从麦克风接收到的信号中除去。

房间混响是远场语音识别特有的问题。房间混响会造成麦克风接收到的信号有很长的拖尾,让人听起来感觉发闷。在实际中,人耳具有自动解混响的能力,在实际房间中相互交流并没有影响反而觉得声音饱满。

相对于近场语音识别来说,远场识别所面临的挑战主要是由复杂的信号传播环境引起的。因此,对于语音信号研究者来说,非常基础且重要的工作是对声音传播环境进行精准的建模。

这个模型不光有助于我们认识信号衰减特性,能够设计出具有针对性的语音信号增强算法。而且,还可以借助这个模型,快速生成大量的远场语音数据用于识别端的声学模型训练,有助于解决远场语音数据难采集难的问题。

远场语音识别需要前后端结合去完成,一方面在前端使用麦克风阵列硬件,通过声源定位及自适应波束形成做语音增强,在前端完成远场拾音,并解决噪声、混响、回声等带来的影响。结合人工智能算法,也就是后台识别引擎,通过软硬件的复杂结合,让远场语音实现自然人机交互,让用户远距离即可实现与智能电视或者智能盒子进行“对话”。

创维推出的这款电视,通过百度智能音箱连接实现远场语音操作,它还采用4K,HDR对比度提升技术,画面清晰可见,是一款值得入手的语音电视。

创维电视55E33A

创维电视55E33A

¥

去购买

热卖爆款
全面了解 创维电视55E33A
  • 创维电视55E33A
  • 没有更多啦