如今语音交互虽然还不能像电影《Her》中的虚拟女主“萨曼莎”一样,能跟人自然交流,甚至理解人类复杂的情感需求,但以问答搜索、任务控制、娱乐消遣为主要功能的各类语音交互类产品,已经涌现在我们的工作、家居、车载等环境中。
近几年,语音交互类产品开始火热起来,BAT、小米、联想等巨头纷纷入局,都发布了语音音箱类产品,想要在这波风口中占据一席之地。而语音音箱的走红,不只是一次远场语音交互技术的突破,它成为了一个真实的市场需求,使用了可简单操作的语音交互功能,取代的可能是闹钟、定时器、遥控器等这些零碎的家居生活用品。
可以预见,随着电视、冰箱、汽车和机器人等进入智能时代,也将依托语音音箱中的核心技术架构。成立于2001年的康华尔电子,就是远场语音交互晶振的代表企业之一,也是上述厂商们语音交互产品的贴片晶振产品供应商。语音音箱的走红离不开前期Siri等虚拟助手的技术积累,但这些虚拟助手大多成为调戏娱乐的对象,在实际应用场景落地中总是差把火。
2014年,亚马逊Echo把近场语音交互拓展到了远场语音交互,放大了其对搜索、任务控制、购物的功能应用,价格又不高,获得了上千万的销售量,成功打开市场。可以说Echo是一款标志性的产品,意味着语音交互在场景化产品落地上拉开了新的帷幕。这也给了国内厂商很大信心,纷纷跃跃欲试,想要抓住下一个潮流趋势和投资风口。
这其中一定离不开贴片晶振的使用,智能音箱所使用的语音音频需要2520晶振,3225晶振等12M/26M/32M频率的支持.ECHO拥有的语音交互性主要依靠蓝牙的TWS技术,任意两台可独立操作的音箱组对后可以实现双立体声模式.而随之带来的虚拟环绕效果,就是通过内部使用的小型化的超轻薄,高精度,低噪音的有源晶振来实现的.
跟Echo类似的语音音箱,会更符合人类自然交流的习惯,也标志着AI的兴起,开始从‘以机器为中心’转向‘以人类为中心’。语音交互不再是和设备‘交头接耳’、‘窃窃私语’的交互状态,也不再是按键和触控交互方式的辅助或者补充。远场语音交互把人机交互的距离扩展到了5米,这也意味着要在语音识别前端和后端处理技术提出了更高的要求,对于石英晶振的要求各选择也更高。
比如前端使用的麦克风列阵晶振,需要通过声源定位以及自适应波束形成做语音增强,完成远场拾音,解决噪声、混响、回声等带来的影响,然后通过后台的识别引擎,也就是各种复杂的软硬件的组合,实现语音转换、语义理解等。
这也是康华尔电子积累的技术优势,从靠贴片晶振对于语音拾取和语音识别信号的识别和获取,开始扩展到完整的语音交互解决方案。其中声音信号传播、麦克风阵列晶振、语音唤醒和语音识别、压控晶振的收集和信息反馈等多方面融合的晶振产业技在术业内受到认可。