了解智能音箱方案更要了解智能音箱硬件

2018-06-20 11:04:41 广州佩特电子科技有限公司已读

智能音箱的构成主要包括三个部分：硬件、算法、内容。关于算法佩特科技已经介绍过，详情可点击链接查看：《智能音箱方案中的算法有哪些？》，下面来聊聊智能音箱的硬件，对众多智能音箱方案研发企业而言，方案是重要的，但是方案如何与硬件结合也是需要重视的部分。

硬件部分除芯片外，麦克风阵列是核心部件。

麦克风阵列是声音的物理入口，在物理世界对声音信号进行处理，得到需要的声音。麦克风阵列是传声器阵列是指由一定数量的声学传感器组成，对声场空间特性进行采样并处理的系统，麦克风阵列是传声器阵列中的一种，特指应用于语音处理的，按一定规则排列的多个麦克风系统。通俗地讲，就是由多个麦克风组成的录音系统。

1_副本2.jpg

麦克风阵列的关键技术包括噪声抑制、混响消除、回声抵消、声源测向、波束形成、阵列增益、模型匹配等等。

由于声音并非平稳信号，而主流的信号处理方法则是用于平稳信号处理的，声音信号只在短时间内具有平稳特性。因此麦克风阵列在模型方面有很大的局限，要解决这一问题，需要基础研究的突破。

麦克风阵列现在的发展趋势是小型化、低成本化和多人识别模式。

小型化：麦克风阵列的口径过大，结构布局会限制智能音箱外形设计的自由性，有些产品用较少个数的麦克风，原因正是因为要把外形做得小巧轻便，但麦克风数量的减少又会削弱语音交互的使用效果。缩小口径的技术有雷达领域的合成孔径方法，目前在军工领域发展得比较成熟，还没有移植到消费领域。

低成本化：要做到低成本化，需要重新设计整个结构，包括器件、芯片、算法和云端。如果加上实现各种功能的硬件成本，2个麦克风的阵列和6个麦克风的阵列在成本上没有多少区别。因此减少麦克风的数量并不能实现低成本化。

多人识别模式：现在的语音识别基本都是单人识别模式，要发展多人识别模式，还需要基础科学的研究来支撑。

总结来说，追求高性价比的产品使用单麦克风即可，单麦克风方案加上算法优化也可在一定程度上进行噪声抑制和回声抵消，在距离足够近时语音识别率尚可，并且成本比使用麦克风阵列要低很多。如果要在单麦克风的基础上对性能要求略有提升，可以选用2个麦克风的阵列，特点是人听机器发声时噪音更弱，但机器听人声时，和单个麦克风没有明显区别。并且双麦克风的声源定位能力很差，主要用于手机和耳机设备的降噪。用单独麦克风也可模拟出双麦克风的效果，即指向性麦克风，但需要机身前后两个开孔，比较麻烦。

更多数量的麦克风阵列用户体验更好，并且麦克风个数增加造成边际成本越来越低，因此今后多麦克风个数的阵列是大势所趋，用户体验是最关键的。

除麦克风阵列外，智能音箱作为音箱自然也要有扬声器，但市面上的智能音箱更像是语音交互机器人，反而在音乐播放的品质方面要求并不高。音箱的造型要小巧轻便，使用专业扬声器并不现实，所以智能音箱更偏向使用AV扬声器或重低音扬声器。

至于存储器、电池、蓝牙等部件或功能，与其他常见智能产品（比如智能手机）没有显著区别，技术基本是通用的。

www.gzpeite.net是广州佩特电子科技有限公司的研发技术展示网站，佩特科技是广州地区知名的嵌入式方案研发公司，主打产品为全志多系列嵌入式核心板/开发板，如A33核心板、A33开发板、A83T核心板、R16核心板、R58核心板、H8核心板等等。佩特科技不仅研发技术先进，批量出货能力强大，也提供嵌入式芯片方案定制，欢迎咨询洽谈。

了解智能音箱方案 更要了解智能音箱硬件

了解智能音箱方案更要了解智能音箱硬件