串口与电控通讯的纯离线语音方案¶
新用户建议先查看 ☞新手指南,了解开发的基础知识,再查看该文档。
1 概述¶
离线语音在各类产品上的使用越来越多,这为原有的非智能产品增加了能听会说的“耳朵”和“嘴巴”,提升了用户体验。应用中最常见的增加离线语音识别的方式为:采用串口通讯的方式,将语音芯片的串口与用户电控板的MCU的串口进行通讯,该方法的优点如下:
- 快速开发和验证:只需要在原有产品上增加麦克风孔和语音硬件部分,产品不用重新进行完整的软硬件设计,可以快速进行开发和验证;
- 应用灵活:该方法可以灵活应用在多个产品上,不同的产品只需要修改串口协议和语音命令词即可。
我司为该类应用专门准备了标准模块,用户产品直接选用后可以为产品的快速出货提供保障。
2 方案优势¶
我司目前已经迭代了多代芯片,在离线语音领域有很强的优势,我司的语音方案部分特点如下:
- 识别响应快:一般在0.2~0.8s内完成;
- 高识别率:识别率 > 95%;
- 高可靠性:芯片方案已通过双85,EMC测试等,可以满足格力、美的等家电巨头的高质量要求;
- 资料成熟:具有完整的软件、硬件、结构设计方案资料,可以为用户节省开发周期,降低开发难度;
- 便捷定制:可以采用我司语音AI平台进行便捷开发,可快速灵活定制唤醒词和命令词,不需用户提供语料;
- 超远识别:安静情况10米仍可良好识别。
目前我司的语音方案已广泛在各种领域中得到量产应用,如风扇、晾衣杆、取暖桌、茶吧机、照明等。
如需了解更多我司芯片方案的信息,欢迎通过以下方式和我司联系。
商务电话:028-61375925 或 18161228763
3 方案介绍¶
如果您是首次接触语音方案,建议先看产品设计完整流程 ☞产品方案开发流程。
本部分内容重点介绍方案设计中的框图,模块及结构的注意事项。
3.1 方案框图¶
该方案的设计框图如下(以晾衣杆为例说明),语音模块与电控模块需要4根线的串口连接,语音模块根据产品电控的状态进行语音播放,产品的本身控制仍由电控模块完成。
语音模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音模块主动播放,同时将信息发电控模块;另一种为语音模块被动播放,其分别描述如下:
3.2 串口通讯方式¶
语音模块主动播放
主动播放方式主要执行以下动作:
- 识别到词条;
- 主动播放反馈声音;
- 将此条信息串口告知电控模块;
- 电控模块执行动作。
优点:控制方式简单,由语音模块单向输出信息给电控模块。
缺点:无法根据产品目前情况及电控板控制的按键情况进行语音反馈。
语音模块被动播放
被动播放方式主要执行以下动作:
- 语音模块识别到词条;
- 将词条信息串口告知电控模块;
- 电控模块执行相关动作;
- 告知语音模块需要播放的内容;
- 语音模块根据电控模块反馈进行播放。
优点:语音模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;电控模块通过按键或者遥控进行控制,语音模块也可以进行状态播放。
缺点:电控的MCU芯片需要少量的代码开发工作,开发周期略长于主动播放方式。
3.3 硬件选型¶
针对该方案,我司有多款标准模块可以支持,用户可以点击 ☞硬件选型指南 查看并选择合适的模块。此处列举一些可用于串口通讯的模块,如下:
3.3.1 CI110X系列芯片模块¶
该类模块有CI-B02GS04S、CI-B02GS06J等,如下图所示:
该类模块应用中要注意以下注意事项:
- 语音模块板如果由电控板供电时,注意电控板给语音模块的供电能力需要大于500mA;
- 使用CI-B02GS04S时注意,请务必在底板预留UART0及PGEN的触点或接插口,以便后续的在线升级;
- 注意串口的电平要匹配,CI-B02GS06J支持5V电平,CI-B02GS04S仅支持3.3V,电控为5V电平时,CI-B02GS04S需要增加电平转换电路,如下图所示。
3.3.2 CI112X系列芯片模块¶
该类模块有CI-C22GS02S、CI-C22GS02J等,如下图所示:
该类模块应用中要注意以下注意事项:
- 语音模块板如果由电控板供电时,注意电控板给语音模块的供电能力需要大于500mA;
- 使用CI-C22GS02S时注意,请务必在底板预留UART0及PGEN的触点或接插口,以便后续的在线升级;
- 注意串口的电平要匹配,CI-C22GS02J支持5V电平,CI-C22GS02S支持3.3V,电控为5V电平时,CI-C22GS02S需要增加电平转换电路,如下图所示。
3.3.3 CI13XX系列芯片模块¶
该类模块有CI-D02GS02S、CI-D02GS01J等,如下图所示:
注意事项:
- 语音模块板如果由电控板供电时,注意电控板给语音模块的供电能力需要大于500mA;
- CI-D02GS02S串口的电平支持3.3V和5V,通过软件可配,注意使用5V时,底板需要增加一个上拉电阻,同时软件需要开启宏定义:UART_PAD_OPENDRAIN_MODE_EN;
- CI-D02GS02S使用时注意务必在底板预留UART0及PGEN的触点或接插口,以便后续的在线升级;
- CI-B02GS06J在PCB板上已经有上拉电阻,默认只支持5V电平。
3.4 SDK包说明和模块串口通讯协议¶
我司为用户提供了本方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。
模块的串口通讯建议使用我司标准协议,具体格式请参考 ☞串口协议 。
注意:
- 不同的领域,建议选用不同的声学模型,详情可以在制作模型时的列表中看到,如下:(注意相关模型的代码配置建议);
- 串口通讯的默认参数设置为:
- 波特率:9600
- 停止位:1
- 数据位:8
- 奇偶校验:无
- 代码中通过判断 “命令+语音ID”获取是什么指令和功能;
- 发送的串口信息建议要检查完整性。
4 产品结构¶
在离线语音方案中,产品的结构设计非常重要,麦克风和喇叭的位置会直接影响用户体验。本部分内容重点描述麦克风和喇叭的结构设计,以保证整机成品的识别效果。
4.1 麦克风结构设计注意事项¶
- 建议选择-32dB±3dB,信噪比大于70dB以上,性价比高的全向模拟麦克风;
- 若产品的震动比较大,选择较厚的麦克风胶套减缓震动,可减小对识别效果的影响;
- 某些应用场景,容易积水或积灰,这时需要选择防水防尘的麦克风(与麦克厂商沟通提供);
- 麦克风头为敏感器件,禁止直接点热溶胶;
- 将麦克风完全插入固定孔内部,避免歪斜,拾音孔中心孔对准麦克风的中心;
- 选择符合环保RoHS要求的RTV硅胶,推荐常用的硅胶有703/704/737等,或其它有机材料、单组分室温固化硅胶等;
- 多数硅橡胶灌胶厚度小于3mm以内实温完全固化时间为8 ~ 12小时,灌胶厚度 > 3mm以上完全固化时间更长,可分层多次浇灌,确保完全固化稳定密封;
- 生产工艺可把固定麦克风工序提前,另外特别注意麦克风接线在重力拉扯下,未完全固化前容易导致麦克风扯歪,也需注意将麦克风插线固定好。
4.2 喇叭结构设计注意事项¶
- 考虑到音质,喇叭功率不能太小,建议选用1W以上喇叭,带音腔的喇叭效果会更好一点,同时注意硬件板上的功放驱动能力要匹配喇叭型号;
- 喇叭放置位置以美观及结构布局方便为主,但注意尽量避免和麦克风放在同一位置;
- 不带音腔喇叭可以在结构上做一个音腔密封后能增大音量输出。
下图是一个喇叭规格及开孔的建议。
4.3 其它注意事项¶
以晾衣杆的结构设计为例时,针对麦克风应当注意以下事项:
- 麦克风布局尽量远离晾衣杆的噪声及电机;
- 麦克风放在晾衣杆的正面/底部的位置,避免遮挡,保证拾音最大范围;
- 分贝仪测试运行时,麦克风处的稳态噪声需小于60dB;
- 麦克风连线较长可选择带屏蔽的线;
- 麦克风线扎捆远离电机或电控线。
下图以升降式晾衣杆为例,讲述麦克风结构开孔及位置的建议方式,固定麦克风的结构件也需要考虑麦克风线方便引出导线和避免干扰。
5 相关参考资料列表¶
编号 | 参考资料描述 | 获取方式 |
---|---|---|
1 | 标准离线SDK CI110X_SDK_ASR_Offline |
请到 ☞启英泰伦语音AI平台 上获取 |
2 | 标准离线SDK CI112X_SDK_V1.4.1 |
请到 ☞启英泰伦语音AI平台 上获取 |
3 | 标准离线SDK CI130X_SDK_Offline_1.2.7 |
请到 ☞启英泰伦语音AI平台 上获取 |
4 | 我司芯片和模块的选型指南 | 请点击 ☞硬件选型指南 查看 |
5 | 我司芯片硬件设计方法参考 | 请点击 ☞硬件设计参考 查看 |
6 | 麦克风和喇叭器件选型 | 请点击 ☞外围器件兼容列表 查看 |
7 | 产品结构设计 | 请点击 ☞产品结构设计 查看 |
8 | 软件开发方法和标准SDK说明 | 请点击 ☞软件开发 查看各部分内容 |
8 | 产品识别性能测试方法 | 请点击 ☞识别效果测试 查看 |
10 | 生产测试的方法 | 请点击 ☞生产测试 查看 |
用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。