串口与电控通讯的纯离线语音+蓝牙方案¶
新用户建议先查看 ☞新手指南,了解开发的基础知识,再查看该文档。
1 概述¶
离线语音在各类产品上的使用越来越多,这为原有的非智能产品增加了能听会说的“耳朵”和“嘴巴”,提升了用户体验。针对市场上的具备蓝牙控制和音乐播放的产品,我司在其基础上增加了离线语音控制功能,推出了一套硬件方案。该方案采用语音芯片的串口和电控进行串口通讯,其优点如下:
- 快速开发和验证:只需要在原有产品上增加麦克风孔和语音硬件部分,产品不用重新进行完整的软硬件设计,可以快速进行开发和验证;
- 应用灵活:该方法可以灵活应用在多个产品上,不同的产品只需要修改串口协议和语音命令词即可。
我司为该类应用专门准备了标准模块,该模块已集成了蓝牙芯片,用户可以避免自己对接蓝牙,不用考虑蓝牙的开发和可能遇到的各种问题,用户产品直接选用后可以为产品的快速出货提供保障。
2 方案优势¶
我司目前已经迭代了多代芯片,在离线语音领域有很强的优势,我司的语音方案部分特点如下:
- 识别响应快:一般在0.2~0.8s内完成;
- 高识别率:识别率 > 95%;
- 高可靠性:芯片方案已通过双85,EMC测试等,可以满足格力、美的等家电巨头的高质量要求;
- 资料成熟:具有完整的软件、硬件、结构设计方案资料,可以为用户节省开发周期,降低开发难度;
- 便捷定制:可以采用我司语音AI平台进行便捷开发,可快速灵活定制唤醒词和命令词,不需用户提供语料;
- 播放打断:在播放蓝牙音乐时,可以随时进行唤醒打断(支持AEC功能)。
该方案蓝牙部分功能特点如下:
- 音乐播放:支持播放手机、平板、电脑或者其它具备蓝牙媒体功能的设备传输的蓝牙音乐;
- 通话功能:支持通过蓝牙语音拨打电话;
- 小程序控制:支持手机通过微信小程序或者APP对产品进行蓝牙无线控制。
目前该方案已广泛在各种领域中得到量产应用,如风扇,取暖桌,茶吧机,照明等。
如需了解更多我司芯片方案的信息,欢迎通过以下方式和我司联系。
商务电话:028-61375925 或 18161228763
3 方案介绍¶
如果您是首次接触语音方案,建议先看产品设计完整流程 ☞产品方案开发流程。
本部分内容重点介绍方案设计中的框图,模块及结构的注意事项。
3.1 方案框图¶
该方案的应用框图如下:
上图中一些注意事项说明如下:
- 离线控制:语音蓝牙模块与电控模块需要4根线的串口连接,语音模块根据产品电控的状态进行语音播放,产品的本身控制仍由电控模块完成;
- 蓝牙播放及通话:由语音芯片与蓝牙芯片通讯完成;
- 手机控制:由手机APP或者微信小程序通过语音蓝牙模块将信息发给电控,由电控进行设备的控制。
语音模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音模块主动播放,同时将信息发电控模块;另一种为语音模块被动播放,其分别描述如下:
3.2 串口通讯方式¶
语音模块主动播放
主动播放方式主要执行以下动作:
- 识别到词条;
- 主动播放反馈声音;
- 将此条信息串口告知电控模块;
- 电控模块执行动作。
优点:控制方式简单,由语音模块单向输出信息给电控模块。
缺点:无法根据产品目前情况及电控板控制的按键情况进行语音反馈。
语音模块被动播放
被动播放方式主要执行以下动作:
- 语音模块识别到词条;
- 将词条信息串口告知电控模块;
- 电控模块执行相关动作;
- 告知语音模块需要播放的内容;
- 语音模块根据电控模块反馈进行播放。
优点:语音模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;电控模块通过按键或者遥控进行控制,语音模块也可以进行状态播放。
缺点:电控的MCU芯片需要少量的代码开发工作,开发周期略长于主动播放方式。
3.3 硬件选型¶
针对该方案,我司有多款标准模块可以支持,用户可以点击 ☞硬件选型指南 查看并选择合适的模块,注意支持该功能的标准模块的主芯片为CI110X系列芯片和CI13XX系列芯片。此处列举一些可用于此方案的模块,如下:
从快速开发角度考虑,推荐用户直接使用我司的以下标准带端子模块,三个模块的外围应用完全兼容,功能区别如下:
- CI-B02GS04J-BT2:支持蓝牙音乐功能;上下曲切换、暂停播放、继续播放等;
- CI-B02GS10J-BT:支持蓝牙音乐,小程序控制;
- CI-B02GS15J-BT:支持蓝牙音乐,小程序控制,蓝牙通话(电话接听及挂断,电话呼叫及保存号码)。
该类模块应用中要注意以下注意事项::
- 蓝牙播放耗电较大,该标准模块的输入供电能力至少需要大于1000mA,选用的喇叭较大时,还需要适当的增大供电电流;
- 端子串口为支持5V电平,5V串口通信时可以不用增加电平转换电路。
3.4 SDK包说明和模块串口通讯协议¶
我司为用户提供了本方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。该SDK开发包为:CI110X_BT_sample_SDK_ASR_Offline_V1.5.7-20220520.rar 或者更新版本。
模块与蓝牙的通讯协议已经默认做好,用户无需修改,模块和电控的串口通讯建议使用我司标准协议,具体格式请参考 ☞串口协议 。
注意:
- 不同的领域,建议选用不同的声学模型,详情可以在制作模型时的列表中看到,如下:(注意相关模型的代码配置建议);
- 串口通讯的默认参数设置为:
- 波特率:9600
- 停止位:1
- 数据位:8
- 奇偶校验:无
- 代码中通过判断 “命令+语音ID”获取是什么指令和功能;
- 发送的串口信息建议要检查完整性。
4 产品结构¶
在离线语音方案中,产品的结构设计非常重要,麦克风和喇叭的位置会直接影响用户体验。本部分内容重点描述麦克风和喇叭的结构设计,以保证整机成品的识别效果。
特别注意:
- 为保证识别效果及AEC打断效果,喇叭与麦克风需尽量远离(至少距离10CM)并且减少同向的情况;
- 如果用户未使用我们标准模块而是自行设计硬件,请详细参考 ☞回声消除使用说明文档,再进行方案设计,并且注意板子上预留IIS接口,如有问题请及时联系我司获取技术支持。
4.1 麦克风结构设计注意事项¶
- 建议选择-32dB±3dB,信噪比大于70dB以上,性价比高的全向模拟麦克风;
- 若产品的震动比较大,选择较厚的麦克风胶套减缓震动,可减小对识别效果的影响;
- 某些应用场景,容易积水或积灰,这时需要选择防水防尘的麦克风(与麦克厂商沟通提供);
- 麦克风头为敏感器件,禁止直接点热溶胶;
- 将麦克风完全插入固定孔内部,避免歪斜,拾音孔中心孔对准麦克风的中心;
- 选择符合环保RoHS要求的RTV硅胶,推荐常用的硅胶有703/704/737等,或其它有机材料、单组分室温固化硅胶等;
- 多数硅橡胶灌胶厚度小于3mm以内实温完全固化时间为8 ~ 12小时,灌胶厚度 > 3mm以上完全固化时间更长,可分层多次浇灌,确保完全固化稳定密封;
- 生产工艺可把固定麦克风工序提前,另外特别注意麦克风接线在重力拉扯下,未完全固化前容易导致麦克风扯歪,也需注意将麦克风插线固定好。
4.2 喇叭结构设计注意事项¶
- 考虑到音质,喇叭功率不能太小,建议选用1W以上喇叭,带音腔的喇叭效果会更好一点,同时注意硬件板上的功放驱动能力要匹配喇叭型号;
- 喇叭放置位置以美观及结构布局方便为主,但注意尽量避免和麦克风放在同一位置;
- 不带音腔喇叭可以在结构上做一个音腔密封后能增大音量输出;
- 为保证AEC效果,喇叭最好选择失真小的喇叭。
下图是一个喇叭规格及开孔的建议。
5 相关参考资料列表¶
编号 | 参考资料描述 | 获取方式 |
---|---|---|
1 | 标准蓝牙离线SDK CI110X_BT_sample_SDK_ASR_Offline_V1.5.7-20220520 |
请到 ☞启英泰伦语音AI平台 上获取 |
2 | 芯片和模块的选型指南 | 请点击 ☞硬件选型指南 查看 |
3 | 芯片硬件设计方法参考 | 请点击 ☞硬件设计参考 查看 |
4 | 麦克风和喇叭器件选型 | 请点击 ☞外围器件兼容列表 查看 |
5 | 产品结构设计 | 请点击 ☞产品结构设计 查看 |
6 | 软件开发方法和标准SDK说明 | 请点击 ☞软件开发 查看各部分内容 |
7 | 产品识别性能测试方法 | 请点击 ☞识别效果测试 查看 |
8 | 生产测试的方法 | 请点击 ☞生产测试 查看 |
用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。