基本功能和选型¶
请问用启英泰伦的语音芯片开发产品的流程是什么?¶
首先您可以通过文档中的相关说明,选取合适的芯片或模块。如果您是初学者,建议直接购买我司的☞开发板套件进行开发。然后您需要在☞启英泰伦语音AI平台上注册账号,并根据其使用方法制作固件或进行软件开发,实际测试语音效果及产品功能。如果您的产品需要批量量产,您可以直接批量采购我司提供的模块,或是根据平台设计资料中的硬件设计资料,自行设计电路板,进行调试后再根据文档中心提供的测试方法进行产品性能测试、可靠性测试及生产测试,以达到整机的要求,进行批量生产。在开发过程中如果您遇到任何问题,都欢迎通过平台的在线支持或发送信息到公司支持邮箱 support@chipintelli.com ,或是联系我司技术支持工程师,我司会为您提供全面的技术支持服务。
开发产品时如何选择合适的语音芯片或模块?¶
您可以点击☞产品选型 获取选型信息。如果文档中心中的产品方案开发文档中有您对应的产品,您可以直接用文档中的建议选择合适的芯片或模块进行开发。
启英泰伦提供的板卡形状不符合要求,可以提供定制设计吗?¶
如果您有板卡设计能力,可以购买启英泰伦的语音芯片,按照文档中心中的硬件开发文档自行设计。如果您需要我司定制板卡,达到一定数量级时我司也可帮助定制,具体请联系我司☞商务人员。
词条能够达到200条的语音芯片有推荐吗?¶
我司的CI1103、CI1302、CI1312语音芯片可支持300条左右词条。不同芯片支持的词条数请参考☞硬件选型指南 。
做语音产品如何选择麦克风数量?¶
我司有单麦克风和双麦克风方案可供选择,两者都支持较高的识别率。单麦克风成本较低,双麦克风成本较高,但支持声源定位、环境噪声抑制等功能。所以一般应用场合推荐单麦克风;噪声大、有声源定位需求的,推荐双麦克风。
如何提高语音识别效果?¶
影响语音识别效果的因素有很多,比如语音芯片本身的性能,词条的选择,产品的结构设计(比如麦克风和喇叭的安装位置等)。推荐您直接使用启英泰伦的语音芯片产品和语音AI平台进行开发,我司已经做了很多的技术和产品积累,标准方案识别率可达97%,您也可以直接使用平台的优化等功能进一步提升语音识别效果。
如何支持各种方言识别?¶
因方言种类较多,目前要全部支持比较困难。我司目前针对一些北方语系方案,以及一些覆盖人数较多的方言做了专门的方案,对于一些比较偏的方言,也可以采用我司的本地自学习方案进行支持。详细信息请查看☞本地自学习功能 。
请问启英泰伦芯片的功耗怎样,是否支持电池应用?¶
因为离线语音识别要一直开启监听模式,其功耗目前较难做到非常小。例如目前我司的CI110X系列语音芯片(CI1102/CI1103)待机功耗约10mA左右, 正常运行功耗35到50mA左右。如果用于电池应用,考虑到待机时间,建议使用大容量电池。或如果有按键,可以用按键开启语音功能后再给语音模块上电,不使用语音功能时给语音模块断电以节省耗电。我司芯片方案上电后一般0.5秒左右可进入到识别状态。
备注
各款芯片详细功耗数据请到☞芯片数据手册中进行查阅。
离线语音方案相比纯在线有什么优势?¶
离线语音方案采用专业离线语音芯片在终端处理语音,不用连接网络,可以最大化保护用户语音隐私,且断网后也能使用,节省网络费用及带宽。离线语音方案实时性好,基本可以做到1S内响应,没有云端方案因网络拥塞或信号不好时出现延时问题,非常适合用在功能控制类产品,如大小家电、汽车、照明等领域。
离在线语音方案和纯在线和纯离线相比主要有什么优势?¶
离在线方案是离线和在线的结合方案,产品的基本操作控制采用离线语音控制,安全性高,又有在线云端服务,内容非常丰富。和纯在线方案比,无网络或网络质量差时仍然可离线语音控制,产品的基本操作使用不受网络影响;和纯离线方案比,离在线方案可以为消费者提供丰富的云端内容服务。该方案特别适合需要增加内容或服务的智能家电和智能家居产品使用。
请问如何实现智能家居的语音控制联动?¶
可以采用语音AIOT方案,即使用智能语音芯片进行语音功能控制,同时增加WiFi、zigbeeg等无线模块进行设备间互联,实现用语音控制所有连接的智能家居设备。
启英泰伦的离在线语音方案中WIFI怎么选型?¶
离在线方案的WIFI选型需考虑传输音频采用的硬件接口,WIFI的主频及预留给离在线方案使用的内存大小等,具体如下:
- WIFI 硬件接口支持UART(921600以上波特率)/IIS SALVE/标准SDIO DEVICE。
- WIFI CPU的主频160Mhz以上,给离在线应用层使用的SRAM 要大于200K Byte。
- WIFI SDK支持基础协议如JSON,SPEEX,Mbedtls,MQTT,HTTP等。
软件设计可参考文档中心中软件开发SDK的相关内容。
离在线语音识别方案是否支持产品的远程控制功能,即IOT功能?¶
我司目前推出的离在线语音识别方案可以增加集成IoT功能并连接IOT云(如涂鸦云、腾讯云等),实现手机远程控制产品。我司目前也有成熟的语音AIOT产品方案供用户选择。
使用唤醒词以外的发音,是否能正常唤醒设备?¶
从技术原理上讲,不能。语音设备设定专用唤醒词的核心目的,是将其作为一道“语音开关”,以杜绝海量无关语音造成的持续误识别,从而保障设备的待机功耗与隐私安全。
然而,在工程实现上,为了提升用户体验——尤其是适应不同的口音、语速和发音习惯——唤醒识别算法必须具备一定的容错性(即“模糊匹配”)。正是这种旨在提高易用性的宽容度,使得部分发音与预设唤醒词高度近似的词汇,存在一定的概率被设备误判为有效唤醒指令。
理想的唤醒系统应在“高唤醒率”与“低误唤醒率”之间实现最佳平衡。当前现象表明,此唤醒词设计尚有优化空间。我们将通过模型迭代,致力于在广泛兼容用户发音的同时,进一步提升唤醒的精准性与鲁棒性。
我购买了贵司的一套录音板和开发板,请问怎么连接起来?¶
请将开发板底板上的 IIS 信号线和录音板上的信号线链接在一起,并用一条 mini-A 线或者用 USB 转串口工具上的 5V 给开发板主板供电,用另外一根 mini-A 线给录音板供电,并且要连接 PC 电脑的 USB 接口。
请问贵司的模块如何生成语音固件?¶
可以在本文档中心软件开发中查看相关使用内容,并使用我司提供的语音AI平台生成固件。
贵司的语音模块如何自己定制播报音?¶
播报音可以通过我司提供的语音AI平台进行定制,该平台也提供语音合成。
贵司语音模块麦克风是接线的形式,可以将麦克风直接贴在板卡上吗?哪种方式更好些?¶
麦克风焊点的焊接时间和温度,都会导致麦克风的灵敏度变化,所以,建议使用连线的方式,如果贴片,需要与麦克风厂家确定好麦克风是否可以过回流焊。
搭载我司语音芯片的模块,其麦克风和喇叭应如何连接?连接时有正反方向要求吗?¶
麦克风的“+”对应模块的左声道,如果mic安装反了会导致声音降低严重,影响识别率,请正确连接。
该模块支持一个喇叭时,不分正负,正接反接没有影响;若有两个喇叭,分左右,则不能接反,SPKL+对应喇叭的正,否则会出现声音相位抵消,播报音会有问题。
请问在基于启英泰伦语音芯片模块的 SDK 开发时,应如何设置串口?¶
目前常用的通信串口是UART0、UART1和UART2,SDK 提供了高度的灵活性,允许开发者根据实际硬件设计分配串口功能。所有配置均通过在 user_config.h 文件中修改宏定义完成。
- 默认配置
为方便开发者快速上手,SDK 设有默认配置。UART0初始默认被配置为log打印输出使用的串口,UART2初始默认被配置为语音模块通信协议使用的串口。代码如下:
//**通讯串口配置
#define CONFIG_CI_LOG_UART HAL_UART0_BASE //配置log输出使用的串口
#define UART_PROTOCOL_NUMBER (HAL_UART2_BASE) //语音模块协议使用的串口。
- 自定义配置
当您的项目需要改变默认串口分配时(例如,需要把log打印输出串口设为UART1,把语音模块协议使用的串口设为UART0。),可以轻松地重新配置。
注意:每个串口仅能用于唯一功能,禁止重复配置。
应用示例如下:
//**通讯串口配置
#define CONFIG_CI_LOG_UART HAL_UART1_BASE //配置log输出使用的串口
#define UART_PROTOCOL_NUMBER (HAL_UART0_BASE) //语音模块协议使用的串口。
语音识别模块设置命令词条要遵循什么原则吗?¶
建议命令词条长度建议4—6个词;相似韵母发音尽量避免使用,比如厨房/书房、风干/烘干;选择比较好发音的字,如“普”字很难大声发音,尽量避免;减少太口语化或生活使用频次很高的词,比如“我”。
固件烧录时烧录进度一直保持0%或异常报错?¶
遇到这类问题常见情况有以下几种:
-
CI110X系列芯片,CI112X系列芯片PGEN脚外部上拉3.3V后,将串口工具连接电脑,需要在升级工具中勾选对应串口号之后,重新给设备上电方可进行正确下载。注意:CI13XX系列芯片及之后系列则无需PGEN脚外部上拉3.3V,芯片内部已对PGEN脚进行了默认上拉使能。
-
测量串口工具TX引脚的电平,目前CI110X系列芯片,CI112X系列芯片串口烧录电平不支持5V及以上的数据信号,如果存在电平不匹配情况,需要修改串口工具的输出电平,或者增加电平匹配电路。CI13XX系列芯片及之后系列均支持3.3V及5V的数据信号。
-
检查设备供电是否稳定,有些使用串口工具5V给设备供电,会出现上电瞬间输出功率不够导致设备无法正常通讯,建议使用单独的供电系统为设备提供稳定的工作电压。
-
检查连接线是否可靠,常见使用杜邦线将串口工具与设备端连接,由于杜邦线长期插拔,导致金属接头处松动,氧化,降低了数据传输稳定性,建议更换连接线重新使用。
该如何选用正确的USB转串口工具?¶
目前启英泰伦离线语音芯片烧录下载使用的串口需要支持最大2M稳定的传输速率,建议推荐CH340G,FT232等这类高稳定的串口通讯传输芯片所制作的USB转串口工具,减少烧录过程中出现的问题,提高烧录效率。
固件打包时出现错误警告如何解决?¶
如遇打包固件过程中出现错误警告,先查看错误信息提示,例如新增了代码后,代码量增 加,超出了原始分区⼤⼩,就会错误提示“分区User:⽂件过⼤,超出预留⼤⼩”。此时将User选项中的“预留⼤⼩”按照错误提示框中的实际⼤⼩修改,修改参考每次最⼩新增 0x1000的⽅式执⾏,填写正确的参数,再刷新地址打包固件;若提示其他分区同类错误,参考上述⽅法修改对应分区⼤⼩。(更多说明可在⼯具中按下F1功能键查看帮助⽂档)。
要做一个鼾声检测,用什么模块合适?¶
可以使用搭载CI1302芯片的模块,可以使用sdk 2.5.28,如需训练需要联系商务
请问哪些型号的芯片有TTS功能?¶
可以联系我司商务
方言能识别吗?¶
需要训练,比如粤语等
请问CI1306支持语音转文本的应用吗?¶
不支持
命令词支持模糊的吗?必须打开大灯,也可以说开启大灯之类的¶
可以泛化加词,也可以做自然说的
CI1302能做语音识别吗,识别除了命令词以外的文字¶
不能
芯片能语音识别的同时支持文字TTS转语音输出不¶
不能