离线语音算法SDK(CI13XX_SDK_LLM_AIoT)¶
概述¶
目前CI13XX系列芯片的离在线大模型对话SDK(CI13XX_SDK_LLM_AIoT)最新发布版本为:CI13XX_SDK_LLM_AIoT_V2.1.2
主要针对纯离在线大模型对话应用场景,例如AI玩具,AI医疗,车载等;支持离线自学习,回声消除(AEC),深度降噪,声源定位(DOA),VAD端点检测,SPEEX/OPUS/G722语音编解码算法;同时支持语音在线上传和播放功能:
- ASR (离线语音识别),☞《语音识别使用说明》
- CWSL(离线命令词自学习),☞《离线命令词自学习使用说明》
- AEC (回声消除),☞《回声消除使用说明》
- NN_DENOISE (深度降噪),☞《深度降噪算法使用说明》
- DOA (双mic声源定位),☞《双mic声源定位算法说明》
目前离在线大模型对话SDK提供了3个sample供用户选择,具体特性如下
| sample名称 | 录音上传 | 指令控制 | VAD | 音频播放 |
|---|---|---|---|---|
| hpout_sample | 使用hpout上传录音,不支持压缩,支持单/双麦 | 支持串口传输指令 | 不支持VAD | 不支持播放,播放端给语音端回声消除参考信号 |
| iis_sample | 使用iis上传录音,不支持压缩,只支持单麦 | 支持串口传输指令 | 不支持VAD | 支持iis下传音频播放,只支持pcm格式,不支持本地播放 |
| uart_sample | 使用uart上传录音,支持g722/speex/opus编码压缩,支持单/双麦 | 支持串口传输指令 | 支持VAD | 支持uart下传音频播放,支持pcm/g722/mp3,支持本地播放 |
离在线大模型对话SDK适配的AI语音芯片型号¶
- 芯片型号(☞启英商城有售):
CI 1302 、 CI 1303 、 CI 1306 。
- 模块型号(☞启英商城有售):
CI-D02GS01J单麦离线语音识别端子模块
CI-D06GT01J双麦离线语音识别蓝牙端子模块
- 开发板套件型号(☞启英商城有售):
CI1306开发板套件
CI1303开发板套件
CI1302开发板套件