跳转至

CI13XX离在线大模型对话SDK_V1.0.10开发流程

1. 概述

离在线大模型对话SDK(CI13XX_SDK_LLM_AIoT_V1.0.10) 相对于算法SDK新增功能有:录音音频数据上传(压缩/非压缩)、SPEEX和OPUS编解码、播放网络音频数据(MP3/PCM)、本地VAD端点检测;由于增加功能加大了内存和算力消耗,故在算法SDK版本上做了功能和组合裁剪,当前只支持下面的算法组合:

算法名称 算法说明
USE_AI_DOA_AEC_DENOISE_NN 双麦声源定位+回声消除+深度降噪(需外挂codec)
USE_AEC_DENOISE_NN 回声消除+深度降噪
USE_CWSL_AEC_DENOISE_NN 自学习+回声消除+深度降噪(需外挂codec)

2. 算法功能组合说明:

开启算法 说明
ASR+声源定位+回声消除+NN降噪 同时开启识别加声源定位+回声消除+深度降噪
ASR+回声消除+NN降噪 同时开启识别+回声消除+深度降噪
ASR+自学习+回声消除+NN降噪 同时开启识别加自学习+回声消除+深度降噪

注意

除了上表算法组合功能,不支持其他组合,请勿随意组合算法功能,否则会出现sdk编译异常或者运行故障。

3. 算法功能使用说明

3.1 在CI13XX_SDK_LLM_AIoT_Vx.x.x\project_file\makefile文件定义了CI_ALG_TYPE变量,通过修改该变量的值,选择使用对应的算法功能,makefile中会自动根据CI_ALG_TYPE的配置去定义和使能对应的宏,用户不需要再去重复定义使能相关宏参数;CI_ALG_TYPE默认等于USE_AEC_DENOISE_NN。例如:应用中如果需要用到自学习+回声消除+降噪,CI_ALG_TYPE配置如下图: CI_ALG_TYPE配置

3.2 CI_ALG_TYPE变量和算法功能对应关系表如下:

CI_ALG_TYPE 算法功能说明
USE_AI_DOA_AEC_DENOISE_NN 开启识别+声源定位+回声消除+NN降噪
USE_AEC_DENOISE_NN 开启识别+回声消除+NN降噪
USE_CWSL_AEC_DENOISE_NN 开启识别+自学习+回声消除+NN降噪

4.模型ID定义:

开启算法功能需使用不同的前端算法模型,各个算法模型对应ID如下表:

模型ID 模型类型
60003 NN深度降噪模型
60004 DOA声源定位模型

5. SDK开发包下载:

5.1 注册并登录AI开发平台:https://aiplatform.chipintelli.com

5.2 获取算法SDK CI13XX_SDK_ASR_ALG_VXX的软件开发包:https://aiplatform.chipintelli.com/attachment, (若有新版本,请使用最新版本的SDK),如下图: SDK下载

6. WiFi/4G芯片和启英语音芯片对接离在线方案:

6.1 上传和播放音频参数+交互协议+指令说明: 请采参考离在线大模型对话SDK对接协议说明文档☞启英泰伦离在线大模型对话SDK对接参数及协议说明

6.2 方案对接说明: 离在线大模型对话SDK前端方案说明文档☞启英泰伦离在线大模型对话对接方案说明