跳转至

SDK概述


1. 概述

目前CI13XX系列芯片的SDK仅有纯离线版本,如下:

  • 纯离线SDK-离线版:CI130X_SDK_Offline
  • 纯离线SDK-算法版:CI130X_SDK_ALG

各版本SDK可以到 ☞启英泰伦语音AI平台 资料库中下载并使用。


2. SDK版本介绍

2.1. CI130X_SDK_Offline

主要针对纯离线简单应用场景,例如智能家居等,支持的音频前端算法有:

2.2. CI130X_SDK_ALG

CI13XX系列芯片具有较强的CPU运算能力,支持硬件NN加速,以及充足的RAM。能够完成一些常见的语音处理算法。主要包含了以下功能。使用者可以根据不同产品需求进行合适的选择。具体使用方式及适用场景可参考文档☞《算法SDK开发流程》中相关章节。

  • ASR(单麦语音识别,固定词条或者自然说)
  • VPR(基于特定人的声纹识别)
  • WMAN_VPR(男女声纹检测功能)
  • SED_CRY(哭声检测功能)
  • SED_SNORE(鼾声检测功能)
  • DENOISE_NN(基于识别的深度降噪功能)
  • DOA(双麦声源定位功能)
  • CWSL(自学习功能)
  • DERVERB(双麦降混响)
  • AEC(回声消除)
  • CWSL_AEC(自学习加回声消除(当前只支持单mic))
  • TTS(文本转语音(只支持中文、数字、字母,不支持英文))
  • BF(双麦语音增强)
  • AI_DOA_AEC(双麦声源定位加回声消除(需外挂codec-推荐7243e))
  • DEREVERB_AEC(双麦降混响加回声消除(需外挂codec))
  • BF_AEC(双麦语音增强加回声消除(需外挂codec))
  • DOA_DEREVERB(双麦声源定位加双麦降混响(仅双mic可用))
  • BF_DEREVERB(双麦语音增强加双麦降混响(仅双mic可用))
  • CWSL_DOA(自学习加双麦声源定位(仅双mic可用))
  • ANY_MIC_AEC(任意MIC识别加回声消除(需外挂codec))
  • CWSL_DOA_AEC(自学习加双麦声源定位加回声消除(需外挂codec))
  • PWK(声音能量值值计算,区分目标声音距离)
  • ALC(自动增益控制)