语音降噪使用说明¶

降噪（DENOISE）算法能有效抑制稳态噪声，在保证语音失真度的同时具有良好的噪声抑制效果。开启该功能后，可以通过降低稳态噪声的方式进行识别效果的提升。本文档主要介绍降噪算法适用的场景，以及如何打开该功能。

1. SDK中语音降噪算法的默认配置和对应硬件板¶

所有CI110X系列芯片的SDK都带DENOISE功能，具体为：

纯离线SDK：CI110X_SDK_ASR_OfflineV1.2及以上版本，DENOISE功能默认关闭，可配置为打开。该SDK可用于启英泰伦提供的CIB02GS01/ CIB03GS01/CIB02CS01/CIB03CS01等模块板，或用户自行开发的带DENOISE参考线路的模块板，具体硬件选型可咨询启英泰伦技术支持人员；
算法SDK：CI110X_SDK_ALG_Application_V1.0及以上版本，DENOISE功能默认关闭，可配置为打开。该SDK可用于启英泰伦提供的CIB02GS01/ CIB03GS01/CIB02CS01/CIB03CS01等模块板，具体硬件选型可咨询启英泰伦技术支持人员；
离在线SDK：CI110X_SDK_Combine_Cloud_V1.5及以上版本，DENOISE功能默认关闭，可配置为打开。该SDK可用于启英泰伦提供的CIB03ST01J-WL21等离在线模块板，具体硬件选型可咨询启英泰伦技术支持人员。

另如果用户需要测试DENOISE效果，还需要准备录音板（该录音板可在启英泰伦官网中的启英商城中购买）。用该录音板可以实现直接观察DENOISE的效果，用于调试。录音板的使用方法请参考语音AI平台中的文档 ☞录音板使用说明。

2. 语音降噪算法应用方法¶

语音降噪算法的应用原理示意框图如下，人声为目标语音信号A，噪音和信号A在应用环境进行复杂的混合后进入芯片，语音降噪算法可抑制噪音信号，提高信号A的信噪比，从而提升识别效果。

目前启英泰伦提供的语音降噪算法仅适用于稳态噪声。

语音降噪算法应用原理示意框图

图2-1 语音降噪算法应用原理示意框图

3. 语音降噪算法软件配置方法¶

用户可打开SDK包中的 \工程名称（如\sample\internal\sample_light）\src\user_config.h文件，修改下述宏定义配置语音降噪算法功能，如下：

//打开语音降噪功能

#define USE_SINGLE_MIC_DENOISE        1

//关闭语音降噪功能

#define USE_SINGLE_MIC_DENOISE        0

语音降噪算法有以下常用函数可供用户使用：

降噪门限设置函数

int ci_denoise_set_threshold( float denoise_threshold, int window_size );

/**

* @brief    降噪门限设置

   * @param api_eng_th   门限值决定当前噪声环境下是否进行降噪，默认值为4.5

   * @window_size        窗长大小用于处理判断是否进行降噪，默认值为20

   * @return int         0:降噪门限设置成功;其它:降噪门限设置失败

*/

上述函数中denoise_threshold为常用的设置参数，window_size使用默认值即可，下图是一个denoise_threshold的值与实际的分贝值的拟合关系曲线，可供用户参考。下图的数据与真实实测数据往往会存在误差，需调试人员根据实际噪音环境进行调试，判断在当前噪声条件下是否进行降噪。

denoise_threshold的值与实际的分贝值的拟合关系曲线

图3-1 denoise_threshold值与实际分贝值的拟合关系曲线

注意

门限判断接口ci_denoise_set_threshold（）仅适用于V_10402之前的版本。

V_10402版本之后的降噪门限更改方法用户可打开SDK包中的 sdk\components\alg\basic_alg\ci_basic_alg.h文件，修改下述宏定义
```
/*! 降噪门限设置，默认值为3200*/
#define SET_DENOISE_THRESHOLD             (3200)
```

SET_DENOISE_THRESHOLD的值与实际的分贝值的拟合关系曲线

图4-1 SET_DENOISE_THRESHOLD值与实际分贝值的拟合关系曲线

4. 语音降噪算法软件配置方法¶

为了产品效果更好，不同的产品开启降噪后，请使用对应的声学模型，举例如下：

场景介绍	使用距离	使用模型
油烟机	2米以内	中文普通话单麦烟机SE159
风扇	5米以内	中文普通话SE150
卫浴	3米以内	中文普通话单麦水声SE130

5. 语音降噪算法软件调试说明¶

为了更直观的观察算法的效果，用户可以借助录音板进行调试，录音板的使用方法请参考语音AI平台上的文档 ☞录音板使用说明。具体配置如下：
在SDK \components\audio_in_manage\alg_preprocess.c文件中，alg_preprocess_two_ch()函数或alg_preprocess_four_ch_single_aec()函数调用的audio_pre_rslt_write_data( (int16_t*)dst, (int16_t*)micl )函数为IIS输出的数据内容，开启后，录音板可以从IIS接口录制到声音，该函数说明如下：

audio_pre_rslt_write_data函数中第一个参数为IIS输出的右声道的数据，第二个参数为IIS输出的左声道的数据，可以填写以下参数：

dst：输出算法处理结果的数据

Ref：输出原始获取到的参考声音

Micl：输出麦克风左声道获取到的原始声音

MicR：输出麦克风右声道获取到的原始声音

例如，当设置为：audio_pre_rslt_write_data( (int16_t*)dst, (int16_t*)micl )时，意思为右声道输出算法处理后的结果，左声道为原始的麦克风左声道的数据。

下图为录音板采音时域效果，该图上可以看到原始的左声道数据（上半图）为目标语音和噪音的混合，经过语音降噪算法处理后，抑制了噪声，提高了目标语音的信噪比（下半图）。

录音板采音时域效果

图5-1 录音板采音时域效果

下面为同样该音频的频域显示。该结果为正常结果。

音频的频域显示

图5-1 音频的频域显示