男女声纹检测方案¶
1、方案介绍¶
男女声纹识别是一种通过深度学习方法对说话人的声音特征来区分说话者性别(男性或女性)的技术。它基于男女声音在生理和声学特性上的差异,通过算法模型自动判断说话者的性别。
2、硬件方案选型¶
(1)支持的芯片有1303 、1306等4M的flash的芯片,可以看☞芯片规格说明;
(2)支持的模块CI-D02GS01J(芯片选1302)、CI-D03GS01J(芯片1303),☞模块资料。
3、固件开发¶
3.1 编译环境搭建¶
如果是第一次用启英泰伦130X的SDK进行开发,则需要配置固件编译环境,如下☞IDE 搭建与使用
3.2 熟悉固件开发流程¶
如果是第一次用启英泰伦130X的SDK进行开发,则需要看一下☞SDK如何快速开发。包括命令词添加,语言模型添加,播报音添加等。我们也提供☞视频教程链接
3.3男女声纹固件基础配置¶
(1)首先把CI130X_SDK_ALG_PRO_2.X.X\external\model\wman_vpr(男女声纹)下的[60008]VGR_model_1027_v8.bin文件(男女声纹模型)(图1所示)复制到工程目录下的firmware目录下的dnn目录下面(图2所示)。


(2)然后在makefile中配置CI_ALG_TYPE := $(USE_WMAN_VPR),如图3所示。

完成如上两个步骤以后,工程需要先点击清理再生成。如图4所示

3.4男女声纹算法配置和对外接口¶
(1)算法配置如图6所示,可以根据宏的具体描述确认是否要调整

(2)对外接口
调用vpr_run_one_recognition();执行一次男女声纹识别,根据vp_buffer_identify[0]的大小来判断男女声学特征,如图7所示。也可以根据这个接口来做应用层逻辑。