跳转至

模型制作

1、概述

该功能模块为个人用户以及企业用户共有,用户可以根据自己的需求,在对应的样例表格中填写对应词条,平台会在线生成语言模型,完成后放入SDK开发包中编译生成固件。

用户可以在进入“语言模型”模块后,点击浏览器上方的“语言模型”进入该模块,如下图所示:

语言模型

2、列表视图

点击进入语言模型界面后,首先进入语言模型功能模块的列表视图,在这里将会展示用户自己的语言模型记录。每条记录包含了客户名称、作者、创建日期以及输入的芯片型号等参数,如下图所示,用户能够在此处查询自己的语言模型制作记录。

列表视图

3、语言模型主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入语言模型制作的主界面:

  • ①左侧菜单栏中选择语言模型
  • ②选中语言模型
  • ③点击创建,进入语言模型制作主界面

语言模型主界面

4、语言模型制作

  • ①项目所属客户名称:填写该语言模型对应的客户名称(请正确填写,后面如若需要查找时,方便搜索);
  • ②芯片型号:选择对应的芯片型号(如对芯片型号不了解,可浏览 ☞硬件选型指南);
  • ③产品类型:选择语言模型用于的产品,目前有大于100种产品类型,用户可以点击该下拉列表中的“搜索更多”按钮找到符合该语言模型的产品,如果列表中没有,可以选择“其他”;
  • ④语言类型:选择语言模型对应的语言,目前有中文、英文、中混英、日文供用户选择;
  • ⑤声学模型类型:在选择了芯片型号和语言类型后,该下拉列表会自动出现对应的可供选择的声学模型,用户可以根据自己的需求进行选择;
  • ⑥下载样例:提供了命令词制作文件的模板,根据用户的语言类型选择,会自动生成对应语言样例的下载链接;
  • ⑦上传命令词制作文件:用户可以按要求的格式将希望生成语言模型的命令词填入一个文件中,按此按钮上传到平台中,平台使用该文件制作对应的语言模型;
  • ⑧注意事项:如若生成文件失败,可以查看注意事项里的内容,会帮助您快速找到问题所在;
  • ⑨保存or丢弃:确认无误后,选择保存,进行文件生成。

制作流程

5、上传命令词制作文件

上传的命令词制作文件格式模板可以通过创建表单界面中的“下载样例”获取。目前在语言模型功能模块中支持上传命令词制作和固件制作文件(固件制作文件请详见“语音固件”章节中相应描述)。用户可以按照该模板的格式,填写需要的命令词,注明其类型及其他功能,保存后上传。

中文样例如下图:

中文样例

英文样例如下图:

英文样例

日文样例如下图:

日文样例

6、命令词规范

中文命令词

  1. 一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
  2. 命令词中相邻汉字的声韵母区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“吃饭啦”;
  5. 生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
  6. 命令词中的字最好不要有语气词,如“啊”、“呢”等;
  7. 应避免使用叠词,如:“你好你好”;
  8. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
  9. 命令词中的数字需要以汉字表示,如“调高一度”;
  10. 若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。

英文命令词

  1. 建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“HI、HELLO”;
  5. 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
  6. 应避免使用叠词,如:“HELLO-HELLO”。

日文命令词

  1. 一条日语命令词建议由4-6个音节的日文组成,过短容易出现高误识,过长不便用户呼叫和记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“はい、おはよ”;
  5. 避免使用相似音节,词的发音清晰响度要大,如;下げて(sa ge te)、上げて(a ge te);
  6. 应避免使用叠词,如:“ラボ-ラボ”。

其他注意事项

  1. 中英日文命令词上传附件及格式参考样例。
  2. 为了保证唤醒率,降低误唤醒,一个模型仅允许一个唤醒词。

7、表单的提交

用户在制作语言模型时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传您的文件”,上传已经按照规范做好的命令词制作文件。

表单提交

上传完成后,点击左上角的“保存”按键;

语言模型保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

8、语言模型下载

文件加载完成后,请点击“下载声学模型”和“下载语言模型”按钮,下载对应的声学模型和语言模型,放入SDK开发包中使用。

模型下载

9、模型替换

9.1 语言模型压缩包内各文件夹说明

CmdWordStructure:该文件夹存放的内容为{cmd_info}表格,为用户词条置信度相关参数配置文件;

GfstCmd:该文件夹存放的内容为平台生成的命令词模型文件;

GfstWake:该文件夹存放的内容为平台生成的唤醒词模型文件;

语言模型

9.2 SDK内文件替换

文件夹位置:CI110X_SDK_ASR_Offline_V1.x.x\sample\internal\sample_110x\firmware

下图为firmware文件夹的内容

文件夹内容

用户需要将GfstCmd以及GfstWake这两个文件夹里的[x]asr_zn_SExxx_CI1103_normal.dat文件替换firmware内的asr文件夹里的内容。

同时用户将{cmd_info}配置文件放入user_file\cmd_info内并替换原先的内容;

将声学模型里的内容放到dnn文件夹内替换SDK原有的内容,即可使用。