跳转至

语音AI平台使用指南(旧)

1、语音AI平台介绍

1.1 语音AI平台简介

成都启英泰伦科技有限公司语音AI平台,是我司为用户提供的一整套可用于在线开发基于我司智能语音芯片方案的功能平台,地址为:☞启英泰伦语音AI平台。该平台包含了新手指南、文档中心、语言模型、定制产品、播报音合成、领域开发方案下载、在线支持、样品采购、新闻公告、开发者论坛等功能。用户可以登录到该平台,使用本文档中介绍的各项功能,结合我司智能语音芯片和对应的SDK开发包进行方案开发。平台提供的各项功能方便快捷,可以帮助用户节省方案开发时间,保障开发方案的性能,提升开发效率。

该平台目前主要有以下功能模块:

  1. 新手指南:该文档为新手用户介绍如何使用我司产品,以及熟悉语音产品开发的一些基础流程;
  2. 文档中心:文档中心详细介绍了SDK的结构,硬件的相关选型指南,开发方案等相关内容的介绍,用户可以自行查阅相关的章节学习使用;
  3. 语言模型:分为语言模型以及增强语言模型(增强语言模型为企业用户可使用)两个功能,根据用户提供的命令词条等信息,在线生成语言模型,用于SDK开发;
  4. 定制产品:可以“定制固件”,“定制SDK”(定制SDK为企业用户可使用)或者“定制涂鸦AIOT固件”,根据用户提供的命令词条信息,在线生成可烧录的固件,可以直接下载到开发板上使用;
  5. 播报音合成:该功能模块用于在线制作音频文件,可以用来做播报音;
  6. 领域开发方案下载(该功能为企业用户可使用):该功能模块为用户提供了不同领域的开发方案,内容包括语言模型,SDK包等开发资料,方便用户进行快速开发;
  7. 在线支持:该功能模块为用户提供在线帮助,用户可以将自己开发中所遇到的问题通过该模块提交给我司,我司技术支持人员会在一定时间内为用户做出解答;
  8. 开发资料:用户可以通过该模块获取开发时所需要使用到的SDK以及硬件原理图等相关资料;
  9. 样品采购:该功能模块为用户提供了模块购买途径,用户可以根据自己的需求购买模块,如若用户需要购买大量模块,也可通过批量购买模块来获取联系方式;
  10. 新闻公告:用户可以通过该功能模块了解到我司平台近期的一些情况,以及各类活动的情报;
  11. 开发者论坛:用户可以在论坛上进行相关方案开发、问题的咨询和技术交流;
  12. 认证企业用户:该模块仅用于个人用户认证为企业用户使用,用户可以按照该模块的功能指引,进行认证工作,认证成为企业用户后该功能模块不会在平台中显示。

1.2 平台基本功能操作介绍

1.2.1 账号登录

用户输入网址后,进入平台入口主界面,如下图所示:

平台入口{: .center .img-fluid tag=1}

输入账号和密码,登录成功后进入主界面,如下图所示:

主界面

1.2.2 账号注册

如果用户还没有账号,请参考下列步骤来注册:

第一步:进入主界面,点击红色框内的“还没有账户?”,进入注册界面,如下图所示:

注册

第二步:注册界面内填写对应的信息(数字序号与图中标识对应)

  • ①您的EMail:用户填写注册用邮箱,后续登录以及一些功能的开通会跟您的邮箱挂钩;
  • ②你的姓名:用户填写账号使用的用户名;
  • ③密码:用户填写登录所使用的密码;
  • ④确认密码:用户填写③中的密码,确认后妥善保存
  • ⑤请输入您的姓名:用户填写真实姓名,该项填写会影响到后续的企业验证操作;
  • ⑥请输入您的联系地址:用户填写联系地址;
  • ⑦请输入您的联系电话:用户填写联系电话;
  • ⑧请问您是通过何种方式了解到启英泰伦:用户通过下拉列表选择对应的选项;
  • ⑨协议条款:请用户仔细阅读使用条款,阅读完毕后勾选上勾选框;
  • ⑩注册:信息填写完成后,用户点击注册按键,完成注册。

具体信息如下图所示:

信息

平台注册账号注册后,默认为个人用户,如需要开通更多功能,请通过企业认证成为企业用户。

下表为各个等级用户的使用权限差异:

功能 个人用户 企业用户
新手指南
文档中心
语言模型
增强语言模型 ×
定制固件
定制SDK ×
定制涂鸦AIOT固件
播报音合成
领域开发方案下载 ×
在线支持
开发资料
样品采购
新闻公告
开发者论坛

1.2.3 企业认证

认证企业用户流程如下:

第一步:如下图红色框内所示,登录账号后,选择左侧菜单栏中的”认证企业用户”模块,进入认证表单视图界面;

认证

第二步:如下图所示,在表单界面选择红色框内的“创建”按键,进入认证主界面;

表单

第三步:如下图所示,填写相关信息,并上传相关资料后,点击“提交申请”后,等待我司人员审核(审核时间预计一天左右);

  • ①用户名:平台自动填写,为此时登录账号的用户名;
  • ②申请日期:平台自动生成,用户可以不用处理;
  • ③您的企业全称:用户填写自己公司的全称;
  • ④您的企业地址:用户填写自己公司的地址;
  • ⑤下载启英泰伦保密协议:该处需要用户下载保密协议,并在阅读完毕确认无误后,打印并盖上企业公章,扫描为电子文档;
  • ⑥请上传盖企业公章的NDA协议:此处需要用户上传盖章后的NDA协议扫描电子文档;
  • ⑦下载启英泰伦启英泰伦语音AI平台使用协议:此处用户下载平台使用协议,并在阅读完毕确认无误后,打印并盖上企业公章,扫描为电子文档;
  • ⑧请上传盖企业公章后的平台使用协议:此处需要用户上传盖章后的平台使用协议扫描电子文档;
  • ⑨企业联系人:用户需要填写企业联系人;
  • ⑩企业联系人电话:用户需要填写联系人的电话;
  • ⑪企业联系邮箱:用户填写正确的企业邮箱;
  • ⑫您的企业相关产品:填写企业相关生产产品;
  • ⑬提交申请:用户填写完上述内容后,点击此按键,完成提交
  • ⑭保存或丢弃:用户若不想此时上传申请,可以点击保存,来保存填写的内容;

界面

第四步:审核完成后,我司技术人员会为通过认证的用户开通企业用户相应权限。

1.2.4 浏览器兼容列表

下面列表为各大浏览器与我司语音AI平台兼容情况,若使用列表中的浏览器无法登录或者无法使用时,请联系我司技术人员。

浏览器 浏览模式 正常 备注
IE浏览器 × 无法加载验证码,视图排版错误。不能使用
Chrome(谷歌) 正常使用
Firefox 正常使用
QQ浏览器 极速模式 正常使用
QQ浏览器 兼容模式 × 有部分显示异常,加载速度较慢,基本无法使用
360安全浏览器 极速模式 正常使用
360安全浏览器 兼容模式 × 无法加载验证码,视图排版错误,不能使用
360极速浏览器 极速模式 正常使用
360极速浏览器 兼容模式 × 无法加载验证码,视图排版错误,不能使用
搜狗浏览器 极速模式 正常使用
搜狗浏览器 兼容模式 × 无法加载验证码,视图排版错误,不能使用


2、新手指南

2.1 概述

该模块适用于新手开发者快速入门,模块下有三个功能模块:新手指南,语音识别原理演示视频,产品方案开发流程。新手开发者通过这三个资料,可以快速了解我司产品的使用方法以及相关方案的开发流程。

示例如下图:

新手指南

2.2 新手指南文档

该文档为新手用户熟悉我司模块时使用,内容介绍分为入门篇以及进阶篇,用户可以根据自己的实际情况来寻找自己想要的资料来完成开发;

如下图所示,用户可以通过点击左侧菜单中的“新手指南”模块进入新手指南文档,在进入文档页面后,也可点击上方菜单栏的“新手指南”按键进行文档查看。

新手指南文档

2.3 语音识别原理视频

该视频展示了语音识别的一些基础原理,方便用户了解语音识别的相关理论,同时也能更好的理解我司方案的一些开发逻辑;

用户可以点击红色框内(如下图所示)的“语音识别原理演示视频”,待页面加载完成后,点击中央的播放按键,即可观看该视频。

识别原理视频

2.4 产品方案开发流程

用户熟悉模块开发后,我司也提供了相关产品开发的参考文档,用户可以进入“产品方案开发的方法”来快速找到文档,该文档可以让用户迅速完成产品的开发,加快项目落地速度;

如下图所示,用户可以点击红色框内的“产品方案开发流程”进入该文档界面。

方案开发


3、文档中心

文档中心如下图所示,该文档中心详细介绍了我司芯片、模块、SDK软件、方案开发、测试等内容,用户可以从中找到各类信息,请自行查阅相应的章节进行学习使用。

如下图所示,用户可以点击左侧菜单栏的“文档中心”按键,进入文档中心主界面,进行文档查阅

文档中心


4、语言模型

4.1 概述

该功能模块用于制作并下载语言模型。语言模型根据用户提供的命令词条制作,完成后放入SDK开发包中编译生成固件,可以使得设备能识别到用户定义的命令词条用于相关控制工作。语言模型和所使用的芯片型号、语言类型以及声学模型相关,用户可以在本功能模块中制作自定义的语言模型并下载。

用户可以点击左侧的菜单中的“语言模型”进入该模块,如下图所示:

语言模型

4.2 基础语言模型

4.2.1 概述

该功能模块为个人用户以及企业用户共有,用户可以根据自己的需求,在对应的样例表格中填写对应词条,平台会在线生成语言模型,完成后放入SDK开发包中编译生成固件。

用户可以在进入“语言模型”模块后,点击浏览器上方的“语言模型”进入该模块,如下图所示:

语言模型

4.2.2 列表视图

点击进入语言模型界面后,首先进入语言模型功能模块的列表视图,在这里将会展示用户自己的语言模型记录。每条记录包含了客户名称、作者、创建日期以及输入的芯片型号等参数,如下图所示,用户能够在此处查询自己的语言模型制作记录。

列表视图

4.2.3 语言模型主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入语言模型制作的主界面:

  • ①左侧菜单栏中选择语言模型
  • ②选中语言模型
  • ③点击创建,进入语言模型制作主界面

语言模型主界面{: .center .img-fluid tag=1}

4.2.4 语言模型制作

  • ①项目所属客户名称:填写该语言模型对应的客户名称(请正确填写,后面如若需要查找时,方便搜索);
  • ②芯片型号:选择对应的芯片型号(如对芯片型号不了解,可浏览 ☞硬件选型指南);
  • ③产品类型:选择语言模型用于的产品,目前有大于100种产品类型,用户可以点击该下拉列表中的“搜索更多”按钮找到符合该语言模型的产品,如果列表中没有,可以选择“其他”;
  • ④语言类型:选择语言模型对应的语言,目前有中文、英文、中混英、日文供用户选择;
  • ⑤声学模型类型:在选择了芯片型号和语言类型后,该下拉列表会自动出现对应的可供选择的声学模型,用户可以根据自己的需求进行选择;
  • ⑥下载样例:提供了命令词制作文件的模板,根据用户的语言类型选择,会自动生成对应语言样例的下载链接;
  • ⑦上传命令词制作文件:用户可以按要求的格式将希望生成语言模型的命令词填入一个文件中,按此按钮上传到平台中,平台使用该文件制作对应的语言模型;
  • ⑧注意事项:如若生成文件失败,可以查看注意事项里的内容,会帮助您快速找到问题所在;
  • ⑨保存或丢弃:确认无误后,选择保存,进行文件生成。

制作流程

4.2.5 上传命令词制作文件

上传的命令词制作文件格式模板可以通过创建表单界面中的“下载样例”获取。目前在语言模型功能模块中支持上传命令词制作和固件制作文件(固件制作文件请详见“语音固件”章节中相应描述)。用户可以按照该模板的格式,填写需要的命令词,注明其类型及其他功能,保存后上传。

中文样例如下图:

中文样例

英文样例如下图:

英文样例

日文样例如下图:

日文样例

4.2.6 命令词规范

中文命令词

  1. 一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
  2. 命令词中相邻汉字的声韵母区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“吃饭啦”;
  5. 生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
  6. 命令词中的字最好不要有语气词,如“啊”、“呢”等;
  7. 应避免使用叠词,如:“你好你好”;
  8. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
  9. 命令词中的数字需要以汉字表示,如“调高一度”;
  10. 若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。

英文命令词

  1. 建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“HI、HELLO”;
  5. 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
  6. 应避免使用叠词,如:“HELLO-HELLO”。

日文命令词

  1. 一条日语命令词建议由4-6个音节的日文组成,过短容易出现高误识,过长不便用户呼叫和记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“はい、おはよ”;
  5. 避免使用相似音节,词的发音清晰响度要大,如;下げて(sa ge te)、上げて(a ge te);
  6. 应避免使用叠词,如:“ラボ-ラボ”。

其他注意事项

  1. 中英日文命令词上传附件及格式参考样例。
  2. 为了保证唤醒率,降低误唤醒,一个模型仅允许一个唤醒词。

4.2.7 表单的提交

用户在制作语言模型时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传您的文件”,上传已经按照规范做好的命令词制作文件。

表单提交

上传完成后,点击左上角的“保存”按键;

语言模型保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

4.2.8 语言模型下载

文件加载完成后,请点击“下载声学模型”和“下载语言模型”按钮,下载对应的声学模型和语言模型,放入SDK开发包中使用。

模型下载

4.3 增强语言模型

4.3.1 概述

该功能模块为企业用户专享 ,用户可以通过该模块,上传分词文件或者excel制作语言模型以及加速模型(加速模型响应速度相当通用模型较快,目前仅支持单个模型为加速模型),平台在线生成语言模型,完成后用户放入SDK编译合成使用。该功能为企业用户提供了更全面的声学模型选择,可以让企业用户的产品达到更好的效果,加速量产进程。

用户可以在进入“语言模型”模块后,点击浏览器上方的“增强语言模型”进入该模块,如下图所示:

概述

4.3.2 列表视图

点击进入增强语言模型界面后,首先进入增强语言模型功能模块的列表视图,在这里将会展示用户自己的语言模型记录。每条记录包含了客户名称、作者、创建日期以及输入的芯片型号等参数,如下图所示,用户能够在此处查询自己的语言模型制作记录。

列表视图

4.3.2 增强语言模型主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入增强语言模型制作的主界面:

  • ①左侧菜单栏中选择语言模型
  • ②选中增强语言模型
  • ③点击创建,进入增强语言模型制作主界面

增强模型主界面

4.3.3 增强语言模型制作

  • ①项目名称:填写该增强语言模型对应的项目名称(请正确填写,后面如若需要查找时,方便搜索);
  • ②芯片型号:选择对应的芯片型号(如对芯片型号不了解,可浏览 ☞硬件选型指南);
  • ③语言类型:选择语言模型对应的语言,目前有中文、英文、中混英、日文供用户选择;
  • ④声学模型类型:在选择了芯片型号和语言类型后,该下拉列表会自动出现对应的可供选择的声学模型,用户可以根据自己的需求进行选择;
  • ⑤操作类型:分为以下三类:

上传G.fst: 即上传附件为分词文件,同时可获取语言模型;

加速模型: 响应速度相当通用模型较快,目前仅支持单个模型为加速模型,上传附件格式为 分词文件(G.fst);

获取分词文件: 即上传附件为格式化命令词,可获取分词文件和语言模型。

  • ⑥产品类型:选择语言模型用于的产品,目前有大于100种产品类型,用户可以点击该下拉列表中的“搜索更多”按钮找到符合该语言模型的产品,如果列表中没有,可以选择“其他”;
  • ⑦附件上传:用户可以按要求的格式将希望生成语言模型的命令词填入一个文件中,按此按钮上传到平台中,平台使用该文件制作对应的语言模型;
  • ⑧注意事项:一些选项的相关说明;
  • ⑨保存或丢弃:确认无误后,选择保存,进行文件生成。

制作流程

4.3.4 分词文件

语言模型制作完成后包含的文件,文件名为“G.fst.txt”,该文件又名分词文件,用户不需要对里面的内容进行修改,直接上传此文件使用;如下图所示:

分词文件

4.3.5 表单的提交

用户在制作语言模型时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传您的文件”,上传已经按照规范做好的命令词制作文件。

表单提交

上传完成后,点击左上角的“保存”按键;

语言模型保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

4.3.6 语言模型下载

文件加载完成后,请点击“下载声学模型”和“下载语言模型”按钮,下载对应的声学模型和语言模型,放入SDK开发包中使用。

模型下载


5、定制产品

5.1 定制固件

5.1.1 概述

该功能模块用于制作并下载语音固件。语音固件根据用户提供的命令词条和播报音词条制作,用户可以在本功能模块中制作自定义的语音固件并下载到硬件板中使用。

用户可以在进入“定制产品”模块后,点击浏览器上方的“定制固件”进入该模块,如下图所示:

概述

5.1.2 列表视图

点击进入定制固件界面后,首先进入定制固件功能模块的列表视图,在这里将会展示用户自己的定制固件记录。每条记录包含了项目名称、作者、创建日期以及芯片型号等参数,如下图所示,用户能够在此处查询自己的定制固件制作记录。

列表视图

5.1.3 定制固件主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入定制固件制作的主界面:

  • ①左侧菜单栏中选择定制产品
  • ②选中定制固件
  • ③点击创建,进入定制固件主界面

定制固件主界面

5.1.4 定制固件界面说明

  • ①项目名称:填写定制固件对应的项目名称(请正确填写,为方便后续查找);
  • ②语言类型:选择语言模型对应的语言,目前定制固件功能支持中文,英文两类语种的固件制作;
  • ③产品类型:选择语言模型用于的产品,目前有大于100种产品类型,用户可以点击该下拉列表中的“搜索更多”按钮找到符合该语言模型的产品,如果列表中没有,可以选择“其他”;
  • ④声学模型类型:声学模型选择,需选择芯片型号以及语言类型后才能进行选择;
  • ⑤芯片型号:选择对应的芯片型号(如对芯片型号不了解,可浏览 ☞硬件选型指南);
  • ⑥麦克风类型:选择对应的麦克风类型(目前定制固件仅支持单麦固件制作);
  • ⑦串口类型:选择对应的通讯串口(目前仅支持UART1);
  • ⑧波特率:选择通讯用的波特率(目前波特率为固定值9600);
  • ⑨上传固件制作文件:用户可以按要求的格式将希望生成语音固件的命令词以及对应的播报音填入一个样例中,按此按钮上传到平台中,平台使用该文件制作对应的语音固件;
  • ⑩下载样例:提供了固件制作文件的模板,根据用户的语言类型选择,会自动生成对应语言样例的下载链接;
  • ⑪注意事项:如若生成文件失败,可以查看注意事项里的内容,会帮助您快速找到问题所在;
  • ⑫保存或丢弃:确认无误后,选择保存,进行固件生成。

制作流程

5.1.5 上传固件制作文件

上传的固件制作文件格式模板可以通过创建表单界面中的“下载样例”获取。目前在语音固件功能模块中仅支持上传固件制作文件。用户可以按照该模板的格式,填写需要的命令词,播报语句,以及注明其类型及其他功能,保存后上传。

中文的样例如下图所示:

中文样例

英文的样例如下图所示:.

英文样例

5.1.6 命令词填写规范

中文命令词

  1. 一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
  2. 命令词中相邻汉字的声韵母区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“吃饭啦”;
  5. 生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
  6. 命令词中的字最好不要有语气词,如“啊”、“呢”等;
  7. 应避免使用叠词,如:“你好你好”;
  8. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
  9. 命令词中的数字需要以汉字表示,如“调高一度”;
  10. 若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。

英文命令词

  1. 建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
  2. 命令词间音节区分度越大越好;
  3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
  4. 应避免使用日常用语,如:“HI、HELLO”;
  5. 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
  6. 应避免使用叠词,如:“HELLO-HELLO”。

其他注意事项

  1. 中英文输入格式:请下载样例。
  2. 为了保证唤醒率,降低误唤醒,一个模型仅允许一个唤醒词。

5.1.7 表单的提交

用户在制作语音固件时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传你的文件”,上传已经按照规范做好的命令词制作文件。

表单提交

上传完成后,点击左上角的“保存”按键;

定制固件保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

5.1.8 定制固件下载

固件生成成功后,选择“下载语音固件”,便可得到生成的定制固件。

固件下载

5.2 定制SDK

5.2.1 概述

该功能模块为企业用户专享 ,该功能模块用于制作并下载定制SDK。用户可以根据自己的需求,下载SDK或者语音固件,整套SDK根据用户提供的命令词条和播报音词条制作,用户也可以自己配置相应的一些算法参数,例如降噪、AEC等,定制SDK可以极大程度的节省用户开发代码的时间,加快产品落地速度。

用户可以在进入“定制产品”模块后,点击浏览器上方的“定制SDK”进入该模块,如下图所示:

概述

5.2.2 列表视图

点击进入定制SDK界面后,首先进入定制SDK功能模块的列表视图,在这里将会展示用户自己的定制SDK记录。每条记录包含了项目名称、作者、创建日期以及芯片型号等参数,如下图所示,用户能够在此处查询自己的定制SDK制作记录。

列表视图

5.2.3 定制固件主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入定制SDK的主界面:

  • ①左侧菜单栏中选择定制产品
  • ②选中定制SDK
  • ③点击创建,进入定制SDK主界面

定制固件主界面

5.2.4 定制SDK界面说明

定制SDK默认主界面如下图所示:

项目名称:用户填写对应的名称

应用场景:用户需要选择不同应用场景,目前我司有单麦离线,双麦离线以及离在线三种选择;

初始

用户选择好应用场景后,需要选择芯片型号,如下图所示:

CI1103:高性能方案,MCU+BNPU框架,内置512k+2M ram,可做通用MCU,方案主要如下:

  1. 单mic离线方案,支持词条300+;
  2. 双mic离线方案,开关不同算法,对词条数量影响不同,建议不超过100;
  3. 离在线识别方案,开关不同算法,对词条数量影响不同,建议不超过100;
  4. 前端降噪及本地词条识别,开关不同算法,对词条数量影响不同,建议不超过100;
  5. 方言自学习。

CI1102:高性价比方案,MCU+BNPU框架,内置512k ram,可做通用MCU,方案主要如下:

  1. 单mic离线方案,支持词条不超过200;
  2. 单mic离线方案,仅支持降噪算法和AEC算法,开启功能后,词条建议不超过100。

CI1122:高性价比方案,FLASH内置,MCU+BNPU+FLASH框架,内置512k ram,可做通用MCU,方案主要如下:

  1. 单mic离线方案,支持词条不超过200;
  2. 单mic离线方案,仅支持降噪算法和AEC算法,开启功能后,词条建议不超过100。

芯片

选择芯片型号后,用户需要填写如下图所示的一些内容:

  • ①语言:用户选择需要制作的SDK的语言,目前有中文以及英文;
  • ②Flash大小:用户根据需求选择flash的大小,不同芯片的flash有所不同;
  • ③SDK配置:用户对SDK进行相关参数配置;
  • ④协议类型:用户可以选择标准协议或者自定义协议两种不同的方式,根据选择不同上传文件的内容会有所变化;
  • ⑤声学模型选择:分为自定义声学模型以及自适应声学模型两种,自定义是根据用户自己的选择来决定声学模型,自适应则是按照我司的经验自动生成;
  • ⑥灵敏度:分为中和高两档,用户根据自己产品的需求选择;
  • ⑦声学模型类型:根据声学模型选择的分支决定,选择自适应,默认生成自适应模型,选择自定义,用户需要选择对应的模型;
  • ⑧下载需求:用户根据自己的需求,下载SDK或者固件文件;
  • ⑨固件流程配置:分为“快速合成”以及“优化识别效果”两类,快速合成可以使用户更快的得到SDK,优化效果可以得到更好的识别体验效果,但合成时间耗时会更长。
  • ⑩产品类型:选择定制SDK用于的产品,目前有大于100种产品类型,用户可以点击该下拉列表中的“搜索更多”按钮找到符合该语言模型的产品,如果列表中没有,可以选择“其他”;
  • ⑪上传固件制作文件:使用标准协议的用户可以按要求的格式将希望生成的命令词填入文件中,按此按钮上传到平台中,平台使用该文件制作对应的SDK;使用自定义协议的用户还需要按照格式需求填写对应的协议信息;
  • ⑫下载样例:提供了SDK制作文件的模板,根据用户的语言类型选择以及协议类型,会自动生成对应语言样例的下载链接;
  • ⑬保存或丢弃:确认无误后,选择保存,进行固件生成。

内容

5.2.5 上传SDK制作文件

上传的SDK制作文件格式模板可以通过创建表单界面中的“下载样例”获取。目前在定制SDK功能模块中仅支持上传固件制作文件。用户可以按照该模板的格式,填写需要的命令词,播报语句,以及注明其类型及其他功能,保存后上传。

中文的样例如下图所示:

中文样例

中文带协议样例如下图所示:

中文协议

英文的样例如下图所示:

英文样例

英文带协议样例如下图所示:

英文协议

5.2.6 表单的提交

用户在制作定制SDK时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传你的文件”,上传已经按照规范做好的excel文件。

表单提交

上传完成后,点击左上角的“保存”按键;

定制固件保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

5.2.7 定制SDK下载

SDK生成成功后,选择“下载语音固件”,便可得到生成的定制SDK。

固件下载

5.3 定制涂鸦AIOT固件

5.3.1 概述

涂鸦AIoT产品方案是由我司与涂鸦智能联合推出的集语音控制与APP远程控制于一体的AI IoT产品解决方案; 该方案以我司推出离线语音控制方案为基础融合IOT模块,使产品不仅拥有语音控制功能,还能通过无线网络与IOT服务器连接,实现产品远程控制。用户可以使用该功能模块制作AIOT的demo固件。

用户可以点击上方的菜单栏中的“定制涂鸦AIOT固件”进入该模块,如下图所示:

概述

5.3.2 列表视图

点击进入“定制涂鸦AIOT固件”界面后,首先进入定制涂鸦AIOT固件功能模块的列表视图,在这里将会展示用户自己的定制涂鸦AIOT固件记录。每条记录包含了作者、创建日期等参数,如下图所示,用户能够在此处查询自己的定制涂鸦AIOT固件制作记录。

列表视图

5.3.3 定制涂鸦AIOT固件主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入“定制涂鸦AIOT固件”的主界面:

入口

5.3.4 定制涂鸦AIOT界面说明

  • ①下载涂鸦AIOT中文表格样例:用户在此处下载涂鸦AIOT的中文样例表格,用户可以根据生成指南的内容进行填写;
  • ②下载涂鸦AIOT语音固件在线生成指南:用户可以在此处下载涂鸦固件的生成指南,若对该功能不太熟悉,请查阅该文档;
  • ③创建者:平台自动生成;
  • ④上传固件制作文件:用户将填写好的表格样例,点击此处进行上传;
  • ⑤保存或丢弃:确认无误后,选择保存,进行固件生成。

界面

5.3.5 使用说明

固件制作流程引导

  1. 请联系涂鸦或者启英泰伦的商务获取AIOT开发板。
  2. 请下载样例及《涂鸦AIOT语音固件在线生成指南》,参考《涂鸦AIOT语音固件在线生成指南》填写样例表格。
  3. 提交表格后,等待5~10分钟可以产生语音模块的固件。
  4. 该平台产生的固件仅供demo。

命令词建议

  1. 一般为4-6个字,4个字最佳,如:你好小格,芝麻开门,智能管家。
  2. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符。
  3. 唤醒词的音节覆盖尽量多且差异大,最少为4个音节。
  4. 相似音节尽可能避免,字的发音清晰响度要大。
  5. 应避免使用日常用语,如:吃饭啦,在生活中经常用到,容易误识唤醒。
  6. 生僻字和零声母字应尽量避免,如语音识别,“语音”两个字均为零声母字,应尽量避免。
  7. 应避免使用叠词,如:你好你好。
  8. 当命令词由中文和英文组成时,语言类型请选择中混英。
  9. 命令词不允许词内或词间存在中英文混合。
  10. 为了保证唤醒率,降低误唤醒,一个模型仅允许一个唤醒词。

5.3.6 上传文件说明

上传的涂鸦AIOT中文表格样例文件格式模板可以通过创建表单界面中的“下载涂鸦AIOT中文表格样例”获取。用户可以按照该模板的格式,填写必要的信息,保存后上传。

说明

5.3.7 表单的提交

用户在合成涂鸦AIOT固件时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传你的文件”,上传已经按照规范做好的excel文件。

表单提交

上传完成后,点击左上角的“保存”按键;

定制固件保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

5.3.8 涂鸦AIOT固件下载

涂鸦AIOT固件合成成功后,选择“下载语音合成文件”,便可得到生成的固件。

固件下载


6、播报音合成

6.1 概述

该功能模块用于在线制作音频文件,可以用来做播报音。

用户可以点击左侧的菜单中的“播报音合成”进入该模块,如下图所示:

概述

6.2 列表视图

点击进入“播报音合成”界面后,首先进入播报音合成功能模块的列表视图,在这里将会展示用户自己的播报音合成记录。每条记录包含了项目名称、作者、创建日期以及语言类型等参数,如下图所示,用户能够在此处查询自己的播报音合成制作记录。

列表视图

6.3 播报音合成主界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入播报音合成的主界面:

  • ①选择菜单栏左侧的“播报音合成”按键
  • ②点击创建,即可进入主界面。

界面

6.4 播报音合成界面说明

  • ①语音合成项目名称:用户填写对应的项目名称;
  • ②语言类型:目前提供中文以及英文播报音制作;
  • ③人声分类:目前提供成年男声,成年女声,男童声,女童声这四种人声制作;
  • ④语速:有20个等级,默认等级为10,等级越高语速越快;
  • ⑤合成人声:选择完成人声分类后,选择对应的人声;
  • ⑥下载样例:选择语言类型后,提供制作表格样例的下载链接;
  • ⑦音量:有20个等级,默认等级为10,等级越高音量越大;
  • ⑧语音合成文件上传:用户可以按要求的格式将希望生成播报音的词条填入一个文件中,按此按钮上传到平台中,平台使用该文件制作对应的播报音;
  • ⑨试听样音:用户可以根据自己的合成人声进行样音试听;
  • ⑩填写说明:用户可以及时查看相应的说明;
  • ⑪保存或丢弃:确认无误后,选择保存,进行固件生成。

制作流程

6.5 填写说明

  1. 该功能窗口可将文本批量转换成SDK中需要的播报语音。
  2. 根据需求选择相应的参数,点击试听按钮试听。
  3. 标注“推荐“字样的为推荐发音人。
  4. 语速:0最快-20最慢,推荐值10。
  5. 音量:0最小-10最大,推荐值10。

注意

  1. 上传的EXCEL中,第一列为音频序号,第二列为音频名,第三列为待合成文本。
  2. 音频名不宜过长且不能包含空格,待合成文本不宜超过四十字。
  3. 现仅支持上传EXCEL文件,请在“样例中”下载EXCEL模板。

6.6 上传播报音合成样例文件

上传的播报音样例文件格式模板可以通过创建表单界面中的“下载样例”获取。用户可以按照该模板的格式,填写需要的播报语句,以及其内容,保存后上传。

中文的样例如下图所示:

中文

英文的样例如下图所示:

英文

6.7 表单的提交

用户在合成播报音时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击“上传你的文件”,上传已经按照规范做好的excel文件。

表单提交

上传完成后,点击左上角的“保存”按键;

定制固件保存

等待文件被平台加载;

加载

请注意:加载的过程当中请勿退出或者刷新界面,否则制作进度将会终止!

6.8 播报音下载

播报音合成成功后,选择“下载语音合成文件”,便可得到生成的播报音。

固件下载


7、领域开发方案下载

此功能仅限企业用户使用,该功能模块为用户提供了不同领域的开发方案,下载内容包括语言模型,SDK包等开发资料,方便用户进行快速开发;

用户可以点击左侧菜单中的“领域开发方案下载”进入该模块,如下图所示:

概述

如下图所示,用户点击“下载”按键,进行文件下载:

下载


8、在线支持

8.1 概述

该功能模块为用户提供在线帮助,用户可以将自己开发中所遇到的问题通过该模块提交给我司,我司技术支持人员会在一定时间内为用户做出解答;

用户可以点击左侧菜单中的“在线支持”进入该模块,如下图所示:

概述

8.2 问题定位

8.2.1 概述

用户可以使用该功能模块对在开发中的遇到的问题进行定位,用户在填写表单的过程,可以根据各种提示,解决当前遇到的开发问题,如表单信息填写完成后,依旧没能解决问题,用户也可以将自己的问题上传到平台,我司会有技术人员为大家解答。

8.2.2 问题定位界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入问题定位的主界面:

  • ①点击左侧菜单栏中的“在线支持”模块;
  • ②进入后选择上方菜单选项中的“问题定位”模块;
  • ③点击“创建”按键,即可进入界面。

入口

8.2.3 问题定位各组问题说明

第一组:模组工作环境确认(问题1-4):该组问题用户需要确认环境对识别的影响情况;

第二组:语音或者测试方式确认(问题5-8):该组问题用户需要确认测试方法以及地方口音问题;

第三组:硬件确认(问题9-12):该组问题用户需要确认硬件相关问题;

第四组:软件确认(问题13-19):该组问题用户需要确认软件问题;

如果上述四组问题确认完后,问题依旧存在,用户可以选择将问题上传附件到平台,并对问题进行相应的描述。

如下图所示:

说明

8.2.4 问题定位表单上传

用户在使用“问题定位”功能时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击左上角的“保存”按键;

表单提交

保存完成后进入完成界面

完成

注意:用户提交的问题,在工作时间(10:00~18:00),我司工作人员会在15分钟内进行回复。

8.3 在线工单

8.3.1 概述

本模块用于客户向我司提交问题工单,便于你快速解决遇到的问题。

8.3.2 在线工单界面入口

请用户参考如下流程进行操作(注意下方数字标识对应下图中的数字标识),便可进入在线工单的主界面:

  • ①点击左侧菜单栏中的“在线支持”模块;
  • ②进入后选择上方菜单选项中的“在线工单”模块;
  • ③点击“创建”按键,即可进入界面。

入口

8.3.3 在线工单界面说明

  • 用户:平台自动填写;
  • 创建日期:平台自动填写;
  • 工单类型:用户根据自己的问题类型,选择相应的工单类型;
  • 问题描述:用户对问题进行进一步描述;
  • 上传附件:如果有问题内容附件,用户也可以进行上传;
  • 您的联系电话:填写您的电话号码;
  • 您的邮箱:填写您的邮箱地址;
  • 保存或丢弃:填写完成后,选择“保存”,对工单进行提交;

说明

8.3.4 在线支持表单上传

用户在使用“在线表单”功能时,需先新建表单,填写好表单中对应的内容,如下图所示:

填写表单

填写完成后,点击左上角的“保存”按键;

表单提交

保存完成后进入完成界面

完成

注意:用户提交的问题,在工作时间(10:00~18:00),我司工作人员会在15分钟内进行回复。


9、开发资料

开发资料中包含了我司模组的硬件开发设计所需资料,软件SDK开发包,工具软件等资料,用于开发使用。用户可以点击各个分类目录,查看对应的文档,也可以进行搜索关键字找到合适的文档(该分类目录可能会不定期更新)。

用户可以点击左侧的菜单中的“开发资料”进入该功能模块,如下图所示:

概述


10、样品采购

该功能模块为用户提供了模块购买途径,用户可以按照页面的说明,根据自己的需求购买模块,如用户需要购买大量模块,请通过页面中的联系方式联系我们。


11、新闻公告

用户登录成功后默认跳转到“新闻公告”界面,我司会不定期发送相关通知,用户能够在这里查阅最新的通知公告;

用户也可以点击左侧菜单中的“新闻公告”进入该功能模块,如下图所示:

概述


12、开发者论坛

12.1 概述

该功能模块主要用户开发者论坛的页面跳转,用户可以在论坛上进行相关方案开发、问题的咨询和技术交流。

用户可以点击左侧菜单中的“开发者论坛”,如下图所示:

概述

12.2 论坛使用说明

开发者论坛为用户提供一个相互交流的平台,用户可以在论坛上发帖交流技术问题,同时我司技术人员也会不定期对用户提出的问题进行解答。

注意事项:论坛账号与AI平台账号不通用,用户使用论坛前,请先注册账号

12.3 模块介绍

12.3.1 登录模块

如下图所示,为该功能模块的说明,用户可以根据标号对应了解各功能的作用;

  • ①账号:为用户注册时创建时填写的信息,可以使用注册时使用的邮箱或者用户名;
  • ②密码:为用户注册时自己生成的密码;
  • ③自动登录:可勾选项,用户勾选后下次登录时会自动登录账号;
  • ④登录:输入正确的账号和密码后,点击此按键,即可登录开发者论坛;
  • ⑤找回密码:该功能为用户忘记自己密码时使用,用户可以通过相应流程找回自己的密码;
  • ⑥立即注册:新用户若没有论坛账号,请点击该功能选项,注册成功后的账号才能使用开发者论坛。

12.3.2 语音开发者论坛

如下图所示,用户进入论坛后,点击红色框内的“语音开发者论坛”按键,可以跳转到论坛主界面。

12.3.3 技术交流

如下图所示,用户可以点击红色框内的“技术交流”按键,进入技术交流主界面,也可以选择下拉列表中的选项,进入各自对应的专题界面;

如下图所示,为“技术交流”主界面,用户可以在这个界面找到相关专题界面进入对应的专题界面;

如下图所示,为“硬件开发”专题界面,用户可以在这个专题讨论硬件开发的相关问题;

如下图所示,为“软件开发”专题界面,用户可以在这个专题讨论软件开发的相关问题;

如下图所示,为“工具使用”专题界面,用户可以在这个专题讨论工具使用的相关问题;

如下图所示,为“测试相关”专题界面,用户可以在这个专题讨论测试的相关问题;

如下图所示,为“智能算法”专题界面,用户可以在这个专题讨论智能算法的相关问题;

12.3.4 知识库

如下图所示,用户可以点击红色框内的“知识库”按键,进入知识库主界面,也可以选择下拉列表中的选项,进入各自对应的专题界面;

如下图所示,为“知识库”主界面

如下图所示,为“FAQ经验库”专题界面

如下图所示,为“知识分享”专题界面

如下图所示,为“语音命令词推荐”专题界面