离线TTS方案使用说明¶
一、产品功能描述¶
1、文本合成功能¶
支持任意中文汉字(不支持繁体字,生僻字)文本合成,英文按单个字母发音。文本编码支持GB2312,单次合成文本量不超过4K字节。
2、文本分析功能¶
智能解析常见标点符号,常见多音字、数字。支持常用英文单位(需小写)、特殊数字发音。单句无停顿标点符号句子长度超过50字将自动切断。
3、支持音量、语速、语调调整¶
支持10级音量、10级语速、10级语调调整。
发送协议头+[v0]-[v9],音量由小到大。默认为中间值。
发送协议头+[s0]-[s9],语速由快到满,默认为中间值正常语速。
发送协议头+[t0]-[t9],语调由低到高,默认为中间值正常语调。
4、支持单发音人,可根据需求定制。¶
5、支持文本标记,可标记多音字发音、数字发音、短停顿。¶
多音字标记方式:
[=*] 标记前一汉字的拼音
例:空调[=tiao2]调[=tiao2]到三十度
汉字拼音解析为:kong1 tiao2 tiao2 dao4 san1 shi2 du4
其中,拼音格式为拼音+声调,声调数值范围1-5,分别代表(1:阴平 2:阳平 3:上声 4:去声 5:轻声)。拼音中ü用字母v代替,字母均为小写。
数字标记方式:
[n*],指定该标记后的数字发音方式,*为1时按数字发音,*为2时按数值发音,*为3时按电话号码格式发音。该标记后必须跟数字才能有效转换。
例:共消费[n2]100元,请拨打电话[n1]95511,手机号码[n3]18812341121。
解析为:共消费一百元,请拨打电话九五五一一,手机号码幺八八幺二三四幺幺二幺。
短停标记方式:
[w0],指定该位置做短暂停顿。
例:欢迎使用[w0]我司的语音合成系列方案。
6、支持控制指令:开始合成,暂停合成,继续合成,停止合成,查询芯片状态。¶
7、支持15种提示音效,其中:铃声 5 首; 信息提示音 5 首;警示音 5 首。¶
类型 | 提示音名称 | 提示音名称 | 提示音名称 | 提示音名称 | 提示音名称 |
---|---|---|---|---|---|
铃声 | ring_1 | ring_2 | ring_3 | ring_4 | ring_5 |
信息提示音 | message_1 | message_2 | message_3 | message_4 | message_5 |
警示音 | alert_1 | alert_2 | alert_3 | alert_4 | alert_5 |
提示音使用方法:发送协议头+提示音名称,则播报对应提示音名称的音频。
二、硬件说明¶
-
硬件方案 1103 CI-B03GS01S
-
待机功耗:约200mw,默认音量播放文本功耗:约 500~600 mw。
1:接5V电源; 2:升级固件(若已烧好固件,不需要连接串口0)使用串口RX0和TX0; 3:喇叭底座; 4:模式选择,PGEN和EN短接为升级模式、断开为正常模式;
5:使用TTS功能时连接串口1,RX1和TX1;
- 底板和USB烧录器连接关系
底板 | USB烧录器 |
---|---|
RX0/RX1 | TXD |
TX0/RX1 | RXD |
5V | 5V0 |
GND | GND |
三、TTS串口工具¶
步骤1:打开TTS串口工具¶
注:该工具可前往启英泰伦语音AI平台☞开发资料中搜索“启英泰伦语音离线开发工具”进行下载使用。
步骤2:点击TTS串口工具¶
步骤3:选择好对应的端口号(串口1),和波特率115200,并打开串口¶
步骤3:在文本输入框输入待播放的文本,输入完成后,将光标点击到句首。¶
步骤4:点击开始合成按钮¶
四、串口协议介绍¶
-
UART:串口1
-
波特率:115200
-
起始位:1bit
-
数据位:8bit
-
停止位:1bit
-
校验位:无
帧头 | 数据长度 | 命令字 | 编码参数 | 文本 |
---|---|---|---|---|
0xFD | 0-x00 0xLL | 0x01 | 0x00 | TEXT(N字节) |
例如:合成GB2312格式的“谢谢使用”
帧头 | 数据长度 | 命令字 | 编码参数 | 文本 |
---|---|---|---|---|
0xFD | 0x00 0x0A | 0x01 | 0x00 | D0 BB D0 BB CA B9 D3 C3 |
注:没有繁体字时,上述编码参数支持0x01