跳转至

离线TTS方案使用说明

一、产品功能描述

1、文本合成功能

支持任意中文汉字(不支持繁体字,生僻字)文本合成,英文按单个字母发音。文本编码支持GB2312,单次合成文本量不超过4K字节。

2、文本分析功能

智能解析常见标点符号,常见多音字、数字。支持常用英文单位(需小写)、特殊数字发音。单句无停顿标点符号句子长度超过50字将自动切断。

3、支持音量、语速、语调调整

支持10级音量、10级语速、10级语调调整。

发送协议头+[v0]-[v9],音量由小到大。默认为中间值。

发送协议头+[s0]-[s9],语速由快到满,默认为中间值正常语速。

发送协议头+[t0]-[t9],语调由低到高,默认为中间值正常语调。

4、支持单发音人,可根据需求定制。

5、支持文本标记,可标记多音字发音、数字发音、短停顿。

多音字标记方式:

[=*] 标记前一汉字的拼音

例:空调[=tiao2]调[=tiao2]到三十度

汉字拼音解析为:kong1 tiao2 tiao2 dao4 san1 shi2 du4

其中,拼音格式为拼音+声调,声调数值范围1-5,分别代表(1:阴平 2:阳平 3:上声 4:去声 5:轻声)。拼音中ü用字母v代替,字母均为小写。

数字标记方式:

[n*],指定该标记后的数字发音方式,*为1时按数字发音,*为2时按数值发音,*为3时按电话号码格式发音。该标记后必须跟数字才能有效转换。

例:共消费[n2]100元,请拨打电话[n1]95511,手机号码[n3]18812341121。

解析为:共消费一百元,请拨打电话九五五一一,手机号码幺八八幺二三四幺幺二幺。

短停标记方式:

[w0],指定该位置做短暂停顿。

例:欢迎使用[w0]我司的语音合成系列方案。

6、支持控制指令:开始合成,暂停合成,继续合成,停止合成,查询芯片状态。

7、支持15种提示音效,其中:铃声 5 首; 信息提示音 5 首;警示音 5 首。

类型 提示音名称 提示音名称 提示音名称 提示音名称 提示音名称
铃声 ring_1 ring_2 ring_3 ring_4 ring_5
信息提示音 message_1 message_2 message_3 message_4 message_5
警示音 alert_1 alert_2 alert_3 alert_4 alert_5

提示音使用方法:发送协议头+提示音名称,则播报对应提示音名称的音频。

二、硬件说明

  • 硬件方案 1103 CI-B03GS01S

  • 待机功耗:约200mw,默认音量播放文本功耗:约 500~600 mw。

img

img

1:接5V电源; 2:升级固件(若已烧好固件,不需要连接串口0)使用串口RX0和TX0; 3:喇叭底座; 4:模式选择,PGEN和EN短接为升级模式、断开为正常模式;

5:使用TTS功能时连接串口1,RX1和TX1;

  • 底板和USB烧录器连接关系
底板 USB烧录器
RX0/RX1 TXD
TX0/RX1 RXD
5V 5V0
GND GND

三、TTS串口工具

步骤1:打开TTS串口工具

img

注:该工具可前往启英泰伦语音AI平台☞开发资料中搜索“启英泰伦语音离线开发工具”进行下载使用。

步骤2:点击TTS串口工具

img

步骤3:选择好对应的端口号(串口1),和波特率115200,并打开串口

img

步骤3:在文本输入框输入待播放的文本,输入完成后,将光标点击到句首。

img

步骤4:点击开始合成按钮

img

四、串口协议介绍

  • UART:串口1

  • 波特率:115200

  • 起始位:1bit

  • 数据位:8bit

  • 停止位:1bit

  • 校验位:无

帧头 数据长度 命令字 编码参数 文本
0xFD 0-x00 0xLL 0x01 0x00 TEXT(N字节)

例如:合成GB2312格式的“谢谢使用”

帧头 数据长度 命令字 编码参数 文本
0xFD 0x00 0x0A 0x01 0x00 D0 BB D0 BB CA B9 D3 C3

注:没有繁体字时,上述编码参数支持0x01