语音合成
语音合成接口,基于HTTP协议的调用方式,支持speex和amr输出格式。
请求地址
请求方式:POST
请求地址:http://vcloud.xiaoi.com/synth.do
请求头参数
参数名 说明 示例
Content-Type 内容类型 text/plain
X-AUE 音频编码 "raw","speex-wb;7"等。具体音频编码方式参见附录"音频编码方式"
X-TXE 期望识别文本的编码 "gbk","utf-8"等
X-AUF 音频格式 "audio/L16;rate=16000"或"audio/L16;rate=8000"
响应头说明
元素名 说明 示例
Content-Type 内容类型 application/plain
X-AUE 合成音频的编码 "raw","speex-wb;7"等。具体音频编码方式见附录"音频编码方式"
X-AUF 合成音频的格式 "audio/L16;rate=16000"或"audio/L16;rate=8000"
调用示例(HTTP请求报文)
POST /synth.do HTTP/1.1
Cache-Control: no-cache
Pragma: no-cache
Host: nlp.xiaoi.com
Connection: keep-alive
Content-Type: text/plain
X-AUE: speex-wb;7
X-TXE: gbk
Content-Length: xxx
X-Auth:xxxxxx
返回示例
HTTP/1.1 200 OK
Cache-Control: no-cache
Pragma: no-cache
Content-Type: application/audio
X-AUE: speex-wb;7
Content-Length: xxx
附录
音频编码方式(音频默认位16位、16KHz)
元素名 说明
raw 原始PCM音频编码,无压缩,相当于wav文件去掉文件头的剩余部分。
speex-wb;7 speex压缩编码方式,编码质量为7,宽带模式,每320样本(20ms采样、640字节、编码后为60字节)编码为一个Packet体,每Packet头为一字节(无符号char型)长度
speex-nb;7 speex压缩编码方式,编码质量为7,窄带模式(8KHz),每160样本(20ms采样、320字节、编码后为30字节)编码为一个Packet体,每Packet头为一字节(无符号char型)长度
amr amr窄带压缩编码方式。