创建异步语音合成任务

授权

Authorization

string

header

必填

HTTP: Bearer Auth

Security Scheme Type: http
HTTP Authorization Scheme: Bearer API_key，用于验证账户信息，可在账户管理>接口密钥中查看。

请求头

Content-Type

enum<string>

默认值:application/json

必填

请求体的媒介类型，请设置为 application/json，确保请求数据的格式为 JSON

可用选项:

application/json

请求体

application/json

model

enum<string>

必填

请求的模型版本，可选范围：speech-2.8-hd, speech-2.8-turbo, speech-2.6-hd, speech-2.6-turbo, speech-02-hd, speech-02-turbo, speech-01-hd, speech-01-turbo.

可用选项:

speech-2.8-hd,

speech-2.8-turbo,

speech-2.6-hd,

speech-2.6-turbo,

speech-02-hd,

speech-02-turbo,

speech-01-hd,

speech-01-turbo

text

string

必填

待合成音频的文本，限制最长 5 万字符。和 text_file_id 二选一必填

语气词标签：仅当模型选择 speech-2.8-hd 或 speech-2.8-turbo 时，支持在文本中插入语气词标签。支持的语气词：(laughs)（笑声）、(chuckle)（轻笑）、(coughs)（咳嗽）、(clear-throat)（清嗓子）、(groans)（呻吟）、(breath)（正常换气）、(pant)（喘气）、(inhale)（吸气）、(exhale)（呼气）、(gasps)（倒吸气）、(sniffs)（吸鼻子）、(sighs)（叹气）、(snorts)（喷鼻息）、(burps)（打嗝）、(lip-smacking)（咂嘴）、(humming)（哼唱）、(hissing)（嘶嘶声）、(emm)（嗯）、(whistles)（口哨）、(sneezes)（喷嚏）、(crying)（抽泣）、(applause)（鼓掌）

text_file_id

integer<int64>

必填

待合成音频的文本文件待合成音频的文本文件 id，单个文件长度限制小于 10 万字符，支持的文件格式：txt、zip。和 text 二选一必填，传入后自动校验格式。

txt 文件：长度限制 <100,000 字符。支持使用 <#x#> 标记自定义停顿。x 为停顿时长（单位：秒），范围 [0.01,99.99]，最多保留两位小数。注意停顿需设置在两个可以语音发音的文本之间，不可连续使用多个停顿标记
zip 文件：
- 压缩包内需包含同一格式的 txt 或 json 文件。
- json 文件格式：支持 [title, content, extra] 三个字段，分别表示标题、正文、附加信息。若三个字段都存在，则产出 3 组结果，共 9 个文件，统一存放在一个文件夹中。若某字段不存在或内容为空，则该字段不会生成对应结果

voice_setting

object

必填

Show child attributes

audio_setting

object

Show child attributes

pronunciation_dict

object

Show child attributes

language_boost

enum<string>

是否增强对指定的小语种和方言的识别能力。默认值为 null，可设置为 auto 让模型自主判断。

注意：speech-01 和 speech-02 系列模型暂不支持 Persian、Filipino、Tamil 这三个语种。

可用选项:

Chinese,

Chinese,Yue,

English,

Arabic,

Russian,

Spanish,

French,

Portuguese,

German,

Turkish,

Dutch,

Ukrainian,

Vietnamese,

Indonesian,

Japanese,

Italian,

Korean,

Thai,

Polish,

Romanian,

Greek,

Czech,

Finnish,

Hindi,

Bulgarian,

Danish,

Hebrew,

Malay,

Persian,

Slovak,

Swedish,

Croatian,

Filipino,

Hungarian,

Norwegian,

Slovenian,

Catalan,

Nynorsk,

Tamil,

Afrikaans,

auto

voice_modify

object

声音效果器设置

Show child attributes

aigc_watermark

boolean

默认值:false

控制在合成音频的末尾添加音频节奏标识，默认值为 False。该参数仅对非流式合成生效

响应

200 - application/json

task_id

string

当前任务的 ID

file_id

integer<int64>

任务创建成功后返回的对应音频文件的 ID。

当任务完成后，可通过 file_id 调用文件检索接口进行下载
当请求出错时，不返回该字段注意：返回的下载 URL 自生成起 9 小时（32,400 秒）内有效，过期后文件将失效，生成的信息便会丢失，请注意下载信息的时间

task_token

string

完成当前任务使用的密钥信息

usage_characters

integer

计费字符数

base_resp

object

本次请求的状态码及其详情

Show child attributes

API 指引

文本

语音

视频

图片

音乐

文件

返回文件信息

txt 文件

json 文件

授权

请求头

请求体

响应

API 指引

文本

语音

视频

图片

音乐

文件

​返回文件信息

​txt 文件

​json 文件

授权

请求头

请求体

响应

返回文件信息

txt 文件

json 文件