跳转到主要内容
使用本接口需要完成个人认证及企业认证用户后,方可调用。 请在 账户管理 -> 账户信息 中,完成个人用户认证或企业用户认证,以确保可以正常使用本功能。 本接口适用场景:IP 音色复刻、音色克隆等需要快速复刻某一音色的相关场景。 本接口支持单、双声道复刻声音,支持按照指定音频文件快速复刻相同音色的语音。

支持模型

以下为 MiniMax 提供的语音模型及其特性说明。
模型特性
speech-2.5-hd-preview最新的 HD 模型,韵律表现出色,复刻相似度极佳
speech-2.5-turbo-preview最新的 Turbo 模型,支持 40 个语种
speech-02-hd拥有出色的韵律、稳定性和复刻相似度,音质表现突出
speech-02-turbo拥有出色的韵律和稳定性,小语种能力加强,性能表现出色
speech-01-hd拥有超高的复刻相似度,音质表现突出
speech-01-turbo在出色的生成效果基础上有更快的生成速度

接口说明

  1. 上传待克隆音频 调用 上传复刻音频) 上传待克隆的音频文件并获取 file_id
  2. 上传示例音频 (可选) 若需要提供示例音频以增强克隆效果,需要再次调用 上传示例音频 上传示例音频文件并获得对应的 file_id。填写在clone_prompt中的prompt_audio中。
  3. 调用复刻接口 基于获取的 file_id 和自定义的 voice_id 作为输入参数,调用 快速复刻 克隆音色。
⚠️ 注意:
  • 调用本接口进行音色克隆时,不会立即收取音色复刻费用。音色的复刻费用将在首次使用此复刻音色进行语音合成时收取(不包含本接口内的试听行为)。
  • 本接口产出的快速复刻音色为临时音色,若希望永久保留某复刻音色,请于 168 小时(7 天)内在任意 T2A 语音合成接口中调用该音色(不包含本接口内的试听行为)。若超过时限,该音色将被删除。
  • 接口采用无状态设计:每次调用仅处理传入数据,且不存储用户上传内容,不涉及任何业务逻辑状态。

官方 MCP

MiniMax 提供官方的 Python 版本JavaScript 版本 模型上下文协议(MCP)服务器实现代码,支持音色克隆功能,详细说明请参考 MiniMax MCP 使用指南文档
I