跳转到主要内容
接口本身为无状态接口,即单次调用时,模型仅处理单次传入内容,不涉及业务逻辑,同时模型也不存储您传入的数据。 该接口支持以下功能:
  1. 支持 300+ 系统音色、复刻音色自主选择;
  2. 支持音量、语调、语速、输出格式调整;
  3. 支持按比例混音功能;
  4. 支持固定间隔时间控制;
  5. 支持多种音频规格、格式,包括:mp3, pcm, flac, wav。注:wav 仅在非流式输出下支持;
  6. 支持流式输出。
该接口的适用场景:短句生成、语音聊天、在线社交等。

支持模型

以下为 MiniMax 提供的语音模型及其特性说明。
模型特性
speech-2.5-hd-preview最新的 HD 模型,韵律表现出色,复刻相似度极佳
speech-2.5-turbo-preview最新的 Turbo 模型,支持 40 个语种
speech-02-hd拥有出色的韵律、稳定性和复刻相似度,音质表现突出
speech-02-turbo拥有出色的韵律和稳定性,小语种能力加强,性能表现出色
speech-01-hd拥有超高的复刻相似度,音质表现突出
speech-01-turbo在出色的生成效果基础上有更快的生成速度

接口说明

同步语音合成功能,共包含 2 个接口,可根据需求,选择使用。
  • HTTP 同步语音合成
  • WebSocket 同步语音合成

支持语言

MiniMax 的语音合成模型具备卓越的跨语言能力,全面支持 40 种全球广泛使用的语言。我们致力于打破语言壁垒,构建真正意义上的全球通用人工智能模型。 目前支持的语言包含:
支持语种
1. 中文(Chinese)15. 土耳其语(Turkish)28. 马来语(Malay)
2. 粤语(Cantonese)16. 荷兰语(Dutch)29. 波斯语(Persian)
3. 英语(English)17. 乌克兰语(Ukrainian)30. 斯洛伐克语(Slovak)
4. 西班牙语(Spanish)18. 泰语(Thai)31. 瑞典语(Swedish)
5. 法语(French)19. 波兰语(Polish)32. 克罗地亚语(Croatian)
6. 俄语(Russian)20. 罗马尼亚语(Romanian)33. 菲律宾语(Filipino)
7. 德语(German)21. 希腊语(Greek)34. 匈牙利语(Hungarian)
8. 葡萄牙语(Portuguese)22. 捷克语(Czech)35. 挪威语(Norwegian)
9. 阿拉伯语(Arabic)23. 芬兰语(Finnish)36. 斯洛文尼亚语(Slovenian)
10. 意大利语(Italian)24. 印地语(Hindi)37. 加泰罗尼亚语(Catalan)
11. 日语(Japanese)25. 保加利亚语(Bulgarian)38. 尼诺斯克语(Nynorsk)
12. 韩语(Korean)26. 丹麦语(Danish)39. 泰米尔语(Tamil)
13. 印尼语(Indonesian)27. 希伯来语(Hebrew)40. 阿非利卡语(Afrikaans)
14. 越南语(Vietnamese)

官方 MCP

MiniMax 提供官方的 Python 版本JavaScript 版本 模型上下文协议(MCP)服务器实现代码,支持语音合成功能,详细说明请参考 MiniMax MCP 使用指南
I