返回工具列表
Fish Audio

Fish Audio

音频AI

开源的中文TTS项目,支持声音克隆和多种语音风格

功能特点

  • 中文TTS:专注中文语音合成,效果自然
  • 声音克隆:上传少量音频即可克隆声音
  • 开源免费:代码开源,可自部署
  • 多音色支持:内置多种预设音色和风格
  • API接口:提供API方便开发者集成

适用场景

  • 内容创作者:为视频/音频内容配音
  • 开发者:将TTS集成到自己的应用或网站
  • 技术爱好者:自部署TTS系统,保护隐私

使用方法/教程

第一步:访问平台

访问 fish.audio 进入官网。

点击 Try Now 可以直接体验在线演示。

支持直接使用浏览器进行语音合成。

第二步:在线体验

在 Demo 页面输入需要转换的文字。

选择预设的音色(男声/女声/不同年龄层)。

调整语速和音调参数。

点击 Generate 生成语音。

第三步:声音克隆(进阶)

点击 Create Voice 进入声音克隆流程。

上传10-30秒的目标声音音频(清晰、无噪音)。

填写声音名称和描述。

系统训练克隆声音(约5-10分钟)。

克隆完成后即可使用该声音进行TTS。

第四步:API调用(开发者)

获取API Key后,可通过API调用TTS服务。

示例请求:POST /tts,发送文本和声音ID。

支持多种音频格式输出(MP3/WAV/OGG)。

第五步:本地部署

如需完全自托管,可访问 GitHub 获取开源代码。

需要GPU显卡支持(推荐NVIDIA,6GB以上显存)。

按文档说明配置环境并启动服务。

同类工具推荐