Fish Audio

音频AI

开源的中文TTS项目，支持声音克隆和多种语音风格

功能特点

第一步：访问平台

访问 fish.audio 进入官网。

点击 Try Now 可以直接体验在线演示。

支持直接使用浏览器进行语音合成。

第二步：在线体验

在 Demo 页面输入需要转换的文字。

选择预设的音色（男声/女声/不同年龄层）。

调整语速和音调参数。

点击 Generate 生成语音。

第三步：声音克隆（进阶）

点击 Create Voice 进入声音克隆流程。

上传10-30秒的目标声音音频（清晰、无噪音）。

填写声音名称和描述。

系统训练克隆声音（约5-10分钟）。

克隆完成后即可使用该声音进行TTS。

第四步：API调用（开发者）

获取API Key后，可通过API调用TTS服务。

示例请求：POST /tts，发送文本和声音ID。

支持多种音频格式输出（MP3/WAV/OGG）。

第五步：本地部署

如需完全自托管，可访问 GitHub 获取开源代码。

需要GPU显卡支持（推荐NVIDIA，6GB以上显存）。

按文档说明配置环境并启动服务。