AI工具箱

AI音频

AI语音合成与音频处理工具,共 16 个工具

Whisper
Whisper

OpenAI 开源的通用语音识别模型,支持多语言语音转录和翻译。识别准确率高,可处理各种音频质量和环境噪声,是目前最流行的开源语音转文字工具。

101,487
GPT-SoVITS
GPT-SoVITS

开源 AI 变声和语音克隆工具,效果出色。

58,211
Coqui TTS
Coqui TTS

深度学习文本转语音工具包,支持多种 TTS 模型架构。可训练自定义语音模型,支持多语言合成和语音克隆,适合需要定制化语音方案的开发者和企业。

45,485
ChatTTS
ChatTTS

专为对话场景优化的文本转语音模型,能生成自然流畅的对话语音。支持中英文混合和情感表达,特别适合聊天机器人和虚拟助手的语音输出。

39,382
Bark
Bark

Suno AI 推出的文本转语音模型,支持多种语言和声音。

39,144
RVC
RVC

基于检索的语音转换工具,提供简洁易用的 WebUI 界面。支持实时变声和歌声转换,社区生态活跃,有大量预训练好的声音模型可供下载使用。

35,875
Fish Speech
Fish Speech

SOTA Open Source TTS

30,653
VoiceBox
VoiceBox

开源的 AI 语音工作室,支持语音克隆、语音转文字和语音创作。提供直观的操作界面和丰富的声音模型,适合播客制作者和内容创作者。

29,222
AudioCraft
AudioCraft

Meta 开源的 AI 音频处理工具包,支持音乐生成和音频处理。

23,342
Dia
Dia

Nari Labs 推出的文本转语音模型,能一次性生成超逼真的对话音频。支持多人对话生成和情感表达,是目前开源 TTS 领域效果最好的模型之一。

19,306
Kokoro TTS
Kokoro TTS

高质量的开源文本转语音引擎,支持多种语言和声音风格。推理速度快,生成音质清晰自然,适合需要实时语音合成的应用场景。

15,001
Tortoise TTS
Tortoise TTS

A multi-voice TTS system trained with an emphasis on quality

15,001