Whisper

AI开源语音合成

Whisper

star 58k。语音识别，语音生成文本

标签：AI开源语音合成TTS开源语音识别ASR

链接直达手机查看

OpenAI的Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译等任务。

github : https://github.com/openai/whisper

相关导航

PaddleSpeech

百度开源的音色合成工具，github star 9.8k

coqui-ai TTS

Star 27.7k。Coqui 文本转语音（Text-to-Speech，TTS）

24.1k。DeepSpeech 是一个开源的嵌入式（离线、设备上）语音到文本引擎，可以在从 Raspberry Pi 4 到高性能 GPU 服务器等各种设备上实时运行。

Massively Multilingual Speech

star 29k。Massively Multilingual Speech(MMS，大规模多语种语音)是 Meta 开源的一款全新的 AI 语言模型，可以识别 4000 多种口头语言并生成 1100 多种语音（文本到语音）

马斯克开源Grok-1：3140亿参数迄今最大

Lepton Search

AI 开源搜索 star 6.9k