24.1k。DeepSpeech 是一个开源的嵌入式(离线、设备上)语音到文本引擎,可以在从 Raspberry Pi 4 到高性能 GPU 服务器等各种设备上实时运行。
DeepSpeech 是一个开源的嵌入式(离线、设备上)语音到文本引擎,可以在从 Raspberry Pi 4 到高性能 GPU 服务器等各种设备上实时运行。
github : https://github.com/mozilla/DeepSpeech
star 58k。语音识别,语音生成文本
Meta LLaMA是元宇宙平台公司(Meta)公开发布的一款人工智能大模型
star9k。大模型微调
star 29k。Massively Multilingual Speech(MMS,大规模多语种语音)是 Meta 开源的一款全新的 AI 语言模型,可以识别 4000 多种口头语言并生成 1100 多种语音(文本到语音)
Star 27.7k。Coqui 文本转语音(Text-to-Speech,TTS)
Star 83k。LangChain 是一个开源框架,允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来。