全部项目 视觉感知 视觉增强 自然语言 音频处理 分析推荐 自动驾驶

DeepSpeech语音转文本|语音识别

789     2021-03-10 09:30   [分类:音频处理]   

源码
论文
0

    语音识别的项目主要话语权还是掌握在一些科技巨头的手中,如Google、IBM等;而这些项目都是商业项目,暂时都未开源;今天要介绍的是百度提供的DeepSpeech2,可以先做了解;

    百度的研究人员也在研究自己的语音转文本引擎DeepSpeech2。这是一个端到端的开源引擎,它使用“ PaddlePaddle深度学习框架将英语和普通话的语音转换为文本。该项目在BSD许可下发布。

    该引擎可以针对任何模型和所需的任何语言进行培训。模型不随代码一起发布;就像其他软件一样,你必须自己构建它们。DeepSpeech2的源代码是用Python编写的;因此,如果这是你使用的语言,你应该很快就能使用上手。



其它语音识别类项目:

Mozilla也开源了一套语音转文字的项目,也叫DeepSpeech,与百度的项目基于同一篇论文,这是一个100%免费的开源语音转文本库,它使用了 TensorFlow 机器学习框架实现去功能。

你可以使用它自己构建训练模型,以增强语音转换到文本的效果,你还可以根据自己的需要引入其他语言,甚至可以轻松把它集成到TensorFlow上的其他机器学习项目中。唯一可惜的是,该项目目前默认情况下仅支持英语

项目地址:https://github.com/mozilla/DeepSpeech



推荐项目
Copyright © 2020 万物律动 旗下 AI算法狮 京ICP备20010037号-1
本站内容来源于网络开放内容的收集整理,并且仅供学习交流使用;
如有侵权,请联系删除相关内容;