声明:工作以来主要从事TTS工作,工程算法都有涉及,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 低调奋进 TTS 开源数据 低调奋进。如转载,请标明出处。
欢迎关注微信公众号:低调奋进
目录
1 标贝
2 希尔贝壳
3 DiDiSpeech
4 LJ speech Dataset
5 VCTK
6 LibriTTS
7 CSS10
8 Hi-Fi TTS
语音合成系统的训练需要大量高质量精标语料库,这给很多研究人员带来诸多不便。本篇文章主旨为整理目前开源的语音语料,便于相关从业者使用。首先,我们需要为这些为开源数据做贡献的个人、公司或者组织表达敬意,有了这些开源的数据,才能促进语音合成的发展。
我把个人搜集的语音合成、语音识别和噪声数据整理到个人的网站,有兴趣的研究者可以搜藏 低调奋进
本文章对开源的语音合成数据的选取的标准:音频的质量较高,语料库包含音频和对应的标注信息文件。
标贝(北京)科技有限公司(简称“标贝科技”)是一家专注智能语音交互和AI数据服务的人工智能公司,为AI领域提供各种高质量的训练语料和技术方案。标贝开源了一万句的女生音库,详细信息如下:
数据内容:中文标准女声语音库数据
录音语料:综合语料样本量;音节音子的数量、类型、音调、音连以及韵律等进行覆盖。
有效时长:约12小时
平均字数:16字
语言类型:标准普通话
发音人:女;20-30岁;声音积极知性
录音环境:声音采集环境为专业录音棚环境:1)录音棚符合专业音库录制标准;2)录音环境和设备自始至终保持不变;3)录音环境的信噪比不低于35dB。
录制工具:专业录音设备及录音软件
以上就是本篇文章【语音合成(speech synthesis)方向四:开源中文和英文训练语料库open speech corpus】的全部内容了,欢迎阅览 ! 文章地址:http://dh99988.xhstdz.com/news/4438.html
栏目首页
相关文章
动态
同类文章
热门文章
网站地图
返回首页 物流园资讯移动站 http://dh99988.xhstdz.com/mobile/ , 查看更多