语音数据集Common Voice用你的声音为公益项目作出共享,现有的人工智能很大的一个方向性就是进行学习,通过不断的接触到新的内容让人工智能能够运用到更多的场景当中,这个公共的数据集能够让全球的用户免费的实用,如果你也想做出属于你的一份贡献的话就快来下载这款语音数据集Common Voice!
语音数据集Common Voice介绍
这不是Common Voice的官方应用。由Saverio Morelli开发
软件功能
-用户界面(UI)简洁,清晰,现代
-登录到您的Common Voice帐户
-验证剪辑
-记录句子
-在相关部分中报告句子/剪辑
-支持多国语言
-离线模式(继续当您不连接到Internet时也要做出贡献!)
-常用语音统计信息(所选语言)
-杰出贡献者(所选语言)
-应用程序统计信息(匿名)
-在线语音(所选语言)
-深色主题支持
-每日目标
-手势
-应用体验可在“设置”中完全自定义
相关介绍
Common Voice是Mozilla的一项倡议,旨在帮助教会机器真实的人们如何说话。
声音是自然的,声音是人的。这就是为什么我们为为机器创造可用的语音技术而感到兴奋。但是,要创建语音系统,开发人员需要大量的语音数据。
大公司无法使用大多数人的大多数数据。我们认为这扼杀了创新。因此,我们启动了Common Voice,这是一个旨在使所有人都能打开并访问语音识别的项目。
现在,您可以捐赠自己的声音,以帮助我们建立一个开放源代码的语音数据库,任何人都可以使用该数据库为设备和网络制作创新的应用程序。读一句话,以帮助机器学习真实的人怎么说。检查其他贡献者的工作以提高质量。就这么简单!
开发背景
该应用程序是专为智能手机开发的,因此它是本机的。它具有网站不提供的许多功能,例如深色主题,脱机模式,自定义,手势等。
该应用程序比网站更轻巧,没有令人讨厌的动画(并且该应用程序中的动画也可以在“设置”中停止)。
此外,该网站存在许多错误,尤其是针对移动版本的错误,因此您无法正确完成所有操作。
相关新闻
让人工智能的声音更加的贴近于人声而不是那种非常不自然的合成音!
Mozilla发布了可供使用的最大人类语音数据集,包括18种不同的语言,累计记录了超过42,000多名贡献者的近1,400小时的语音数据。
从一开始,我们对Common Voice的愿景就是构建世界上最多样化的语音数据集,为构建语音技术进行优化。我们还做出了开放的承诺:向初创公司、研究人员以及对语音技术感兴趣的任何人公开我们收集到的高质量语音数据。
今天,我们很高兴与大家分享我们的第一个多语种数据集,其中包含18种语言。包括英语、法语、德语和普通话(繁体),以及威尔士语和卡比尔语。总的来说,新的数据集囊括了超过42000人的大约1400个小时的语音片段。
中文名:Common Voice
包名:org.commonvoice.saverio
MD5值:493a77cdd9ec1fb4fcbd8993644d2f5b