转载

发表于 2017年12月03日
浏览 (850)
评论 (0)

Mozilla开源音频数据库已成为第二大公开语音数据集

Mozilla 的开源音频数据库 Common Voice 已收集了来自 20,000 个人的近 40 万个录音，整体时间已超过 500 个小时，据称这是公开发布的第二大语音数据集。

Common Voice 是 Mozilla 今年 7 月推出的一个大型公共数据集，并已开源。它允许用户通过 iOS 应用或网站捐赠他们的话语，提交他们自己阅读特定句子的简短音频记录。

Mozilla开源音频数据库已成为第二大公开语音数据集

Mozilla 新兴技术高级副总裁肖恩·怀特（Sean White）在一篇博客文章中曾表示，“商业上可用的语言服务很少的一个原因是缺乏数据。当我们开始打造语音识别系统时，我们发现我们可以在已有算法的基础上工作，并在算法方面进行一些创新。但是要想让语音识别系统真正起作用，数据的策划，创建和聚合是一个绕不开的挑战，如果你想做一个新的语音识别系统，你无法找到一个现成的高质量音频数据集。” 目前，Common Voice 收集的重点是英文，计划在 2018 年上半年将其扩展到其他语言。

Mozilla开源音频数据库已成为第二大公开语音数据集

扩展阅读

通过WebRTC实现实时视频通信（一）
开源软件及国内发展现状
开源社区自己从来不想承认的九大事实
年度最佳硬件、软件、开发工具和云服务
改用 Linux 之后，那酸爽超出了我的想象

为您推荐

最全面的前端开发指南
10个最佳的HTML5代码段，以简化您的开发任务
AlloyTeam：致我们终将组件化的 Web (多图)
5个实用的CSS代码开发片段
关于Chrome的那些小技巧

更多

Mozilla
开源软件

正文到此结束

所属分类：开源软件

本文标签： CSS 语音识别 IO web 数据开发 IOS 云开源软件软件文章 linux Chrome 网站 HTML 博客数据库时间 http https 代码 src 质量 HTML5 开源 id db
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,972) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,246) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,049) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,949) 评论(0)
Decorators in ES7

浏览(16,567) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,539) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,984) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,899) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,046) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,199) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG