转载

发表于 2018年06月10日
浏览 (1,422)
评论 (0)

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

近日，阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型 DFSMN，将全球语音识别准确率纪录提高至 96.04%（这一数据测试基于世界最大的免费语音识别数据库 LibriSpeech）。

达摩院机器智能实验室的语音识别团队主导了这个模型的研发，并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的 LSTM 模型，DFSMN 模型训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了 3 倍，语音识别速度提高了 2 倍。

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

图：阿里在 GitHub 平台上开源了自主研发的 DFSMN 语音识别模型

在近期举行的云栖大会武汉峰会上，装有 DFSMN 语音识别模型的“AI 收银员”在与真人店员的 PK 中，在嘈杂环境下准确识别了用户的语音点单，在短短 49 秒内点了 34 杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家，西北工业大学教授谢磊表示：“阿里此次开源的 DFSMN 模型，在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和 AI 技术应用都有巨大影响。”有业内人士称，DFSMN 有望成为继传统的 LSTM 模型后，成为全球语音识别领域最主要的声学识别模型之一。

来自: 网易科技

扩展阅读

2017云栖大会展示互动现场吸引了400多家企业参加
量子计算、区块链、自动驾驶将如何影响世界？15位科学家出预测
深度盘点国内四大机器学习开源平台：PaddlePaddle,Angel
阿里云宣布开放开源AliSQL数据库性能可提升70%
阿里巴巴消息中间件RocketMQ正式成为Apache孵化项目

为您推荐

前端篇: 前端演进史
AlloyTeam：致我们终将组件化的 Web (多图)
利用HTML5与jQuery技术创建一个简单的自动表单完成
最全面的前端开发指南
10个最佳的HTML5代码段，以简化您的开发任务

更多

阿里达摩院
DFSMN
开源软件

正文到此结束

所属分类：开源软件

本文标签： 代码企业 MQ web 装备 HTML5 开源深度学习 apache 数据库 GitHub 语音识别免费云地铁数据开发科技开源软件阿里云 http 突破 jquery 软件 DDL 模型 https HTML src RocketMQ git sql 智能 lib id 测试阿里巴巴
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,964) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,243) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,046) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,946) 评论(0)
Decorators in ES7

浏览(16,562) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,536) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,980) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,895) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,042) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,195) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG