Amazon公司的 Werner Vogels 于上周宣布Amazon深度学习框架将会 正式 选用 MXNet ,并且AWS将会通过增加源代码贡献、改进文档以及支持来自其它框架的可视化、开发以及迁移工具,为实现MXNet成功的长远目标做出贡献。
Vogles指出在欺诈检测、推荐流水线、库存和产品检查审计等领域,有一系列无法通过编写显式算法实现的计算任务,对此问题一类被称为 深度学习 的 机器学习 方法正日益发挥重要作用,此外,在内容搜索、自主无人机、订单履行中心机器人、文本及语音识别等领域中也广泛地使用了机器学习方法。Vogels给出了Amazon在深度学习框架选取中所考虑的三个因素,即扩展能力、开发速度及可移植性。
深度学习程序库 Caffe 、 CNTK 、MXNet、 TensorFlow 、 Theano 和 Torch 都得到了Amazon的评估,并且被AWS所支持。现在AWS选定了MXNet作为可扩展框架,并号召开源社区为MXNet投入更多的努力。在机器学习平台服务的开发上,AWS所采取的方法将会如同在RDS中一样,并且:
“我们将通过提供最好的EC2实例组及适用的软件工具,支持深度学习框架领域中所有广受欢迎的深度学习框架。”
Vogels提到了今年初发布的深度学习 AMI 及附带的云信息 模板 。AMI工具集是一种64位的Amazon Linux发布版,其中预装了对CNTK的支持,以及针对MXNet、 Graphviz 、 pygal 和Pythonpandas的更新包。该发布版中预置了六种深度学习架构,分别是NXNet、Caffe、TensorFlow、Theano、Torch和CNTK。AMI中还包括NVIDIA CUDA Toolkit 和 cuDNN 库安装程序、 Anaconda 、Python 2 和 3 。评论表明这仍是第一代的AMI,它已经可为开始使用GPU架构的分析工程师提供良好的工作基础。
MXNet最初是由 华盛顿大学 和卡内基梅隆大学( CMU )开发,用于支持卷积神经网络( CNN )和长短期记忆网络( LSTM )运算。CMU计算机科学系主任Andrew Moore指出:
MXNet诞生于CMU,并在CMU发展壮大。它是我目前所见到的最具扩展性的深度学习框架,也是计算机科学领域辉煌研究的代表性成果。多个不同学科交汇于其中并共同协作,实现将线性代数创造性地引入大规模分布式计算中,从而引领了深度学习的全新局面。我们很高兴看到Amazon对MXNet的投入,并迫切期待MXNet能不断地走向强大。
CMU在MXNet上训练了Inception V3算法。训练运行在一个P2实例的集群上,并逐步增添了GPU数目。在运行多至1000层的深度网络时,MXNet仅占用了低至4GB的内存。MXNet支持多种语言的API接口,包括Python、C++(并支持在Android和iOS上编译)、R、Scala、Julia、Matlab和JavaScript。
查看英文原文: Amazon Announces MXNet as Deep Learning Framework of Choice at AWS
感谢冬雨对本文的审校。
给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们。