对于任何值得加以认真对待的云方案,其都需要满足用户对于功能的不断追求。机器学习显然应该被列入这份需求清单当中,而各大云服务供应商如今也已经拿出了自己的答卷。
不过其具体实现方式则又是另一码事了。除了“设计API对开放式算法市场”模型,市面上还存在着“涵盖一切对够用就好”这类衍生方案。下面我们将一同了解四大云服务供应商——IBM、微软、谷歌与Amazon——如何各自实现机器学习技术。
自当初IBM公司宣布将其沃森AI系统转化为可消费服务以来,相关问题可谓越来越多。它会以怎样的形式体现?客户如何对其进行消费?不过最重要的仍然是,此举能给IBM的云巨头发展之路带来怎样的影响?
经历了两年的时光与变迁,如今IBM公司已经在其Bluemix PaaS之上推出了一整套机器学习服务组合,具体包括天气预报、语言分析系统、图像识别、语言翻译以及情绪与语调分析等等。
在全部立足于云环境交付某种形式的机器智能方案的厂商当中,IBM公司拥有最为可观的发展野心。更重要的是,蓝色巨人也一直在努力让这项高科技成果更接地气,而其具体体现就是分析与报告机制。(正处于发展中的沃森似乎还在通过一系列战略性收购冲击其它领域:气候、医疗卫生以及更多层面。)
目前的问题并不在于沃森服务是否能够找到合适的起效平台——假以时日,相信答案会是肯定的——而在于这些服务能否在特定领域取得良好进展,并帮助IBM找到合适的投入节奏。目前大部分此类服务选项都需要慢慢找到适合自己的用例,而IBM方面亦认为Spark服务(或者其最新推出的仿AWS Lambda服务,OpenWhisk)更容易赚钱。
某些企业已经开始将沃森分析服务以创造性方式引入业务。不过尽管IBM公司明确表示其有信心将沃森发展为一项年价值100亿美元的业务,但摆在其面前的发展道路仍然非常漫长——漫长到令这项营收目标显得有些遥不可及。
正如IBM拥有沃森,微软拥有Oxford项目——这是一整套经过精心设计的高级API组合,涵盖机器视觉、语音识别与语言分析。这份API清单并不像沃森那样广泛得夸张,但微软提出的既定目标却与蓝色巨人基本一致:构建一套精心设计的API,旨在充分发掘机器学习的潜能。
Azure Machine Learning Studio可能是目前微软机器学习发展计划中最为重要的组成部分。在这里,人们能够导入自己的数据、以此为基础训练机器学习模型,而后将得到的模型作为API通过REST接口进行共享。IBM公司在自家Bluemix上的预测性分析服务中也提供类似的功能,不过微软的Studio存在时间更长且表现得更具泛用性。
IBM与微软双方正在努力构建两种不同风格的机器学习服务。一种风格在于位居幕后悄悄鼓捣,并主要使用经过规划的数据集与经过调整的行为(沃森API、Oxford项目),另一种风格则作为通用型平台,允许各类机器学习服务以此为基础实现构建、共享甚至是商业化(Azure Machine Learning Studio与预测性分析服务)。
不过微软与IBM之间的最大区别并不在于服务,而在于动机。微软公司只是希望通过云业务反哺自己的其它业务类型——例如游戏业务——这意味着其并不像IBM那样面临着生存压力。不过这并不是说微软正盲目地迈出自己的机器学习发展步伐。
如果非要给谷歌与Amazon的云方案总结出一种指导方针,那就是“少即是多”。也许更准确的说法应该是“够用就好”,这一点自然也体现在了两家企业在所提供的云机器学习服务身上。
在谷歌方面,谷歌Cloud Platform目前只提供两项机器学习类服务:谷歌翻译(一套API,支持谷歌的现有机器翻译引擎)以及谷歌预测API。前者是由谷歌完全掌控的内部API。而后者尽管名号不响,但却属于一项广泛的包容性服务,允许用户以等同于Azure Machine Learning Studio的方式上传数据与训练模型。(数据可以导出自各类谷歌现有服务,例如谷歌BigQuery。)
Amazon Machine Learning与谷歌预测API在模型层面上非常相似,可根据数据实现训练并被用于预测方向。这是一项经过刻意简化的服务,这可能是为了面向只希望解决具体特定问题的开发人员,或者是因为Amazon希望首先进行市场试水。
对于Amazon与谷歌来说,双方的目标在于引导开发人员尽可能简化需求定义,并利用已经存在于其云环境中的数据——也就是“够用就好”模式。IBM与微软则拥有更为远大的目标,其中IBM的野心最大,当然一旦失败也将面临最为惨重的损失。
原文标题: How IBM, Google, Microsoft, and Amazon do machine learning in the cloud
【51CTO.com独家译稿,合作站点转载请注明来源】