大家好!我是John Platt,我在微软创建和使用机器学习(简称ML)算法已经17年了。最近这几年机器学习开始受到广泛关注,所以人们经常问我:“什么是机器学习?你们用机器学习来做什么?”
我非常乐意回答这些问题,因为事实证明,机器学习的使用已经广泛存在于微软的大量产品中——这些产品使微软变成一个做机器学习的有趣的和有影响力的地方(简直就像一个孩子走进了糖果店)。
一般来讲,机器学习能够将数据集转换成被称为“模型”的软件,这些模型可以代表数据集并且推广到新的数据从而进行预测。由于机器学习的广泛使用,我觉得有必要把它进行一个粗糙的分类。人们会在三种情况下使用机器学习:
1、数据挖掘 :机器学习可以帮助人们从大型数据库里得到深刻的见解。
2、统计工程 : 机器学习可以用来把数据转换成对不确定数据做决定的软件。
3、人工智能 : 机器学习可以用来模拟人类的思维,来创造可以看到,听到和理解人的计算机。
在微软,上述机器学习的这三个目标都有被实现。例如:
打击恶意软件
与微软研究院合作的微软恶意软件保护中心已经利用机器学习创建了软件来自动检测恶意软件,并帮助分析师了解了恶意软件的开发。你可以从Dennis Batchelder博客里了解到更多关于这方面的内容。
建立一个搜索引擎
微软的必应搜索引擎是一个非常复杂的系统,这个系统可以解释你的查询,搜索网页和返回对你有用的信息。正因为必应引擎有这么高的信息量,所以必须使用自动的决策制定系统来处理自然语言的不确定性和歧义性。我们已经用机器学习创建了许多必应引擎的插件,这些插件一起工作的时候可以形成一个高质量的搜索引擎。机器学习对于搜索的一个特别的有用之处是排序:几年前,一个来自微软研究院的队伍利用我们开发的算法赢得了学习排序的比赛。
使计算机能够看到和听到
微软一直在推动技术在计算机视觉和语音识别领域的发展。Kinect里识别手势的软件是由机器学习开发的。微软的语音识别系统是基于深度学习的,也是机器学习的一种受到大脑结构的启迪而形成的模型。此外,我们还使用机器学习创造了一个实时语音翻译机。
看着这些令人兴奋的应用,我意识到现在正是机器学习的黄金时间。许多研究人员和开发者在这些年里一直稳定地使用这些应用。因为摩尔定律和互联网,我们现在有足够的标记数据和计算使得机器学习创造卓越的软件。我期待着为其他开发者提供我们的算法和工具,使他们能用他们的创造力来创造他们自己的引人注目的应用。
在下一篇文章中,我将谈论过去20年机器学习在微软的发展。我很期待有机会通过博客与读者进行互动!
John Platt
本原文由微软研究院提供,授权译言进行翻译,非商业转载请注明译者、来源,未经许可不得商业使用。