转载

关于机器学习在网络安全中的五大误解

机器学习已经渗透到了人类活动的所有领域，它不仅在语音识别、手势识别、手写识别和图像识别上起着关键的作用，这些领域如果没有机器学习在现代医学、银行、生物信息和存在任何质量控制的行业中都是一个灾难。甚至机器没有学习和生成的能力，连天气预报都无法做出。但是此时我想澄清一些问题：关于机器学习在网络安全领域的使用中存在的一些误解。

误解一：网络安全中的机器学习是新鲜玩意

由于某种原因，在网络安全中的人工智能技术变成了过去流行的东西。如果你没有长期关注过这个主题，你可能会认为这是新的东西。

一些场景： 第一个机器学习算法，人工神经网络在上个世纪50年代就被发明了 。有趣的是，在当时人们都认为该算法将很快导致“强”人工智能的出现。即，智能的思考能力、独立思考并可以解决那些默认编程程式外任务的人工智能。可随后就是“弱”人工智能的时代，它可以解决一些创造性的任务，比如识别图片、预测天气、玩象棋等。六十年后，我们会对一些基本事实有更多的理解，那时真正的人工智能也许已经出现了，而我们现在提起的人工智能其实更准确的说是机器学习。

关于机器学习在网络安全中的五大误解

当谈到网络安全领域时，机器学习也不是什么新鲜事。这类算法在十年前左右就提出了，那时候新的恶意软件数量每两年翻一番。

但是简单的自动化对病毒分析师来说是不够的，它需要一个质的飞跃。这个飞跃出现在处理病毒家族样本时，可以用机器学习来搜索和已经判别完成的样本相似的文件。最终一个文件是否是恶意的以前要由人来判断，但是这个工作快速地转移给了机器。换句话说，在网络安全行业，机器学习没什么新奇的。

误解二：网络安全中的机器学习简单明了——一切都有现成的

在某些领域，机器学习有一些早就准备好的算法，这确实是事实。这些领域包括面部、情感识别或者从狗中区分猫。在这种情况下，通常是有一些人做了大量的思考、确定必要的标识、选取适当的数学工具、设置必要的计算资源然后公布他们的研究结果。现在，每个做这些工作的人都可以利用这些算法。

关于机器学习在网络安全中的五大误解

这导致了一个错误的印象，好像把恶意软件检出的算法也已经存在了。实际情况并非如此，我们在卡巴斯基实验室花了超过十年的时间来开发这项技术，并申请了许多专利。我们持续进行研究、提出新的想法也与下一个误解有关。

误解三：机器学习——做一次就够了

恶意软件检测和人脸识别在概念上的区别，脸永远是脸，在这方面永远也不会有什么改变 。在机器学习被应用的大多数领域中，目的不随时间变化，但是在恶意软件检出这个范畴内，事情在不断且快速地变化着。因为网络罪犯往往是高动机的人，为了钱、间谍活动、恐怖主义等。他们的智力不受人工的局限，他们积极出击、故意修改恶意程序好摆脱已有的成熟模型的检测。

这就是为什么这些模型需要不断学习、不断修正，甚至推倒从来。显然，面对快速变化的恶意软件，基于没有反病毒数据库模型的安全解决方案是毫无价值的。当必要的时候，网络犯罪分子可以以创造性的思考来应对。