转载

发表于 2016年01月09日
浏览 (765)
评论 (0)

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法

自组织映射神经网络，即Self Organizing Maps (SOM)，可以对数据进行无监督学习聚类。它的思想很简单，本质上是一种只有输入层--隐藏层的神经网络。隐藏层中的一个节点代表一个需要聚成的类。训练时采用“竞争学习”的方式，每个输入的样例在隐藏层中找到一个和它最匹配的节点，称为它的激活节点，也叫“winning neuron”。紧接着用随机梯度下降法更新激活节点的参数。同时，和激活节点临近的点也根据它们距离激活节点的远近而适当地更新参数。

所以，SOM的一个特点是，隐藏层的节点是有拓扑关系的。这个拓扑关系需要我们确定，如果想要一维的模型，那么隐藏节点依次连成一条线；如果想要二维的拓扑关系，那么就行成一个平面，如下图所示（也叫Kohonen Network）：

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法

既然隐藏层是有拓扑关系的，所以我们也可以说，SOM可以把任意维度的输入离散化到一维或者二维(更高维度的不常见)的离散空间上。 Computation layer里面的节点与Input layer的节点是全连接的。

拓扑关系确定后，开始计算过程，大体分成几个部分：

1）初始化：每个节点随机初始化自己的参数。每个节点的参数个数与Input的维度相同。

2）对于每一个输入数据，找到与它最相配的节点。假设输入时D维的，即 X={x_i, i=1,...,D}，那么判别函数可以为欧几里得距离：

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法

3) 找到激活节点I(x)之后，我们也希望更新和它临近的节点。令S_ij表示节点i和j之间的距离，对于I(x)临近的节点，分配给它们一个更新权重：

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法

简单地说，临近的节点根据距离的远近，更新程度要打折扣。

4）接着就是更新节点的参数了。按照梯度下降法更新：

Self Organizing Maps (SOM): 一种基于神经网络的聚类算法

迭代，直到收敛。

与K-Means的比较

同样是无监督的聚类方法，SOM与K-Means有什么不同呢？

（1）K-Means需要事先定下类的个数，也就是K的值。 SOM则不用，隐藏层中的某些节点可以没有任何输入数据属于它。所以，K-Means受初始化的影响要比较大。

（2）K-means为每个输入数据找到一个最相似的类后，只更新这个类的参数。SOM则会更新临近的节点。所以K-mean受noise data的影响比较大，SOM的准确性可能会比k-means低（因为也更新了临近节点）。

（3） SOM的可视化比较好。优雅的拓扑关系图。

正文到此结束

所属分类：编程技术

本文标签： 数据 UI map http src 参数组织空间
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,802) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,136) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(11,947) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,846) 评论(0)
Decorators in ES7

浏览(16,468) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,438) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,890) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,807) 评论(0)
【开班了】JAVA培训班正式招生

浏览(7,938) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,107) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG