Self-Organizing Maps,简称 SOM

简介: 自组织映射(Self-Organizing Maps,简称 SOM)是一种用于降维和可视化高维数据的机器学习算法。它是一种人工神经网络,通过模拟人脑对信号处理的特点,将高维数据映射到低维空间,同时保持数据的拓扑结构。SOM 常用于聚类、分类和异常检测等任务。

自组织映射(Self-Organizing Maps,简称 SOM)是一种用于降维和可视化高维数据的机器学习算法。它是一种人工神经网络,通过模拟人脑对信号处理的特点,将高维数据映射到低维空间,同时保持数据的拓扑结构。SOM 常用于聚类、分类和异常检测等任务。
SOM 主要包括以下几个步骤:

  1. 初始化:随机设置输入层和输出层的权重,权重向量表示神经元对输入特征的响应。
  2. 训练:对于每个训练样本,计算输入层到输出层的权重更新值,使得相似的样本在输出层靠近彼此。这一过程通过竞争学习(competitive learning)完成,即寻找最优参考矢量集合来对输入模式集合进行分类。
  3. 更新:更新输出层神经元的权重,使得相似的样本在输出层靠近彼此,同时保持拓扑结构不变。
    SOM 的应用场景包括:
  4. 数据降维:将高维数据映射到低维空间,便于可视化和分析。
  5. 聚类:将相似的数据点映射到输出层中的相邻位置,形成聚类。
  6. 分类:通过映射后的低维数据进行分类任务。
  7. 异常检测:将正常数据映射到输出层的某个区域,异常数据则被映射到远离正常数据的区域。
    下面是一个简单的 SOM Demo:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

加载数据集

iris = load_iris()
X = iris.data
y = iris.target

数据预处理

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

创建 SOM 模型

som = somoclu.SOM(n_components=2, learning_rate=0.01, n_iter=1000)

训练模型

som.fit(X_train)

绘制结果

fig, ax = plt.subplots(figsize=(10, 8))
ax.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap='viridis')
ax.scatter(X_test[:, 0], X_test[:, 1], c=y_test, cmap='viridis', alpha=0.5)
ax.set_title('SOM')
plt.show()
CopyCopy

在这个示例中,我们使用了 Iris 数据集,首先对数据进行预处理,然后创建一个 SOM 模型,训练模型并将结果可视化。

目录
相关文章
|
3月前
|
存储 算法 计算机视觉
【博士每天一篇文献-模型】Meta-Learning Based Tasks Similarity Representation for Cross Domain Lifelong Learning
本文提出了一种基于元学习的跨域终身学习框架,通过跨域三元组网络(CDTN)学习任务间的相似性表示,并结合自注意模块与软注意网络(SAN)来增强特征提取和任务权重分配,以提高学习效率并减少对先前知识的遗忘。
47 1
【博士每天一篇文献-模型】Meta-Learning Based Tasks Similarity Representation for Cross Domain Lifelong Learning
|
3月前
|
移动开发 算法 数据挖掘
【博士每天一篇文献-算法】Extending stability through hierarchical clusters in Echo State Networks
本文研究了在回声状态网络(ESN)中引入分层聚类结构对网络稳定性的影响,发现通过调整簇内和簇间的连接性及每个簇的主干单元数量,可以扩展谱半径的稳定范围,从而提高网络的稳定性和性能。
35 2
|
3月前
|
算法 前端开发 数据可视化
【博士每天一篇文献-综述】Brain network communication_ concepts, models and applications
本文综述了脑网络通信的概念、模型和应用,将脑网络通信模型分为扩散过程、参数模型和路由协议三大类,并探讨了这些模型在理解大脑功能、健康和疾病方面的应用,同时提出了未来研究方向和使用Brain Connectivity Toolbox等工具箱进行实际研究的指导。
39 1
【博士每天一篇文献-综述】Brain network communication_ concepts, models and applications
|
3月前
|
机器学习/深度学习 算法 数据挖掘
【博士每天一篇文献-模型】Investigating Echo State Network Performance with Biologically-Inspired Hierarchical
本文研究了一种受果蝇生物启发的分层网络结构在回声状态网络(ESN)中的应用,通过引入层次随机块模型(HSBM)来生成具有更好结构性的网络拓扑,发现这种新拓扑结构的网络在Mackey-Glass系统预测和MNIST分类任务中表现出改善的整体解分布,从而提高了ESN的性能。
25 2
|
机器学习/深度学习 数据采集 数据可视化
自组织映射(Self-Organizing Map, SOM
自组织映射(Self-Organizing Map, SOM)是一种聚类方法,它属于非线性降维技术。SOM 的主要思想是将原始数据映射到一个较低维的子空间,同时保持数据之间的原始结构和关系。SOM 的特点是可视化程度较高,可以直观地展示数据中的簇结构和关联关系。
251 1
|
机器学习/深度学习 资源调度 算法
自组织图(Self-Organizing Map,SOM)
自组织图(Self-Organizing Map,SOM),也称为Kohonen网络,是一种无监督学习算法,用于将高维输入数据映射到低维的拓扑结构中。它主要用于数据的聚类、可视化和特征提取。
231 1
|
机器学习/深度学习 人工智能 自然语言处理
【论文精读】AAAI 2022 - Unified Named Entity Recognition as Word-Word Relation Classification
到目前为止,命名实体识别(NER)已经涉及三种主要类型,包括扁平、重叠(又名嵌套)和不连续NER,它们大多是单独研究的。
231 0
【论文精读】AAAI 2022 - Unified Named Entity Recognition as Word-Word Relation Classification
|
机器学习/深度学习 自然语言处理 算法
【论文精读】COLING 2022 -Event Detection with Dual Relational Graph Attention Networks
图神经网络(Scarselli et al, 2009)已被广泛用于编码事件检测的依赖树,因为它们可以基于信息聚合方案有效地捕获相关信息(Cao et al, 2021)。
167 0
PointNet++:Deep Hierarchical Feature Learning on Points Sets in a Metrci Space 学习笔记
PointNet++:Deep Hierarchical Feature Learning on Points Sets in a Metrci Space 学习笔记
79 0
|
机器学习/深度学习 存储 自然语言处理
Bi-SimCut: A Simple Strategy for Boosting Neural Machine Translation 论文笔记
Bi-SimCut: A Simple Strategy for Boosting Neural Machine Translation 论文笔记