什么是学习向量量化?

K邻近算法的缺点是你需要坚持整个训练数据集。学习向量量化算法(或简称LVQ)是一种人工神经网络算法,允许您选择要挂起的训练实例数量,并准确了解这些实例应该是什么样子。

学习矢量量化算法(简称LVQ)
学习矢量量化算法(简称LVQ)

LVQ的表示是码本向量的集合。这些是在开始时随机选择的,并且适于在学习算法的多次迭代中最佳地总结训练数据集。在学习之后,可以使用码本向量来进行与K-Nearest Neighbors类似的预测。通过计算每个码本矢量和新数据实例之间的距离来找到最相似的邻居(最佳匹配码本矢量)。然后返回最佳匹配单元的类值或(回归情况下的实际值)作为预测。如果将数据重新缩放到相同范围(例如0到1之间),则可获得最佳结果。

如果您发现KNN在您的数据集上提供了良好的结果,请尝试使用LVQ来降低存储整个训练数据集的内存要求。

 

百度百科版本

学习向量量化(Learning Vector Quantization,简称LVQ)属于原型聚类,即试图找到一组原型向量来聚类,每个原型向量代表一个簇,将空间划分为若干个簇,从而对于任意的样本,可以将它划入到它距离最近的簇中,不同的是LVQ假设数据样本带有类别标记,因此可以利用这些类别标记来辅助聚类。

查看详情

 

维基百科版本

LVQ可以被理解为人工神经网络的一个特例,更确切地说,它应用了一种赢家通吃的 Hebbian学习方法。它是自组织图(SOM)的前体,与神经气体有关,也与k-最近邻算法(k-NN)有关。LVQ由Teuvo Kohonen发明。

查看详情