k-NN graph construction based on Markov random walk
文件大小: 170k
源码售价: 10 个金币 积分规则     积分充值
资源说明:文章主要讨论了基于马尔可夫随机游走(Markov Random Walk, MRW)构建k-最近邻(k-Nearest Neighbors, k-NN)图的方法。k-NN图在图像检索、机器学习等研究领域有着广泛的应用,其核心在于选择可靠的邻居节点构建图。现有的方法在选择邻居时往往会遇到一些不可靠的邻居,而本文提出的基于MRW的方法能更有效地选择邻居,提高k-NN图的质量。 k-NN图是通过为数据集中每个样本选择k个最近邻来构建的,这可以帮助表示数据之间的关系。在很多情况下,相比于全图(每个节点都与其他节点相连),k-NN图能更好地反映数据之间的结构关系。不过,由于相邻两点之间的相似度比远离的两点之间的相似度更可靠,k-NN图的选择变得至关重要。 文章的引言部分强调了图在模式识别、图像检索和机器学习等领域的核心地位,特别是在流形学习中。全图是指一个加权图,每个顶点都与所有其他顶点相连,而边则由对应顶点之间的相似性或距离加权。然而,选择合适的k值,以及如何确定有效的邻居对于构建有效的k-NN图是至关重要的。 本文提出了一个高效的基于马尔可夫随机游走的方法,利用高阶转移概率反映数据间的复杂关系,从而选择更可靠的邻居节点构建k-NN图。由于高阶转移概率能够体现出数据的复杂关联,因此,与现有方法相比,本文方法得到的图中的邻居节点更加可靠。 高阶转移概率是马尔可夫过程中的一个概念,描述了在随机游走过程中,系统从一个状态经过多个步骤到达另一个状态的概率。在k-NN图中,每个样本的k个最近邻是根据MRW的概率来决定的。通过实验,作者比较了所提出的基于MRW方法与现有最先进方法构建的k-NN图的性能,并通过在合成数据集和真实数据集上进行了实验比较。结果表明,本文所提出的方法构建的图更好地对应了数据的结构。 在机器学习和数据挖掘中,k-NN图可以用于各种应用,包括分类、聚类和数据可视化等。通过改进k-NN图的构建方法,可以提升这些应用的性能。具体而言,本文通过定义在k-NN图上的MRW模型,可以更准确地评估样本间的相似度,以此决定邻居,最终提高模型的准确性和鲁棒性。 此外,文章还提到了谱聚类(spectral clustering)这个概念,谱聚类是一种基于图论的聚类算法,通过图的谱分解来进行数据的分组。虽然本文的重点在于k-NN图的构建,但谱聚类作为一个相关技术,有助于理解如何利用图的结构来改善数据的组织和分析。 文章提出的基于MRW的方法在选择k-NN图的邻居时考虑了数据间的复杂关系,从而提高所构建图的质量,这对于依赖k-NN图的各种数据挖掘和机器学习应用是非常有益的。通过实验验证,证明了该方法的有效性,并在结构对应性方面超越了现有的构建技术。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。