density weighted support data description.pdf - 源码 - 源码 - 免费下载

density weighted support data description.pdf

文件大小： 816k

源码售价： 10 个金币积分规则积分充值

资源说明：Cha, M., J. S. Kim, and J.-G. Baek (2014). “Density weighted support vector data description,” Expert Systems with Applications, 41, 3343 – 3350. 在机器学习领域，单类分类（One-Class Classification, OCC）是一种重要的学习方法，特别是在只有一类数据可用的情况下，目标是构建一个模型来描述这单一类别，以便有效地识别异常或非目标数据。支持向量数据描述（Support Vector Data Description, SVDD）就是一种流行的OCC方法，它利用核技巧（Kernel Trick）将数据映射到高维空间，并找到一个最能概括目标数据的球形边界。然而，原始的SVDD方法仅考虑了数据点与球形描述之间的基于核的距离，而忽略了数据的密度分布，可能导致高密度区域的数据点未被包含在内，从而影响分类性能。为了解决这个问题，研究人员提出了密度加权支持向量数据描述（Density Weighted Support Vector Data Description, DW-SVDD）。这个方法引入了密度权重的概念，即每个数据点相对于目标数据集的相对密度，这可以通过k-最近邻（k-Nearest Neighbor, k-NN）方法来估计。通过将这些新的权重纳入到SVDD的优化描述搜索过程中，DW-SVDD会优先考虑高密度区域的数据点，使最优描述边界更加倾向于这些区域。这样做可以增强对高密度区域的覆盖率，从而提高分类的准确性和鲁棒性。具体来说，DW-SVDD的工作流程如下： 1. 计算目标数据集中的每个数据点的相对密度，这通常通过k-NN方法实现。每个点的密度是其k个最近邻的平均距离的倒数。 2. 然后，使用这些密度权重调整SVDD的目标函数，使得高密度区域的数据点在构建描述边界时具有更大的影响力。 3. 在高维空间中，通过优化过程寻找一个新的描述边界，该边界不仅考虑距离，还考虑了数据的密度，使得高密度区域的数据点更可能被包含在内。 4. 最终，得到的描述边界能够更好地代表目标类别的主要特征，对异常检测和分类任务的性能有所提升。实验结果表明，使用DW-SVDD在各种UCI数据集上表现出优于原始SVDD的性能，证实了密度权重对于改进单类分类边界描述的有效性。 DW-SVDD是单类分类领域的一个创新，通过结合数据的密度信息，增强了支持向量数据描述的能力，提高了在没有反例的情况下识别异常的能力。这种方法特别适用于那些数据分布不均匀或者异常检测场景，如网络入侵检测、故障诊断等。

部分文件列表（点击文件名可查看文件内容）

					
									本源码包内暂不包含可直接显示的源代码文件，请下载源码包。