-
-
-
论文研究-一种基于扩展区域查询的密度聚类算法.pdf
针对DBSCAN算法中最小点数和最大邻域半径难以确定、算法时间开销大、对起始数据点的选择比较敏感,以及难以发现不同密度下的邻近簇等问题,提出一种基于扩展区域查询的密度聚类算法(GISN-DBSCAN)。该方法首先提出扩展区域查询算法,随后采用最近邻域和反最近邻域的邻域关系,建立每个点的k-影响空间域;最后提出一种异常点判定函数,使得算法能够准确地识别边界点和噪声点。实验结果表明,GISN-DBSCAN算法能够有效地解决DBSCAN算法的不足。
-
-
论文研究-一种基于密度的文本聚类挖掘算法.pdf
针对DBSCAN算法需用户设置参数值、易产生挖掘结果偏差等不足,提出改进算法DBTC(density-based text clustering),该算法不仅能够发现任意形状的簇,还有效地解决了基于密度的DBSCAN聚类算法在文本挖掘中参数设置困难和高密度的簇被相连的低密度簇包含的问题。理论分析和实验结果表明,算法是有效可行的。
-
论文研究-一种新的基于网格的聚类算法.pdf
新的基于网格的聚类算法(CABG)利用网格处理技术对数据进行了预处理,能根据数据分布情况动态计算每个单元格的半径,并成功地将网格预处理后所得单元格数据运用于其后的聚类分析中,从而简化了算法所需的初始参数。实验表明,CABG算法不仅具有DBSCAN算法准确挖掘各种形状的聚类和很好的噪声处理能力的优点,而且具有较高聚类速度以及对初始参数较低的敏感度。
-
论文研究-基于相对距离的密度聚类算法.pdf
首先介绍传统距离计算方法在聚类应用中的不足,并针对这点提出一种基于权重向量的相对距离计算方法。在应用DBSCAN算法的基础上,融入相对距离的计算及k-d树的范围查找的应用。该算法不仅能得到很好的聚类效果,而且消除了数据的度量单位对聚类结果的影响。
-
论文研究-基于时空因素聚类算法的研究与应用.pdf
为了发现移动对象的迁徙轨迹和经停地, 提出结合经停地检测算法和单链接聚类算法的方法。通过青海湖鸟类的历史位置信息验证该方法的准确性和有效性, 并与应用于本领域的其他方法进行分析比较, 如DBSCAN聚类算法、减聚类及模糊聚类算法。结果显示提出的方法能够克服对比算法仅考虑迁徙数据空间位置信息的缺点, 准确有效地挖掘出鸟类经停地和迁徙轨迹。
-
论文研究-基于多重特征的双层Web用户聚类方法.pdf
... 的收敛效率低、易受用户访问多样性影响的问题,提出了基于多重特征的双层用户聚类方法。该方法采用多重特征对用户相似性进行度量,并在此基础上进行双层聚类。采用基于密度的DBSCAN算法来排除用户会话中的离群对象和发现不规则簇,然后再采用自底向上的Hierarchical方法对第一层的聚类结果进行聚类。实验结果表明,该方法具有良好的稳定性和聚类效果。
-
-
Ruby-Rumale是Ruby语言的机器学习库类似于Python中的ScikitLearn
Rumale(Ruby机器学习)是Ruby中的机器学习库。 Rumale提供的机器学习算法的接口类似于Python中的Scikit-Learn。 Rumale支持线性/内核支持向量机,Logistic回归,线性回归,岭,套索,分解机,朴素贝叶斯,决策树,AdaBoost,梯度树增强,随机森林,额外树,K-最近邻分类器,K-Means ,DBSCAN,t-SNE,主成分分析和非负矩阵分解。
-