简介:摘要:针对目前市场上已有的桌面文件整理软件不够智能化,不能根据文件文本信息进行分类的问题,根据文件的标题和文本内容,开发出了一款基于凝聚层次聚类和词袋模型 分类的智能化桌面文件整理软件。聚类算法适用于用户使用初期零散文件较多的情况,将散乱的桌面文件自动划分为不同的类别,并整理成对应的文件夹;分类算法适用于用户后期零散文件继续增加的情况,将各文件匹配到对应文件夹。实验结果表明,在短文本,且样本数量较少的情况下,上述算法能很好地对桌面文件进行类别的划分,聚类和分类的准确率分别达到了90%和86.77%。该软件能很好地解决桌面文件整理问题。
简介:介绍一些网络聚类算法及其基本原理,简述了其在生物信息学的应用。本文不是网络聚类算法的全面综述,只介绍这些网络聚类算法的基本思路,体会其数学建模的基本思想。
简介:摘要文章针对遥感图像的模糊聚类算法进行了研究。数字图像分类技术是数字图像处理技术中非常重要的一个内容。遥感图像固有的模糊性,对于遥感数字图像来说,尤其是中、低分辨率遥感图像,由于混合像元的影响使得分类结果并不是最优的,也就是说,传统的分类方法往往不能取得理想的分类效果。而应用软分类算法原理,采用模糊聚类方法进行遥感图像的非监督分类是解决这种分类模糊性的主要方法之一。文章研究模糊聚类中的模糊C均值聚类算法,并通过计算机程序来实现算法,从而达到对遥感图像非监督分类的目的。此算法与人工判读分类相比,提高遥感图像非监督分类的速度和效率,节省了人力和物力。
简介:云计算中的群集计算应用程序(例如MapReduce和面向用户的应用程序)具有应用程序级别的需求,因此需要有高级别的抽象来表示这些应用程序的需求.协流(coflow)是一个网络级别的抽象,用来表达数据并行编程范例的通信要求.协流使应用程序更容易地将其通信语义传达给网络,从而使网络能够优化常见的通信模式.然而,现有的协流识别方案依赖于修改应用程序,并不适用于多数实际场景.提出了基于增量聚类的协流识别策略,采用增量聚类算法来执行快速、透明的协流识别,实现了协流识别的自动化,同时无需对应用进行修改.仿真实验结果显示,本文的识别算法具有超过90%的准确率,具有一定的鲁棒性.