基于Sollin算法的快速聚类研究

在线阅读 下载PDF 导出详情
摘要 文本聚类技术作为处理和组织大量文本数据的一项重要技术,能够在很大程度上解决由于信息爆炸所带来的问题。Sollin算法是构建最小生成树的典型算法,与Kruskal算法和Prim算法相比,具有容易实现并行运算的特点。因此,利用基于Sollin的快速层次聚类算法在复旦语料和搜狗语料上进行聚类实验,结果表明基于Sollin的快速层次聚类算法在运行效率和聚类质量上都优于传统层次聚类算法。
作者 刘欢
机构地区 不详
出处 《船舶职业教育》 2015年1期
出版日期 2015年01月11日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献