基于云计算MapReduce的并行关联规则算法改进研究

在线阅读 下载PDF 导出详情
摘要 关联规则是数据挖掘的重要方法之一,但传统的关联规则算法Apriori需要多次扫描数据库,需要很大的I/O开销,不能处理节点失效和负载均衡。云计算下的MapReduce模型能够处理节点失效并能做到负载均衡。将传统的关联规则算法Apriori进行改进,然后移植到Hadoop平台,提出了基于MapReduce编程的数据挖掘算法,它能高效的、并行的完成海量数据挖掘任务。通过实验验证了算法的有效性。
机构地区 不详
出版日期 2017年01月06日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献