云计算环境下基于MapReduce的并行化排列熵算法

(整期优先)网络出版时间:2019-01-11
/ 1
针对工业监测数据在特征提取环节需要处理的数据集越来越大、实效性要求越来越高的问题,设计了一种在云计算平台MaxCompute环境下并行化的排列熵(PermutationEntropy,PE)算法。采用MaxCompute表存储海量的监测数据,基于MaxCompute扩展MapReduce模型设计了并行化排列熵算法,用于海量监测历史数据的批量排列熵特征提取。通过在单机和云计算平台环境下测试,算法具有良好的可扩展性,并可以适应大规模数据集,算法性能与数据量成线性关系。