基于MapReduce的大规模数据挖掘技术研究-中国期刊网

首页 > 《科技新时代》 > 2019年8期 > 基于MapReduce的大规模数据挖掘技术研究

（整期优先）网络出版时间：2019-08-18

作者: 袁广南，罗金满

医药卫生 >

打印

同系列资源

/ 2

基于MapReduce的大规模数据挖掘技术研究

袁广南，罗金满

广东电网有限责任公司东莞供电局

摘要：网络信息技术快速发展模式下，依照信息共享平台，实施MapReduce大规模的数据算法分析，通过高效的数据挖掘，对计算机系统中的规模数据进行提升。根据计算机综合信息应用，对数据规模进行结构化分析，判断MapReduce大规模数据分析下，相关数据的挖掘应用。通过生物信息、网路信息、媒体数据组合模式，以图例、音频、视频等模式进行数据分布，判断大数据背景下的综合数据高维思路，结合数据的综合合适分布操作模式，加强数据计算机的分布模式应用分析。

关键词：MapReduce；数据挖掘；技术分析

引言

MapReduce是以计算机大规模数据挖掘为前提，通过云计算机分布实现的综合机构平台的应用。按照相关编程，对函数进行拓展，分析相关云计算平台上的各类数据的叠加通信情况。MapReduce模型通过数据的集中操作，对图数据进行处理应用，获取有效的扩展增容效果。按照大规模的挖掘模式，对MapReduce模型进行图数据分析，实现有效的数据挖掘，解决网路哦数据信息、计算机信息、社会网络平台下的相关数据内容。

一MapReduce模型和支配图

MapReduce编程模型中，需要以数据挖掘算法为基础，通过MapReduce模型完成扩展，其中包含对MapReduce模型的支配分析，索引分析，提出局限的标号传播、分析大规模图的具体划分。按照数据传播分析提出局部算法，对其进行规模引导。通过局部敏感函数的数据分配，获取有效的数据精度。按照数据精度函数，通过计算机的增减操作，按照相关K值进行分析，确定不断提升运行效果的中心质量模式，满足当下运行操作的基础效率。

MapReduce通过与云计算的模式，实现分布式计算机、数据维多计算机虚拟资源的兔展。按照多量数据分析，通过网络访问可以完成网络、服务器、数据库、存储、应用、服务等信息过程。以最小的管理结构模式标准，以较小的数据挖掘分析过程，判断MapReduce编程条件下的索引范围。通过集中数据计算的标准概念，结合计算机进行集密的应用，从而获取充分利用数据的并行关系。

图MapReduce与云计算流程模式

1数据图的挖掘与分析

依照计算机应用数据规模，调整大规模图例下的应用。按照生物信息领域的基因模式进行网络作用分析，获取大规模的网络信息数据内容。通过计算机数据结构，可以实现对数据交通、传播、文献、信息等关系的引入。通过MapReduce完成预期数据的互联网操作下的数据挖掘。数据挖掘过程中需要重点分析具体的几方面内容。通过对数据的图形耦合性进行计算及分析，依照数据图预制计算的独立关系，按照各个子图之间的计算标准。依照相似度、频繁模式进行挖掘，判断全局特性下的数据分发情况。通过大量数据的传输，准确的分析其分布计算的优势。数据规模大、算法次序多，可能导致数据执行时间长。在MapReduce大规模数据分析中，依照数据之间的相关系，数据运行算法、数据量、目标值等进行云平台的计算分析。按照相关检索、查询效果，判断相关图数据的操作，明确实际MapReduce特点，获取图数据的处理技术标准。通过大规模数据挖掘，对分子图进行分割操作，确定分子图的计算模式，确保子图之间的关系。

传统图算法主要以内存算法为基础，而MapReduce算法是利用大数据集成的云平台设计模式，通过大规模的内存数据挖掘，将MapReduce与之模型联系结合起来，构建MapReduce数据图挖掘的索引模式，从而提升计算机的整体性能。索引中包含数据库、树形结构、位图、索引图等。充分利用索引图，分析具体的数据查询效率，访问分析数据占有的原始数据标准，通过分析其规模，从中获取有效的底层分布文件系统。

2MapReduce挖掘上的数据问题

MapReduce在数据挖掘上，需要重视数据计算的替换操作。根据挖掘数据问题进行集中数据的对比分析，判断挖掘问题下的数据集中过程。如果没有索引，需要对数据进行多方面分析判断。MapReduce中包含一定的缺陷性问题，依照k-means算法，依照海量高维数据问题，实施中心多叠加代算法分析，从中获取直观的批量数据处理操作。通过集合点的分析，判断海量数据信息内容，确保可以接受的数据集合点。

对于海量的数据，需要通过描绘数据，按照数据聚合的多类别进行区分。依照数据集中分析，判断K值标准中心意识表示，分析计算价值下的消耗资源比例关系。在MapReduce条件下，分析高维数据下的K值情况，减少不必要的数据分析。

二MapReduce数据模型

MapReduce数据通过多项叠加操作，分析数据的局限性。通过改变局部叠加模式，对数据局部性进行多项重组，完成数据的综合性应用。

图MapReduce数据流程图

1MapReduce数据叠加模式的适用分析

MapReduce叠加按照数据分片操作，通过Map函数，写入磁盘，Reduce阶段完成远程任务的数据读取，完成数据文件的系统转化。MapReduce文件具有备份保存特性，依照不同的阶段，获取磁盘数据信息，按照逐步降低系统性能操作的模式，加强可靠性应用，从MapReduce中完成叠加编程操作。依照MapReduce作业操作，重复的对数据信息进行集中移动操作，调整I/O数据操作结构。

MapReduce框架分析中，针对叠加算法的数据分析操作，准确的判断需要改进的思路和内容。通过选择叠加，对每一项MapReduce作业和任务进行处理。依照作业任务的模式，分析逐步减少MapReduce初始化、调度模式，提升计算的比率关系。按照节点进行数据索引分析，逐步减少远程访问数据的比例，减少系统消息传递通信过程。通过缓存文件的分析，对循环的不变量进行存储，确定数据的存取过程。

2MapReduce的局部叠加模式

按照MapReduce叠加模式的复杂结构情况，对数据进行支撑操作，提出符合MapReduce的核心思路。充分挖掘数据图的局部，对图进行分割技术操作。按照子图的任务内容，结合各个子图的局部计算操作，分析函数下需要协调的全局算法。加强大数据之间的操作，逐步增加缓存、索引的支持分配。依照数据挖掘算法，对数据图的挖掘核算进行分析，调整数据系统可以提供的索引。采用数据随机存取的操作，实施多方面的缓存索引分配。调整相关产品的结合关系，按照相关的利用价值，判断子图单位下的局部计算过程，明确数据信息图的衔接操作。通过数据的单元、单位分析，对子图进行支撑，明确数据读取分析操作的标准。

充分考虑局部的计算，在MapReduce任务中，根据相关的内部细节，对MapReduce任务及你想过直接的文件系统写入，对各个节点的数据进行计算分析，确定MapReduce所有适用符合局部叠加的计算模式要求。

充分考虑局部性分片技术，根据计算机信息的具体缓存标准要求，获取信息节点。

通过矩阵顶端的权值向量分析，确定子图处理单位。依照分图的具体缓存策略，实施高效的运算操作。

三MapReduce数据大规模高维数据的汇集

按照输分析进行汇集，依照相关数据集中区分，判断数据对象。依照海量高维数据进行挖掘，调整数据对象的不同类型。按照维度进行数据调整，判断平台上的高维数据汇聚，采用准确的信息系统规模分析，判断汇聚数据的对象标准。

按照中心采样确定分布，明确各个区分之间的汇集情况，结合数据挖掘算法，确定编程系统。采用有效的数据扩展模式，对数据进行挖掘分析，调整数据分布的延展过程。通过云计算的高效挖掘，实施综合数据的规模化应用，获取高可用性，结合MapReduce算法，重点分析数据的并行算法流程。

依照MapReduce模式，提出大数据的集成批量处理。依照MapReduce阶段，对数据进行挖掘分析，确定大规模下的数据分割，结合各个部分进行数据相关图解，明确拓展的数据权值。按照标准值的索引，通过分析索引服务器的具体内容，判断相关重点，明确快速检索的图例算法。尝试对数据的变化量、分割数据、传输数据进行分析，完善算法的改在和运算过程。

结语

综上所述，MapReduce大规模数据挖掘通过对数据的云平台技术存储，按照变化量、分割量调整数据的叠加汇集值，满足当下大数据规模综合应用，实现MapReduce大规模下数据的综合模式拓展。

参考文献

[1]基于数据挖掘技术对车载蓄电池数据的研究与分析[D].赵天星.沈阳师范大学2019

[2]数据挖掘技术在高校智慧资助中的应用研究[D].姚蓓.安徽大学2019

[3]数据挖掘技术在北京市雾霾预测及雾霾经济模型中的应用研究[D].周旭.内蒙古财经大学2018

同系列内容

查看全部

来源期刊

科技新时代

2019年8期

基于MapReduce的大规模数据挖掘技术研究

基于MapReduce的大规模数据挖掘技术研究

来源期刊

相关推荐

同分类资源更多

相关关键词

基于MapReduce的大规模数据挖掘技术研究

基于MapReduce的大规模数据挖掘技术研究

来源期刊

相关推荐

同分类资源 更多

相关关键词

同分类资源更多