Hadoop系统运行机制研究

(整期优先)网络出版时间:2016-04-14
/ 1
Hadoop系统是一种开源的包括丰富软件库的分布式系统基础框架,其作为一种并行处理引擎在大数据处理方面有着广泛的应用。Hadoop系统发展至今出现了基于MapReduce的第一代和基于YARN的第二代两个版本。两代Hadoop系统各有特点和应用场景。在实际应用中,具体选择哪种系统还需要因地制宜、统筹安排。