简介:摘要本文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进k-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。
简介:摘要进入铁路大数据时代,未解决铁路统计存在的数据分散、统计滞后、结果不准确等问题,亟需构建数据高度融合的铁路统计信息化平台。在对铁路各业务统计以及各专业统计系统进行充分调研的基础上,分析铁路统计信息化平台的总体需求和业务需求,提出平台的整体架构以及主要功能的设计方案,以提升铁路统计信息服务质量,加强统计分析的决策支持作用,从而适应大亟数据环境下铁路业务的不断发展变化。主要对铁路机务段大数据建设的现状进行分析,堆积段的大数据的提出了相关的建议,并且对极端信息系统的一些主要内容进行简要的描述。
简介:摘要随着大数据时代的来临,大数据内在所蕴含的潜在价值也更加凸现出来。在此将大数据信息进行一定程度的统计处理和优化分析,为现在的工程项目管理提供新的思路和视角。本文首先对大数据相关的技术问题进行分析,将大数据技术引入工程项目管理,然后构建在大数据环境下的大数据全生命周期管理模型,最后分析此模型的应用价值和应用前景。