简介:摘要随着数据量的增加,数据间的关联和交叉,需要通过数据融合来实现数据的价值最大化。然而,由于数据融合过程复杂,为清晰解释数据融合过程,建立数据融合的回溯机制十分必要。虽然对数据溯源的研究很多,但大多是面向查询和工作流的溯源研究,而面向数据融合的溯源研究很少。文中面向数据融合溯源展开研究,提出了一种支持多粒度数据溯源的方法。首先,对数据融合过程进行抽象,以实体为核心构建模式,实体和属性的语义图,将数据融合过程语义化,并提出优化的溯源信息存储模式;然后,基于语义图,分别提出了实体级和属性级的溯源查询算法,以及相应的查询优化策略;最后,通过实验证明了提出的数据溯源方法的有效性。
简介:摘要经过多年的信息化建设,国网甘肃省电力公司(以下简称“甘肃电力”)在各个业务领域已经基本建立了各自的业务应用系统,并通过使用自动化系统有效提升了自身的业务运营能力。企业开展信息化工作的基础是数据,而最终目标也是为了得到对各层次决策更有用的数据,所以数据管理是企业信息化的核心。随着应用系统的不断增多,数据的无序现象却有愈演愈烈的趋势,这种情形与越来越高的应用需求之间的矛盾日益突出。因此,甘肃电力期望利用知识图谱技术来提高数据质量,通过建立企业、部门、场景等不同层次的元数据,实现数据溯源、数据影响关系的全面管理,为公司数据资产的管理奠定良好基础。