基于大数据技术的医院数据集成平台建设

(整期优先)网络出版时间:2017-01-11
/ 2

基于大数据技术的医院数据集成平台建设

刘银

(四川省泸州市中医医院四川泸州646000)

【摘要】基于大数据技术的医院数据集成平台,整合医疗业务和医院管理的数据,即建立全院级的数据中心。改变原有信息系统存在的数据不标准、格式不统一,且数据零星、分散的局限性,利用数据平台对院内的诊疗信息进行全集成,实现数据的综合展现与利用,为临床工作人员提供全数据集成的工作平台,为医院的临床部门、管理部门提供科学的数据支撑能力。

【关键词】大数据;数据集成;数据中心;决策分析;数据利用

【中图分类号】R197.3【文献标识码】A【文章编号】2095-1752(2017)01-0330-02

近几年在国家推进深化医药卫生体制改革中,要求“大力推进医药卫生信息化,加快医疗卫生信息系统建设”,信息技术在医疗行业的广泛应用使得医疗领域产生了海量数据。相比传统数据除了其庞大的数据量,大数据也表现出其他特性。例如大的数据通常是非结构化的,数据体量巨大,种类繁多,流动速度快,需要更精确的实时分析。这意味着需要新的系统架构对数据进行采集、传输、存储以及大规模数据处理的机制。而大数据技术很好的解决了这个难题,它能够在成本可承受的条件下,在较短的时间内,将数据采集到数据仓库中,用分布式技术框架对非关系型数据进行异质性处理,通过数据挖掘与分析,从大量化、多类别的数据中提取价值,大数据技术将是IT领域新一代的技术与架构。

目前,在国内外大数据技术中,比较具有代表性的是Apache软件基金会开发的Hadoop,以Hadoop为代表的非关系数据分析技术,凭借其适合非结构处理、大规模并行处理和简单易用等优势,在互联网搜索和其他大数据分析技术领域取得重大进展,成为主流技术。其核心功能是提供一个稳定的共享存储和分析系统,存储由HDFS实现,分析由MapReduce实现。Hadoop架构支持在公有云端存储EB量级数据的应用,许多互联网公司,包括Facebook、谷歌、eBay和雅虎等,都已开发了基于Hadoop的EB量级超大规模数据应用。因此,采用目前比较成熟的hadoop技术,进行医院数据集成平台建设,实现数据中心和数据仓库功能。

1.临床数据中心(CDR)

医院数据中心是医院数据集成平台的关键环节。通过医院数据中心的建设,形成完整的、以病人为核心、以时间轴为主线的大数据仓库,以服务于当前以及未来的综合数据挖掘利用需求。

医院数据中心在建设统一的临床数据库的基础上,逐步建立基于疾病、治疗、卫生经济、医生、患者等各方面的主题数据集,为医务人员提供完整、统一的数据展现。同时,对整合后的原始临床数据提供强大的数据检索、数据导出等多种工具,为医疗科研服务。

1.1技术架构

医院临床数据中心(CDR)采用大数据技术,接收医院的各项数据,运用大数据技术实现对临床数据的统一存储,然后运用大数据技术实现对数据的并行计算。

1.2数据组织

1.2.1数据参考模型参照HL7标准中的RIM模型,对患者来院就诊所发生的医疗行为进行事件细化,将患者的就诊行为细分为一个一个细颗粒度的事件,按照临床事件机制和时间轴组织数据。CDR能够通过XML(可扩展标记语言)文档的形式,完整的还原每一位就诊患者在医院产生的所有临床事件,并完整记录这些临床事件发生的时间、参与的医护人员、使用的临床资源和产生的结果,包括临床结果以及相关的卫生经济学数据。

1.2.2数据存储标准数据元是不同业务领域之间进行无歧义信息交换和数据共享的基础,也是组成数据集的基本单位。在卫生部发布的健康档案、电子病历规范中有明确的数据元标准定义,数据中心可以基于这些标准内容根据实际情况进行扩展。

临床数据具有数据来源多、格式多、种类多、标准多,数据中心采用关系型与非关系型数据库的混合方式来存储与管理。数据中心能适应不同的标准,如:HL7CDA、SNOMEDCT、MedDRA等;CDR通过定义一系列的CDATemplates,把临床事件转成一系列的临床文档,并通过消息机制,按照自然时间队列数据维度与临床业务逻辑相关数据进行数据的统一与集中存储。存储后的数据可以提供给临床应用、数据分析平台、临床研究平台、疾病知识库等。

1.3体系结构

数据中心的整体结构由于不同的业务场景和数据利用方式,分为适配器、数据仓库、电子病案库和指标分析数据库。

2.数据仓库

数据仓库从医院数据中心获得阶段性的结果数据,支持医院管理决策支持系统的运行,给医院的中高层管理者提供数据分析和管理决策。

系统通过ETL工具从医院数据中心提取数据,根据不同的业务主题存储到数据仓库里,根据不同的业务主题,分析建模工具从数据仓库中生成不同时间密度的运营统计数据,可按小时、日、周、月、季、年等密度计算。还能根据不同的角色构建不同的运营数据界面,为不同的管理者提供个性化的数据展现方式。

3.基于数据平台的管理系统应用

3.1医院管理决策分析系统(BI)

通过对医院临床和管理数据的抽取,建立主题数据仓库,为不同维度的数据挖掘提供数据支撑。要求根据实际业务需要,基于标准应用的业务模型和客户自定义的业务,通过ETL工具从业务数据库进行抽取、清洗、转换,形成支撑业务模型的数据集。

3.2临床集成视图系统

临床集成视图产品是基于集成平台及CDR的数据利用展现系统。利用集成平台将分布在各个应用系统的异构数据统一采集标化后推送至CDR中,并基于CDR进行数据的整体展示,为医院的临床业务提供实时数据服务。

临床集成视图主要为医、护操作者在一个界面上,提供了可查询、浏览、书写各医护文书、特护记录、辅诊检查资料的快捷方式,且界面以直观方式显示患者当前各生命体症(体温、脉搏、血压、呼吸)、检查检验、医嘱等患者重要的观察指标,并能以时间方式查询此前任意上述指标的情况、相互关系和趋势。

基于大数据技术的医院数据集成平台,实现各个系统数据统一集成到数据中心进行统一存储,将相对独立的软件系统的数据以企业的角度进行抽象和封装,使得数据有一个统一的视图。并实现对业务的数据的监控,并且能够对数据的变化做出自动化地处理。

【参考文献】

[1]甘晓,李国杰.大数据成为信息科技新关注点[J].中国科学报,2012.

[2]员巧云,程刚.近年来我国数据挖掘研究综述[J].情报学报,2005.

[3]郭海涛,段礼祥,闫春颖.数据挖掘方法综述[J].计算机科学,2009.

[4]杨志玲,韩荣华,王超.基于大数据的医院数据中心建设思考[J].中国数字医学,2015,10(4):82-85.

[5]孙琳,潘登,蒋丽霞.基于全过程医疗质量管理思想的临床数据存储库设计[J].中国医院管理,2012,32(11):38-39.