人口地理信息系统建设研究

(整期优先)网络出版时间:2008-11-21
/ 4

人口地理信息系统建设研究

苏墨李满春

关键词:人口地理信息系统人口普查地理编码面插值现势性Populationgeographicinformationsystemconstructionstudies

SuMoLiManchun

Abstract:Thepresentstageourcountrypopulationgeographicinformationsystemdevelopmentfromthepreliminarystagetothematurestageexcessively,verymanycitiesallindependentlyhasalreadydevelopedthepopulationgeographicinformationsystem.Atpresentdevelopsthepopulationgeographysystemallmeetsthebottleneck,seriouslylimitedthepopulationgeographicinformationsystemfunctionfurthertoconsummate.Theresearchfirstcarriesontheinductiontothedomesticpopulationgeographicinformationsystemdevelopmentcondition,broadgeneralpopulationgeographicinformationsystemconstructionplan.Thendiscussesemphaticallylimitsthepopulationgeographicinformationsystemdevelopmenttwobottlenecks:Theusesurfaceinterpolationmethodbreakthroughgeographycodelimit,thegainrandomregionpopulationinformation,realizesmanyyearcensusdataunification;Usedoublethreaddatastoragemethod,effectiveaddressingpopulationdatarenewalquestion,guaranteepopulationdatacurrentsituation.

Keywords:ThepopulationgeographicinformationsystemCensusGeographycodeSurfaceinterpolationCurrentsituation

【中图分类号】G644.6【文献标识码】A【文章编号】1009-9646(2008)11-0001-04

1.引言

人口问题是21世纪人类面临的影响可持续发展的难题之一。要解决好人口问题,首先就要全面地掌握人口信息。我国现行的人口信息的获取手段主要:户籍登记、人口普查和抽样调查。抽样调查操作简便,不能够提供全面的准确的人口信息。户籍登记制度可以提供详细的连续的人口信息,但是登记的项目有限。人口普查信息内容全面,可以准确的提供全面人口信息,但是周期(10年)很长。目前的人口信息来源大部分是人口普查信息,另外有部分流动人口信息来源于公安部门的户籍登记数据。

人口信息具有地理分布属性,人口信息与地理信息结合,能够进一步提高人口信息管理水平[1~3]。因此,各国都相继研究和建设与人口普查、户籍管理制度相适宜的人口地理信息系统。国外以美国1980~1990年人口普查据研制的TIGER系统(topologicallyintegratedgeographicencodingandreferences,拓扑综合地理编码和参考系统)最为典型,其成功应用于银行、房产、电话等都个社会领域[1~2]。日本、法国、英国、加拿大等GIS发达国家相继建立人口地理信息系统,其中英国开发的HMSO,SASPAC等人口地理信息系统得到广泛的应用[4]。国内人口地理信息系统建设起步于2000年,2000年11月1日我国第五次人口普查全面展开,随后国务院人口普查办公室提出“有条件、有能力的省市地区可率先建设人口地理信息系统”,掀起全国人口地理信息系统开发热潮,相关研究文章如雨后春笋般出现,到2005年,上海、深圳、青岛、宁波、常州等地区先后独立开发人口地理信息系统[3,5,6,7]。1996年以后,我国GIS发展进入产业化阶段,GIS软件开发技术已经成熟[2,8,9,10];同时,各地开发人口地理信息系统积累了大量的经验,人口地理信息系统开发正迈向成熟。

但是,目前系统开发面临技术瓶颈,阻碍系统功能进一步突破。研究首先对国内人口地理信息系统开发状况进行归纳,概括一般性的人口地理信息系统建设方案;然后再此基础上深入分析系统面临的瓶颈并提出突破瓶颈的技术手段。

2.人口地理信息系统建设方案

人口地理信息系统能够将人口数据与空间数据有机的结合,提高人口信息的管理水平,更大限度发挥对经济社会决策的支持作用。相同的系统建设目标在加上工业化的GIS软件开发流程,国内目前开发的人口地理信息系统在系统建设目标,系统结构设计,系统功能等方面是相似的。将国内多个人口地理信息系统进行比较和分析,人口地理信息系统一般性的建设方案如下:

人口地理信息系统建设目标是在空间信息的基础上,以先进的GIS软件和大型数据库管理系统为平台,建设往往囊括人口方面,并且可以扩充经济、社会的多类型、多层面、多功能的GIS,实现包括检索查询、分析研究、决策支持、更新维护、安全保密、用户管理、权限设置、网络管理、系统备份及成果输出与打印等功能。人口地理信息系统用户往往是政府机关,人口地理信息系统往往成为相关行政人员实现办公自动化及电子政务的工具,系统开发基本上要能够与其他已有的政务系统衔接。

2.1基础数据描述。人口地理信息系统的基础数据可以分成两个层面:人口数据以及空间数据(表1)。我国各城市都在一定程度上保存了历次人口普查的数据,从第五次人口普查开始,开始使用电子文件保存普查数据,国内人口地理信息系统使用的基础人口数据均是我国第五次人口普查数据。人口普查数据包括性别、年龄、受教育程度、住宅情况等丰富的内容[1]。

各城市空间数据建设近年来取得的丰硕的成果,人口地理信息系统的地理数据来源方式多种多样,最具代表性的数据源是地区土地利用现状数据(矢量数据)及遥感影像数据(栅格数据)。土地利用现状数据来源于国家组织的土地利用更新调查,数据十分详细,各种比例尺数据都有,每五年更新一次。另外结合国土资源局的土地利用管理,数据基本上可以做到实时更新。遥感影像数据目前应用十分广泛,获取方式简单,价格相对便宜,在一定程度上能够实现地物的立体显示,增加系统的表现力。

人口地理信息系统不仅需要建立空间数据库,还要建立人口地理数据库,故需要的原始数据包括空间数据和人口数据(表1)。人口数据来自人口普查数据。空间数据可以来自国家基础地理数据,也可以由个人或组织通过数字化工作采集的数据。

表1原始数据描述表

分类内容描述空间数据带有属性记录的多种比例尺的电子地图数据。人口数据包括人口总数、家庭、户籍、性别、年龄、民族、受教育程度、出生、死亡、产业、职业、就业、婚姻、生育、迁移流动、住房等。2.2系统结构设计。依据当前城市信息化背景以及人口地理信息系统的用户需求,国内主流的人口地理信息系统结构有两种:C/S体系结构以及C/S与B/S结合的体系结构,两种体系结构同时都是基于多层分布式应用开发技术(MIDAS)的三层分布式结构。

以C/S体系结构为例,系统主体分三层,即客户服务层、应用逻辑层、数据层。系统三层结构中,数据层由基础空间数据库、人口信息数据库及其管理系统构成;应用逻辑层由数据应用服务器和数据管理服务器构成;客户服务层由以GIS为平台的应用子系统构成。这种体系结构能够使基础数据、事务处理和客户应用在逻辑上有效地分离,将大部分日常事务处理功能集中在中间服务层中,使数据、事务处理之间可以相对独立的适应各自的变化需求,同时实现真正意义上的“瘦客户端”应用程序。C/S与B/S结合的体系结构可以理解为在C/S体系结构客户服务层上添加了浏览器模式(图1)。

系统的功能经过归纳分组,相应设计的系统模块结构包括以下六个子系统,基本上囊括了国内人口地理信息系统全部功能(图2)。数据输入与输出子系统实际上实现系统数据库的功能,包括数据修改、更新、备份等,并且能够实现数据格式的转换与加密,保证人口数据的安全性平且实现与其他系统的衔接。人口信息查询与统计子系统实现人口信息管理中最基本的功能,是针对信息服务等具体人口统计业务开发的功能。并且能够实现人口信息空间属性的查询与统计,包括人口流动、人口分布等信息。人口信息分析与预测子系统实现的人口地理信息系统的高级功能,也可以称为决策支持子系统,综合应用空间分析、数据挖掘、专家系统等先进的技术手段,实现对人口发展状况进行模拟,分析决策对人口分布产生的影响等功能。公共网站信息发布子系统以WebGIS为核心,实现人口信息的网上宣传、咨询、浏览、下载、订购等服务,是实现人口管理政务公开的重要手段。成果管理与输出子系统实现将系统分析的成果以文件、图、表等多种方式表现的功能,是对系统本身的一种宣传手段,也是对用户工作的一种肯定方式。系统维护子系统是对系统的性能和安全等方面进行管理,是目前开发标准化系统必须的模块之一。

2.3系统开发平台。对于人口地理信息系统开发平台的选择,应该综合考虑以下几个因素:已有的数据格式、已有的软件平台、自身经济实力等。考虑目前城市发展的潮流,人口地理信息系统开发平台选择出现两极化趋势:专业的政府系统开发平台及广泛使用的民用系统平台。

由于经济的发展,城市实力的提示及国家对电子政务的重视等因素,各城市人口管理相关部门基本上具备足够的经济实力开发稳定的、大型的人口地理信息系统。操作系统主流选择是Windows系列。软件客户端选择WindowsXP,以及最新的WindowsVISTA。服务器端选择WindowsServer2003。GIS平台软件一般使用进口的ESRI系列软件,或者是国内自主开发的MapGIS、SuperMap等系列软件。数据库使用Oracle、Informix、Sybase等大型数据库,尤其是Oracle,是GIS领域中最为流行的数据库软件。

另外,随着开源软件的发展,越来越多的优秀GIS开源软件逐渐进入大众的视野。开源软件与商业软件相比,主要的优点是跨平台的特性以及优秀的多种文件格式支持能力,主要的弱点是效率较低,稳定性和保密性较低。此外,开源软件是完全免费的。对于政府而言,系统稳定性和保密性是第一位要考虑的因素,所以政府开发人口地理信息系统选择专业级商业GIS软件开发平台。对于民用系统而言,成本是第一位要考虑的因素,开源软件虽然存在一些问题,但是其集思广益,免费更新的特性保证软件性能和功能能够不断完善,部分志愿者已经开始尝试使用开源软件平台开发民用人口地理信息系统。

3.人口地理信息系统关键问题探讨

3.1地理编码限制问题。现有的人口地理信息系统以人口普查数据作为基础数据,人口普查数据是以普查小区为单位收集的,以地理编码的方式将人口普查信息与地理信息结合起来。在进行人口信息分析与查询必须以普查小区为基本单元,这种人口数据应用方式存在以下一些问题:①社会、经济、环境等方面的数据都是以面状区域进行采集,但是这些面状区域边界往往不重合,无法直接将数据关联使用。②普查小区边界往往以行政边界一致,但是行政边界随社会经济发展不断调整,两次人口普查采用的普查小区边界往往不一致,失去了人口普查数据的连续性。③实际应用中,为满足特定的研究目的需要确定特定的研究区域,与普查小区边界无关。普查小区是最小的查询单元,无法获取更小区域,更高分辨率的人口数据。

为解决上述问题,需要将人口普查数据从源区域(sourcezones)向目标区域(targetzones)转换,解决这个问题的方法叫面插值(arealinterpolation)[18,19]。面插值有多种分类方法[20],根据Lam和Okabe的分类体系将面插值分成没有辅助数据的面插值和有辅助数据的面插值。在没有辅助数据的面插值方法中,有一种较为简单的基于源区域和目标区域几何特征的叠加算法在我国人口信息提取中有广泛的应用,国内一些研究将此方法称为面积权重法[21~24]。该方法具体步骤如下:方法前提条件是假设在源区域内人口分布是均匀的,根据假设计算出每个源区域的人口密度,然后在源区域数据层上叠加目标区域并计算出每一个源区域在目标区域中的面积比例,面积比例可以认为是源区域相对目标区域的权重。目标区域的人口总数就等于每一个源区域的总人口与对应权重的乘积之和[20,24]。若源区域人口为ys,面积为As,目标区域人口为yt,面积为At,源区域落在目标区域内的面积为Ast,则:

yt=∑ysAstAs(1)

At=∑Ast(2)

此方法简便易行,但是其主要缺点是假设人口在一定区域内均匀分布,与人口真实分布情况不符。另外一种广泛使用的无辅助数据的面插值方法是Tolber提出的pycnophylactic插值[25]。该方法使用规则网格表达人口数据的空间分布,通过光滑密度函数考虑相邻源区域的影响。该方法运算结果是生产一个光滑的人口密度表面,平滑的条件是要求每一个网格数值接近它周围四个网格数值的平均值,从而最小化人口密度表面曲率。该方法能够保持平滑前后源区域的人口数不变,并且不要求人口在普查单元中均匀分布[20,26]。Rash对该插值方法进行了改进,使用不规则三角网(TIN)代替规则网格,提高了插值的精确程度,但是也同时提高了算法的复杂度[27]。

3.2人口数据实时更新问题。我国人口普查每10年一次,要保证人口数据的现势性,必须采用其他数据源更新人口数据库。人口普查数据可以分成遍历型及抽样型两种数据类型,一般情况下,遍历型数据可以通过公安部门的户口登记及各居委会上报数据更新,抽样型数据可以通过统计部门的分区域抽样调查更新。由于人口普查数据与其他人口数据相比内容多、范围大,采用其他数据源,只能更新数据库中的部分区域或者记录中不同部分字段。为解决此问题,研究提出人口数据双线存储方式,将原始数据及更新数据分别保存,查询时原始数据与更新数据按同一时间点显示,两线数据到下次人口普查时统一。具体思路如下:

首先将数据库中的数据划分成三种类型:①遍历型,可通过公安部门户口登记数据更新。②抽样型,可通过统计部门人口抽查数据更新。③其他型,可通过人口普查数据更新。对于其他型,采取正常的人口数据存储方式保存。对于遍历型和抽样型,采用双线方式存储,同时保存更新数据和原始数据。查询时按时间点同时显示更新数据和原始数据。人口数据更新模式如图3。

4.总结与展望

综上所述,人口地理信息系统的开发技术目前已经较为成熟。政府可以采用专业级的商业GIS软件开发平台建设大型的人口地理信息系统,为政府制定人口相关政策提供技术支撑。志愿者也可以采用免费的开源GIS软件开发平台,使用政府公开的数据建设小型的人口地理信息系统,满足群众的部分需求。人口地理信息系统建设面临的主要挑战是人口数据的连续性和现势性。使用人口信息面插值方法能够获取任意区域的人口数据,将多年人口数据统一,在使用遥感数据、土地利用现状数据、交通数据等辅助数据的基础上,甚至可以获得更高的空间分辨率的人口数据,提升人口数据的应用价值。使用人口数据库双线存储技术可以一定程度上解决人口数据的更新问题,保证人口数据的现势性,同样可以提升人口数据的应用价值。但是,技术手段是间接的解决方法,要从根本上解决人口数据的连续性和现势性,需要政府建设一套行之有效的人口数据获取方案,在数据获取层面解决问题。参考文献

[1]王新洲、柳宗伟等.城市人口地理信息系统建设模式探讨[J].武汉大学学报(信息科学版),2001,26(3):226~231

[2]金君、印洁等.人口地理信息系统设计与建设[J].工程勘察,2002,(3):51~54

[3]高寒松、李满春.常州市人口地理信息系统的设计与实现[J].现代测绘[J],2006,29(4):3~5

[4]科技部国家遥感中心.地理信息系统与管理决策.北京:北京大学出版社,2000

[5]上海市人口地理信息系统课题组.上海市人口地理信息系统的开发和特点.上海统计[J],2002,(10):24~25

[6]米红.青岛人口系统应用分析.地球信息科学[J],2003,(1),28~33

[7]刘德钦.城市人口地理信息系统建设,北京规划建设[J],2001,(4):46~49

[8]黄杏元、汤勤.地理信息系统概论[M].北京:高等教育出版社,1989

[9]陈俊、宫鹏.实用地理信息系统.北京:科学出版社,1998

[10]李满春、任建武.GIS设计与实现.北京:科学出版社,2003

[11]刘敏.人口地理信息系统探讨.工作视点[J]:92

[12]米红.中国城市人口地理信息系统的研究.统计与决策[J],2001.10(142):19

[13]李军利、查良松等.基于组件技术的人口统计地理信息系统开发研究.地域研究与开发[J],2006,25(6):104~107

[14]何宗宜、贾凉.人口地理信息系统的研制.地理空间信息[J],2005,3(2):3~5

[15]何雄、易成栋.人口普查工作新平台:人口地理信息系统.南方人口[J],2004,4(19):45~51

[16]伍建铭.积极推进人口地理信息系统建设.统计与预测[J],2001,6(114):48

[17]邹秀萍.基于”面向区域”GIS控件的人口地理信息系统开发研究—以陕西省为例[D]

[18]GoodchildM.ArealInterpolation:Avariantofthetraditionalspatialproblem[J].Geo-Processing,2000,(1):297~312

[19]潘志强、刘高焕.面插值的研究进展.地理科学进展,2002,21(2):146~152

[20]李素、庄大方.基于RS和GIS的人口估计方法研究综述.地理科学进展,2006,25(1):109~121

[21]吕安民、李成名等.面积内插算法初探.测绘通报,2002,1:44~46

[22]吕安民、刘海启等.人口密度的密集内插算法研究.中国农业资源与区划,2002,23(1):35~40

[23]刘建军、李春来.基于遥感和GIS的巢湖流域人口信息提取.科学通报,2002,47(23):1835~1837

[24]吕安民、李成名等.基于GIS的人口信息提取.清华大学学报,2005,45(9):1189~1192

[25]TolberWR.SmoothPyncophylacticInterpolationforGeographicalRegions.JournaloftheAmericanStatisticalAssociation,1979,74(367):519~530

[26]田永中、陈述彭等.基于土地利用的中国人口密度模拟.地理学报,2004,59(2):283~292

[27]RashW.Volume-PreservingInterpolationofaSmoothSurfacefromPolygon-RelatedData.JournalofGeographicalSystems,2001,3(2):199~213