上海市法人数据空间化及空间分析研究

(整期优先)网络出版时间:2020-06-15
/ 2

上海市法人数据空间化及空间分析研究

王安迪

上海市测绘院 200063

摘要:法人库、空间库和人口库是城市信息化建设中的三大基础信息库。探索法人数据的空间化,并对法人空间数据进行空间分析具有重要意义。本文基于地址匹配技术对法人数据空间化进行探索,并进行法人空间数据的空间分析研究,对法人空间数据进行多维度的空间可视化展示,更加形象、直观的展示各类法人信息,使法人专题数据得到更充分和高效的展示、利用,让各项管理更智能,各类服务更便利。

关键字:数据空间化;空间分析;空间可视化

  1. 引言

上海正在持续推进政府信息资源开发利用,持续建设人口、法人、空间地理三大领域的基础信息库[1]。法人数据库的内容包括了所有企业、机关、事业单位、社会团体以及其他组织机构的基本信息[2]。地理信息则是反映城市发展布局的最直观的数据,两者在政府管理决策、国民经济建设、区域经济规划等方面均发挥着越来越重要的作用。在上海加快推进“一网通办”以及长三角一体化发展国家战略的大背景下,加快智慧城市建设和大数据发展战略[3],探索法人数据的空间化,并对法人空间数据进行空间分析,是搭建大数据公共服务载体的重要举措。法人数据空间化能够揭示传统技术方式难以展现的关联关系,提升数据分析能力。对法人空间信息进行空间分析,并将分析结果直观的在地图上展示,更好的支撑城市运行。

  1. 法人数据空间化处理

    1. 空间化处理流程设计

法人数据的空间化处理需要对法人库数据的注册地址和经营地址进行空间匹配,实现法人信息的空间定位。传统的法人地址信息是基于文本描述的地址,一般是采用XX区XX路XX弄XX号这样的地址结构。根据法人数据的地址字段情况,设计了法人数据的空间匹配处理流程,即通过法人地址标准化预处理、自动化的地址匹配、内业人工匹配和外业实地核查结合的方式进行数据的空间匹配处理,实现法人库的空间匹配处理工作。

5ee716c72cfae_html_ddb7e3e20120d087.jpg

  1. 法人数据空间化处理流程

    1. 法人信息标准化预处理

法人数据库中,与空间位置相关联的注册地址、经营地址等属性信息是由申报人自行填写申报的。因此地址描述方面存在不够规范的情况,如会出现错字漏字的情况。针对法人库中地址描述存在的此类问题,对法人库中地址描述信息进行梳理和预处理。采用程序判断的方法,对缺少“路”、“弄”等字的地址,进行自动判读和修正。对存在的地址描述模糊、错别字、地址缺乏、乱码等情况进行筛选和人工核实。形成较为规范、清晰的法人地址描述。

    1. 基于地名地址编码的地址自动匹配

通过研究法人库地址描述与空间库地址之间的匹配方法,开发了批量匹配工具。匹配时基于地址分词,将地址字符串切分不同级别的地址单词。然后利用分词后的地址要素组成查询条件在标准地址库进行匹配,并返回标准地址库中相应记录的地理坐标。同时在匹配过程中对精准度进行加权计算[4]。通过此方法,在法人库地址描述与空间库的门址数据之间建立关系,利用地名地址批量匹配定位工具,实现了法人地址的批量匹配。

    1. 在线地址纠偏

由于法人库中操作地址描述模糊、不准确等情况,部分法人地址数据无法自动匹配到准确的空间位置信息。针对此类匹配后空间位置准确度较低的法人数据,采用内业人工核查的方法进行处理。搭建在线地址纠偏系统,作业员通过解读原始法人地址的描述信息,通过查阅系统中的地形图、影像图等各种地图资料,查找相应的地理位置,在线完成法人地址的人工定位,将空间位置坐标与法人信息相关联。

    1. 外业人工核查

对于法人库地址描述采用自动匹配处理和人工在线纠偏处理方式均无法准确定位的情况,采用了现场人工核查的方法,实地查找并采集相应地址坐标,做到法人信息和空间位置信息的关联存储。

  1. 法人空间数据分析

    1. 空间分析方案设计

通过法人空间化处理,得到具有空间坐标的法人数据,可以对其进行空间分析,揭示法人数据在空间上的分布规律。通过对行政区、法人类别以及时空变化进行热力分析、聚合分析、撒点分析等分析方法,得到相应空间分析结果。

    1. 区域分析

区域分析采用了空间聚合技术,以行政区为聚合条件,将同一行政区的数据聚合在一起,并显示具体的聚合点数目。实现了法人信息的区域性综合分析和统计功能,并将分析结果利用统计图表和专题图的方式进行全方位的直观展示。避免了由于法人数据总数量较多而对数据展示效率的影响。利用空间聚合技术,在视觉效果上提高了地图的交互性与美观程度,使得信息展示简单明了。在数据请求上,优化做法只需统计个数,不需要详细的信息,更不需要将所有的点在地图上展示,大大提高了程序的效率与速度。

根据区县、街道镇、村居委三级行政区划进行划分,结合法人的各项属性数据,统计各行政区法人的注册数量、注册资金以及最近一个月法人增长的情况。

5ee716c72cfae_html_ca3bec04eb14bc58.png

  1. 区域分析

    1. 法人信息统计分析

基于法人空间大数据,根据法人信息具备的行业属性信息,结合各类专业的范围面,分析区域内各项指标的统计汇总情况。形成了多种分析模型,对行政区、自贸区、产业区等专题范围面进行时间和空间的多维度分析,对各行业类型的法人数量、注册资金数量、法定代表人等指标进行统计,以折线图、柱状图、饼图、金字塔图与表格相结合的数据展现形式,将各类法人统计结果进行展示。提供了直观、高效的可视化展示手段,丰富了数据展示形式,使数据价值得到最大化利用。

5ee716c72cfae_html_ebfe9db50888c0f7.png

  1. 统计信息分析

    1. 类别分析

基于空间聚合方法,将空间区域划分为连续规则的网格单元,根据落入每个网格的法人数量进行统计,使每个网格都具有统计信息,通过色带对网格单元进行色彩填充。针对注册法人单位的不同行业,集成法人信息和空间信息,实现法人分行业的网格聚合统计功能。根据不同的行业类别,统计特定区域的法人聚集情况,以发现城市区域发展的趋势,可作为城市未来规划的参考依据。

5ee716c72cfae_html_6a01477914c11d15.png

  1. 类别分析

    1. 时空变化

基于对法人时间序列的分析,可以对法人变化情况进行时间序列展示。通过分析法人的创立时间,对每日新增的法人进行汇总。可以得到每日的法人注册情况,通过对时间轴的选择,可以选择要展示的时间点或时间段,从而分析该时间段内法人新增的热点地区。

5ee716c72cfae_html_fe1081fb5e0ff106.png

  1. 时空变化分析

  1. 结语

本研究将地理信息与法人信息数据相融合,得到法人空间化数据,并针对此数据进行空间分析和展示,将传统的法人数据在地图上用聚类图、热力图等方式表达出来,更加形象、直观的了解各种法人相关信息,使法人专题数据得到更充分和高效的展示和利用,服务于上海的一网通办,加快整体协同、高效运行、精准服务、科学管理的智慧政府建设,让各项管理更智能,各类服务更便利。

参考文献

1] 刘健. 上海:推进公共信息资源共享开放[J]. 世界电信, 2014(Z1):107-110.

2] 顾迎建. 谈法人单位基础信息库建设[J]. 标准科学, 2005(4):58-61.

3] 王枫云, 陈亚楠. Intelligent City Construction and Resolution of Development Problems in Big Data Times%大数据时代的智慧城市建设与发展困局化解[J]. 上海城市管理, 2016, 000(002):30-35.

4] 刘广涛, 向煜. 基于中文分词的地址匹配技术在警用地理信息系统中的应用[J]. 科技创新导报, 2013(02):61-63.