Page 22 - 202004期
P. 22
专论综述
作为重要的城市基础设施数据,地下管 域如越秀区的管线密度达到104.8km/km ;其
2
[3]
线数据具有典型的时空大数据特征 ,随着 中,燃气、电力、排水、给水、通信等几类管线
城市地下普查/修测、日常竣工验收以及专业 后台数据库中的管线点记录数、管线段记录
管线数据汇交等动态更新机制的建立,城市 数以及管线实际长度如表1所示。
地下管线的数据量快速增长,基于传统关系 表1 系统管线数据情况
型数据库如oracle上存储的地下管线数据库 序号 管线 管线点 管线段 长度(m)
类别 记录数 记录数
和基于传统GIS软件架构如ArcGIS上开发的 1 燃气 267,844 274,252 4,979,693
城市地下管线综合管理系统,面临着海量地 2 电力 400,957 382,908 7,378,967
3 排水 1,170,592 1,167,089 19,465,761
下管线数据在入库、渲染、查询、统计、分析
4 通信 1,826,926 1,817,554 42,524,808
等方面的速度、效率等瓶颈问题,制约着管 5 给水 730,626 753,634 13,249,165
线数据在城市规划、建设、管理中的应用。因 合计 4,396,945 4,395,437 87,598,394
此,基于非关系型数据库和分布式计算平台, 2.2 系统运行环境
重构城市地下综合管线信息系统尤为重要。 系统运行环境主要采用了如下软件:1)
Hadoop:是一个分布式文件系统(HDFS)的
2 系统管线数据及运行环境
基础架构 [4,5] ,该架构允许用户可以在不了解
2.1 系统数据情况 分布式底层细节的情况下,开发分布式程序,
广州市地下管线普查按照《广州市地下 充分利用集群的威力进行高速运算和存储,
管线探测技术规程》(2015年)等相关标准和 并且设计用来部署在低廉的(low-cost)硬件
规范要求,建立了地下综合管线数据库,数据 上,而且其提供高吞吐量来访问应用程序的
库中管线点属性包括唯一识别码、图上点号、 数据,非常适合有着超大数据集(large data
管线类型、管线分级、管线点代码、特征点、附 set)的应用程序。2)HBase:是一个高可靠
属物、X坐标、Y坐标、地面高程、最高管顶高 性、高性能、面向列、可伸缩的分布式存储系
程、最低管底高程、入库时间、更新时间等36 统,利用HBase技术可在廉价PC服务器上搭
个属性;管线段包括唯一识别码、管线编号、 建起大规模结构化的存储集群,HBase不同
起点号、终点号、管线类型、子类型、分级、代 于一般的关系数据库,是一个适合于非结
码、材料、起点管顶高程、终点管顶高程、起 构化数据存储的数据库,此外,HBase基于
点管底高程、终点管底高程、管径、断面尺寸、 列的而不是基于行的模式来存贮数据。3)
起点埋深、终点埋深、更新时间等38个属性。 GeoMesa:由locationtech开源的一套地理大
管线数据库涵盖电力、给水、燃气、通 数据处理工具套件,可在分布式计算系统上
信、排水、工业、石油、垃圾真空、综合管沟等 进行大规模的地理空间查询和分析,其支持
共十大类地下管线,总长度近9万公里,部分区 将海量的时空数据存储到Accumulo,HBase
12 地下管线管理