Page 22 - 202004期
P. 22

专论综述





                     作为重要的城市基础设施数据,地下管                          域如越秀区的管线密度达到104.8km/km ;其
                                                                                                        2
                                                    [3]
               线数据具有典型的时空大数据特征 ,随着                              中,燃气、电力、排水、给水、通信等几类管线
               城市地下普查/修测、日常竣工验收以及专业                             后台数据库中的管线点记录数、管线段记录

               管线数据汇交等动态更新机制的建立,城市                              数以及管线实际长度如表1所示。
               地下管线的数据量快速增长,基于传统关系                                           表1 系统管线数据情况

               型数据库如oracle上存储的地下管线数据库                            序号    管线     管线点        管线段       长度(m)
                                                                       类别     记录数        记录数
               和基于传统GIS软件架构如ArcGIS上开发的                            1    燃气    267,844    274,252   4,979,693
               城市地下管线综合管理系统,面临着海量地                                2    电力    400,957    382,908   7,378,967
                                                                  3    排水   1,170,592  1,167,089  19,465,761
               下管线数据在入库、渲染、查询、统计、分析
                                                                  4    通信   1,826,926  1,817,554  42,524,808
               等方面的速度、效率等瓶颈问题,制约着管                                5    给水    730,626    753,634   13,249,165

               线数据在城市规划、建设、管理中的应用。因                                 合计       4,396,945  4,395,437  87,598,394

               此,基于非关系型数据库和分布式计算平台,                                   2.2 系统运行环境
               重构城市地下综合管线信息系统尤为重要。                                    系统运行环境主要采用了如下软件:1)

                                                                Hadoop:是一个分布式文件系统(HDFS)的
                     2 系统管线数据及运行环境
                                                                基础架构      [4,5] ,该架构允许用户可以在不了解

                     2.1 系统数据情况                                 分布式底层细节的情况下,开发分布式程序,
                     广州市地下管线普查按照《广州市地下                          充分利用集群的威力进行高速运算和存储,

               管线探测技术规程》(2015年)等相关标准和                           并且设计用来部署在低廉的(low-cost)硬件
               规范要求,建立了地下综合管线数据库,数据                             上,而且其提供高吞吐量来访问应用程序的

               库中管线点属性包括唯一识别码、图上点号、                             数据,非常适合有着超大数据集(large data

               管线类型、管线分级、管线点代码、特征点、附                            set)的应用程序。2)HBase:是一个高可靠
               属物、X坐标、Y坐标、地面高程、最高管顶高                            性、高性能、面向列、可伸缩的分布式存储系


               程、最低管底高程、入库时间、更新时间等36                            统,利用HBase技术可在廉价PC服务器上搭
               个属性;管线段包括唯一识别码、管线编号、                             建起大规模结构化的存储集群,HBase不同
               起点号、终点号、管线类型、子类型、分级、代                            于一般的关系数据库,是一个适合于非结

               码、材料、起点管顶高程、终点管顶高程、起                             构化数据存储的数据库,此外,HBase基于

               点管底高程、终点管底高程、管径、断面尺寸、                            列的而不是基于行的模式来存贮数据。3)
               起点埋深、终点埋深、更新时间等38个属性。                            GeoMesa:由locationtech开源的一套地理大

                     管线数据库涵盖电力、给水、燃气、通                          数据处理工具套件,可在分布式计算系统上
               信、排水、工业、石油、垃圾真空、综合管沟等                            进行大规模的地理空间查询和分析,其支持

               共十大类地下管线,总长度近9万公里,部分区                            将海量的时空数据存储到Accumulo,HBase



               12  地下管线管理
   17   18   19   20   21   22   23   24   25   26   27