Page 61 - 202004期
P. 61

The Management of underground pipelineanagement of underground pipeline
                                                                                   The M



               音样本在特征坐标轴所形成的的特征空间中                                    3 数据量化
               都是一个点。从漏水声音最基本的两个特征
                                                                      由于传统漏水检测工作对人依赖程度
               频率与声强入手,利用这两个特征坐标轴可
                                                                非常高,检测中使用的数据也都为人服务,加
               以构建出一个二维坐标系,所有漏水声音样
                                                                入了很多人的主观的、模糊的评价。人可以靠
               本在坐标系上分布,我们可以很轻易的找到
                                                                重复性的操作从这些模糊的数据中掌握漏水
               坐标系中漏点声音的点和非漏点声音的点的
                                                                声音的规律,但机器是无法从中的到有效信
               存在规律。如果再加上一个管道压力特征坐
                                                                息的。数据量化就是梳理分类出影响漏水声
               标轴,二维坐标系变成了三维坐标系,再做判
                                                                音的各种因素,统一度量标准,标准化计量仪
               断就要费一番脑筋了;要是再加上一个管道
                                                                器,并将它们采集为具体的数据,为下一步机
               材质特征,变成了四维特征空间,恐怕只有少
                                                                器学习提供数据基础。
               数人可以想象出来;那么把所有影响漏水声
                                                                      3.1 数据分类
               音的特征都加上,特征空间变成了一个更为
                                                                      我们将影响漏水声音的数据分为三大
               复杂的高维空间,人类的思维很难在想象出
                                                                类,第一类为直接数据,即漏水声音声强与频
               高维空间的样貌,更不要说找到空间中这些
                                                                率;第二类为间接数据,即管径,漏量,管道
               点的分布规律,这就是为什么我们很难描述                              材质等影响漏水声音的间接特征;第三类为

               漏水点的声音。                                          提供给机器学习的标签数据,数值为采集点
                     2.2 利用机器学习解决复杂问题                           与漏水点的距离:该数据需要在采集时做好

                     机器学习可以不去求解漏水声音在其                           标记,并在开挖维修时时采集具体数值。由于

               特征空间中的分布规律,而可以直接给出新                              该数据将作为机器学习的标签数据,其精绝
               声音样本是否是漏水点的分类判断,而且判                              度直接影响到对分类判断,所以应将该数据

               断的正确率可以远高于人,如果样本足够大、                             精确到毫米。
               足够准确,这个正确率可以趋近于百分之百。                                   3.2 数据采集

               但要想让机器像人一样学习,必须解决两个                                    虽然本文把数据采集放在了一个二级类

               新的问题,一是、人在检测的时候得到的是                              目,篇幅也不是很大,但并不是说数据采集不
               漏水声的特征,这些特征对机器来说是没有                              重要,恰恰相反,数据采集在我们所探讨的基

               意义的,必须将这些特征量化,变成数据才                              于数据和机器学习的智慧测漏工作模式中占

               能被机器所接受;二是、人工通过大脑进行                              有着最重要的位置。机器学习是机器根据数
               学习和经验积累,而机器需要找到合适的数                              据自动做出决策的过程,机器学习的主体称

               据模型框架算法进行训练,我们将通过接下                              为数据模型,数据模型并不是由人搭建起来

               来的“数据量化”和“机器学习”两节逐一                              的,而是由数据与数据模型框架算法共同作
               解决。                                              用的结果。经验表明,数据集的质和量,与数



                                                                                              2020年第4期 47
   56   57   58   59   60   61   62   63   64   65   66