Page 61 - 202004期
P. 61
The Management of underground pipelineanagement of underground pipeline
The M
音样本在特征坐标轴所形成的的特征空间中 3 数据量化
都是一个点。从漏水声音最基本的两个特征
由于传统漏水检测工作对人依赖程度
频率与声强入手,利用这两个特征坐标轴可
非常高,检测中使用的数据也都为人服务,加
以构建出一个二维坐标系,所有漏水声音样
入了很多人的主观的、模糊的评价。人可以靠
本在坐标系上分布,我们可以很轻易的找到
重复性的操作从这些模糊的数据中掌握漏水
坐标系中漏点声音的点和非漏点声音的点的
声音的规律,但机器是无法从中的到有效信
存在规律。如果再加上一个管道压力特征坐
息的。数据量化就是梳理分类出影响漏水声
标轴,二维坐标系变成了三维坐标系,再做判
音的各种因素,统一度量标准,标准化计量仪
断就要费一番脑筋了;要是再加上一个管道
器,并将它们采集为具体的数据,为下一步机
材质特征,变成了四维特征空间,恐怕只有少
器学习提供数据基础。
数人可以想象出来;那么把所有影响漏水声
3.1 数据分类
音的特征都加上,特征空间变成了一个更为
我们将影响漏水声音的数据分为三大
复杂的高维空间,人类的思维很难在想象出
类,第一类为直接数据,即漏水声音声强与频
高维空间的样貌,更不要说找到空间中这些
率;第二类为间接数据,即管径,漏量,管道
点的分布规律,这就是为什么我们很难描述 材质等影响漏水声音的间接特征;第三类为
漏水点的声音。 提供给机器学习的标签数据,数值为采集点
2.2 利用机器学习解决复杂问题 与漏水点的距离:该数据需要在采集时做好
机器学习可以不去求解漏水声音在其 标记,并在开挖维修时时采集具体数值。由于
特征空间中的分布规律,而可以直接给出新 该数据将作为机器学习的标签数据,其精绝
声音样本是否是漏水点的分类判断,而且判 度直接影响到对分类判断,所以应将该数据
断的正确率可以远高于人,如果样本足够大、 精确到毫米。
足够准确,这个正确率可以趋近于百分之百。 3.2 数据采集
但要想让机器像人一样学习,必须解决两个 虽然本文把数据采集放在了一个二级类
新的问题,一是、人在检测的时候得到的是 目,篇幅也不是很大,但并不是说数据采集不
漏水声的特征,这些特征对机器来说是没有 重要,恰恰相反,数据采集在我们所探讨的基
意义的,必须将这些特征量化,变成数据才 于数据和机器学习的智慧测漏工作模式中占
能被机器所接受;二是、人工通过大脑进行 有着最重要的位置。机器学习是机器根据数
学习和经验积累,而机器需要找到合适的数 据自动做出决策的过程,机器学习的主体称
据模型框架算法进行训练,我们将通过接下 为数据模型,数据模型并不是由人搭建起来
来的“数据量化”和“机器学习”两节逐一 的,而是由数据与数据模型框架算法共同作
解决。 用的结果。经验表明,数据集的质和量,与数
2020年第4期 47