Page 63 - 202004期
P. 63

The M
                                                                                   The Management of underground pipelineanagement of underground pipeline



               器进行训练,计算出算法,从而再利用算法来
               解决问题。

                     4.1 支持向量机(SVM)

                     接下来介绍一个经典的机器学习训练方
               法,支持向量机(Support Vector Machine,

               SVM),以下我们简称为SVM,它在利用小训
               练样本解决分类问题上有非常卓越的表现,
                                                                                     图1
               之所以说它经典是因为它的背后有非常完美

               的数学推导做支撑,下面我们简单介绍如何
               将SVM应用到漏水检测中。

                     所有的机器学习方法都是在做同样一件
               事,把不同类型的样本区分开,以我们开篇的

               那个例子,什么样的声音才是漏水点的声音?

               我们试着使用SVM解决这个问题,把采集到
               经过开挖验证的漏水声音作为样本,漏点声                                                   图2

               音记作“Class 1”,用“○”表示;非漏点声音                        优”的预先假设。那么人想要的这条直线除了

               记作“Class 2”,用“×”表示,众多声音样本                        能将训练样本正确分类,还应该具有以下两
               在特征空间中有如下分布:                                     个预先假设:

                     如图1中可以用一条线将两类样本分开的                               假设一、可以将训练样本中未出现的且
               叫做线性可分样本集,对应的是相对简单的问                             更靠近直线的样本区分到正确的一边的直线

               题;而如图2中我们没有办法找出一条直线将                             是好的。这里要加入“特征相似度高的样本更
               两类样本分开的叫做线性不可分样本集,对应                             可能是同一类”的人类思维。

               的也就是我们需要解决的复杂问题。SVM提                                   假设二、可以将由于采集过程造成特征轻

               出了两个步骤来将S2中的样本分开,第一步是                            微误差的样本区分到正确的一边的直线是好的,
               找出图1中可以将两类样本分开的无数条直线                             这是要求算法对样本误差要有更高的宽容度。

               中最优的那一条;第二步是将图2线性不可分                                   根据这两个预先假设,SVM给出了这样

               的情况转化为图1线性可分的情况。                                 一条直线,如图3。
                     4.2 线性可分样本                                       将一条直线向两边平移,直到和两侧某

                     我们先来讨论第一步,这些可将两类样                          个或某几个样本重合,会在直线两侧各得到

               本分开的无数直线,对于机器来说无所谓优                              一条平行线,能使得平行线间距离d取到最大
               劣,要想找出最优的直线,必须定义出“最                              值的两条平行线,其中心线为最优直线,这条



                                                                                              2020年第4期 49
   58   59   60   61   62   63   64   65   66   67   68