Page 63 - 202004期
P. 63
The M
The Management of underground pipelineanagement of underground pipeline
器进行训练,计算出算法,从而再利用算法来
解决问题。
4.1 支持向量机(SVM)
接下来介绍一个经典的机器学习训练方
法,支持向量机(Support Vector Machine,
SVM),以下我们简称为SVM,它在利用小训
练样本解决分类问题上有非常卓越的表现,
图1
之所以说它经典是因为它的背后有非常完美
的数学推导做支撑,下面我们简单介绍如何
将SVM应用到漏水检测中。
所有的机器学习方法都是在做同样一件
事,把不同类型的样本区分开,以我们开篇的
那个例子,什么样的声音才是漏水点的声音?
我们试着使用SVM解决这个问题,把采集到
经过开挖验证的漏水声音作为样本,漏点声 图2
音记作“Class 1”,用“○”表示;非漏点声音 优”的预先假设。那么人想要的这条直线除了
记作“Class 2”,用“×”表示,众多声音样本 能将训练样本正确分类,还应该具有以下两
在特征空间中有如下分布: 个预先假设:
如图1中可以用一条线将两类样本分开的 假设一、可以将训练样本中未出现的且
叫做线性可分样本集,对应的是相对简单的问 更靠近直线的样本区分到正确的一边的直线
题;而如图2中我们没有办法找出一条直线将 是好的。这里要加入“特征相似度高的样本更
两类样本分开的叫做线性不可分样本集,对应 可能是同一类”的人类思维。
的也就是我们需要解决的复杂问题。SVM提 假设二、可以将由于采集过程造成特征轻
出了两个步骤来将S2中的样本分开,第一步是 微误差的样本区分到正确的一边的直线是好的,
找出图1中可以将两类样本分开的无数条直线 这是要求算法对样本误差要有更高的宽容度。
中最优的那一条;第二步是将图2线性不可分 根据这两个预先假设,SVM给出了这样
的情况转化为图1线性可分的情况。 一条直线,如图3。
4.2 线性可分样本 将一条直线向两边平移,直到和两侧某
我们先来讨论第一步,这些可将两类样 个或某几个样本重合,会在直线两侧各得到
本分开的无数直线,对于机器来说无所谓优 一条平行线,能使得平行线间距离d取到最大
劣,要想找出最优的直线,必须定义出“最 值的两条平行线,其中心线为最优直线,这条
2020年第4期 49