Page 65 - 202004期
P. 65
The M
The Management of underground pipelineanagement of underground pipeline
4.3 线性不可分样本 凡的创造性,他提出可以不求解无限维映射φ
一些线性不可分的问题可能是非线性可 (x)的显式表达,而借助一个低维核函数:
T
分的,即特征空间存在超曲面(非线性决策边 K(x ,x )=φ(x )φ(x )
1 2 1 2
界)可以将正类和负类分开。一些机器学习方 根据强对偶定理,原函数在满足KKT条
法试图找到这个超曲面,如神经网络和决策 件下与对偶函数的解相等,将优化式中的无
树,而支持向量机的提出者弗拉基米尔•万普 限维映射函数φ(x)由其对偶函数K(x ,x )
2
1
尼克执着于寻找一条直线,他认为将低维度 代替。
特征空间中非线性可分的问题映射到更高维 最后得到SVM的算法分为训练流程和
度将有更大可能性变得线性可分,而且可以证 测试流程
明维度越高样本变的线性可分的概率越大, 训练流程:
万普尼克在支持向量机中给出的这个φ(x) 输入 {(x ,y )} i = 1 ~ N
i
i
为无限维,那么非线性可分样本在无限维变 最 大 化:θ(α)= N α -1/2 N N
i
为线性可分的概率就是1。 α α y y K(x ,x ) i=1 i=1 j=1
i
i
j
j i j
SVM处理非线性可分问题需要将优化 N
限制条件:① 0 ≤ α ≤ C;② α y =0
i i
i
式进行改造 i=1
再由这一步解出的 α 计算出 b
前文已经推导出间隔最大化可以转化为 N
b=[1-y α y K(x ,x )]/y
求||ω|| 最小化 i j=1 j j i j j
2
2
由于非线性可分,||ω|| 最小化问题将变得 训练流程结束。
测试流程
无解,需要加上一个正则项使它变得有解。
输入测试样本 x
N N
最小化1/2||ω|| +C ξ i 若 α y K(x ,x)+b ≥ 0,则 y=+1
2
i i
i
i=1 i=1
N
T
限制条件①y[ω φ(x)+b] ≥1-ξ(i= 若 i=1 α y K(x ,x)+b < 0,则 y=-1
i i
i
i
i
1~N);②ξ≥0 根据输出的y值可以将样本分类,如果
i
改造中加入了一个松弛变量ξ使得凸优 y=+1,样本被分为正类,如果y=-1,则样本被
i
化问题变得有解,同时加入了常数C和将所有 分为负类。再将机器分类情况与样本实际分
ξ求和,是为了平衡ξi的取值不会变的过大, 类情况进行比较,可以测试出机器分类的正
i
而使所得的解失去意义。前面的1/2是为了求 确率。经过训练和测试找到最优的核函数以
导方便,不影响ω在最小值出的取值。 及参数,机器学习过程全部结束
问题又来了,ω是与φ(x)同样维度的向 4.4 利用SVM判断漏水点
量,φ(x)也将变为无限维,那么将无法找到 智能系统通过对样本的训练,测试,
相应的无限维的ω,万普尼克再次发挥了他非 调参,再训练,再测试……最终会得到一个
2020年第4期 51