Page 65 - 202004期
P. 65

The M
                                                                                   The Management of underground pipelineanagement of underground pipeline



                     4.3 线性不可分样本                                凡的创造性,他提出可以不求解无限维映射φ
                     一些线性不可分的问题可能是非线性可                          (x)的显式表达,而借助一个低维核函数:

                                                                                         T
               分的,即特征空间存在超曲面(非线性决策边                                   K(x ,x )=φ(x )φ(x )
                                                                          1  2        1       2
               界)可以将正类和负类分开。一些机器学习方                                   根据强对偶定理,原函数在满足KKT条
               法试图找到这个超曲面,如神经网络和决策                              件下与对偶函数的解相等,将优化式中的无

               树,而支持向量机的提出者弗拉基米尔•万普                             限维映射函数φ(x)由其对偶函数K(x ,x )
                                                                                                          2
                                                                                                       1
               尼克执着于寻找一条直线,他认为将低维度                              代替。
               特征空间中非线性可分的问题映射到更高维                                    最后得到SVM的算法分为训练流程和

               度将有更大可能性变得线性可分,而且可以证                             测试流程
               明维度越高样本变的线性可分的概率越大,                                    训练流程:

               万普尼克在支持向量机中给出的这个φ(x)                                  输入 {(x ,y )}      i = 1 ~ N
                                                                                   i
                                                                               i
               为无限维,那么非线性可分样本在无限维变                                   最 大 化:θ(α)=              N  α -1/2  N  N
                                                                                                  i
               为线性可分的概率就是1。                                     α α y y K(x ,x )             i=1       i=1  j=1
                                                                              i
                                                                   i
                                                                                  j
                                                                     j i j
                     SVM处理非线性可分问题需要将优化                                                              N
                                                                     限制条件:① 0 ≤ α ≤ C;②               α y =0
                                                                                                        i i
                                                                                          i
               式进行改造                                                                               i=1
                                                                     再由这一步解出的 α 计算出 b
                     前文已经推导出间隔最大化可以转化为                                        N
                                                                     b=[1-y    α y K(x ,x )]/y
               求||ω|| 最小化                                                   i  j=1  j  j  i   j     j
                      2
                                         2
                     由于非线性可分,||ω|| 最小化问题将变得                          训练流程结束。
                                                                     测试流程
               无解,需要加上一个正则项使它变得有解。
                                                                     输入测试样本 x
                                       N                                N
                     最小化1/2||ω|| +C      ξ i                         若    α y K(x ,x)+b ≥ 0,则 y=+1
                                   2
                                                                            i i
                                                                                   i
                                       i=1                             i=1
                                                                        N
                                      T
                     限制条件①y[ω φ(x)+b] ≥1-ξ(i=                        若 i=1  α y K(x ,x)+b < 0,则 y=-1
                                                                            i i
                                                                                   i
                                  i
                                                       i
               1~N);②ξ≥0                                              根据输出的y值可以将样本分类,如果
                           i
                     改造中加入了一个松弛变量ξ使得凸优                          y=+1,样本被分为正类,如果y=-1,则样本被
                                                  i
               化问题变得有解,同时加入了常数C和将所有                             分为负类。再将机器分类情况与样本实际分
               ξ求和,是为了平衡ξi的取值不会变的过大,                            类情况进行比较,可以测试出机器分类的正
                 i
               而使所得的解失去意义。前面的1/2是为了求                            确率。经过训练和测试找到最优的核函数以
               导方便,不影响ω在最小值出的取值。                                及参数,机器学习过程全部结束
                     问题又来了,ω是与φ(x)同样维度的向                              4.4 利用SVM判断漏水点
               量,φ(x)也将变为无限维,那么将无法找到                                  智能系统通过对样本的训练,测试,

               相应的无限维的ω,万普尼克再次发挥了他非                             调参,再训练,再测试……最终会得到一个



                                                                                              2020年第4期 51
   60   61   62   63   64   65   66   67   68   69   70