基于KPCA子空间虚假邻点判别的非线性建模的变量选择-李太福
- 海之魂
-
1 次阅读
-
0 次下载
-
2020-02-22 13:58:51
文档简介:
第48卷第10期2012年5月机械工程学报JOURNALOFMECHANICALENGINEERINGVol.48No.10May2012DOI:10.3901/JME.2012.10.192基于KPCA子空间虚假邻点判别的非线性建模的变量选择*李太福易军苏盈盈胡文金高婷(重庆科技学院电气与信息工程学院重庆401331)摘要:特征变量选择技术是非线性系统建模过程中降低信息冗余和提高精度的有效方法。提出一种结合核主成分分析法(Kernelprincipalcomponentsanalysis,KPCA)与虚假最近邻点法(Falsenearestneighbor,FNN)的变量选择法。引入核方法,将非线性原始数据映射到线性空间,再采用主成分分析法有效合理地消除因子之间的多重共线性,受混沌相空间虚假最近邻点法的启示,通过计算原始数据在KPCA子空间中投影的距离,判断其对主导变量的解释能力,由此进行变量的选择该方法用氢氰酸生产工艺工程中的非线性模型验证,并与全参数模型进行比较,结果显示该方法有良好的变量选择能力。因此,该研究为非线性系统建模的变量选择方法提供一种新方法。关键词:非线性系统建模核主成分分析法虚假最近邻点法变量选择中图分类号:TP273VariableSelectionforNonlinearModelingBasedonFalseNearestNeighboursinKPCASubspaceLITaifuYIJunSUYingyingHUWenjinGAOTing(DepartmentofElectricalandInformationEngineering,ChongqingUniversityofScienceandTechnology,Chongqing401331)Abstract:Selectionofsecondaryvariablesisaneffectivewaytoreduceredundantinformationandtoimproveefficiencyinnonlinearsystemmodeling.Anovelmethodbasedonkernelprincipalcomponentsanalysis(KPCA)andfalsenearestneighbormethod(FNN)isproposedonselectthemostsuitablesecondaryprocessvariablesusedasnonlinearmodelinginputs.Intheproposedapproach,theKPCAcanbeemployedtoovercomedifficultiesencounteredwiththeexistingmulticollinearitybetweenthefactors.InthenewKPCAfeaturesubspace,itisinspiredbyFNNthatinterpretationofprimaryvariablewouldbeestimatedbycalculatingthevariables’mapdistanceintheKPCAspacetoselectsecondaryvariables.Nonlinearmodelformtheproductionprocessingofhydrogencyanideisusedtoverifythevalidityofthemethod,andcomparedwiththefullyparametricmodel.Theresultsshowthatthemethodiseffectiveandsuitableforvariableselection.Therefore,anewmethodisprovidedforthevariableselectionofnonlinearsystemmodeling.Keywords:NonlinearsystemsModelingKernelprincipalcomponentsanalysis(KPCA)Falsenearestneighbor(FNN)Variableselection0前言*在非线性系统中,原始特征参数往往较多,过多的变量不但容易造成信息冗余,建模复杂度增加,而且模型的可靠性反而可能降低[1]。为了剔除冗余国家自然科学基金(50905194)、重庆市自然科学基金(CSTC2008BB2356)和重庆科技学院校内科研基金(CK2011B04)资助项目。20110622收到初稿,20111215收到修改稿信息,在建模过程中普遍采用特征提取消除自变量空间的信息冗余,通过某种映射将原始数据转变到特征子空间进行特征选择,以便提高判别模型的精度,并适当
评论
发表评论