- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小 型 微 型 计 算 机 系 统 2008年 11月 第 11期
JournalofChineseComputerSystems Vo1.29 No.11 2008
孤立点检测的一类支持向量机方法研究
田 江 ,顾 宏
(大连理工大学 电子与信息工程学院,辽宁 大连 116023)
E—mail:tianjiang@gmail.eom
摘 要:孤立点是不具备数据一般特性的数据对象,One—Class支持向量机将数据点映射到高维空间,通过划分距离坐标原点
最远间隔的超平面来发现孤立点.该学习算法在应用中误检率比较 高,另外模型参数不易选择.由此,本文将无监督的One
Class支持向量机同监督学习方法相结合,提出了一种新的检测算法,利用ROC(受试者工作特征)分析作为评价依据,在限定
范围内自动搜索最优参数,进而通过调节闽值获得孤立点检测决策函数.仿真实验结果表明,该算法简单有效,易于推广到实际
应用 中.
关 键 词:孤立点检测;支持向量机;ROC曲线
中图分类号 :TP181 文献标识码:A 文 章 编 号:1000—1220(2008)11-2107—04
StudyofOne-classSupportVectorM achinesforOutlierDetection
TIAN Jiang,GU Hong
(SchoolofElectronicandInformationEngineering,DalianUniversityof Technology,Dalian116023,China)
Abstract:Outliersareobjectsthatdonotcomplywiththegeneralbehaviorofthedata.Inordertodetectoutliers,One—Class
SVM (supportvectormachine)computesahyperplaneinfeaturespacewhichhasmaximalmargintotheorigin.ButtheFPR
(falsepositiverate)isalwayshighandtheparameterswilldirectlyaffecttheresult.SowecombinetheunsupervisedOne-class
SVM withasupervisedmethod,proposeanew modelfordetectingoutlierswhichmakeuseofROC(receiveroperatingcharac—
teristic)analysis.Theoptimum parametersareautomaticallysearchedinlimitedscope,andthenleadtothedetectiondecision
fucntionafteradjustingthethreshold.Experimentresultsshowthatthemethodissimple,effectiveandeasytouse.
Keywords:outlierdetection;supportvectormachine;ROC analysis
1 引 言 具体实现是通过计算最优ROC曲线面积AUC(Areaunder
theROCcurve)来评价检测效果[9],在限定范围内自动搜索,
随着信息技术的发展,数据库的容量、维数和复杂度都增
从而获得最佳模型参数;通过调节决策函数的输出阈值即可
长的十分迅速,而真实数据往往受到人工错误、舍入误差、导 获得最佳检测率和误检率.将实现后的软件应用于真实数据,
入导出因素的影响而不能直接用于数据挖掘.孤立点检测用 仿真实验结果证明了算法的有效性.
于发现不具备一般数据特性的数据,进而发现潜在的有用信
息.孤立点检测可以应用到很多领域,如信用卡欺诈检测、安 2 One—Class支持向量机
全系
您可能关注的文档
最近下载
- 校本研修教师手册(校级小课题研修手册).doc VIP
- 广东2024年11月广东省四会市行政服务中心公开招考4名政府雇员笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx VIP
- 高二英语选择性必修一Unit 2 Reading and Thinking课件(人教版2019).pptx VIP
- (2024新版本)人教版七年级上册语文全册教案.doc
- 高中数学人教A版:导数专题之极值点偏移 课件.pdf VIP
- 富士伺服电机ALPHA5-smart用户手册(全).pdf
- 局放及定位基础.ppt VIP
- 2024燃气物联网NB-IoT智能表的安全芯片检测技术规范.pdf VIP
- 贵州省遵义市2024年中考英语模拟试卷(含答案).docx VIP
- T_CBMCA 015-2020 陶瓷岩板产品规范.docx VIP
文档评论(0)