Parzen窗核密度估计的模式分类隐私保护方法.pdfVIP

Parzen窗核密度估计的模式分类隐私保护方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Parzen窗核密度估计的模式分类隐私保护方法.pdf

2014年第 5期 淮南师范学 院学报 No.5,2014 第 16卷 (总第 87期 ) JOURNALOFHUAINANNORMALUNIVERSITY GeneralNo.87,Vo1.16 Parzen窗核密度估计的模式分类隐私保护方法 张友能,王德兵 ,汪伟 (安徽工贸职业技术学院,安徽 淮南 232001) 摘『 要]针对大规模数据集上的模式分类任务 ,提 出了一种基于Parzen窗核密度估计的模式分类 隐私保护算法 该算法首先利用Parzen窗算法对原始大规模训练集服从的概率密度进行估计 .然后根 据估计的概率密度函数构造la个替换训练样本 .其 中l为原始样本的数 目.a通过 10折交叉验证方式确 定。最后发布替换训练样本进行模式分类,以实现原始数据上的隐私保护。在Adult数据集上的仿真实 验充分验证 了该算法的有效性 关【键词1parzen窗 ;核密度估计;数据发布 ;隐私保护 中『图分类号1TP309.2 文『献标识码]A f文章编号11009—9530(2014)05—0093—04 数据挖掘①技术 的发展极大地促进 了人们对 现 了许多优秀 的分类算法 如人工神经 网络 海量数据的利用 .同时也引起 了数据隐私的泄露。 (ArtificialNeuralNetwork,ANN)④,支持 向量机 为了进行隐私保护②.同时又能对数据中隐藏 的有 (Support VectorMachines.SVMs) ⑤和 决 策 树 用信息进行挖掘 .面向隐私保护的数据挖掘应运而 (Decisi0nTree.DT)⑥等。这些算法的出现极大促进 生。本文针对大规模数据集上的模式分类任务,提 了模式分类技术在生活中各领域的应用 出了一种基于 Parzen窗③核密度估计的模式分类 训练样本数据 的获取是模式分类工作的基础 . 隐私保护算法 ,避免了原始数据上的隐私泄露。 所以模式分类任务很容易造成一些敏感数据 的泄 模式分类就是指对表征事物或现象的各种形 露 为了保护用来分类的训练数据 .同时又尽可能 式的信息进行处理和分析 .以对事物或现象进行描 不影响模式分类算法的性能.本文提出了一种基于 述、辨认、分类和解释的过程 。是人类 以及动物的最 Parzen窗核密度估计的模式分类隐私保护算法。该 基本 的智能表现 随着人类收集和存储数据能力 的 算法的主要思想是通过核密度估计方法估计原始 不断增长以及计算机运算能力 的飞速发展 .利用计 数据的概率密度分布 .然后根据这一密度函数生成 一 算机来分析数据进行模式分类的要求越来越广泛 . 定数 目的新样本 .最后用这些新样本替换原始样 越来越迫切。近些年随着研究人员的深人研究,出 本进行训练,实现原始数据的隐藏。因为本文算法 【收稿 日期】2014—05—25 基【金项 目】安徽省高校省级自然科学研究项 目(KJ2013B037);安徽省高校省级自然科学研究项 目(KJ2014A239) 作【者简介】张友能(1973一),男,安徽工贸职业技术学院电气与信息工程系副教授 ,硕士,主要研究方向为微机测控技术和物联网技术 。 ①HanJW,Kamber,DataMiningConceptsandTechniques,北京 :机械 工业 出版社 ,2001年 ,第 257—259 页 。 (周 水庚 ,李丰 ,陶宇飞 ,肖小奎 :《面向数据 库应 用 的隐私保护 研 究综 述》,《计算机 学$~}2009年 第 5期 , 第 847-861页 ③ 周恩策,刘纯平,张玲 燕,龚声蓉,刘全 :《基于时间窗的 自适应核 密度估计运动检测方法》,《通信学报 》 2011年 第 2期 ,第 106-114,124页 。 YangJ,YuX,XieZQ,AnovelvirtualsamplegenerationmethodbasedonGaussiandistribution,Knowl— edge-BasedSystems,2011,24(6).PP.740-748. @CortesC,VapnikV.Support

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档