- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生学位论文开题报告
题目名称: 基于隐私保护的多源数据挖掘高效算法研究
姓 名:
学 号:
专业名称:
研究方向:
攻读学位:
学 院:
导师姓名:
导师职称:
填表时间 年 月 日
填 表 说 明
1.开题报告是研究生培养的重要环节,研究生需在认真完成。
2.完成时间:硕士研究生的开题报告应于第三学期末前完成
3.打印要求:此表用A4纸双面打印。
4.此表与中期考核审核表、成绩单、实践报告、学术活动列表等材料一起交于学院,参加中期考核
一、课题来源,国内外研究现状、水平及发展趋势,选题的研究意义、目的,参考文献
(一)课题来源
1、问题的提出
数据挖掘,顾名思义即是从大型数据库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在的、有用信息,提取的知识表示为概念、规则、规律、模式等形式[1]。数据挖掘要处理的问题,就是在庞大的数据库中寻找有价值的隐藏事件,加以分析,并将这些有意义的信息归纳成结构模式,提供给有关部门决策时参考。目前已经提出的常用方法有关联规则、决策树、聚类、神经网络等方法。
然而,在对数据进行挖掘的时候,都不可避免的会出现敏感信息泄露的问题,随着数据挖掘技术的日益发展,数据隐私和信息安全逐渐引起人们的关注。为了保护数据的隐私,人们不愿提供正确的信息给服务商,以免个人信息泄露造成不必要的麻烦,但是数据挖掘结果准确的重要前提是提供的数据正确。由于数据挖掘主要任务是对汇总数据的模式开发,这使得构造一个不需要访问精确的单个信息而获得准确的模式的挖掘技术成为可能。目前,基于隐私保护的数据挖掘技术已经成为一个新颖热门的研究领域,国内外已有很多成熟的研究算法和技术。
通过众多文献比对我们发现,目前已有的这些基于隐私保护的数据挖掘算法和技术大多是针对单源数据库进行挖掘和保护,而在实际应用中,有很多情况必须面对多个数据源。例如,许多大型企业、跨国公司都拥有过个子公司,每个子公司都有自己相应的数据库。这就迫切需要数据库挖掘系统具有针对多数据源进行挖掘和保护的能力。已有的国内外文献中,针对多源数据进行挖掘的模型和算法已经出现,但是基于隐私保护技术的多源数据挖掘研究却很少提及。这可能是由于多源数据挖掘本身的技术局限性,导致在对多个数据源进行挖掘时,泄露敏感信息都成为了不可避免的操作。因此,本文在对当前已有的多源序列模式挖掘技术研究的基础上,分析结合并行和隐私保护技术的特点,提出新的基于隐私保护的多源数据挖掘高效算法,使得在多源环境下既可以高效率高准确度的挖掘出高投票率模式(全局模式),又可以隐藏敏感序列模式,达到较好的隐私保护效果。
(二)国内外研究现状、水平及发展趋势
1、
数据挖掘中的隐私保护主要考虑两个方面的问题,一个是敏感的原始数据,一个是从数据库中提取出来的敏感知识。这两种信息都应当在挖掘的时候进行删除,因为可能导致隐私泄露问题。因此,隐私保护数据挖掘的主要目的就是用某种技术改进已有的数据挖掘算法来修改原始数据,使得敏感的数据和知识不被泄露。目前,针对隐私保护数据挖掘的研究,国外已经有很多方法。文献[4]采用数据扰乱技术,从训练数据中重构一个决策树分类器从而解决数据挖掘中隐私保护问题。文献[5]提出了一种基于随机化的方法——随机响应技术,利用这种源于统计学研究中隐私保护的方法,来实现在不泄露隐私数据的情况下进行一定精度的建模,文中主要探讨了与ID3决策树算法结合进行分类的方法。文献[6]讨论了一个利用不确定性符号进行数据阻塞并应用于关联规则挖掘的具体例子,这种情况下支持度和置信度分别用支持度区间和置信度区间代替。文献[7]提出一个利用添加噪声数据对待挖掘数据库进行有效分类的框架,满足了对数据集中敏感信息方差和协方差的有效保护。对于如何很好的平衡隐藏限制模式和揭露非限制模式,文献[8]中提出了一个基于隐私保护的频繁项集数据挖掘框架,对原始数据库进行了一定程度的安全清洗。文献[9]针对交易型数据库,提出一个新的仅需要一遍扫描数据库的算法对原始数据库数据进行处理,使得既能达到保护隐私数据,又能挖掘出准确的关联规则,保留关联规则挖掘的益处。由于在关联规则挖掘中,很容易从非敏感信息和原始未分类数据中推测出敏感信息,因此文献[10]提出了一个新的算法来平衡关
您可能关注的文档
- 烟雾检测报警系统的设计毕业设计.doc
- 煤炭开采技术毕业论文浅析当今煤炭开采技术及绿色开采技术.doc
- 煤炭深加工论文浅谈焦炉热工管理的加热制度.doc
- 热力学论文热力学第一,第二定律的具体表述浅谈热力学第三定律的发展.doc
- 漯河市农业物流的现状及相关建议课程设计.doc
- 热释电红外报警系统的设计本科毕业论文.doc
- 热障涂层技术对于提高发动机热端关键部件服役温度的效果研究.doc
- 热风处理时间对鲜切双孢菇褐变的影响.doc
- 焓值法空调器性能检测实验室的研制制冷及低温工程硕士论文.doc
- 爱的哲学浅析冰心早期文学创作的精神本质.doc
- 研究生计量经济学作业结课论文河北省城乡居民收入与居住消费关系分析基于协整和误差修正模型.doc
- 研究设计属性网络支付服务效用的影响.doc
- 硕士本科论文办公自动化系统的设计与实现.doc
- 硕士研究生学位论文针织面料在国内外服饰设计中的运用及其现代意义.doc
- 硕士本科论文基于J2EE的政务督查系统的设计和实现.doc
- 硕士研究生论文:基于神经元网络的我国船舶产业竞争力研究.doc
- 硕士论文MRO工业品超市服务因素对客户购买的影响研究以LL工业品超市为例.doc
- 破乳絮凝法处理乳化含油废水的研究化学工程工艺毕业论文.doc
- 研究生论文薄浅湿晒和干湿交替灌溉稻田有机碳转化及其相关微生物特性研究.doc
- 矿山机电专业毕业设计浅谈煤矿供电技术.doc
最近下载
- 某尾矿溢水塔回水隧洞封堵工程施工方案.pdf VIP
- 婴幼儿的早期教育工作总结PPT.pptx VIP
- 【高考真题】重庆市2025年高考真题物理试卷(含答案).pdf VIP
- 教案对外汉语我是跟旅游团一起来的.pdf VIP
- 2024年秋季新教材人教版一年级上册数学全册教案-129页.docx VIP
- 2024-2025学年初中英语九年级上册牛津上海(试用本)教学设计合集.docx
- 2020年《城镇燃气设计规范》GB50028-2006 .pdf VIP
- T_CDHA 13-2023 热力管道用金属波纹管补偿器.pdf
- 燃气工程技术专业基础知识考试题库(含答案).docx VIP
- 室内滑雪馆消防设计探讨.pdf VIP
文档评论(0)