- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种多层次分布式数据挖掘方法改进探究
一种多层次分布式数据挖掘方法改进探究 摘 要: 针对多层次分布式数据存在高维特征和类间不平衡因素的问题,提出一种基于随机决策树检索模型的数据挖掘技术。采用随机相位重组方法进行分布式数据的层次空间重构,在重构的层次空间中提取多层次分布式数据的关联维特征量,采用高阶特征压缩方法进行降维处理,实现分布式数据的自适应挖掘。仿真结果表明,采用该方法进行数据挖掘的准确性能较好、查准率较高、计算开销降低、性能优越
关键词: 多层次分布式数据; 数据挖掘; 决策树; 检索; 数据库
中图分类号: TN911.1?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)09?0070?03
Abstract: Aiming at the high?dimensional feature and inter?class imbalance factor exiting in the multi?level distributed data mining method, a multi?level distributed data mining technology based on random decision tree retrieval model is proposed. The random phase recombination method is used to reconstruct the hierarchical space of the distributed data. The correlation dimension characteristic quantity of the multi?level distributed data is extracted in the reconstructed hierarchical space, and performs the dimension reduction with the high?order feature compression method to realize the adaptive mining of distributed data. The simulation results show that the method has high accuracy for data mining, high precision ratio, low computation cost, and superior performance.
Keywords: multi?level distributed data; data mining; decision tree; retrieval; database
0 引 言
在大数据环境下,大量的多层次分布式数据通过云技术积累并存储于网络数据库中,形成高维数据,在对多层次分布式数据采集和存储的过程中,由于采集手段的差异性以及测量误差的存在,导致数据挖掘的精度不高,从而影响了网络数据库的访问精度,需要对多层次分布式数据进行有效挖掘,结合特征提取和数据信息融合方法,进行多层次分布式数据的状态特征参量提取。研究多层次分布式数据挖掘方法在数据库访问和数据结构优化存储设计方面具有重要意义
对多层次分布式数据的挖掘是建立在数据信息流模型构建和特征提取的基础上,目前使用的数据挖掘算法很多,按类别可分为模糊挖掘算法、层次挖掘算法、网格区域分割挖掘方法等[1?2],通过对数据结构的属性类别分类处理和信息融合,实现数据信息特征检测和挖掘,取得较好的挖掘精度。文献[3]提出一种云计算环境下基于朴素贝叶斯分类的多层次分布式数据挖掘方法,进行多层次分布式数据归类,提取多层次分布式数据的语义关联性和规则性特征,实现数据优化挖掘,但该算法的计算开销较大,数据信息检测和挖掘的实时性不好
文献[4]提出一种基于相关子空间的数据挖掘方法,采用属性维上的局部稀疏程度重新定义相关子空间,采用局部数据集的概率密度给出相关子空间中的计算公式,获取相关子空间中的数据分布特征,引入LSH分布式策略,实现对分布式数据的挖据,该方法提高了多层次分布式数据库检索的查准性,但是该算法随着多层次分布式数据库规模的增大,信息挖掘的准确性不好
针对上述问题,提出一种基于随机决策树检索的多层次分布式数据挖掘方法。首先进行数据信息流构建和数据特征分析,对多层次分布式数据信息流进行特征空间重构;然后在重构的特征空间中提取多层次分布式数据的关联维特征量,采用高阶特征压缩方法进行降维处理,实现分布式数据的自适应挖掘;最后进行仿真试验分析
1 多层次分布式数据信息流重构
1.1 分布式数据的特征空间
您可能关注的文档
- pH对淀粉酶活性影响实验再探究.doc
- PIRLS给语文阅读教学启示.doc
- PLC在工业自动化控制领域中应用及发展探究.doc
- PLC在自来水厂自动化系统应用.doc
- PLC在高压配电系统控制中应用探究.doc
- PKVP中保留膀胱颈完整性对中年前列腺增生患者治疗效果及术后性功能影响分析.doc
- PLC宽带通信技术及应用性能之探究.doc
- PLC技术在机电工程自动化中应用分析.doc
- PLC技术在煤矿提升机电控制系统中应用.doc
- PFNA治疗老年不稳定型股骨转子间骨折临床疗效分析.doc
- T∕WXBDA 012-2025 人工智能翻盖式垃圾箱.docx
- T∕WXBDA 017-2025 人工智能机器视觉智能检测系统.docx
- 2025年佳木斯市公安局面向社会公开招聘警务辅助人员政治考察备考题库及答案解析(必刷).docx
- 2025江苏南京财经大学招聘教学科研岗76人备考题库带答案解析.docx
- 2025年孝感辅警协警招聘考试备考题库最新.docx
- 2025年原阳县辅警招聘考试真题及答案1套.docx
- 2025年济宁辅警招聘考试真题最新.docx
- 2025年定兴县辅警招聘考试真题最新.docx
- 2025年安庆市双生谷发展促进中心公开选调副科级人员2名备考题库及答案解析(夺冠).docx
- 部编版(2024)一上第八单元10《雨点儿》课件.pptx
最近下载
- 分子技术的临床应用题库及答案-2025年华医网继续教育.docx VIP
- 采矿工程毕业设计(论文)-平顶山矿1.2Mta新井设计(全套图纸).doc VIP
- Zebra斑马ZQ630 用户手册.pdf
- 2025年高中语文复习讲义选择性必修下册(一) 单篇梳理2 项脊轩志.docx VIP
- 风电机组叶片防雷相似性对比研究.pptx VIP
- 2026年中国长城资产管理股份有限公司校园招聘笔试模拟试题及答案解析.docx VIP
- 国开2024年秋《经济法学》计分作业1-4答案形考任务.docx
- 2014年q12 impact提升计划管理表(结构).xls VIP
- 党政办公室工作人员业务培训教学演示课件.ppt VIP
- 山梨酸钾MSDS化学物质技术说明书.pdf VIP
原创力文档


文档评论(0)