- 33
- 0
- 约 5页
- 2016-10-20 发布于重庆
- 举报
数据挖掘可视化系统研究与实现
数据挖掘可视化系统设计与实现
摘要:针对当前数据可视化工具的种类、质量和灵活性的存在的不足,构建一个数据挖掘可视化平台。将获取的数据集上传到系统中,对数据集进行预处理,利用Mahout提供的分类、聚类等挖掘算法对数据集进行挖掘,使用ECharts将挖掘产生的结果进行可视化展示。
关键词:数据挖掘;可视化展示;数据预处理;挖掘算法
1引言
大数据时代,通过数据挖掘,可以对数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从而提取辅助商业决策的关键性信息。丰富而灵活的数据挖掘结果可视化技术使抽象的信息以简明的形式呈现出来,加深用户对数据含义的理解,更好地了解数据之间的相互关系和发展趋势。然而当前数据可视化工具的种类、质量和灵活性较大的影响数据挖掘系统的使用、解释能力和吸引力。
为此,本系统使用分布式大数据处理技术进行数据的存储和计算,构建一个数据挖掘可视化平台,以多种挖掘算法的实现对原始数据集进行挖掘,从而发现数据中有用的信息。
2.关键技术
(1)MapReduce离线计算框架
一种在YARN系统之上的大数集离线计算框架,使用MapReduce可以并行的对原始数据集进行计算处理,从而高效的得出结果。
(2)HBase分布式数据库
HBase是一个构建在Hadoop之上分布式的、面向列的开源数据库。HBase不同于一般的关系数据库,他是一个适合于非结构化数据存储的
您可能关注的文档
最近下载
- 财务岗位招聘笔试题及解答(某大型国企)2025年阅读与附答案.docx VIP
- 2026年家庭教育指导理论知识考核试题及答案.docx VIP
- PPT:《国有企业领导人员廉洁从业规定》重点内容学习宣讲.pptx VIP
- 保洁人员手卫生培训.pptx VIP
- 2026中国半导体设备国产化率提升路径分析报告.docx
- 财务岗位招聘笔试题及解答(某大型集团公司).docx VIP
- 财务岗位招聘笔试题及解答(某大型国企)2024年.docx VIP
- 温室气体 产品碳足迹量化方法与要求 全钒液流电池电解液_标准研究报告.docx VIP
- 国企财务岗位招聘笔试题.docx VIP
- Q 010-2017_EMF8系列电磁流量计.pdf VIP
原创力文档

文档评论(0)